Browser Use, une start-up américaine qui ambitionne de transformer la manière dont les agents d’IA interagissent avec le web a annoncé récemment une levée de fonds de 17 millions de dollars dans le cadre d’un tour de financement seed mené par Felicis Ventures, avec la participation de A Capital, Nexus Ventures, Y Combinator, Paul Graham, Liquid2, SV Angel, et Pioneer Fund. 

Construire l’interface entre les LLMs et le web 

Browser Use a vu le jour en 2024 sous l'impulsion de Magnus Müller et Gregor Žunič, deux anciens étudiants en science des données de l'ETH Zurich. Leur projet est né d'une simple expérience de week-end visant à tester si les modèles de langage (LLMs) pouvaient naviguer sur le web comme des humains. En quatre jours seulement, ils ont développé un prototype initial qu'ils ont ensuite lancé sur la plateforme Hacker News. L'engouement a été immédiat, confirmant leur intuition que l'avenir de l'automatisation web pilotée par l'IA était plus proche que beaucoup ne le pensaient. Quelques semaines plus tard, la première démo était prête.

Les deux cofondateurs assurent :
"Internet est la plus grande source de données non structurées au monde, mais interagir avec lui nécessite encore des actions humaines : cliquer sur des boutons, remplir des formulaires, naviguer manuellement sur les sites web. Avec l’essor des LLMs et des agents autonomes, cette réalité est en train de changer. Nous construisons l’infrastructure permettant à l’IA d’interagir avec le web aussi naturellement qu’un humain."

La plupart des solutions d’automatisation existantes reposent sur des méthodes basées sur la vision, tentant d’imiter la perception humaine des pages web.  Sensibles aux variations visuelles (changement de couleur, de position des éléments...), elles sont pour les deux hommes "lentes, coûteuses et peu fiables".  Ils ont donc adopté une stratégie radicalement différente : leur outil convertit les interfaces web en texte structuré, permettant aux modèles de langage d’interagir avec les sites de façon plus prévisible. Cette approche permet une interaction plus précise avec les éléments d’interface utilisateur (boutons, formulaires, menus) tout en garantissant une exécution plus rapide et plus économique que les solutions basées sur l’analyse d’images.

Contrairement à la plupart de ses concurrents, Brower Use Cloud peut être utilisé avec différents LLMs. Sa version Pro est proposée par la start-up à 30 $/mois, ce qui fait de lui une alternative open source plus flexible et moins onéreuse qu'Operator d'OpenAI.

Une traction rapide et des cas d’usage variés

En seulement quelques mois, Browser Use a connu une croissance fulgurante. Son projet open source, auquel une communauté de plus de 15 000 développeurs contribue activement, cumule plus de 48 400 étoiles sur GitHub. Ses outils couvrent divers cas d’usage, parmi lesquels l'automatisation de connexion et navigation web, l'extraction de données à grande échelle, les tests d’assurance qualité ou les intégrations CRM.

Avec cette levée de fonds, Browser Use entend accélérer le développement de son infrastructure et, dans ce but, prévoit de recruter les meilleurs ingénieurs.

Magnus Müller commente :
"Nous croyons fermement que l’interaction entre l’IA et le web va connaître une transformation majeure dans les années à venir. D’ici quelques années, nous pensons que les interactions automatisées par l’IA dépasseront celles effectuées par les humains."