Tout est dans les données - Battery Ventures

Entreprises Équipes Services À propos Recherche

Entreprises
En 40 ans d'existence, Battery a investi dans plus de 450 entreprises. Nous avons donc eu la chance de soutenir de très grandes idées.

SECTEURS
Équipes
Nos spécialistes de l'investissement travaillent main dans la main pour former une unité mondiale unique capable d'évaluer et de soutenir les investissements potentiels.

ÉQUIPES
Services
Nous apportons notre soutien aux entreprises dans lesquelles nous avons investi. Nos domaines d'expertise comprennent l'acquisition de nouveaux talents, la prospection, le marketing, la communication et la croissance/le leadership.

SERVICES
À propos Blog Feuille de route des fondateurs Actualités et événements Contact

Blog Battery Feuille de route des fondateurs Études de cas Actualités et événements Carrières au sein de nos sociétés de portefeuille Contact

En 40 ans d'existence, Battery a investi dans plus de 450 entreprises. Nous avons donc eu la chance de soutenir de très grandes idées.

SECTEURS

Logiciel applicatif Logiciel deep tech Consommation Outils logiciels et technologies industrielles SVT Toutes les entreprises

Nos spécialistes de l'investissement travaillent main dans la main pour former une unité mondiale unique capable d'évaluer et de soutenir les investissements potentiels.

ÉQUIPES

Partenaires d'investissement Équipe d'investissement Operating Partner/EIR Opérations de l'entreprise Services de portefeuille Tout afficher

Nous apportons notre soutien aux entreprises dans lesquelles nous avons investi. Nos domaines d'expertise comprennent l'acquisition de nouveaux talents, la prospection, le marketing, la communication et la croissance/le leadership.

SERVICES

Développement commercial Talents et recrutement Marketing et communication Leadership, croissance et analyses Tout afficher

Logiciel deep tech

Dharmesh Thakker, Danel Dayan, Jason Mendel | 31 octobre 2022

Tout est dans les données

En tant que scientifique des données, il y a de fortes chances que vous ayez ressenti la frustration de passer un nombre d'heures apparemment infini à préparer l'ensemble de données propre et représentatif nécessaire pour alimenter votre modèle d'apprentissage machine (ML). Nous sommes ici pour faire la lumière sur votre frustration et vous dire que vous n'êtes pas seul - et qu'il existe une nouvelle technologie pour vous aider.

Le ML est essentiellement un problème de données volumineuses et désordonnées, et les modèles - qui sont déployés dans tous les secteurs pour automatiser les tâches commerciales essentielles et accroître l'efficacité - nécessitent des quantités massives de données avant de pouvoir être utilisés de manière fiable en production. Pour le dire simplement, un modèle ne peut être aussi bon que les données sur lesquelles il est entraîné, et les prédictions de mauvaise qualité d'un modèle sont souvent causées par des données erronées ou de mauvaise qualité. L'intelligence des données - ou la capacité de comprendre et d'améliorer de manière holistique la santé des données qui alimentent le modèle - est l'une des considérations les plus critiques, mais sous-estimée, pour toute organisation qui cherche à récolter avec succès les avantages du ML.

Le passage d'une intelligence artificielle centrée sur les modèles à une intelligence artificielle centrée sur les données est à l'origine de l'intérêt intense porté à l'intelligence des données. Les progrès récents, y compris les modèles pré-entraînés largement disponibles sur étagère et les nouveaux cadres puissants de ML, ont démocratisé l'accès aux modèles complexes et performants et ont déplacé l'attention du modèle vers les données. Dans le cadre du paradigme de l'IA centrée sur les données, la meilleure façon d'améliorer la santé et les performances du modèle est d'améliorer la qualité des données sous-jacentes qui transitent par le modèle.

L'adoption de l'IA ne cesse d'augmenter, tout comme l'importance de l'intelligence des données, sans laquelle il est pratiquement impossible de comprendre et d'inspecter de grands ensembles de données ML. Déterminer le mélange de données optimal sur lequel étiqueter et former un modèle - sans oublier de découvrir et de corriger continuellement les erreurs de données - est devenu un processus désordonné et chronophage. Les erreurs dans les données peuvent provenir d'un certain nombre de problèmes, notamment de données manquantes ou insuffisantes, de trop de données, de données mal étiquetées et de données périmées. Et les problèmes de qualité des données, bien que difficiles à repérer à l'œil nu, peuvent avoir un impact catastrophique sur les performances du modèle.

Il n'est donc pas surprenant que les développeurs ML passent autant de temps à optimiser les données qui alimentent leurs modèles ; cependant, une grande partie de ce flux de travail est aujourd'hui ad-hoc et manuel, et les développeurs ML manquent d'un ensemble standard d'outils pour comprendre et gérer intelligemment les données à l'échelle et améliorer proactivement les performances des modèles.

Entrez Galileo*

Galileo a été spécialement conçu pour résoudre le problème des données désordonnées du ML et sert de couche d'intelligence pour aider les scientifiques à gérer les données tout au long du cycle de vie du ML. Grâce à la technologie de Galileo, les scientifiques des données peuvent facilement visualiser les données qui circulent dans leurs modèles, sélectionner les bonnes données pour l'entraînement des modèles, suivre et collaborer entre les ensembles de données, et identifier et corriger les erreurs coûteuses des données ML, telles que les données manquantes ou les erreurs d'étiquetage. Cela permet de réduire le temps et l'argent consacrés à la préparation des données et, surtout, d'améliorer les performances du modèle grâce à des données de meilleure qualité. Le produit de Galileo est déjà utilisé en production par une poignée d'adopteurs précoces dans des entreprises Fortune 500 et des startups dans de multiples secteurs.

L'entreprise a été fondée en 2021 par Vikram Chatterji, Atindriyo Sanyal et Yash Sheth, une équipe d'experts en ML qui ont fait l'expérience directe du problème des données désordonnées de l'IA en construisant et en déployant des modèles dans certaines des plus grandes entreprises du monde spécialisées dans l'IA. Vikram et Yash ont précédemment travaillé sur des projets d'IA à grande échelle chez Google, et Atindriyo a précédemment participé à la mise en place de la plateforme Michelangelo d'Uber et a été un des premiers membres de l'équipe Siri chez Apple. Grâce à ses expériences antérieures, l'équipe de Galileo a acquis une foule de connaissances et de principes de première main, qu'elle utilise pour résoudre l'un des défis les plus complexes et les plus pressants de ML.

Nous avons eu la chance de nous associer à d'autres entreprises dans le domaine de l'IA / ML : Databricks*, Arize*, Dataiku* et Paperspace*. Nous sommes ravis de travailler avec Galileo, car la société apporte l'intelligence des données au ML. Nous nous réjouissons de ce prochain chapitre de croissance à venir.

Ce contenu est fourni à titre d'information et ne constitue pas, et ne peut en aucun cas être considéré comme, un conseil juridique, fiscal ou d'investissement ou comme une offre de vente ou une sollicitation d'une offre d'achat d'un intérêt dans un fonds ou un instrument d'investissement géré par Battery Ventures ou toute autre entité de Battery.

*Signale une entreprise de Battery Portefeuille passée ou présente. Pour une liste complète de tous les investissements de Battery Ventures, veuillez cliquer sur ici. Il ne faut pas présumer que les investissements identifiés ci-dessus ont été ou seront rentables. Il ne faut pas supposer que les recommandations à venir seront rentables ou égaleront les performances des entreprises identifiées ci-dessus.

Les informations et les données sont en date de la publication, sauf indication contraire.

Le contenu obtenu de sources tierces, bien que considéré comme fiable, n'a pas été vérifié de manière indépendante quant à son exactitude ou son exhaustivité et ne peut être garanti. Battery Ventures n'a aucune obligation de mettre à jour, de modifier ou d'amender le contenu de ce post ni d'avertir ses lecteurs dans le cas où toute information, opinion, projection, prévision ou estimation incluse, changerait ou deviendrait ultérieurement inexacte.

Les informations ci-dessus peuvent contenir des projections ou d'autres déclarations prévisionnelles concernant des événements ou des attentes futurs. Les prédictions, opinions et autres informations discutées dans cette vidéo sont susceptibles d'être modifiées en permanence et sans préavis d'aucune sorte et peuvent ne plus être pertinentes après la date indiquée. Battery Ventures n'assume aucune obligation et ne s'engage pas à mettre à jour les déclarations prospectives.

Retour au blog

PARTAGER CET ARTICLE

ARTICLE ÉCRIT PAR

Dharmesh Thakker

Dharmesh Thakker est un general partner chez Battery Ventures, où il investit dans des entreprises en phase de démarrage et de croissance sur les marchés de l'infrastructure cloud, du big data, de la sécurité et des applications d'entreprise nouvelle génération.

Danel Dayan

Danel est un Principal qui se concentre actuellement sur les investissements en phase de démarrage et Growth Equity dans des domaines tels que l'infrastructure en nuage, le big data, la sécurité et les applications d'entreprise de nouvelle génération.

Jason Mendel

Jason est un Vice President qui se concentre actuellement sur les investissements en phase de démarrage et Growth Equity dans des domaines tels que l'infrastructure en nuage, les données massives, la sécurité et les applications d'entreprise de nouvelle génération.

Un bulletin d'information mensuel pour partager de nouvelles idées, des aperçus et des introductions pour aider les entrepreneurs à développer leurs entreprises.

DOMAINES DE COMPÉTENCES

FONCTIONS MÉTIER

Actualité Battery et tendances du marché Études de cas RH et finance Leadership Ventes et marketing

Cookie	Duration	Description
AWSELB	session	Associated with Amazon Web Services and created by Elastic Load Balancing, AWSELB cookie is used to manage sticky sessions across production servers.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie.
optimizelyRumLB	session	This cookie controls the AWSELB cookie's attributes (e.g., SameSite and Secure).
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	Persistent	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	Persistent	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt.innertube::nextId	Persistent	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	Persistent	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Duration	Description
__cf_bm	30 minutes	This cookie, set by Cloudflare, is used to support Cloudflare Bot Management.
sb	2 years	This cookie is used by Facebook to control its functionalities, collect language settings and share pages.

Cookie	Duration	Description
_gat	1 minute	This cookie is installed by Google Universal Analytics to restrain request rate and thus limit the collection of data on high traffic sites.
AWSELBCORS	session	This cookie is used by Elastic Load Balancing from Amazon Web Services to effectively balance load on the servers.

Cookie	Duration	Description
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
browser_id	5 years	This cookie is used for identifying the visitor browser on re-visit to the website.
CONSENT	2 years	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.
pvc_visits[0]	1 day	This cookie is created by post-views-counter. This cookie is used to count the number of visits to a post. It also helps in preventing repeat views of a post by a visitor.
vuid	2 years	Vimeo installs this cookie to collect tracking information by setting a unique ID to embed videos to the website.

Cookie	Duration	Description
__Host-GAPS	2 years	This cookie allows the website to identify a user and provide enhanced functionality and personalisation.
fr	3 months	Facebook sets this cookie to show relevant advertisements to users by tracking user behaviour across the web, on sites that have Facebook pixel or Facebook social plugin.
NID	6 months	NID cookie, set by Google, is used for advertising purposes; to limit the number of times the user sees an ad, to mute unwanted ads, and to measure the effectiveness of ads.
test_cookie	15 minutes	doubleclick.net sets this cookie to determine if the user's browser supports cookies.

Cookie	Duration	Description
_cookie_id	session	No description available.
_scribd_session	3 years	No description available.
scribd_ubtc	100 years	No description available.
VISITOR_PRIVACY_METADATA	6 months	Description is currently not available.