12th édition – du 17 au 19 avril 2024
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
Lucian Precup
Adelean
Lucian Precup est CTO de all.site - le moteur de recherche et assistant intelligent collaboratif développé à Station F. Avec ses collègues d’Adelean, Lucian développe des solutions pour l’indexation, la recherche et l’analyse de données. Lucian participe régulièrement à des conférences françaises et internationales spécialisées sur les moteurs de recherche et organise le Meetup Search, Data & AI à Paris.
Nous explorerons comment utiliser Elasticsearch et Hugging Face pour créer un assistant intelligent personnalisé. Nous utiliserons les modèles pour le traitement du langage naturel (NLP), les modèles open source de langage de grande taille (LLMs) et l’indexation et la recherche vectorielle. Elasticsearch, moteur de recherche avancé et base de données NoSQL, permet d'indexer et d'analyser des données de manière efficace, tandis que Hugging Face offre une plateforme collaborative pour le développement et le déploiement de modèles de machine learning open source. Cette session approfondira la manière d'intégrer ces deux technologies pour construire des assistants intelligents sur mesure. Les participants auront l'occasion d'apprendre à travers des exemples concrets et des prototypes, de comprendre les subtilités des modèles de langage naturel disponibles sur Hugging Face, de revisiter les fonctionnalités d'Elasticsearch et de découvrir comment ces outils peuvent être combinés pour créer des versions personnalisées d'assistants intelligents comme ChatGPT.
More
Apache Lucene a soufflé ses vingt-deux bougies en septembre dernier, un voyage qui continue d'impacter profondément le monde des technologies Search et Data. Lucene est le moteur derrière des géants comme Elasticsearch, OpenSearch, Apache Solr, ou encore le récent Atlas Search de MongoDB. Son intégration dans de nombreux autres projets Open Source, tels que Apache Nutch - le pionnier des web crawlers et précurseur d'Hadoop, et Apache Cassandra - la base de données NoSQL la plus scalable, témoigne de son influence étendue. Utilisé dans des milliers de projets d'entreprise, y compris par des leaders comme LinkedIn et Twitter, Lucene bénéficie d'une base d'utilisateurs solide et diversifiée.
La conférence se plongera dans l'évolution de Lucene, depuis son index inversé essentiel pour le traitement du texte, jusqu'aux innovations récentes qui reflètent une avancée technologique constante. Pour conclure, nous aborderons les dernières fonctionnalités de Lucene : l'indexation des vecteurs et la recherche vectorielle, qui créent une synergie puissante avec l'intelligence artificielle générative, ouvrant des horizons inédits pour l'avenir de la recherche de données.
More
en_USEnglish