12th édition – du 17 au 19 avril 2024
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
Vincent Bréhin
Adelean
Depuis 5 ans chez Adelean en tant que spécialiste des moteurs de recherche et des technologies connexes (NLP, data pipelines, crawling...) Apres un passé de développeur et architecte java, j'ai travaillé sur de nombreuses applications de e-commerce, de recherche documentaire et de gestion de contenus éditoriaux en tant que consultant métier, tech lead, développeur, architecte ou animateur d'une cellule d'expertise.
RAGtime : Discuter avec vos propres données
3H Hands-on Lab (INTERMEDIATE level)
Au-delà de la hype autour de ChatGPT, comment construire un moteur de recherche conversationnelle (aka “chatbot”) basé sur des données et documents qui doivent rester privés ? La solution est le RAG (Retrieval Augmented Generation). C’est le moteur de recherche qui va fournir un contexte vérifiable sur lequel se basera la génération des réponses du chatbot.
Elasticsearch, bien connu pour ses capacités de recherche par mots-clés a depuis plusieurs années intégré les "dense vectors" et la recherche sémantique, permettant une recherche et un scoring hybrides combinant ces deux approches. En parallèle, l'utilisation des LLM (Large Language Models) s'est démocratisée avec des orchestrateurs comme LangChain4J et des LLM accessibles et faciles à déployer avec Ollama.
Dans ce hands-on lab, après une introduction des principes de base, nous vous proposons de construire un chatbot sur un jeu de données d'entreprise et discuter avec lui ! Nous utiliserons Elasticsearch, Quarkus, LangChain4J et Ollama.
Toutes les informations techniques ainsi que les prérequis nécessaires pour participer à ce lab sont détaillés dans ce repo qui contient également le code qui sera utilisé : https://github.com/bdauvissat/ragtime
More
en_USEnglish