myScience
Zurich
Avant-hier
Stage ou mémoire de master
- 23 avril 2026
- 100%
- Zurich
Résumé de l'emploi
Stage ou mémoire de Master chez IBM Zurich, leader en recherche.
Tâches
- Contribuer à la conception de systèmes de données centrés sur l'agent.
- Développer des mécanismes d'apprentissage intersessions.
- Évaluer des systèmes basés sur des agents complexes.
Compétences
- Étudiant en Master en informatique ou domaine connexe requis.
- Compétences solides en programmation Python nécessaires.
- Connaissance des bases de données relationnelles requise.
Est-ce utile ?
À propos de cette offre
Stage ou mémoire de master
Lieu de travail Zurich - Région de Zurich - SuisseCatégoriePostePublié22 avril 2026Stage ou mémoire de master
Contexte
Les systèmes de données d’entreprise évoluent des architectures centrées sur les pipelines vers des systèmes centrés sur les agents, dans lesquels des agents basés sur des grands modèles de langage (LLM) interprètent l’intention de l’utilisateur et exécutent des opérations sur les données pour le compte de l’utilisateur. Contrairement aux approches traditionnelles basées sur des pipelines ETL prédéfinis et une orchestration statique, ces systèmes reposent sur un raisonnement adaptatif en plusieurs étapes et une utilisation dynamique des outils.
Ce changement introduit un certain nombre de défis fondamentaux. À mesure que le nombre d’outils disponibles et de capacités spécifiques aux tâches augmente, la gestion efficace du contexte de l’agent devient critique. De plus, les méthodologies d’évaluation établies basées sur la précision d’une seule requête ne suffisent plus à évaluer la qualité des flux de travail multi-étapes pilotés par des agents. En outre, permettre aux agents de tirer parti des interactions antérieures pour améliorer les performances et adapter le comportement aux utilisateurs individuels reste un problème de recherche ouvert.
Notre groupe développe des systèmes de données de nouvelle génération qui répondent à ces défis à l’intersection des LLM, de la gestion des données et de l’ingénierie des systèmes. Notre attention actuelle porte sur les opérations centrées sur les données, y compris la génération de données synthétiques, l’analyse autonome des données et la récupération de données inter-moteurs. Parallèlement, la conception sous-jacente du système vise à se généraliser au-delà de la gestion des données et à soutenir une classe plus large d’applications pilotées par des agents.
Votre rôle
Vous contribuerez à la conception, à la mise en œuvre et à l’évaluation de systèmes de données centrés sur les agents. Le poste offre une flexibilité dans la définition de la zone de concentration spécifique, tout en maintenant un lien étroit avec le développement et les activités de recherche en cours. Les domaines de travail typiques incluent :
Le poste offre l’opportunité de travailler à la fois sur des contributions orientées système et sur une évaluation empirique. Selon l’étendue du projet, les résultats peuvent contribuer au développement de produits ainsi qu’à des publications dans des conférences de premier plan.
Qualifications minimales
Qualifications préférées
Ce que nous offrons
Diversité & environnement de travail
IBM s’engage à promouvoir la diversité et l’inclusion sur le lieu de travail. Vous rejoindrez un environnement de recherche ouvert et multiculturel qui valorise les perspectives différentes et soutient des modalités de travail flexibles. Notre objectif est d’aider tous les genres et origines à s’épanouir professionnellement tout en maintenant un équilibre sain entre vie professionnelle et vie privée.
Comment postuler
Veuillez soumettre votre CV, une brève lettre de motivation (maximum une page) et votre relevé de notes académique. Si disponible, incluez des liens vers des projets pertinents ou des dépôts de code.
Systèmes de données centrés sur l’agent
Réf. 2026_014Contexte
Les systèmes de données d’entreprise évoluent des architectures centrées sur les pipelines vers des systèmes centrés sur les agents, dans lesquels des agents basés sur des grands modèles de langage (LLM) interprètent l’intention de l’utilisateur et exécutent des opérations sur les données pour le compte de l’utilisateur. Contrairement aux approches traditionnelles basées sur des pipelines ETL prédéfinis et une orchestration statique, ces systèmes reposent sur un raisonnement adaptatif en plusieurs étapes et une utilisation dynamique des outils.
Ce changement introduit un certain nombre de défis fondamentaux. À mesure que le nombre d’outils disponibles et de capacités spécifiques aux tâches augmente, la gestion efficace du contexte de l’agent devient critique. De plus, les méthodologies d’évaluation établies basées sur la précision d’une seule requête ne suffisent plus à évaluer la qualité des flux de travail multi-étapes pilotés par des agents. En outre, permettre aux agents de tirer parti des interactions antérieures pour améliorer les performances et adapter le comportement aux utilisateurs individuels reste un problème de recherche ouvert.
Notre groupe développe des systèmes de données de nouvelle génération qui répondent à ces défis à l’intersection des LLM, de la gestion des données et de l’ingénierie des systèmes. Notre attention actuelle porte sur les opérations centrées sur les données, y compris la génération de données synthétiques, l’analyse autonome des données et la récupération de données inter-moteurs. Parallèlement, la conception sous-jacente du système vise à se généraliser au-delà de la gestion des données et à soutenir une classe plus large d’applications pilotées par des agents.
Votre rôle
Vous contribuerez à la conception, à la mise en œuvre et à l’évaluation de systèmes de données centrés sur les agents. Le poste offre une flexibilité dans la définition de la zone de concentration spécifique, tout en maintenant un lien étroit avec le développement et les activités de recherche en cours. Les domaines de travail typiques incluent :
- Concevoir et mettre en œuvre des approches évolutives pour associer l’intention de l’utilisateur aux outils et capacités pertinents dans des environnements avec un ensemble large et en évolution continue de fonctionnalités disponibles
- Développer des mécanismes pour l’apprentissage inter-session, permettant à l’agent de capturer, structurer et réutiliser les connaissances opérationnelles (par exemple, comportement spécifique au fournisseur, modèles efficaces et solutions de contournement) afin d’améliorer l’efficacité et de s’adapter aux utilisateurs individuels
- Étudier l’exécution pilotée par agent à travers des systèmes de données hétérogènes, où une seule requête utilisateur nécessite des opérations coordonnées couvrant plusieurs types de plateformes de gestion des données
- Concevoir et évaluer des interfaces de plugins extensibles qui permettent de découvrir et d’intégrer dynamiquement des capacités de données tierces à l’exécution
- Établir des cadres d’évaluation pour les systèmes basés sur des agents, y compris la génération de données synthétiques et la définition de métriques qui capturent la justesse et la robustesse des flux de travail multi-étapes au-delà de la précision des requêtes isolées
Le poste offre l’opportunité de travailler à la fois sur des contributions orientées système et sur une évaluation empirique. Selon l’étendue du projet, les résultats peuvent contribuer au développement de produits ainsi qu’à des publications dans des conférences de premier plan.
Qualifications minimales
- Étudiant en master en informatique, science des données ou discipline apparentée
- Solides compétences en génie logiciel avec une expérience solide en Python
- Bonne compréhension des bases de données relationnelles et du SQL
- Familiarité avec les grands modèles de langage et leur application pratique
- Expérience avec les systèmes de contrôle de version (par exemple, Git) et les flux de travail de développement collaboratif
- Capacité à travailler de manière autonome sur des problèmes ouverts
- Excellentes compétences en communication écrite et orale en anglais
Qualifications préférées
- Expérience avec des systèmes basés sur LLM ou des cadres d’agents (par exemple, Model Context Protocol ou concepts similaires)
- Familiarité avec les systèmes et outils de données modernes (par exemple, DuckDB, Apache Arrow, Spark)
- Formation en ingénierie des données, traitement des requêtes ou intégration des données
- Expérience en benchmarking et évaluation de systèmes complexes
- Intérêt pour la combinaison du développement système avec un travail orienté recherche
Ce que nous offrons
- L’opportunité de travailler sur des systèmes de pointe à l’intersection des LLM et de la gestion des données
- Collaboration étroite avec des chercheurs et ingénieurs expérimentés dans un environnement axé sur la recherche
- Accès à une infrastructure LLM moderne et à des plateformes de données hétérogènes
- Opportunités de contribuer à des projets open source et à des publications de recherche
- Un environnement de travail flexible et collaboratif au sein d’une équipe internationale
Diversité & environnement de travail
IBM s’engage à promouvoir la diversité et l’inclusion sur le lieu de travail. Vous rejoindrez un environnement de recherche ouvert et multiculturel qui valorise les perspectives différentes et soutient des modalités de travail flexibles. Notre objectif est d’aider tous les genres et origines à s’épanouir professionnellement tout en maintenant un équilibre sain entre vie professionnelle et vie privée.
Comment postuler
Veuillez soumettre votre CV, une brève lettre de motivation (maximum une page) et votre relevé de notes académique. Si disponible, incluez des liens vers des projets pertinents ou des dépôts de code.
Dans votre candidature, veuillez mentionner myScience.ch et référencer JobID69703.