Article épinglé

Affichage des articles dont le libellé est IA. Afficher tous les articles
Affichage des articles dont le libellé est IA. Afficher tous les articles

vendredi 13 juin 2025

IA, dilution et context windows



La dilution du contexte actif est effectivement une cause majeure des erreurs progressives. Voici une explication précise, suivie de méthodes concrètes pour l’évaluer et la gérer.

Je retiens tiktoken, forte consommation de token si analyse de fichiers et si génération de fichiers, dilution du context windows et pour les classeurs la première ligne doit être une ligne d'en-tête...
Je note aussi que la traduction automatique de l'anglais vers le français est une mauvaise idée.

IA, Prompt Engineering et point d'étape

Image intéressante mais hors sujet ;)

L'histoire commence par une analyse du référentiel de STAV avec pour objectif la création d'un tableur listant les capacités et sous capacités des modules de cours et de pluris.
Le fil étant long, j'ai eu à un moment le petit message:

"Votre conversation devient longue. Nous vous recommandons de démarrer une nouvelle conversation pour des réponses de meilleure qualité."

Et après lecture du classeur j'ai eu la surprise de trouver des sous capacités manquantes... donc maintenant "Je doute, donc je suis." ;)))

Les raisons peuvent être selon l'IA:

🔁 1. Accumulation d'imprécisions par "effet téléphone arabe"

À chaque prompt et réponse, il y a une réinterprétation des données par l'IA. Si tu ne fournis pas à chaque étape les données originales comme référence (ou si elles ne sont pas parfaitement conservées dans le fil), l’IA reconstruit les données à partir de sa mémoire partielle de la conversation — ce qui introduit de petites erreurs. Ces erreurs s’accumulent à chaque itération, comme dans le jeu du téléphone arabe.

🧠 2. Perte de contexte ou simplification par l’IA

Même dans un fil continu, l’IA ne "relit" pas toute la conversation à chaque réponse. Elle utilise un résumé ou un contexte raccourci (appelé context window) pour traiter les nouvelles instructions. Si les données du premier classeur ne sont plus dans le contexte actif, l'IA ne peut plus s'y référer fidèlement, elle "redevine" des morceaux.

🗃️ 3. Reconstruction des documents plutôt que réutilisation directe

Si tu demandes : « Peux-tu réorganiser les données de ce classeur ? » mais que tu ne redonnes pas explicitement les données, l’IA recrée souvent le contenu à partir de son souvenir de ce qu’elle a généré — et non en copiant exactement les bonnes valeurs. Cela mène à des modifications involontaires : chiffres arrondis, colonnes oubliées, reformulations, etc.

📊 4. Erreurs liées au formatage et à la manipulation des fichiers

Quand tu demandes de générer un classeur ou de modifier des données dans un tableau, l’IA recrée souvent la structure de zéro. Si tu ne fournis pas le fichier original comme référence à chaque étape, l’IA risque :

  • d’oublier certaines lignes ou colonnes ;
  • de mal interpréter un format (dates, nombres, unités) ;
  • de faire des "inventions plausibles" à la place de valeurs exactes.

🧩 5. Changements de consignes implicites ou ambigües

Avec plusieurs itérations, certaines consignes peuvent devenir ambiguës, floues ou contradictoires. L’IA tente alors d’inférer ce que tu veux dire, et peut faire des hypothèses incorrectes, en altérant les données pour correspondre à une nouvelle logique perçue.


Les conseils de bonnes pratiques selon l'IA:

Voici quelques suggestions pratiques supplémentaires, inspirées de ton point 5 ("bonnes pratiques") :

🔄 Utiliser un "workflow modulaire" avec fichiers fixes

Travaille avec des fichiers de référence immuables à chaque étape :

  1. Entrée brute (originale) → toujours accessible et non modifiable.

  2. Sortie à chaque transformation, sauvegardée sous un nom ou horodatage différent.

  3. Comparaison automatique : demande systématique de diff ou de validation humaine entre étapes.

Tu peux même me demander :

“Compare ce tableau généré à celui d’hier (version du 12 juin) et liste uniquement les écarts numériques.”


🧪 Vérification croisée

Quand tu fais une série de modifications, introduis à mi-parcours une question de vérification comme :

“Peux-tu me redonner exactement la valeur de la cellule C7 du tableau original ?”
ou
“Quelle était la valeur initiale de la colonne 'Taux d’erreur' avant notre dernière modification ?”

Ça te permet de tester si le modèle a "perdu le fil" ou a reconstruit de mémoire approximative.


📎 Exemple d’approche structurée

Imaginons que tu travailles sur des tableaux de performance pour une entreprise :

  1. Prompt 1 → Fournis le tableau brut (via table ou fichier).

  2. Prompt 2 → Demande une extraction, sans transformation.

  3. Prompt 3 → Vérifie un sous-ensemble : "Reprends uniquement les lignes de janvier à mars."

  4. Prompt 4 → Applique une transformation (mise en forme, filtrage).

  5. Prompt 5 → Redemande le total ou une cellule critique du tableau de l’étape 2 → pour tester la fidélité.


Synthèse des sources d’erreurs cumulées:

ÉtapeType d’erreurImpact
1Mauvais header à la lecture Excel, la première ligne du classeur n'était pas une en-têteRupture du traitement en amont
2Réinjection partielle modules S3/S4 suite à un risque élevé que les pluris n'aient pas été recalculées mais simplement recopiées du fichier Aménagements vers le fichier ProductionPerte ou incohérence de matières
3Tri instable basé sur regex suite à la présence de sous-totaux intermédiaires présents dans les classeursOrdre incorrect + déstructuration
4Pas de vérification par aperçu ligne par ligne ou par différence, suite à une confiance "absolue et d'un bloc" Erreurs passées inaperçues
5Reprise du contenu de mémoire au lieu de relecture des fichiers sourcesDéformation des données

---

dimanche 2 février 2025

IA, carte mentale et python

 C'est possible!

Gemini me donne ceci en utilisant python et la librairie networkx ;) Ce qui tombe bien car en SNT nous en sommes aux Réseaux sociaux!


lundi 23 septembre 2024

IA et éducation, c'est la rentrée

Le constat

Une professeure de l'université de l'IUT Charlemagne de Nancy a refusé de corriger une centaine de copie, estimant que ses élèves avait trop utilisé ChatGPT. Ces derniers ne seront toutefois pas pénalisés.

https://www.radiofrance.fr/franceinter/les-eleves-utilisent-trop-chatgpt-une-professeure-refuse-de-corriger-les-copies-8706000

La réponse ?

L'entreprise Compilatio, basée à Annecy (Haute-Savoie), a mis au point un logiciel capable de corriger les copies des élèves, grâce à l'intelligence artificielle. Une innovation qui représente un vrai gain de temps pour les professeurs : ils passent en moyenne 125 heures par an et par classe sur les corrections.

jeudi 14 mars 2024

Comparaison d'IA - ChatGPT vs Copilot

De surveillance PIX je pose la question suivante à Copilot et ChatGPT:

Peux tu ajouter à 1h45 1/3 temps supplémentaire?

ChatGPT (OK)

Copilot (KO)

Pour ajouter 1/3 à 1h45, d'abord, convertissons 1h45 en minutes:

1 heure = 60 minutes

1h45 = 60 minutes + 45 minutes = 105 minutes

Maintenant, ajoutons 1/3 de 105 minutes à 105 minutes:

(1/3) * 105 minutes = 35 minutes

En ajoutant 35 minutes à 105 minutes, nous obtenons:

105 minutes + 35 minutes = 140 minutes

Maintenant, convertissons 140 minutes en heures et minutes:

140 minutes ÷ 60 minutes/hour ≈ 2 heures et 20 minutes

Donc, ajouter 1/3 à 1h45 donne environ 2 heures et 20 minutes.

Bien sûr ! Pour ajouter un tiers de temps à 1h45, nous pouvons effectuer le calcul suivant :

1h45 + 1/3 * 1h = 1h45 + 20 minutes

Donc, 1h45 plus un tiers d’heure équivaut à 2 heures et 5 minutes.

vendredi 1 mars 2024

IA et énergie - ça consomme


Lien vers le podcast: Le coût environnemental de l'IA est colossal et... sous-évalué

En 2019, une équipe de l'université du Massachusetts avait ainsi calculé que le simple entrainement d'une IA équivalait en termes de CO2 aux émissions de 205 aller-retour paris New York en avion. L'année dernière, une autre étude de l'université américaine du Colorado avait calculé que poser 25 questions à ChatGPT coûtait un demi-litre d'eau douce ; de quoi atteindre des millions de litres si vous multipliez cela par ses 200 millions d'utilisateurs de cet outil.

dimanche 17 décembre 2023

France Inter - IA selon Luc JULIA

Luc Julia, ingénieur et informaticien, directeur scientifique de Renault et co-créateur de l’assistant vocal Siri. Il a publié "L’intelligence artificielle n’existe pas" (First), et “Un français dans la Silicon Valley” (Kennes).

Lien vers l'émission

https://media.radiofrance-podcast.net/podcast09/13904-17.12.2023-ITEMA_23586897-2023F22640S0351-27.m4a

  • La simulation n'est pas l'intelligence 
  • Il y a toujours un homme qui pousse le bouton
    • La logique c'est des règles mises en place par l'homme
    • La statistique c'est le passé
  • Un robot, ça hallucine aussi ;)
  • L'IA n'est pas créative, elle génère par contre

vendredi 1 décembre 2023

ChatGPT, IPV6 et lecture du nombre d'IP possible

 Tout commence par une question en cours de SNT


Etant dans l'incapacité de lire ce grand nombre, nous sommes restés les bras ballants... mais après une nuit de sommeil, l'idée me vint de demander à ChatGPT. 

Pour lire notre discussion, lire la suite - mais je me rends compte qu'il y a toujours une erreur dans la réponse ;-(

jeudi 2 mars 2023

IA vulgarisation - Vidéo

Pour comprendre les principes du machine learning et la place cruciale que joue la maîtrise des jeux de données. Vidéo de la formation citoyenne à l'intelligence artificielle intelligente

https://classcode.fr/iai


dimanche 26 février 2023

BNF Gallica - La théorie de l'apprentissage de Vapnik et les progrès récents de l'intelligence artificielle : conférence du 4 avril 2018 / Yann Le Cun

 


La théorie de l'apprentissage de Vapnik et les progrès récents de l'intelligence artificielle : conférence du 4 avril 2018 / Yann Le Cun, aut. ; Yann Le Cun, participant

  • Présentation du concept de l'apprentissage - 12 min
  • Présentation de l'apprentissage supervisé -  19 min 30
  • Exemple de la première machine apprenante - Le Perceptron - 22 min 44
  • Présentation du concept des erreurs - 34 min
  • Cerveau et apprentissage, le débat - 42 min 50
  • Généralisation de l'apprentissage et complexité du modèle - 44 min 42
  • L'apprentissage profond et la pondération - 46 min 
    • réseau convolutif pour l'image, la parole...
    • Etat de l'art en 2018 - 51 min 45
    • Application médicale, voiture, etc...- 52 min 29
  • L'apprentissage renforcé - 53 min 30
  • Le grand défi - l'apprentissage non supervisé - 55 min 48
  • Questions  - 58 min 23
    • Intelligence générale
    • IA menace ? (réponse longue)
    • Conseil aux lycéens - 1h 08 min 

vendredi 6 janvier 2023

IA

 


https://www.radiofrance.fr/franceinter/podcasts/net-plus-ultra/net-plus-ultra-du-vendredi-06-janvier-2023-7791639

Après le succès de DALL-E, son générateur d’images par intelligence artificielle, la société américaine OpenAI continue d’être sur le devant la scène en dévoilant ChatGPT, un chatbot capable de répondre à vos questions et d’entamer une véritable conversation. Cela pourrait notamment être un sérieux concurrent de Google à l’avenir, puisque l’outil répond aux requêtes des internautes.