Die Bard-KI von Google kann jetzt Code schreiben und ausführen, um eine Frage von Ars Technica zu beantworten
Es kann Language Large Models (LLMs) wie ChatGPT und Google Bard bereitstellen manche Gute Antworten auf bestimmte Arten von Fragen, aber ironischerweise sind diese Computer ziemlich schlecht im Rechnen. Google hat eine neue Lösung für den Versuch, Sprachmodelle dazu zu bringen, einfache Aufgaben wie Mathematik zu erledigen, richtig: Holen Sie sich KI Schreiben Sie ein Programm. Google sagt, dass, wenn Sie dem Bard jetzt eine „Rechenaufgabe“ wie Mathematik oder String-Manipulation stellen, statt die Ausgabe eines Sprachmodells anzuzeigen, dieses Sprachmodell stattdessen ein Programm schreibt, dieses Programm ausführt und dann die Ausgabe davon anzeigt als Antwort an den Benutzer senden.
Ein Google-Blogbeitrag liefert ein Beispiel für einen Eintrag, der „das Wort ‚Lollipop‘ für mich umkehrt“. ChatGPT dreht diese Frage um und gibt die falsche „pillopoL“-Antwort, weil Sprachmodelle die Welt in Wortteilen oder „Symbolen“ sehen und darin nicht sehr gut sind. Hier ist eine Beispielausgabe von Bard:
Sie erhalten die korrekte Ausgabe als „popilloL“, aber was noch interessanter ist, ist das auch Enthält Python-Code Ich habe geschrieben, um die Frage zu beantworten. Das ist großartig für Programmierinteressierte, um zu sehen, was sich hinter der Haube verbirgt, aber wow, für normale Leute ist das wahrscheinlich der gruseligste Ausweg von allen. Es ist auch nicht besonders relevant. Stellen Sie sich vor, Gmail würde Ihnen einen Codeblock anzeigen, als Sie gerade darum gebeten haben, die E-Mail abzurufen. Es ist komisch. Erledigen Sie einfach die Arbeit, die Sie erledigen sollen, cool.
Google vergleicht ein KI-Modell, das ein Programm schreibt, mit Menschen, die lange Divisionen durchführen, da es sich dabei um eine andere Denkweise handelt:
Dieser Ansatz ist von einem gut untersuchten Dualismus in der menschlichen Intelligenz inspiriert, der speziell in Daniel Kahnemans Buch behandelt wird Schnelles und langsames DenkenTrennen Sie das Denken von „System 1“ und „System 2“.
- System-1-Denken ist schnell, intuitiv und einfach. Wenn ein Jazzmusiker auf der Stelle improvisiert oder wenn jemand an ein Wort denkt und zusieht, wie es auf dem Bildschirm erscheint, verwendet er das System-1-Denken.
- Im Gegensatz dazu ist das Denken in System 2 langsam, bewusst und mühsam. Wenn Sie lange Divisionen durchführen oder lernen, ein Instrument zu spielen, verwenden Sie System 2.
In dieser Analogie kann davon ausgegangen werden, dass das LLM nur unter System 1 arbeitet – es produziert schnell, aber ohne viel Nachdenken einen Text. Dies führt zu einigen erstaunlichen Fähigkeiten, kann jedoch auf erstaunliche Weise zu kurz kommen. (Stellen Sie sich vor, Sie versuchen, ein mathematisches Problem allein mit System 1 zu lösen: Sie können nicht aufhören und rechnen, Sie müssen nur die erste Antwort aufschreiben, die Ihnen in den Sinn kommt.) Klassische Berechnungen sind eng mit System verknüpft 2 Denken: Es ist eine Formel und ein unflexibler Prozess, aber die richtige Abfolge von Schritten kann zu beeindruckenden Ergebnissen führen, wie z. B. langen Divisionslösungen.
Laut Google wird die „Code on the Fly“-Methode auch für Fragen wie „Was sind die Primfaktoren von 15.683.615?“ verwendet. und „Berechnen Sie die Wachstumsrate meiner Ersparnisse.“ Das Unternehmen sagt: „Bisher haben wir gesehen, dass diese Methode die Genauigkeit von Bards Antworten auf rechnerische Wort- und Mathematikprobleme in unseren internen Herausforderungsdatensätzen um etwa 30 % verbessert.“ Wie üblich warnt Google Bard, dass „Sie es möglicherweise nicht richtig machen“, weil Sie Ihre Frage falsch interpretiert haben oder einfach, wie wir alle, Code geschrieben haben, der nicht beim ersten Mal funktioniert.
Bard codiert gerade schnell die Antworten, wenn Sie es unter bard.google.com ausprobieren möchten.