AGI - künstliche allgemeine Intelligenz und ASI - künstliche Superintelligenz

    This site uses cookies. By continuing to browse this site, you are agreeing to our Cookie Policy.

    • Manni5 wrote:

      ChatGPT formuliert die Antworten auf meine Fragen selbständig.

      Selbständig handeln kann ChatGPT darüberhinaus nicht.
      Das muss es auch nicht, denke ich.

      Eine "K.I." handelt selbständig in dem für sie geschaffenen Rahmen, glaube ich.

      Wenn nun also einer "K.I." gesagt wird (darauf trainiert wird): "Handele diese ministerialen Entscheidungen selbständig ab!", dann ist dies absolut kein Science-Fiction-Szenario mehr sondern bereits technisch mögliche Realität, behaupte ich mal.

      Deswegen ist es so wichtig darauf zu achten, welche Wahl wir treffen, da bestimmte Repräsentant:innen darauf hinarbeiten werden "K.I."-geführte Ministerien (und andere Institute) zu schaffen, könnte ich mir vorstellen.

      Dafür muss es keine AGI sein, dafür reicht ein trainierbares LLM, meine ich.

      Manni5 wrote:

      Ich denke, das Programm Diella kann vorgegebene Verwaltungsprozedere und Routinen überprüfen [...] aber nicht als "Minister" agieren.
      Deine Prognose wird ja nun vielleicht überprüft. Mal schauen, wie es weitergeht.

      The post was edited 1 time, last by din ().

    • din wrote:



      Wenn nun also einer "K.I." gesagt wird (darauf trainiert wird): "Handele diese ministerialen Entscheidungen selbständig ab!", dann ist dies absolut kein Science-Fiction-Szenario mehr sondern bereits technisch mögliche Realität, behaupte ich mal.

      Hast Du irgendwelche Referenzen oder Belege, die für Deine Aussage sprechen?

      Ich denke, dies ist zur Zeit technisch nicht möglich, allenfalls das Überprüfen von Verwaltungsprozedere.

      Eine LLM geht abgespeicherte Versionen des Internets durch, hat aber keine Strategien für komplexe Entscheidungsfragen.
      Das Finden von Strategien wird derzeit weiter am DeepMind Research-Institut in UK erforscht
      (siehe mein vorheriger Post), und zwar zunächst noch an komplexen Spielen.

      Ein weiterer Grund: Microsoft und OpenAI hatten eine Diskussion, wann OpenAI sagen kann,
      dass sie eine AGI entwickelt haben (das hätte vertragliche wirtschaftliche Konsequenzen).
      Da eine genaue Definition von AGI schwierig ist, einigten sie sich auf ein einfaches finanzielles Kriterium:
      Eine AGI ist entwickelt, sobald diese einen Profit von mindestens 100 Milliarden Dollar erzeugt.

      Davon ist OpenAI weit entfernt: für 2024 wurde für OpenAI ein Verlust von 5 Milliarden Dollar erwartet.

      heise.de/en/news/General-artif…a-price-tag-10220909.html

      Und ministeriale Entscheidungsfragen sind noch mal Stufen komplexer.
    • Manni5 wrote:

      Hast Du irgendwelche Referenzen
      Aus der von Meffi verlinkten Quelle:

      "[...] „Diella“ wurde bislang als digitaler Chatbot auf staatlichen Seiten eingesetzt. [...]

      Dass ein KI-Wesen administrative Entscheidungen treffen soll, halten Experten und die Opposition für bedenklich. [...]" ... also nicht für unmöglich sondern für bedenklich.

      https://www.srf.ch/news/international/empoerung-bei-der-opposition-ki-chatbot-diella-als-neue-ministerin-albaniens wrote:

      [...] Rein technisch wären heutige KI-Systeme aber in der Lage, eng umrissene Aufgabenkataloge zu übernehmen [...]
      Keine Ahnung, wie seriös der SRF ist.

      Aber stimmt schon. Bis zur Letztentscheidung durch eine "K.I." wird es wohl noch etwas dauern:

      https://media.ccc.de/v/2024-381-besser-natrlich-dumm-als-knstlich-intelligent-ber-generative-ki-sie-werden-enttuscht-sein wrote:

      [...] Algorithmen schreiben Quellcode, komponieren Musikstücke, verfassen wissenschaftliche Artikel. [...] KI versucht zu "gefallen", wie ein Schüler, der versucht, auf eine Frage, die er nicht beantworten kann, eine plausible Antwort zu geben, die seinem Lehrer gefällt. Die KI kümmert sich nicht um ethische oder rechtliche Fragen. Wenn sie nicht "gezähmt" wird, kann sie zu einer Gefahr werden, die nicht mehr kontrolliert werden kann. Generative KI kann Existenzen zerstören - sei es durch "halluzinierte Informationen über Menschen", sei es im militärischen Bereich, wo sie bereits eine weitaus größere Rolle spielt als angenommen. Generative KI optimiert nicht nur Logistik- und Produktionsprozesse. Generative KI kann auch die militärische Strategieplanung übernehmen und militärische Operationen steuern, von Sabotageakten bis hin zur eigenständigen Auswahl von Zielen und der Wahl geeigneter Waffensysteme. Auch in der Wirtschaft tragen Algorithmen zunehmend zu Geschäftsentscheidungen bei. Von automatisierten Bewerbungsverfahren bis hin zu Portfoliostrategien und Marketingkampagnen.
      [...] noch trifft der Mensch die letzte Entscheidung - aber wie lange noch?
      Der Referent wird versuchen, anschaulich zu erklären, warum generative KI weder intelligent noch kreativ ist und warum Algorithmen zwar die Rolle des Co-Piloten, sogar des Autopiloten, aber niemals die Rolle des Flugkapitäns übernehmen können.
      Allerdings: Wenn die das alles jetzt schon können, wie lange wird es dann wohl noch dauern für "einfache" ministeriale Entscheidungen?

      https://media.ccc.de/v/c4.openchaos.2024.06.kuenstliche-intelligenz wrote:

      In dieser umfassenden Einführung werden wir die grundlegenden Fragen klären:
      Was ist KI?
      Woher kommt sie?
      Wie funktioniert KI eigentlich?
      Wie funktionieren Large Language Models?
      Was sind die Risiken von KI?
      Was bringt KI in der Zukunft?
      Von den historischen Meilensteinen bis hin zu den modernen großen Sprachmodellen wie GPT-4 werden wir die Entwicklungen und das Potenzial der KI durchleuchten. Wir werden nicht nur die technische Seite beleuchten, sondern auch einen Blick in die Zukunft werfen: Was kann KI in den kommenden Jahren für unsere Gesellschaft leisten?
    • Es kommen Fragen auf, ob der KI-Hype und der Bau riesiger Rechenzentren,
      sogar mit Anlagen zur eigenen Energieversorgung, wirtschaftlich gesehen eine Blase ist, die bald (?) platzt.

      "Laut einer Analyse des MIT können 95 Prozent aller befragten Organisationen keine messbare Rendite aus ihren KI-Investments ziehen."

      Dies und mehr Details in:

      n-tv.de/wirtschaft/Der-KI-Hype…lase-article26071975.html

      Habe ChatGPT gefragt: Werden sich die Investitionen in neue KI-Rechenzentren wirtschaftlich lohnen?

      Antwort von ChatGPT:

      "Das ist eine ausgezeichnete und komplexe Frage — und die Antwort hängt stark davon ab,
      welche Art von KI-Rechenzentrum, welches Geschäftsmodell und welchen Zeithorizont man betrachtet."

      [...]

      "5. Fazit (Stand 2025)

      Kurz- bis mittelfristig (2025–2028):
      Investitionen in KI-Rechenzentren lohnen sich sehr wahrscheinlich,
      solange Nachfrage, GPU-Knappheit und Softwareexplosion anhalten.

      Langfristig (ab 2029):
      Die Rendite wird stark variieren. Anbieter mit nachhaltiger Energieversorgung, effizienter Architektur und Integration in KI-Ökosysteme (OpenAI, Anthropic, Google DeepMind, etc.) werden bestehen.
      Andere riskieren eine Überkapazitätskrise ähnlich wie im Telekom- oder Cloud-Sektor vergangener Jahrzehnte."

      ********

      Die Hoffnung war, dass die schnelle und unglaublich erfolgreiche Entwicklung weiter geht und zu AGIs führt.
      Aber mir scheint, nun ist mit der LLM-Nutzung des Internets eine Schranke erreicht,
      und die Verwendung von Expertenwissen wird wichtiger.
      Das verlangt aber natürlich die Mitwirkung dieser Experten -- damit dauern weitere Verbesserungen länger.
    • Wie oben dargestellt AGI - künstliche allgemeine Intelligenz und ASI - künstliche Superintelligenz,
      hat DeepMindResearch mit Googles KI Gemini 2.5, aufgewertet durch DeepThink,
      bei der Internationalen Mathematik-Olymiade IMO im Juli Resultate erzielt, die einer Goldmedaille entsprechen.

      Nun haben sie auch am internationalen Programmierwettbewerb
      International Collegiate Programming Contest World Finals (ICPC 2025) teilgenommen.

      Teilnehmer waren fast 140 Teams aus über 50 Ländern, die sich über vorherige Wettbewerbe qualifizieren mussten.
      Während die IMO-Teilnehmer exzellente Schüler sind, aber keine Studenten sein dürfen,
      sind beim ICPC auch Studenten zugelassen.
      Der ICPC gilt als der weltweit angesehenste Programmierwettbewerb auf Universitätsniveau.

      Von den 139 Teams erreichten nur 4 Teams die Goldmedaille.

      Eine aufgewertete Version von Gemini 2.5 Deep Think hat auch hierbei wieder Goldmedaillen-Resultate erzielt.
      Es hätte sogar Rang 2 entsprochen.
      Dabei lösten sie auch ein Problem, das keines der offiziellen Teilnehmerteams lösen konnte.

      Eine Besprechung:

      deepmind.google/discover/blog/…ing-contest-world-finals/

      Offenbar hat OpenAI's GPT-5 (mit einer Aufwertung, über die wenig bekannt ist) sogar alle Probleme gelöst,
      hätte damit noch besser abgeschnitten als Gemini 2.5 Deep Think.

      venturebeat.com/ai/google-and-…tition-show-enterprise-ai

      siliconangle.com/2025/09/17/op…ores-icpc-coding-contest/

      The post was edited 2 times, last by Manni5 ().

    • Wie beschrieben, ist der Weg zu AGI oder gar ASI noch sehr lang.

      Mathematik ist hierfür grundlegend, da mit Mathematik die Gesetze der Physik bis zur Logik der Informatik exakt beschrieben werden können.

      Google und Google's Tochterfirma DeepMind Research haben nun eine
      "KI für Mathematik"-Initiative (AI for Math initiative) gegründet.

      Ihr gehören 5 weltführende Institutionen an:

      - Imperial College London (UK)
      - Institute for Advanced Study (Princeton, USA)
      - Institut des Hautes Études Scientifiques (Frankreich)
      - Simons Institute for the Theory of Computing (UC Berkeley)
      - Tata Institute of Fundamental Research (Mumbai, Indien)

      Das Ziel ist herauszufinden, welche mathematischen Probleme mit Hilfe von KI bearbeitet werden können.

      DeepMind Research stellt diesen Institutionen ihre top-KIs zur Verfügung,
      inkl. Gemini Deep Think, AlphaEvolve und AlphaProof,
      und Google gibt Geld (wie viel, wurde nicht bekannt gegeben).

      blog.google/technology/google-deepmind/ai-for-math/?
    • https://media.ccc.de/v/2025-11-15-erklarbare-ki-3a-warum-und-wie-3f wrote:

      Erklärbare KI: Warum und wie?

      Warum man in neuronale Netze hineinschauen sollte und wie es geht.

      Neuronale Netze (DNNs) wie ChatGPT findet man dank ihrer guten Performanz inzwischen in vielerlei Bereichen, nicht nur im privaten sondern auch in ethisch relevanten Anwendungsgebieten wie medizinische Diagnostik und autonomem Fahren. Gleichzeitig werden Stimmen laut, dass die Entscheidungen von DNNs nachvollziehbar, und die genutzte KI „transparent“ sein müssen – inzwischen sogar teils gesetzlich vorgeschrieben. Aber was heißt das eigentlich, warum ist das tatsächlich wichtig und sinnvoll, und wie kann man das schon heute angehen?

      In diesem Vortrag gehen wir diesen Fragen auf den Grund: Nach einem Crash-Kurs zu DNNs und deren Eigenschaften, leiten wir ab, was so alles bei DNN-basierten Entscheidungen schief gehen kann. Danach stelle ich beispielhaft Methoden aus meinem Forschungsbereich vor, der Erklärbaren Künstlichen Intelligenz. Die erlauben es, in DNNs hineinzuschauen und gelerntes sowie deren Entscheidungen besser nachzuvollziehen. Auch wenn es noch ein langer Weg zur adäquat transparenten künstlichen Intelligenz ist, soll der Ausflug dabei helfen, angemesseneres Vertrauen (also weder zu wenig aber auch nicht zu viel) in aktuelle DNN-basierte Anwendungen zu entwickeln. Und vielleicht lässt sich der eine oder die andere auch dazu inspirieren, selbst DNNs in Zukunft auf den Zahn zu fühlen. [...]
    • Demnächst dann also K.I.-Anwältinnen:

      https://www.lto.de/recht/hintergruende/h/ki-agenten-juristischer-alltag-wir-werden-alle-fuehrungskraefte wrote:

      [...] KI-Chatbots sind toll: Frage rein, Antwort raus. Dabei bleibt es aber nicht: KI-Agenten, die eine gestellte Aufgabe selbstständig lösen, sind das nächste große Ding [...]

      Wir leben in spannenden Zeiten. Seit etwas mehr als drei Jahren ist der Begriff der Künstlichen Intelligenz im Alltag der meisten Juristen angekommen. [...]

      KI-Agent: Persönlich zugeschnittenes Helferlein

      Das aktuelle Zauberwort heißt KI-Agent. Während ein klassischer Chatbot meist nur auf Fragen antwortet, ist ein KI-Agent dazu da, selbstständig Ziele zu verfolgen und ganze Aufgaben vollständig zu erledigen.

      Ein Chatbot kann beispielsweise sagen, wo man im März in Europa am besten Urlaub machen kann, wohingegen ein KI-Agent gleich die ganze Reise, inklusive Flügen und Hotelübernachtungen, bucht, einen ausführlichen Reiseplan mit Wegbeschreibungen erstellt und auch direkt für abends einen Tisch in einem Restaurant mit der besten Weinkarte reserviert. Soweit zumindest die Theorie.

      In der Praxis sieht es bisher in der Regel noch nicht ganz so beeindruckend aus. Zumindest für die meisten Durchschnittsnutzer. Wer aber schon einmal selbst mit OpenAI Codex, Claude Cowork oder auch OpenClaw (früher: Moltbot, davor: Clawdbot) experimentiert hat, sieht am Horizont eine neue Arbeitswelt aufziehen.

      Die Ära des reinen Frage-Antwort-Spiels mit den KI-Chatbots neigt sich wohl langsam schon wieder dem Ende zu, denn wir treten gerade schon in die nächste Phase ein, in der KI nicht mehr nur ein bloßes Werkzeug ist, das auf unsere einzelnen Befehle wartet, sondern ein Agent, der eigenständig für uns arbeitet – auch in der Juristerei.

      Wenn dann beispielsweise demnächst eine Klage eingeht, reicht man die direkt mit ein paar Instruktionen an den passenden KI-Agenten weiter und bittet um Sichtung, Bewertung und Erstellung der gesamten Klageerwiderung. Alles in einem Schritt. Erst wenn das erledigt ist, liest man vielleicht die Klage einmal selbst, kontrolliert den automatisch erstellten Entwurf der Erwiderung und unterschreibt diesen dann, wenn man keine Änderungswünsche (oder keine Zeit) mehrhaben sollte. [...]

      Dieser Wandel wird tiefgreifend sein, weil er eine neue Qualität der Führung und des Managements von uns verlangt. Ein KI-Agent trifft nämlich eigene Entscheidungen, um ein von uns gesetztes Ziel zu erreichen. Das erfordert von unserer Seite also vor allem die Fähigkeit, klare Ziele zu definieren und den Rahmen abzustecken, in dem sich der KI-Agent bewegen soll. [...]

      Es geht in Zukunft wahrscheinlich weniger darum, wer die neuesten Prompts auswendig gelernt hat oder wer insgesamt am fleißigsten ist. Es wird darum gehen, wer die beste Arbeitsstrategie für die KI-Agenten entwirft, diese bei der Arbeit angemessen beaufsichtigt und die Ergebnisse der KI dann am kritischsten kontrollieren kann.

      Wir sollten also lernen, die neuen KI-Agenten als "digitale Kollegen" zu begreifen, die aktiv geführt werden wollen, statt sie nur als passives Werkzeug zu betrachten. Unsere Rolle als Juristen – egal in welcher Position – verschiebt sich damit langsam weg vom Operativen und immer mehr hin zum Strategischen.

      Das klingt vielleicht auf den ersten Blick nach einer Entlastung, ist aber in Wahrheit eine viel anspruchsvollere Aufgabe.
    • Zum derzeitigen Stand ein persönlicher Bericht eines KI-Entwicklers und Software-Ingenieurs über
      Gemini 3 Deep Think, das kürzlich herauskam. Mit Elo-Rating im Programmieren ...

      Auszüge; Erfolge, Misserfolge, Preis, Folgerungen:

      "Humanity's Last Exam — Deepthink erzielte etwa 48% ohne Werkzeugzugang.
      Für den Kontext: Die bisherigen besten Ergebnisse lagen in den niedrigen 30ern.

      Codeforces gab Deepthink ein ELO-Rating von 3.455.
      Mein eigenes Rating schwebt um 1.400 an einem guten Tag.
      Ein ELO von 3.455 platziert Deepthink im oberen Bruchteil eines Prozents aller kompetitiven Programmierer, die je teilgenommen haben.

      Ark AGI 2 [Test zur Messung abstrakter Denkfähigkeit, M5]: Deepthink erzielte 84,6, unabhängig verifiziert von der ARK Prize Foundation. Die menschliche Basislinie auf diesem Test liegt unter 84,6. Lies das nochmal."

      Internationale Mathematikolympiade: Goldmedaillen-Niveau"

      [...]

      "Wo Deepthink Stolperte

      SVG-Generierung war enttäuschend. Ich bat um einen fotorealistischen Schmetterling im SVG-Format.
      Was zurückkam war ... in Ordnung.

      Landing-Page-Design war gut, aber nicht außergewöhnlich.

      Kontextfensterdruck war real. Bei den längeren Generierungen bemerkte ich gelegentliche Inkonsistenz bei der Benennung von Variablen.

      Geschwindigkeit ist nicht seine Stärke.
      Deepthink ist langsam im Vergleich zu Standard-Gemini 3 oder Claude Sonnet."

      "Der Einführungspreis beträgt ungefähr $125 pro Monat für die ersten drei Monate.
      Danach schaust du auf ungefähr $250 monatlich."

      "Das Wettrüsten zwischen Google, Anthropic und OpenAI hat gerade gewechselt
      von "wer hat das beste allgemeine Modell" zu "wer hat das beste Denkmodell." [...]

      Die praktische Implikation für Entwickler:
      Die Modelle, mit denen du heute baust, werden in ihren Denkfähigkeiten innerhalb von 12-18 Monaten veraltet sein.
      Entwerfe deine KI-integrierten Systeme mit austauschbaren Modellschichten."

      mejba.me/de/blog/gemini-3-deepthink-tested

      Von AGI sind wir noch weit entfernt.
      Aber die LLMs können auch Experten bei technischen Aufgaben helfen.
    • Wie weit sind wir von AGI oder ASI im Bereich der Mathematik entfernt?

      Maryna Viazovska hat 2014 das Kepler-Problem zu Kugelpackungen im 8 und 24 Dimensionen gelöst;
      sie erhielt 2022 hierfür die Fields-Medaille.

      Wen es interessiert: etwas Hintergrund findet sich in Matheaufgabe

      Ihre Arbeit für den Fall von 8 Dimensionen in den "Annals of Mathematics" hat 25 Seiten, siehe

      webhomes.maths.ed.ac.uk/~v1ranick/papers/viazovska1.pdf

      Für diesen Beweis wurde kürzlich ein Computer-Beweis mit LEAN entwickelt.
      Er hat 200.000 Zeilen; das Programm "Gauss" der Firma Math,Inc. brauchte hierfür 1 Woche.
      Hinzu kommt jedoch noch Vorbereitung durch Experten. Siehe

      Matheaufgabe

      Eines der tiefsten Resultate der Mathematik, ich denke, sogar das tiefste, ist die
      *Klassifikation der endlichen einfachen Gruppen*.

      Der gesamte Beweis wird auf ca. 15.000 Seiten geschätzt.
      Ein laufendes großes Projekt möchte dies auf ca. 5.000 Seiten herunter bringen und systematisch komplett darstellen.
      Hierzu sind 10 Bände erschienen; es fehlen jedoch noch ca. 5 Bände, die länger dauern, daher werden es über 5.000 Seiten.

      en.wikipedia.org/wiki/Classification_of_finite_simple_groups

      Wenn man diese 5.000 Seiten hätte, könnten 4 Computer der Firma Math,Inc. für die Formalisierung bei obigem Tempo grob und optimistisch geschätzt 1 Jahr brauchen.
      Das würde sich riesig lohnen und sieht doch machbar aus.
      Aber es gibt die folgenden Probleme:

      1. Die 5.000 Seiten verwenden sehr unterschiedliche Methoden; bei der Formalisierung des Resultats von Viazovska war es ein Paper.

      2. Diesen vollständigen Beweis gibt es ja noch gar nicht.
      Selbst die Experten haben Probleme, die vorliegende Reihe von Bänden zu vervollständigen.
      Erst wenn das vorliegt, könnte Math,Inc. damit anfangen zu arbeiten.

      3. Es ist völlig illusorisch, dass ein Computer dies selber vervollständigen könnte.
      Es ist bereits sensationell, wenn Computer exakt vorliegende Beweise genau formalisieren können.

      Daher sind wir von AGI oder ASI im Bereich der Mathematik weit entfernt;
      diese sollen ja sogar neue eigene Konzepte entwickeln und zu Weiterentwicklungen führen.
      Entsprechend in Physik, Chemie, u.a.
    • Anthropic wird sein neues Modell "Claude Mythos review" vorläufig nicht freigeben.

      Dieses Modell sei derart stark im Bereich Codierung, dass es diverse Sicherheitslücken
      in Betriebssystemen und verbreiteten Programmen aufspüren und ausnutzen könne.

      Daher stellt Anthropic dieses Programm zunächst Firmen wie Microsoft, Apple, Amazone u.a.
      im Ramen eines Projekts "Project Glasswing" zur Verfügung, damit sie diese Sicherheitslücken ausmerzen
      und sich auf zukünftige Attacken vorbereiten können.

      thehill.com/policy/technology/…-new-ai-dangerous-public/

      Eine Beschreibung durch Anthropic:

      red.anthropic.com/2026/mythos-preview/
    • Gemini DeepThink hilft sehr angesehenen Mathematikern in der Forschung beim Finden
      von Teilresultaten und Beweisen.

      Es geht um ein neues Resultat in algebraischer Geometrie.
      Auf diesem Gebiet können sich Mathematikstudenten in ihrem Hauptstudium spezialisieren.
      Das Resultat könnte sicher wesentlicher Teil einer Dissertation (Dr.-Arbeit) sein.

      Der Präsident der Amerikanischen Mathematischen Gesellschaft (AMS), Professor an der Elite-Uni in Stanford,
      schreibt, dass er sehr froh wäre, wenn er diesen Beweis so gefunden hätte.

      Der Artikel:

      officechai.com/ai/the-kind-of-…em-in-algebraic-geometry/

      Die Publikation (Preprint im arXiv, noch nicht referiert),
      die im Anhang auch die Prompts für die Engine und ihre Antworten enthält:

      arxiv.org/pdf/2601.07222

      Die Mathematiker gaben Hintergrundinformationen, stellten der KI konkrete Fragen,
      ließen sie dann arbeiten, reagierten auf die Antwortvorschläge.
      Dabei schlugen sie anzustrebende Zwischenresultate und eine Beweisstrategie vor.
      In etwa so, wie ein Professor mit einem sehr guten Promovenden agiert.
      Damit erstellte die KI den vollständigen Beweis.

      Es geht u.a. um Möbius-Funktionen und Polynome in Polynomringen über endlichen Körpern.

      Ein Ausschnitt von Seite 3, übersetzt mit DeepL:

      „Der Beweis wurde durch eine iterative Mensch-KI-Interaktion folgender Art erbracht. ...“

      „... es scheint wahrscheinlich, dass die Möglichkeit, auf diesen Argumenten aufzubauen,
      das Problem für die KI-Systeme leichter lösbar machte als einige andere Forschungsprobleme.
      Allerdings erscheinen die Modellausgaben (wie die in Anhang C) den Autoren nicht besonders nah
      an diesen oder (nach bestem Wissen) anderen bereits bestehenden Quellen.

      Sofern also keine zukünftigen Entdeckungen das Gegenteil beweisen,
      scheint der Beitrag des Modells eine echte Kombination aus Synthese, Abruf,
      Verallgemeinerung und Innovation dieser bestehenden Techniken zu beinhalten.“
    • https://www.youtube.com/watch?v=Hxzfvz1zyos wrote:

      [...] Ja, man hat eben verstanden, dass man mit den mathematischen Methoden der KI Forschung Kreativität, primär Kreativität modelliert. Also die klassische Frage, die ich für inzwischen obsolet und gerade zu aberwitzig halte, aber wir haben es lange diskutiert: Kann eine KI kreativ sein? Die Antwort lautet: Was denn sonst? Ja, eine KI ist Kreativität. Ja, natürlich kann die kreativ sein.

      Die ist Kreativität. Die schafft unablässig Neues. Ja, im semantischen Feld aber nicht nur, im Audio, Video und sonstigen Bereichen auch. Ja, optisch ganz genau, also entlang sehr vieler Sinnesmodalitäten und natürlich mathematisch, ja, weil die automatisierten Verfahren, die innerhalb dann des KI Systems ablaufen, sind auch hochkreativ. Das heißt, im Grunde genommen haben wir die Mathematik der Kreativität im Universum gefunden. [...]

      Ich weiß nicht, ob du es gestern zufällig gesehen hast. In den Tagesthemen war ein, ich fand nicht sehr gutes, Interview mit Roland Emmerich. Und Roland Emmerich also arbeitet an einem neuen Film. Er hat ein Drehbuch geschrieben und versucht das jetzt mit realen Schauspielern, [...] aber auch mit KI umzusetzen und experimentiert jetzt mit KI Modellen, die offensichtlich noch nicht veröffentlicht sind, zu denen er aber Zugang hat. Und ich fand das wirklich interessant, wie er rumgeeiert ist, im Grunde genommen sich dagegen zu wehren, zu sagen: "Die eigentliche Kreativität, also der eigentliche Impuls kommt von der KI. Ich als sozusagen kreativer Regisseur hab es da mit was anderem Kreativen zu tun und ich muss mich im Grunde genommen sehr, sehr bemühen, meine eigene Kreativität in diesem kreativen Umfeld von KI überhaupt noch zu definieren.". [...]


      The post was edited 3 times, last by din ().

    • In den USA (und offenbar auch bei uns) stellen grosse Software-Firmen weniger junge Absolventen ein,
      da ein einzelner etablierter, führender Mitarbeiter mit LLMs die Aufgaben von gleich mehreren Anfängern erledigen kann.

      Nun betrifft dies offenbar auch die Software-Entwicklung und Anwendung im Finanzbereich:

      "Die neuen Finanzagenten von Anthropic sollen schon bald komplexe Arbeitsabläufe in der Bank
      wie die Erstellung von Präsentationsunterlagen, Bilanzprüfungen oder das Verfassen von Kreditberichten
      weitgehend autonom erledigen."

      Allerdings: "die etablierten Programme [sind] den neuen Agenten in einem wichtigen Punkt überlegen:
      Die KI-Programme basieren und arbeiten nur mit öffentlich zugänglichen Daten.
      Große Softwareunternehmen nutzen hingegen deutlich ausführlichere und geschützte Datensätze,
      auf die die KI keinen Zugriff hat"

      n-tv.de/wirtschaft/KI-Agenten-…twicklern-id30801985.html
    • OpenAI hat nun erstmals ein fast 80 Jahre lang offenes "Erdös-Problem"
      der diskreten Geometrie völlig autonom gelöst,
      das als sehr wichtig angesehen wird.

      Bisher hat OpenAI bereits ein paar Erdös-Probleme und andere offene Probleme der Mathematik gelöst,
      aber entweder in Zusammenarbeit mit Experten des Gebiets oder aber sie waren nicht so wichtig.

      Erdös war ein berühmter ungarischer Mathematiker, siehe
      de.wikipedia.org/wiki/Paul_Erd%C5%91s

      Das zusätzlich Überraschende:
      Bei der Lösung verwendete OpenAI Methoden aus einem ganz anderen Gebiet der Mathematik,
      aus der algebraischen Zahlentheorie.

      Bisher ging man davon aus, dass diese LLMs wie Gemini, ChatGPT, Claude usw.
      Mathematikern und anderen Wissenschaftlern helfen können, also Assistenten sein können.
      Nun erfolgte eine Lösung erstmals selbständig.

      Die Bekanntmachung von OpenAI:

      openai.com/index/model-disprov…rete-geometry-conjecture/

      Leider haben sie nicht geschrieben, wie lange das Programm hierfür gebraucht hat,
      d.h. auch, wie viel Rechenzeit und Kapazität zur Verfügung gestellt wurde.

      Letzter Absatz des Artikels, übersetzt mit DeepL:

      "Die Zukunft hängt nach wie vor vom menschlichen Urteilsvermögen ab.
      Fachwissen gewinnt an Wert, statt an Bedeutung zu verlieren.
      KI kann beim Suchen, Vorschlagen und Überprüfen helfen.
      Menschen wählen die wichtigen Probleme aus, interpretieren die Ergebnisse und entscheiden,
      welchen Fragen sie als Nächstes nachgehen wollen."

      Die Lösung des OpenAI-Programms:

      cdn.openai.com/pdf/74c24085-19…3/unit-distance-proof.pdf

      Eine Begleitpublikation von unabhängigen Math-Experten, u.a. einem Fields-Medaillisten:

      cdn.openai.com/pdf/74c24085-19…unit-distance-remarks.pdf