KI / AI künstliche Intelligenz - Chat GPT & CO.

Steuerberater ChatBot & künstliche Intelligenz

Schnellübersicht & Kurzinfo zu KI, Chatbots & Co.
(Lesezeit 5 Min.)

 

KI / AI - künstliche Intelligenz
ChatGPT 
Open AI
Dall-E
Google MusicLM
Voice Cloning
PaLM-E
GPT-4
Google Bard
AutoGPT
KI Agenten
Aleph-Alpha Luminous
HuggingFace

 

Was ist KI (künstliche Intelligenz) bzw. AI (artificial Intelligence)?
Zielsetzung  der KI - künstlichen Intelligenz ist die Entwicklung von Systemen, die dem menschlichen Gehirn ähneln. Hierunter fällt das Lernen, das Urteilen und das Problemlösen.

Um dies zu ermöglichen, müssen Informatiker Computersystem in die Lage versetzen, zu lernen.
Sodass die Kommunikation in menschenähnlicher Art und Weise erfolgen kann.
Darunter fallen das maschinelle Lernen, das Verarbeiten natürlicher Sprache sowie das Deep Learning. Die KI (künstliche Intelligenz) bildet somit das menschliche Denken und Handeln mithilfe von Computern ab nach.

Was versteht man unter "Intelligenz" im Bezug auf KI?
Ein selbst programmiertes System, das eigenständig Abstraktionen herstellen und damit das erlernte anwenden kann.

Was sind KI & AI?
KI / AI ist die Simulation von menschlicher Denkweise durch automatische Systeme. 
Die Systeme  gehen von Algorithmen über Signalverarbeitung, bis hin zum maschinellen Lernen.

Welche 4 Arten künstlicher Intelligenz KI gibt es?
Typ 1: Reaktive Maschinen (Reactive Machines). 
Typ 2: Begrenzte Speicherkapazität (Limited Memory)
Typ 3: Theorie des Denkens (Theory of Mind)
Typ 4: Selbstwahrnehmung / Selbsterkenntnis.

Was ist Chat GPT?
Chat GPT ist ein sogenannter Chatbot von Open AI, der mithilfe von KI (künstlicher Intelligenz) unterschiedlichste Textanfragen ausführlich beantworten kann.
Die Hauptaufgabe von ChatGPT besteht darin, auf Textfragen und -anfragen menschenähnlich zu antworten. Die Antworten entstehen grundsätzlich durch den Text, auf den er trainiert wurde.


So lernt Chat GPT beispielsweise menschenähnlich zu antworten, er kann Briefe schreiben, Programmiercodes oder Hausarbeiten zu schreiben.
Der ChatGPT Chat Bot funktioniert mithilfe der antrainierten neuronalen Netze. 
Aufgrund der umfangreichen Trainingsdaten ist ChatGPT daher in der Lage menschenähnlich zu kommunizieren. Deep Learning ist auch anspruchsvoller als maschinelles Lernen.
Beim maschinellen Lernen werden spezielle Algorithmen mit Datenmengen antrainiert, um bestimmte Zusammenhänge zu erkennen.

 

Was ist ein Chat Bot?
Ein Chatbot kann Texteingabe, Audioeingabe oder beides unterstützen - der Chatbot ist eine Anwendung, die KI / AI verwendet, um sich mit Menschen in natürlicher Sprache zu unterhalten. 

 

Was bedeutet GPT?
- GPT ist die Abkürzung von Generative Pre-trained Transformer
- Die Übersetzung auf deutsch bedeutet: vortrainierter generativer Transformator

 

Was und wer ist Open AI?
Open AI LP ist ein Unternehmen aus den USA.
Es wurde 2015 gegründet und widmet sich der Erforschung künstlicher Intelligenz.
LP ist hierbei die Rechtsform ähnlich der deutschen KG.
Open AI macht Patente und Forschungsergebnisse für eine freie Zusammenarbeit mit anderen Institutionen und Forschern zugänglich.

 

KI & Cloud Computing
KI ist in vielen Bereichen des Büroalltags aufgrund der unverzichtbaren Synchronisation im Bezug auf Cloud-Speicher heutzutage beinahe schon unverzichtbar.
Eine Cloud ermöglicht es jederzeit bei bestehender Internetverbindung von überall aus Zugriff auf hinterlegte Dokumente zu haben.

 

Was ist Dall-E Text zu Bild Generator?
Dall-E bzw. Dall-E2 ist eine KI als Text zu Bild Generator. 
Er wurde mit Bildern und deren Textbeschreibungen trainiert und kann den Zusammenhang zwischen Bild und Text verstehen. 
DALL-E 2 kann Attribute in einem Bild wie beim Photo Editing kontrollieren. 

Die Bildgenerierung erfolgt über natural language processing und künstlicher Intelligenz, die Informationen aus einem Text Prompt aufzunehmen und in eine Vielzahl von Bildern umzuwandeln.
Der Name kommt von dem animierten Roboter Wall-E und dem spanischen Künstler Salvador Dalí.

 

Was ist Google MusicLM (KI zur Musikkomposition) Text in Sound Generator
Google MusicLM kann schlagwortbasiert Musikstücke komponieren.
Hierfür tippt man eine Beschreibung (Gefühl/Ausdruck) ein und Google MusicLM kreiert hierzu den passenden Sound.
Verschiedenste und x-beliebige Textbausteine werden so durch die Google KI zu einem Soundtrack.

 

AI Voice Cloning - Stimmenklon
Mit Voice Cloning kann man eine Stimme zu klonen.
Beim Klonen von Stimmen wird mithilfe der Audioaufnahmen einer realen Person eine synthetische Stimme erstellt.
Das Stimmklonen verwendet Techniken der KI künstlichen Intelligenz, um ein Sprachmodell des maschinellen Lernens mit echten Aufnahmen zu trainieren.
Hierbei soll eine Stimme so erzeugt werden, dass diese fast genau wie die echte Stimme klingt.
Die KI des Stimmenklons kann im Verlagswesen, bei Nachrichten, Bildungsangeboten, Hörbücher sowie in der Film- und Fernsehindustrie eingesetzt werden.

 

PaLM-E Robotik von Google - Roboter KI und Sprachsteuerung
PaLM-E analysiert Daten von der Kamera eines Roboters und kann auf Sprachbefehle reagieren bzw. diese ausführen.
PaLM-E nimmt ununterbrochen Bilder und Sensordaten auf und kodiert sie in eine Folge von Vektoren, die dieselbe Größe wie Sprachtoken haben.

Dadurch kann das Modell sensorischen oder bildhaften Input genauso verstehen, wie es Sprachbefehle.

 

GPT-4

Open AI - GPT 4 
Nächste Generation künstlicher Intelligenz GPT 4 übertrifft Chat GPT von Open AI
Multimodales System das Bilder und Texte analysieren kann.
Die Erweiterung des Deep Learning.

GPT-4 gleicht den Vorgängngern GPT 3 / GPT 3,5 aber wurde aber im Vergleich der Vorgänger in Sachen Performance gesteigert.

 

GPT kann zusätzlich zu Texteingaben auch Bildern analysieren und interpretieren.
Die Beantwortung soll allerdings in Textform erfolgen.
Zudem wurden die Lerninhalte sowie die logischen Fähigkeiten der KI in den Ebenen der Mathematik, Chemie, Moral, Politik und unzähligen weiteren Themenfeldern erweitert und optimiert.
GPT 4 soll dahingehend nützlichere und sicherere Antworten liefern.
Was kann GPT-4 beispielsweise besser oder worin wurde es ausgereifter?
GPT-4 kann kreative und technische Schreibaufgaben bewältigen, u.a.;
- bessere Argumentationsfähigkeiten liefern
- Komponieren von Songs, 
- Schreiben von Drehbüchern 
- Erlernen des Schreibstils eines Benutzers 
- ausgefeiltere und leistungsfähigere Sprachmodelle durch ausgereifteres Deep Learning
- Grafiken können  durch die KI im GPT4 erkannt und erklärt werden
Lt. Open AI sollte man dennoch Menschen die Ausgabe des GPT 4 kontrollieren lassen sowie den Kontext der Ausgaben berücksichtigen.

GPT-4 ist aktuell auf ChatGPT Plus und als API für Entwickler zum Erstellen von Anwendungen und Diensten verfügbar.

 

Google Bard Chatbot

Google Bard Echtzeit ChatBot Experimentierphase am 22.03.2023 in UK & USA gestartet
bard.google.com
Vorerst Beta Version / Testversion in GB & USA für ausgewählte User möglich
Google stellt als Experiment den eigenen Chatbot Bard vorerst Nutzern in Großbritannien und den USA als Beta Programm bzw. Testweise zur Verfügung, um mehr Feedback der User zu sammeln.
Hierfür registriert man sich unter bard.google.com auf einer Warteliste und diejenigen, die einen Freischaltcode erhalten, können den Google Chatbot Bard "austesten". 

Wie funktioniert der Echtzeit Chatbot Bard von Google?
Der Google Chatbot Bard wurde wie ChatGPT von Microsoft auf auf KI-Sprachmodelle trainiert.
Bei Google Bard interagieren die trainierten Texte mit Millionen Texten aus dem Internet.
Google verwendet für Bard das Google Sprachmodell LaMDA als LLM.
Google Bard kann im Vergleich zu seiner Konkurrenz in Echtzeit auf google & deren Dateninhalte zugreifen.
Die Technik basiert auf selbst lernenden, neuronalen Netze, die große Mengen Text analysieren.

Der KI Chatbot von Google fungiert zudem als Ergänzung zur google Suchmaschine google search.

 

Was ist AutoGPT
AutoGPT ist ein leistungsstarkes und vielseitiges Tool zur automatischen Textgenerierung.
Hierzu muss allerdings Python installiert sein.
Es verwendet GPT-4, um Tätigkeitsfelder als KI Agent autonom zu entwickeln und zu verwalten.
Hierbei können auch einzelne KI Agenten miteinander kommunizieren.
AutoGPT kann beispielsweise Webseiten erstellen, Artikel schreiben, Logos generieren und Produkte vermarkten. Sowie über die Internetverbindung Suchen durchführen, Informationen sammeln und mit beliebten Plattformen wie beispielsweise Twitter interagieren.

AutoGPT ist eines der ersten KI Beispiele welches im Zusammenspiel mit GPT-4 vollständig autonom ohne menschliche Überwachung oder Eingriffe läuft. Innerhalb des Systems definiert man verschiedene Ziele & Aufgaben, die AutoGPT dann selbständig erreicht bzw. löst. Das bedeutet zudem, dass AutoGPT aus seinen eigenen Erfahrungen und Rückmeldungen lernen und seine Leistung im Laufe der Zeit verbessern kann. AutoGPT ist eine experimentelle Open-Source-Anwendung, die die Fähigkeiten des GPT-4-Sprachmodells unter Beweis stellt. 

 

AutoGPT verfügt über ein Langzeit- und Kurzzeitgedächtnissystem, das es ihm ermöglicht, relevante Informationen für seine Aufgaben zu speichern und abzurufen. ElevenLabs und ImageGen sind beispielsweise zwei Modelle künstlicher Intelligenz, die AutoGPT verwenden kann, um Sprache und Bilder zu generieren.
 

Was sind KI-Agenten? 
KI-Agenten sind Computerprogramme oder -systeme, die ihre Umgebung wahrnehmen, Entscheidungen treffen und Maßnahmen ergreifen können, um bestimmte Ziele eigenständig zu erreichen. KI-Agenten können autonom agieren oder über natürliche Sprache oder andere Mittel mit Menschen oder anderen Agenten interagieren.

KI-Agenten können für verschiedene Anwendungen verwendet werden, z. B.
- Kundenservice
- persönliche Assistenten
- Spiele
- Robotik
und vieles mehr.

 

Und - KI Agenten können untereinander kommunizieren!

Wie handeln KI Agenten?
- autonom : Kontrolle, die der KI Agent über seine eigenen Handlungen und Ziele hat.
- reaktiv : der KI Agent reagiert auf unmittelbare Reize und plant die Handlungen voraus.
- proaktiv : der KI Agent initiiert Aktionen und weiß wann er auf Anweisungen warten muss.
- durch Wahrnehmung von Umgebungen : der KI Agent kann mit anderen Agenten oder Menschen kommunizieren & kooperieren
- flexibel: der KI Agent lernt aus seinen Erfahrungen und ändert sein Verhalten

 

Aleph alpha & Luminous
Europäische KI künstliche Intelligenz aus Deutschland - made in Germany / Heidelberg.
Aleph Alpha ist ein deutsches Startup mit Sitz in Heidelberg um den Gründer & Geschäftsführer Jonas Andrulis. Aleph Alpha traniert das eigene Sprachmodell der künstlichen Intelligenz namens Luminous. Luminous DSGVO-konform.

Die KI Luminous soll für Transparenz und Nachvollziehbarkeit bei KI-generierten Inhalten stehen.

So könnte die generative KI beispielsweise auch für kritische Aufgaben im Rechtswesen, Gesundheitswesen und Bankenwesen eingesetzt werden. Spezialisiert auf Branchen und dort wo zwingend vertrauenswürdige und präzise Informationen verpflichtend sind.

Die Luminous-Serie ist sozusagen eine Reihe bzw. Familie von KI Sprachmodellen, die auch kontextbasierte Inhalte verstehen kann.

Luminous wurde darauf trainiert die Semantik bzw. die Bedeutung eines Textes zu verstehen.

Luminous besitzt zudem die Fähigkeit Bilder zu beschreiben und Texte zu verstehen.

Beispielsweise kann Luminous anzeigen, auf welche Bildausschnitte es sich bei der Beschreibung eines Bildes bezieht. 
Die 3 verfügbaren Luminous Modelle von aleph alpha besitzen neben der Generierung und Vervollständigungen, Texte semantisch zu vergleichen, Dokumente zusammenzufassen, Q&A-Aufgaben durchzuführen, komplexe Texte in einfachere übersetzen und vieles mehr.

In welchen Sprachen kann Luminous interagieren?
- Englisch, 
- Deutsch, 
- Französisch, 
- Italienisch,
- Spanisch.

 

Bilderverarbeitung durch Luminous Multimodalität
Die Luminous-Familie kann Bilddaten verarbeiten.
Aleph Alpha nennt das System Multimodalität.
Die Luminous-Familie besteht aus drei verfügbaren Modellen mit unterschiedlichen Parametergrößen und Fähigkeiten.

Aleph Alpha & Lumi Modul als Chatbot - Gesprächsagent
Durch den Gesprächsagenten Lumi, der auf dem Basis KI Modell Luminous aufbaut, können Interaktionsmöglichkeiten & Konversationen mit unstrukturierten Daten und Informationen erfolgen.

 

HuggingFace
HuggingFace ist eine KI-Community im Open-Source Bereich.
Ein Bekanntes System ist der "HuggingChat" - ähnl. ChatGPT.
HuggingFace (benannt nach dem beliebten Emoji) wurde 2016 gegründet und begann als Chatbot-Unternehmen und wandelte sich später zu einem Open-Source-Anbieter von NLP-Technologien.
Das damalige Chatbot-Unternehmen, das sich an die Zielgruppe der Teenager richtete, konzentrierte sich darauf eine KI zu bauen bei der es Spaß macht, mit ihr zu interagieren. 

 

HuggingFace bietet modernste Modelle für unterschiedliche Aufgaben in der künstlichen Intelligenz. Giganten aus dem Tech Bereich nutzen die Modelle, Datensätze und Bibliotheken von HuggingFace.
 

HuggingFace ermöglicht es, Werkzeuge, Modelle, Datensätze usw. zwischen verschiedenen Programmierern über das HuggingFace Toolkit auszutauschen, erweitern und ständig zu verbessern.  
Es stellt eine intuitiv gestaltete Python-API bereit, um hochmoderne Deep-Learning-Architekturen für gängige Aufgaben zur Verarbeitung natürlicher Sprache (NLP) zu nutzen.