Luware Blog | Expertenwissen & News aus der Cloud

KI-Modell-Vergleich: So wählen Sie die für Sie passendste KI

Geschrieben von Martina Willig | 30.09.2024 16:46:43

 

Stellen Sie sich vor: Sie benötigen eine KI, um Kunden-E-Mails zu analysieren, die Stimmung zu verstehen und sogar eine Antwort zu verfassen. Sie geben «KI E-Mail Analyse» in eine Suchmaschine ein, und Sie werden von unzähligen Seiten mit Wahlmöglichkeiten begrüsst, von denen jede ihre Stärken anpreist. Deshalb habe ich diesen KI-Modell-Vergleich zusammengestellt. Er ist der Kompass, der Sie durch diese komplexe Landschaft führt und Ihnen dabei hilft, Ihre Zeit und Ressourcen sinnvoll zu investieren. Er befähigt Sie, eine fundierte Entscheidung zu treffen, und das ist stark. 

Tauchen Sie tief in verschiedene KI-Modelle ein  

Was machen Sie als Erstes, wenn Sie ein neues Auto kaufen wollen? Sie machen eine Probefahrt. Sie würden nicht einfach das erste Fahrzeug kaufen, das Ihnen ins Auge springt. Sie vergleichen Leistungsmerkmale, berücksichtigen Ihre spezifischen Bedürfnisse, lesen vielleicht sogar Bewertungen. 

Genau das ermöglicht Ihnen dieser Blogbeitrag mit verschiedenen KI-Modellen. Er hilft Ihnen herauszufinden, welches KI-Modell das richtige für Ihre Bedürfnisse ist. 

Die wichtigsten Überlegungen beim Vergleich von KI-Modellen 

 Lassen Sie uns die wesentlichen Faktoren aufschlüsseln, die bei der Wahl eines KI-Modells zu berücksichtigen sind. 
 
Genauigkeit 
 Der grundlegendste Aspekt bei der Bewertung ist, wie genau ein Modell seine intendierte Aufgabe erfüllt. Genauso wie Sie sich nicht wünschen, dass Ihnen ein Taschenrechner falsche Ergebnisse liefert, entscheidet die Genauigkeit einer KI über deren Gesamteffektivität. In unserem E-Mail-Analyse-Szenario sollte ein hochgenaues Modell einwandfrei negative Gefühle wie Frustration oder Wut erkennen.
 

Das Modell würde Nuancen der Sprache verstehen und dabei zwischen einer leichten Beschwerde und einem schwerwiegenden Problem unterscheiden können. So wird sichergestellt, dass die Reaktion der KI angemessen und hilfreich ist. 

Geschwindigkeit 

Wir alle leben in einer schnelllebigen Welt, in der jede Sekunde zählt. Wie schnell ein Modell Informationen verarbeiten und Ergebnisse liefern kann, ist vor allem in Echtzeitanwendungen wie Chatbots oder Betrugserkennung entscheidend. Beispielsweise kann eine langsame KI, die auf Anfragen von Kunden reagiert, diese mit Verzögerungen frustrieren. 

Dies würde den Eindruck erwecken, dass das Unternehmen langsam reagiert, was zu einem schlechten Kundenerlebnis führt.

Skalierbarkeit 

Nehmen wir an, Ihr Unternehmen wächst. Aber wird Ihr KI-Modell mit ihm mitwachsen? Skalierbarkeit bezeichnet die Fähigkeit eines KI-Modells, eine steigende Datenmenge und mehr Aufgaben zu bewältigen, ohne an Leistung einzubüssen. 

Kosten 

Wie bei jeder unternehmerischen Entscheidung sind die Kosten für die Implementierung und Wartung ein entscheidender Faktor. Einige KI-Modelle erfordern möglicherweise Abonnements, andere bieten Open-Source-Alternativen an. Entscheidend ist, den idealen Punkt zu finden, der ein ausgewogenes Verhältnis zwischen Ihrem Budget und der Leistung herstellt. 

Ein an der Realität orientiertes Szenario: KI-E-Mail-Analyse im Einsatz 

Lassen Sie uns direkt auf ein Praxisbeispiel eingehen. Als jemand, der sich intensiv mit KI und damit beschäftigt, wie sie alltägliche Aufgaben verändern kann, habe ich kürzlich mehrere KI-Modelle – Microsoft Azure KIGoogle AI und Amazon Web Services (AWS) – mit einer gängigen unternehmerischen Herausforderung, der E-Mail-Analyse, getestet. Mein Ziel war einfach: E-Mails zusammenfassen, die vermittelte Stimmung verstehen und sogar Antworten verfassen. 

Dies alles erfolgt durch Automatisierung. Warum Stunden mit manuellen Arbeiten verbringen, wenn eine KI mithelfen könnte? 

1. Kundenstimmung verstehen

Jedes Modell erfasste genau die wichtigsten Punkte der Kunden-E-Mails, um erfolgreich zu verstehen, ob jemand mit seiner Bestellung unzufrieden oder von einer Dienstleistung begeistert war oder einfach nur Informationen suchte.  

2. Richtig reagieren

Die Modelle, die mit dem Verfassen von Antworten beauftragt wurden, boten unterschiedliche, aber ebenso effektive Kommunikationsstile. Einige pflegten einen formellen und professionellen Ton, während andere einen Hauch von Persönlichkeit zeigten. Zum Beispiel war GPT-4 von Microsoft höflich und bot an, Probleme zu untersuchen, während Gemini von Google ähnliche Empathie und Professionalität in seiner Herangehensweise an die Kundeninteraktion zeigte. 

Modell Claude von Amazon Web Services (AWS) gab derweil ausführlichere Antworten sowie vertiefte Details und skizzierte mögliche Lösungsansätze für Kundenanfragen. Auch hier sind keine zwei KI-Modelle identisch, was deutlich macht, warum ein Vergleich wichtig ist. 

Was mich wirklich überrascht hat? Selbst bei identischen E-Mail-Inhalten unterschieden sich die KI-Antworten von Google je nach verwendeter Benutzeroberfläche (UI) leicht. Dies ist ein perfektes Beispiel dafür, wie sich Variablen, auch mit geringen Unterschieden, auf KI-Outputs auswirken können. Es zeigt, warum gründliches Testen wichtig ist. 

Detaillierte Ergebnisse des Vergleichs 

Der Vergleich wurde in Englisch durchgeführt. Als Eingabe geben wir dem Modell folgende E-Mail: 
 

I am writing to express my extreme dissatisfaction with my recent order from you. I received my package today, and to my dismay, I found that the items inside were not what I ordered. Instead of the table I was expecting, I received a yellow painted cupboard, which is completely irrelevant to my needs. 

This is not only frustrating, but also unacceptable for a company that prides itself on customer satisfaction. I have been a loyal customer for years, but this experience has left me questioning the reliability of your service. I demand an immediate resolution to this issue. I expect the correct order to be sent to me expediently, at no additional cost, and a return label for the incorrect items. 

Furthermore, I would appreciate a formal apology and an explanation as to how this mistake occurred. It is imperative that measures are taken to prevent such errors in the future. 

I trust that you will treat this matter with the urgency it deserves and look forward to your prompt response. 

Sincerely, 
Natalya Smith
 

Und das sind die generierten Antworten: 

  Microsoft Google AWS
Configuration

Model: gpt-4o

Temperature: 0

Top P: 0

Model: Gemini Flash 1.5

Temerature: 0

Top P: N/A for Flash

Model: Claude 3 Sonnet

Temperature: 0

TOP P: 0

Instructions

You will be given an Email. Given the email, you need to summarize it, then give a sentiment score and draft a possible short reply. Please return your answer as a machine readable JSON of the following format without using markdown:
{
"Summary": "Peter Pan is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the ordered table",
"Sentiment": "-2 (Negative)",
"Reply": "Dear Peter Pan, 
I sincerely apologize for the inconvenience. Thank you for your patience and understanding. 
Best regards,
Your Name
Customer Service Team"
}

 

You will be given an Email. Given the email, you need to summarize it, then give a sentiment score and draft a possible short reply. Please return your answer as a machine readable JSON of the following format without using markdown:
{
"Summary": "Peter Pan is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the ordered table",
"Sentiment": "-2 (Negative)",
"Reply": "Dear Peter Pan, 
I sincerely apologize for the inconvenience. Thank you for your patience and understanding. 
Best regards,
Your Name
Customer Service Team"
}

 

Summarize the email [Email Input], determine sentiment, and draft a reply. Output as JSON, example:
{
"Summary": "Peter Pan is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the ordered table",
"Sentiment": "-2 (Negative)",
"Reply": "Dear Peter Pan, 
I sincerely apologize for the inconvenience. Thank you for your patience and understanding. 
Best regards,
Your Name
Customer Service Team"
}
Output {
"Summary": "Natalya Smith is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the ordered table. She demands an immediate resolution, including the correct order sent at no additional cost, a return label, a formal apology, and an explanation.",
"Sentiment": "-2 (Negative)",
"Reply": "Dear Natalya Smith,
I sincerely apologize for the inconvenience and frustration this has caused you. We will expedite the correct order and provide a return label for the incorrect items at no additional cost. Additionally, we will investigate how this mistake occurred and ensure it does not happen again. Thank you for your patience and understanding.
Best regards,
Your Name
Customer Service Team"
}
{
"Summary": "Natalya Smith is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the table she ordered. She demands the correct order be sent immediately at no cost, a return label for the incorrect item, a formal apology, and an explanation of how the mistake occurred.",
"Sentiment": "-3 (Very Negative)",
"Reply": "Dear Natalya Smith, \n\nWe sincerely apologize for the inconvenience caused by the incorrect order. We understand your frustration and are taking immediate steps to rectify the situation. \n\nThe correct table will be shipped to you at no additional cost, and a return label for the cupboard will be provided. We are also investigating how this error occurred to prevent similar mistakes in the future. \n\nWe value your loyalty and appreciate your patience as we resolve this issue. \n\nBest regards, \n[Your Name] \nCustomer Service Team"
}

{ "Summary": "The customer, Natalya Smith, is extremely dissatisfied with her recent order from the company. Instead of receiving the table she ordered, she received a yellow painted cupboard, which is completely irrelevant to her needs. She demands an immediate resolution, including the correct order being sent to her expediently at no additional cost, a return label for the incorrect items, a formal apology, and an explanation for how this mistake occurred.", "Sentiment": "-2 (Negative)", "Reply": "Dear Natalya Smith,

We sincerely apologize for the inconvenience caused by the incorrect order you received. We understand your frustration and take full responsibility for this mistake. Customer satisfaction is our top priority, and we have failed to meet your expectations.

Please accept our formal apology for this error. We are investigating the matter thoroughly to identify the root cause and implement measures to prevent such incidents from occurring in the future.

We have already initiated the process to send you the correct order, the table you originally requested, at no additional cost. A return label for the incorrect item will be provided to you as well. Please expect to receive the correct order and the return label within the next 3-5 business days.

Once again, we apologize for the inconvenience and appreciate your patience and understanding. We value your loyalty as a customer and hope to regain your trust through our prompt resolution of this issue.

Sincerely, [Your Name] Customer Service Manager" }

Fun Fact

 

Using google Gemini (google.com) UI with my personal account and the same input, the output is slightly different but still very similar:

 

 

{ "Summary": "Natalya Smith is extremely dissatisfied with her recent order, receiving a yellow painted cupboard instead of the ordered table.", "Sentiment": "-2 (Negative)", "Reply": "Dear Natalya Smith,\n\nI sincerely apologize for the inconvenience caused by the incorrect item in your recent order. We understand how frustrating this must be, and we are committed to resolving the issue promptly.\n\nWe will ensure that the correct table is shipped to you immediately at no additional cost. A return label for the incorrect cupboard will also be provided.\n\nWe are investigating the cause of this error to prevent similar occurrences in the future. Your satisfaction is our top priority, and we appreciate your understanding and patience.\n\nThank you for bringing this matter to our attention.\n\nSincerely,\nYour Name\nCustomer Service Team" }

I also configured an image generation based on the model Stable Diffusion XL with the following instructions:

Imagine this email from a customer: [Email Input]. Visualise what happened in a single comic-styled image. 

 

 

Übersicht KI-Modell-Vergleich 

Modell 

Entwickler 

Kontextfenster 

Preis 

Highlights 

Google AI Gemini 

Google 

32k Token (geschätzt für Gemini 1.5) 

Variabel 

Multimodale Fähigkeiten, hohe Integration mit Google-Diensten 

Microsoft Azure AI GPT-4o 

Microsoft 

Bis zu 32k Token 

Variabel 

Schnelligkeit der Ausgabe, Azure Cloud-Integration 

Amazon Web Services Claude 

Amazon 

Bis zu 100k Token (für Claude 2) 

Variabel 

Umfangreiche Lizenzoptionen, Flexibilität in der Bereitstellung 

Das Wichtigste? Es ist wichtig zu verstehen, dass nicht alle KI-Content-Tools gleich geschaffen sind. Experimentieren Sie mit verschiedenen Optionen, sehen Sie, was am besten funktioniert, und treffen Sie schliesslich eine fundierte Entscheidung, die mit Ihren spezifischen Zielen in Einklang steht. Denken Sie daran, es geht darum, herauszufinden, was Ihren Arbeitsprozess verbessert, ihn reibungsloser, intelligenter und effizienter macht. Das ist stark. 

Umsetzung mit Luware Nimbus 
 
Luware Nimbus bietet maximale Flexibilität. Nimbus unterstützt die Integration aller KI-Modelle, sofern es eine REST-Schnittstelle anbietet, die sich über Microsoft Power Automate ansprechen lässt. Unternehmen haben so die Freiheit, die beste Lösung für ihre individuellen Anforderungen auszuwählen.
 
Die Integration von Microsoft Azure KI, Google AI und AWS mit Luware Nimbus erfolgt in Power Automate auf einem Event-Trigger. In Power Automate verwenden wir ein Standard-HTTP-Element, um mit dem KI-Modell zu kommunizieren und den Nimbus Task mit den Details (Summary, Sentiment, Reply) zu aktualisieren. 
 

Wenn Sie Unterstützung bei der Umsetzung benötigen, wenden Sie sich bitte an Ihren Integrationspartner. Luware Nimbus bietet zwar einen flexiblen Rahmen für die Integration externer Systeme und KI-Modelle, wir übernehmen jedoch keine direkte Verantwortung für die Einrichtung oder Verwaltung individueller Lösungen. Der Erfolg solcher Integrationen hängt von zahlreichen Faktoren ab, die ausserhalb unseres Einflussbereichs liegen. Um sicherzustellen, dass Ihre Integration reibungslos funktioniert, empfehlen wir vorab umfassende Tests durchzuführen.

Fazit 

Alle drei Modelle zeigten beeindruckende Fähigkeiten, E-Mail-Inhalte zu verstehen, Stimmungen zu analysieren und massgeschneiderte Reaktionen zu generieren. Während es bei der Tonalität und dem Inhalt der Antworten kleine Unterschiede gab, hängt die Wahl des Modells letztlich von spezifischen Anforderungen wie Formvorschriften, Empathie oder Personalisierung ab. Die Kosten dürften jedoch ein wichtiger Faktor für die Unternehmen sein, ihre Auswahl zu treffen.