Außerdem: Stable Audio 2.0, Adobe GenStudio, Voice Cloning, KI Compliance sowie weitere Tools und News ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏
Smart Content Report #7
Welche KI ist die beste? Diese Frage ergibt immer weniger Sinn
Die Frage nach der „besten KI“ ist vergleichbar mit der Frage nach dem „besten Auto“. Gäbe es ein einziges, bestes Auto, bräuchten wir nicht so viele verschiedene Fahrzeugkategorien. Ähnlich lässt sich das auf Fragen nach dem „besten Laptop“ oder der „besten Kamera“ übertragen. Natürlich können wir uns eine Reihe von Kriterien ausdenken und dann über alle Angebote hinweg einen Gesamtsieger ermitteln. Das mag für Profis und Nerds von Interesse sein. Der praktische Nutzen aber ist begrenzt. Warum? Weil es immer auf die eigenen Bedürfnisse ankommt. Der KI-Markt hat sich seit dem „Urknall“ ChatGPT rasant weiterentwickelt. Neben Text lassen sich nun auch Bilder, Video und Audio auf Knopfdruck generieren. Hier fließt derzeit viel Geld, denn das Venture Capital ist ganz verrückt nach der Künstlichen Intelligenz. Alle träumen davon, den nächsten Superhit zu finanzieren. Diese Investitionsblase wird sicher platzen. Und bis es soweit ist, wollen sich alle Kandidaten ihr Stück vom Kuchen sichern. Dabei zeigt sich, dass es zunehmend wichtiger wird, sich von anderen Angeboten klar abzugrenzen. Es braucht eine Unique Selling Proposition (USP), also ein klares Unterscheidungsmerkmal. Die USP soll deutlich machen, an wen sich ein Produkt wendet und was es besonders macht. Im Mittelpunkt steht dabei die Frage: Warum X nutzen und nicht Y? Das müssen auch KI-Tools zunehmend beantworten. Dabei gibt es natürlich Benchmarks: Das sind standardisierte Tests, die beispielsweise zeigen sollen, ob eine Text-KI mit kniffligen Aufgaben zurechtkommt und wie gut. Aber diese Benchmarks lassen sich manipulieren und sie unabhängig davon bestenfalls ein Maßstab unter vielen, um sich einen Überblick zu verschaffen. Für die Auswahl muss vor allem klar sein, was die KI hauptsächlich leisten soll. So mag es beispielsweise sein, dass OpenAIs GPT-4 das beste Angebot für eine Vielzahl an Aufgaben ist. Aber eine deutlich kleinere KI kann diese „beste“ KI dennoch in Einzeldisziplinen überholen. Ein wichtiges Kriterium ist zudem nicht nur die reine Leistungsfähigkeit. Ein weiterer Punkt kann beispielsweise sein, wie flexibel und anpassbar eine KI ist, ob sie sich datenschutzkonform einsetzen lässt, ob sie sich mit internen Dokumenten und Datenbanken verbinden lässt und einiges mehr. Denselben Effekt sehen wir im noch vergleichsweise jungen Bereich der Video-KI. Soll es um besonders lange Clips gehen? Kommt es darauf an, dass Personen realistisch dargestellt werden? Ist die Kohärenz zwischen mehreren Clips wichtig? Für alle diese und andere Punkte kann es jeweils eine andere Antwort geben. Insofern: Die Frage nach der „besten KI“ macht ohne weitere Angaben wenig Sinn. Das ist heute bereits der Fall und das wird in Zukunft noch stärker werden. - Jan Tißler, UPLOAD Magazin
|
|
ANZEIGE
neuroflash: Die Nr.1 KI Content Suite für Marketing Teams
|
|
neuroflash ist die führende KI-Software zur Contentgenerierung im deutschsprachigen Raum. Das ist auch kein Wunder: Kein anderes Tool hat eine so hohe Qualität bei deutschen Texten wie das Angebot aus Hamburg. Schließe dich über 1 Million professionellen Content Creators und Teams an und transformiere deine Arbeit mit KI!
|
|
|
Möchtest du hier erscheinen?
Schalte eine Anzeige in den Newslettern des UPLOAD Magazins und erreiche über 4.000 interessierte Leser:innen.
|
|
|
|
TOOLS
Stable Audio 2.0: Songs per Textbefehl
Stability AI hat mit Stable Audio 2.0 ein Update für seine generative Audio-KI veröffentlicht. Mit der neuen Version lassen sich bis zu dreiminütige Audioclips aus Textbeschreibungen erstellen. Außerdem kann Stable Audio 2.0 hochgeladene Audiodateien anhand von Anweisungen in natürlicher Sprache transformieren. Großen Wert hat das Unternehmen offenbar auf den Urheberrechtsschutz gelegt: Es hat nach eigener Aussage nur lizenzierte Daten zum Training verwendet. Stable Audio 2.0 ist auf der Website des Unternehmens verfügbar und wird in Kürze auch als API für Entwickler angeboten. Und wer nur einmal reinhören möchte, findet einen Livestream hier auf YouTube.
Quelle: VentureBeat
|
|
Opera: Text-KI auf dem eigenen PC
Opera ermöglicht es jetzt, KI-Sprachmodelle lokal auf den eigenen Rechner herunterzuladen und dort auszuführen – also auch ohne Internetverbindung, ohne zusätzliche Kosten und privat. Über 150 Modelle von mehr als 50 Familien stehen zur Auswahl, darunter Llama von Meta, Gemma von Google und Vicuna. Das Feature ist zunächst für Nutzer von Opera One im Developer-Stream verfügbar.
Eine Einführung zum Thema „Lokale LLMs“ findest du übrigens in Smart Content Report #3. Quelle: TechCrunch
|
|
Adobe GenStudio: generative KI-Tools für Unternehmen
Adobe kündigt generative KI-Lösungen an, um die Content-Supply-Chain für Unternehmen zu optimieren. Mit Adobe GenStudio erhalten Marketer ein KI-gestütztes Angebot, um schnell markenkonforme Inhalte zu planen, zu erstellen und zu verwalten. Der Bildgenerator Adobe Firefly wird dabei nahtlos integriert und ermöglicht nach Aussagen des Unternehmens mit neuen Firefly Services und Custom Models eine skalierbare Inhaltsproduktion.
|
|
Mehrere neue Tools fürs Voice Cloning
Resemble AI führt mit Rapid Voice Cloning ein Tool ein, mit dem sich innerhalb einer Minute KI-gestützte Stimmklone aus kurzen Audiodaten erstellen lassen. Quelle: VentureBeat Auch MyShell TTS präsentiert mit OpenVoice einen vielseitigen Ansatz zum Klonen von Stimmen. Das Tool kann anhand kurzer Audioschnipsel die Stimme einer Person in mehreren Sprachen replizieren. OpenVoice ermöglicht dabei eine detaillierte Kontrolle über Stimmstil, Emotionen, Akzent, Rhythmus, Pausen und Intonation. Quelle: Hacker News Und OpenAI stellt seine neue KI-Technologie „Voice Engine“ vor, die menschliche Stimmen offenbar täuschend echt nachahmen kann. Das Unternehmen beschränkt den Zugang aber vorerst auf ausgewählte Partner. Quelle: VentureBeat
|
|
Weitere Tools in aller Kürze
Mit Dall-E lassen sich generierte Bilder nun auch weiter bearbeiten. Ein Demovideo auf Twitter/X zeigt eine Funktion, die landläufig als „Inpainting“ bekannt ist: Mit einem Pinselwerkzeug lassen sich Teile des Bildes auswählen und dann per Sprachbefehl verändern. Quelle: Axios Assembly AI stellt sein neues Spracherkennungsmodell Universal-1 vor, das im Vergleich zu OpenAIs Whisper 30% weniger Halluzinationen bei Sprachdaten und 90% weniger bei Umgebungsgeräuschen aufweisen soll. Das Modell bietet verbesserte Genauigkeit für Englisch, Spanisch, Französisch und Deutsch, unterstützt Code-Switching, optimierte Zeitstempelschätzung und schnellere Parallelverarbeitung, was für Anwendungen wie automatisierte Notizen, KI-gestützte Videobearbeitung und Telemedizin von Vorteil sein kann. Quelle: VentureBeat Vectorview hilft dabei, die Fähigkeiten und die Sicherheit von Sprachmodellen zu evaluieren. Durch gezielte Tests mit praxisnahen Szenarien können unbeabsichtigte Verhaltensweisen erkannt und verhindert werden, die von allgemeinen Benchmarks oft übersehen werden. Quellen: TechCrunch, Y Combinator
Eggnog ermöglicht KI-generierte Videos mit konsistenten Charakteren. Zuerst erstellt man die Person inklusive Outfits, dann im Storyboard die geplanten Szenen des Clips und erstellt das Video im letzten Schritt. Eggnog möchte zum „YouTube für KI-Videos“ werden. Quellen: TechCrunch, Y Combinator OctoAI stellt mit OctoStack eine Plattform vor, mit der Unternehmen generative KI-Modelle an ihre Bedürfnisse anpassen und in einer eigenen Umgebung einsetzen können. Quelle: VentureBeat OpenAI erweitert sein Programm zur Erstellung maßgeschneiderter KI-Modelle für Unternehmen, um spezifische Anwendungsfälle abzudecken. Mit Techniken wie assistiertem Fine-Tuning und kundenspezifisch trainierten Modellen sollen Organisationen jeder Größe in der Lage sein, personalisierte Modelle zu entwickeln. Quelle: TechCrunch Soundry AI ist ein generatives KI-Tools für Musiker, mit der sch durch Texteingabe oder durch Beispielsamples weitere Musikschnippsel erstellen lassen. Quelle: Hacker News
Databricks präsentiert mit DBRX ein neues Open-Source-KI-Modell, das Unternehmen eine kostengünstige und effiziente Alternative zu GPT-3.5 bieten möchte. Da Unternehmen es selbst einrichten und verwalten, ist damit gleichzeitig die Sicherheit und Vertraulichkeit der Daten besser gewahrt als bei einem externen Angebot wie ChatGPT. Quelle: VentureBeat Microsoft hat neue Azure-Tools vorgestellt, die Entwicklern helfen sollen, die Sicherheit und Zuverlässigkeit von KI-Werkzeugen zu verbessern. Sie umfassen etwa „Prompt Shields“ zum Schutz vor Prompt-Injection-Angriffen, vorgefertigte Templates für sicherheitsorientierte Systemnachrichten, „Groundedness Detection“ zur Erkennung von Halluzinationen in Textausgaben sowie Echtzeit-Monitoring zur Überwachung von Eingaben und Ausgaben in Produktionsumgebungen. Microsoft wertet den KI-Assistenten Copilot für Microsoft 365 auf. Die Neuerungen umfassen schnellere und umfassendere Antworten durch GPT-4 Turbo, die Entfernung von Chat-Limits, erhöhte Datei-Uploads sowie ab Mai 100 tägliche „Boosts“ für schnellere Bilderstellung im Designer-Tool. Quelle: VentureBeat
|
|
News
Gründer und CEO von Stability AI tritt zurück
Emad Mostaque, Gründer und CEO von Stability AI, ist zurückgetreten, um sich nach eigenen Angaben für eine dezentralisierte KI einzusetzen. Mostaque hatte das Unternehmen 2020 aus der Taufe gehoben und war maßgeblich an der Entwicklung des beliebten Open-Source-Bildgenerierungsmodells Stable Diffusion beteiligt, das seit seiner Veröffentlichung im August 2022 hunderte Millionen Downloads verzeichnete. Während seiner Amtszeit sah sich Stability AI jedoch auch mit Kontroversen und rechtlichen Problemen konfrontiert. Das Unternehmen wird nun übergangsweise von COO Shan Shan Wong und CTO Christian Laforte geleitet, während die Suche nach einem dauerhaften Nachfolger läuft.
|
|
Weitere News in aller Kürze
ChatGPT lässt sich jetzt jetzt in einigen Regionen kostenlos und ohne Anmeldung ausprobieren. OpenAI präsentiert erste Beispiele von ausgewählten Filmemachern, Künstlern und Agenturen, die mit dem neuen KI-Modell Sora Videos erstellt haben. Das soll das Potenzial der Technologie zeigen, stößt aber weiterhin auf Kritik mit Blick auf die Trainingsdaten: Die wurden offenbar ohne Erlaubnis oder Bezahlung der Urheber genutzt. Zum ersten Mal seit Start der „Chatbot Arena“ ist nicht OpenAIs GPT-4 an der Spitze, sondern Claude 3 Opus. In der Chatbot Arena bewerten Nutzer die Antworten anonymisierter KI-Modelle. Es gilt daher als realistischer Benchmark, der sich zudem nicht manipulieren lässt. Google.org startet ein 20-Millionen-Dollar-Förderprogramm für gemeinnützige Organisationen, die generative KI-Technologien entwickeln. Das sechsmonatige Programm umfasst finanzielle Unterstützung, technisches Training, Workshops und Mentoring, um die Teilnehmer bei der Umsetzung ihrer KI-Projekte zu unterstützen, die von Übersetzungsdiensten für Flüchtlinge bis hin zur Optimierung von Anträgen auf Sozialleistungen reichen. Betrüger haben die Gesichter und Stimmen von Frauen aus sozialen Netzwerken genutzt, um mit Hilfe von KI-Technologie gefälschte Werbung für anstößige Produkte zu erstellen. Obwohl die Opfer sich in ihren Persönlichkeitsrechten verletzt fühlen, gibt es bisher offenbar wenig rechtliche Handhabe gegen diese neue Form des Identitätsdiebstahls, da die Täter schwer zu fassen sind und es an entsprechenden Gesetzen mangelt. In einem offenen Brief fordern mehr als 200 berühmte Musiker wie Billie Eilish und Katy Perry Technologieunternehmen und KI-Entwickler auf, nicht die Rechte von Künstlern zu verletzen und ihre Arbeit zu entwerten. Die Unterzeichner betonen, dass KI, wenn sie verantwortungsvoll eingesetzt wird, die menschliche Kreativität fördern kann. Sie warnen jedoch davor, dass einige Plattformen und Entwickler die Technologie missbrauchen, um Kreativität zu sabotieren, Künstler zu untergraben und ihnen eine faire Bezahlung vorzuenthalten. Forscher der Stanford University und von Notbad AI wollen Sprachmodellen beibringen, vor dem Antworten auf Prompts nachzudenken. Durch ihr „Quiet-STaR“ genanntes Modell konnten sie die Fähigkeiten der getesteten Sprachmodelle im Bereich logisches Denken verbessern. Intel bestätigt, dass Microsofts KI-Assistent Copilot bald lokal auf PCs mit passenden Chips laufen wird. Intels Lunar Lake-Prozessoren, die Ende des Jahres auf den Markt kommen, sollen eine dreimal höhere KI-Leistung bieten als die aktuellen Meteor Lake-Chips und damit die Anforderungen für die nächste Generation von KI-PCs erfüllen.
|
|
Lesetipp
KI Compliance fürs Marketing
Dieser Beitrag gibt einen Überblick über bestehende und geplante Regelungen zur KI-Compliance. Er zeigt auf, wie Marketer KI-Tools nutzen können, ohne gegen Vorschriften zu verstoßen. Zu den Risiken zählen tendenziöse Inhalte und Werbung, Falschinformationen sowie Datensicherheit. Unternehmen sollten deshalb klare Richtlinien für den KI-Einsatz festlegen, den Umfang der an KI übertragenen Aufgaben begrenzen und neue Tools sorgfältig prüfen. Gemeinsam mit einer Rechtsanwältin bereiten wir derzeit einen Artikel zum Thema KI-Richtlinien vor. Lass uns gerne wissen, welche Fragen du darin beantworten haben möchtest. Antworte dazu einfach auf diese E-Mail.
|
|
Können KI-Suchmaschinen Google schlagen?
In diesem Beitrag von The Verge geht es darum, ob KI-basierte Suchmaschinen Google bereits ersetzen können. Der Autor analysiert die drei häufigsten Arten von Suchanfragen – Navigation, Information und Exploration – und kommt zu dem Schluss, dass die KI-Tools bei Navigationsfragen deutlich langsamer sind als Google. Bei Informationsfragen schneiden sie unterschiedlich gut ab, können aber bei versteckten Informationen hilfreich sein. Explorative Anfragen sind die Stärke der KI-Suchmaschinen, doch auch hier hat Google mit spezifischen Seitendesigns für Suchergebnisse die Nase vorn. Letztendlich glaubt der Autor, dass es mehr als einen Chatbot braucht, um Google zu schlagen – nämlich ein Umdenken bei den Ergebnisseiten, dem Geschäftsmodell und der Art, wie Informationen präsentiert und zusammengefasst werden.
|
|
Fundstück
KI verwandelt einen drögen Lizenztext in eine Ballade
|
|
Es ist eine Spielerei, zeigt aber zugleich sehr schön den aktuellen Stand einer Musik-KI wie Suno.ai.
|
|
Was bedeutet …
System Prompt
Kommerzielle KIs wie ChatGPT oder Claude haben einen meist unsichtbaren System Prompt, der dem Assistenten wichtige Regeln und Richtlinien erklärt. Der System Prompt beeinflusst also, wie sich eine KI verhält und ob sie beispielsweise bestimmte Anfragen verweigert. Ein Mitglied des Claude-Teams hat den System Prompt ihres Assistenten kürzlich auf Twitter/X veröffentlicht und Zeile für Zeile erklärt:
|
|
Wir über uns
Gefällt dir dieser Newsletter? Dann empfiehl ihn doch weiter! Verweise dazu am besten auf https://upload-magazin.de/smart-content-report/ Wir haben zwei weitere Newsletter, die für dich relevant sind:
Das Content-Briefing liefert dir immer im Wechsel mit dem Smart Content Report einen praktischen Tipp für deine Content-Arbeit sowie Lesetipps andernorts. Ansehen …
Mit dem Update am Montag wiederum erfährst du einmal pro Woche, welche neuen Inhalte und Angebote du beim UPLOAD Magazin findest. Ansehen …
|
|
|