Außerdem: Googles Angebote für Unternehmen, Adobe integriert KI-Videos, Diskussion um Trainingsdaten und vieles mehr ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏
Smart Content Report #8
Musik und Ton per KI generieren – drei Beispiele
KIs können nicht nur Texte, Bilder und Videos generieren, sondern auch Ton und Musik. Die Fortschritte bei der Qualität der Ergebnisse sind dabei erstaunlich. Schauen wir uns drei prominente Beispiele an: Udio Udio ist vor einer Woche im Rahmen einer Public Beta gestartet und hat bereits für viel Wirbel gesorgt. Auf der Website finden sich zahlreiche Beispiele für Songs, die mit diesem Tool erstellt wurden. Derzeit kannst du es kostenlos ausprobieren. Ars Technica hat sich Udio genauer vorgenommen und kommt zu einem Fazit, das einem bekannt vorkommt: Ja, es lassen sich gute Ergebnisse erzielen, aber nur mit Mühe, Geduld und ein bisschen Glück. Als Nutzer kannst du den Songtext automatisch generieren lassen oder selbst liefern. Du beschreibst außerdem, welches Musikgenre gewünscht ist. Daraus entstehen dann zwei Clips. Bei Interesse lassen sich diese Musikschnippsel im nächsten Schritt erweitern. Udio erklärt, dass sie sich keine Rechte an den Songs vorbehalten und dass sie auch kommerziell eingesetzt werden dürfen. Suno Den Hype rund um KI-Musik hatte zuvor allerdings bereits Suno losgetreten. Beide Tools sind sich sehr ähnlich. Udio bietet derzeit einige zusätzliche Optionen, um etwa einen Musikclip zu erweitern. Dafür finden Tester die Songqualität von Suno besser. Das Magazin Rolling Stone hatte es als „ChatGPT für Musik“ bezeichnet. Suno bietet einen kostenlosen Zugang, mit dem sich derzeit zehn Songs pro Tag generieren lassen. Stable Audio Stable Audio geht in eine andere Richtung. Hier lassen sich dreiminütige Songs erstellen, die einer typischen Struktur folgen. Diese aber enthalten keinen Gesang. Es ist also entweder für Instrumentalstücke geeignet oder als Ausgangspunkt für eine eigene Produktion. Stable Audio kann Musik dabei nicht nur anhand eines Textprompts erstellen (Text to Audio), sondern auch einen vorhandenen Clip als Ausgangsbasis nutzen (Audio to Audio). Weitere Beispiele Es gibt etliche weitere Beispiele: - Soundry AI richtet sich an Musiker und generiert Versatzstücke wie Beats.
- Soundraw wiederum bewirbt sich als Werkzeug sowohl für Content Creators als auch Musiker.
- Beatoven.ai spezialisiert sich auf die Zielgruppe der Creators – YouTube-Videos, Podcasts, Games, Audiobücher.
- Loudly kommt aus Berlin und betont lizenzfreie Musik für Inhalte als Benefit.
- AudioCraft ist ein Angebot von Facebook/Meta und kann sowohl Musik als auch Geräuschkulissen erstellen.
- Boomy spricht offenbar vor allem Personen an, die schon immer Musiker werden wollten.
- AIVA bezeichnet sich als KI-Musikgenerierungs-Assistent. Hier steht also weiter der Mensch im Mittelpunkt.
- Hydra will sowohl Unternehmen als auch Musiker ansprechen.
- Soundful bewirbt sich als Lösung für lizenfreie Hintergrundmusik.
- Wavtool sieht sich als Assistenten für Musikproduzenten.
- Amadeus Code ist als Anregung für neue Songideen gedacht.
- Project Music GenAI Control nennt Adobe sein Werkzeug, das Musikern hilfreich zur Seite stehen soll.
- Tuney sieht sich ebenfalls als Unterstützer für Musiker und hilft beim Generieren, Produzieren, Bearbeiten und Remixen.
Ich bin mir sicher, dass diese Liste unvollständig ist. Schlusswort Letztlich scheint es hier drei wesentliche Zielgruppen zu geben. Als erstes sehe ich dort Content Creator inklusive Unternehmen, die Musik als Begleitung für Inhalte wie Videos oder Podcasts benötigen. Als zweites sind es Musiker, die sich eher für die Werkzeuge interessieren, die bestimmte Handgriffe erleichtern oder Loops auf Knopfdruck versprechen. Und als drittes die Laien, die schon immer davon geträumt haben, Musik zu machen. Offen scheint mir persönlich, wie groß der Markt für solche Angebote ist. Viele der hier genannten Tools legen inzwischen übrigens offen, woher sie ihr Trainingsmaterial haben. Für den professionellen Einsatz ist außerdem wichtig zu wissen, ob und unter welchen Bedingungen du deine Ergebnisse kommerziell nutzen darfst. Hier hilft leider oft nur ein Blick in die Geschäftsbedingungen der Dienste. - Jan Tißler, UPLOAD Magazin
|
|
ANZEIGE
neuroflash: Die Nr.1 KI Content Suite für Marketing Teams
|
|
neuroflash ist die führende KI-Software zur Contentgenerierung im deutschsprachigen Raum. Das ist auch kein Wunder: Kein anderes Tool hat eine so hohe Qualität bei deutschen Texten wie das Angebot aus Hamburg. Schließe dich über 1 Million professionellen Content Creators und Teams an und transformiere deine Arbeit mit KI!
|
|
|
Möchtest du hier erscheinen?
Schalte eine Anzeige in den Newslettern des UPLOAD Magazins und erreiche über 4.000 interessierte Leser:innen.
|
|
|
|
TOOLS
Google zeigt neue KI-Angebote für Unternehmen
Google präsentierte auf seiner jährlichen Cloud-Computing-Konferenz in Las Vegas eine Reihe von Updates für seine KI-Angebote im Unternehmensbereich. Trotz jüngster Pannen bei verbraucherorientierten Tools betonte das Unternehmen, dass die Technologie sicher und einsatzbereit für den Unternehmensbereich sei. Google Cloud CEO Thomas Kurian demonstrierte, wie das leistungsstärkste KI-Modell Gemini für Werbung, Cybersicherheit, Videos und Podcasts genutzt werden kann. Außerdem stellte Google einen neuen Chip vor, der die enormen KI-Workloads bewältigen und die damit verbundenen steigenden Kosten kontrollieren soll. Schauen wir uns einige der Neuigkeiten von Google noch genauer an: Google stellte mit „Vids“ etwa eine KI-gestützte App zur Erstellung von Videos für die Arbeit vor, die eine benutzerfreundliche Oberfläche, Vorlagen und eine Integration in bestehende Google-Dienste bietet. Obwohl es bereits zahlreiche KI-Videotools auf dem Markt gibt, könnte Google Vids durch seinen Komfort und die nahtlose Einbindung in Google Workspace punkten, auch wenn es spezialisierte Videosoftware nicht ersetzen wird. Googles leistungsstärkstes generatives KI-Modell Gemini Pro 1.5 ist nun auf der Entwicklungsplattform Vertex AI in einer öffentliche Vorschau nutzbar. Mit einem Kontext von bis zu einer Million Token ermöglicht es unter anderem die Analyse umfangreicher Dokumente, langer Konversationen mit Chatbots sowie die Verarbeitung von Audio- und Videoinhalten. Google kündigte außerdem Updates für sein KI-Bildgenerierungsmodell Imagen 2 an, darunter die Fähigkeit, aus Textanweisungen viersekündige Animationen zu erstellen sowie Bildelemente hinzuzufügen, zu entfernen oder den Bildausschnitt zu erweitern. Diese Neuerungen sollen vor allem Unternehmen dabei helfen, ansprechende visuelle Inhalte zu erstellen, die ihren Markenrichtlinien und Governance-Anforderungen entsprechen. Google Workspace führt zudem KI-gestützte Funktionen ein, um Meetings zu optimieren und die Datensicherheit zu verbessern. Dazu gehören zwei kostenpflichtige Programme, die Googles hauseigene KI Gemini nutzen, um Besprechungen effizienter zu gestalten und sensible Daten zu schützen. Google hat nicht zuletzt mit RecurrentGemma ein neues, effizientes Sprachmodell vorgestellt, das fortschrittliche KI-Textverarbeitung auch auf ressourcenbeschränkten Geräten wie Smartphones und IoT-Systemen ermöglicht.
|
|
Adobe kündigt KI-Videofunktionen für Premiere Pro an
Adobe plant, seine Videobearbeitungssoftware Premiere Pro um Plug-ins für KI-Videogeneratoren von Drittanbietern wie OpenAIs Sora, Runway ML's Gen-2 und Pika 1.0 zu erweitern. Diese Integration würde es Nutzern ermöglichen, mit herkömmlichen Kameras aufgenommenes Material nahtlos mit KI-generiertem Content zu kombinieren und zu bearbeiten. Darüber hinaus kündigt Adobe eine Version seines eigenen KI-Bildgenerators Firefly für Premiere Pro noch in diesem Jahr an. Sie soll neue generative KI-Workflows und Funktionen wie „Generative Extend“ ermöglichen, mit denen sich Clips ohne zusätzliche Aufnahmen verlängern lassen.
|
|
Weitere Tools in aller Kürze
Reka, ein KI-Startup aus San Francisco, stellt mit Reka Core ein leistungsstarkes multimodales Sprachmodell vor, das es in weniger als einem Jahr entwickelt hat und dabei mit führenden Modellen von OpenAI, Google und Anthropic mithalten oder diese sogar übertreffen kann. Das Modell versteht verschiedene Modalitäten wie Bild, Audio und Video, unterstützt 32 Sprachen und bietet ein Kontextfenster von 128.000 Token, wodurch sich Reka Core für vielfältige Anwendungsfälle in unterschiedlichen Branchen eignen sollte. Zyphra stellt mit Zamba ein quelloffenes 7-Milliarden-Parameter-Modell vor, das künstliche Intelligenz auf mehr Geräte bringen soll. Durch den dezentralen Ansatz und die geringere Modellgröße soll Zamba eine kostengünstigere und personalisierte Alternative zu den großen, zentralisierten KI-Modellen bieten. STORM ist ein KI-System, das Wikipedia-ähnliche Artikel von Grund auf schreiben kann, indem es das Internet durchsucht und in einem zweistufigen Prozess zunächst einen Entwurf mit Gliederung und Referenzen erstellt und anschließend den vollständigen Artikel mit Zitaten. Quelle: Hacker News Der Browser Brave ergänzt eine auf Datenschutz fokussierte, KI-gestützte „Antwortmaschine“ in seine Suchmaschine Brave Search. Sie kann Antworten in Form von Text, Informationskarten und Bildern liefern. KI-Bildgenerator Ideogram hat mehrere neue Funktionen veröffentlicht. Eine ermöglicht es Benutzern, Bilder auf der Grundlage von Textbeschreibungen von Referenzbildern zu erstellen. Negative Prompts helfen nun dabei, bestimmte Elemente in einem Bild zu vermeiden. Optionen für den Geschwindigkeitsmodus bieten zudem Kompromisse zwischen Geschwindigkeit und Bildqualität. Anthropic hat sein fortschrittlichstes Sprachmodell Claude 3 Opus auf Amazon Bedrock zugänglich gemacht. Entwickler können nun mithilfe von Opus generative KI-Anwendungen erstellen. Zunächst ist es nur in der Region US West (Oregon) verfügbar. Die Universität von Chicago hat Glaze 2 veröffentlicht. Es ist eine verbesserte Version ihres kostenlosen Tools, das Künstlern hilft, ihre Werke vor unerlaubtem KI-Scraping zu schützen. Geplant ist außerdem ein Schutz für Videos. Loki ist eine Open-Source-Lösung, die den Prozess der Faktenüberprüfung automatisieren will. Das Tool zerlegt dafür lange Texte in einzelne Behauptungen, bewertet deren Verifizierungswürdigkeit, sucht nach Belegen und überprüft letztendlich die Richtigkeit der Aussagen. Quelle: Hacker News Das französische Startup Mistral AI hat das neue KI-Modell Mixtral 8x22B veröffentlicht. Interessierte können es frei herunterladen und einsetzen. Es könnte die Leistung von Modellen wie GPT-3.5 und Llama 2 70B erreichen und übertreffen. Stability AI hat sein Sprachmodell Stable LM 2 auf 12 Milliarden Parameter erweitert und damit dessen Leistungsfähigkeit deutlich gesteigert. Das Unternehmen strebt an, mit dem Update eine gute Balance zwischen Leistung, Genauigkeit und Zugänglichkeit zu erreichen. Es positioniert das Modell als Teil umfassenderer Systeme, in denen Sprachmodelle untereinander interagieren und externe Werkzeuge nutzen können. Logitech stellt mit dem Logi AI Prompt Builder eine neue Software vor, die ChatGPT in die Logi Options+ App integriert. Sie soll Nutzern ermöglichen, KI-Funktionen einfacher in ihren Arbeitsablauf einzubinden. Passend dazu launcht Logitech auch die Signature AI Edition Mouse, eine Maus mit dedizierter KI-Prompt-Taste, die ab diesem Monat für 49,99 US-Dollar erhältlich ist. Limitless ist ein neues KI-Werkzeug, das Besprechungen aufzeichnet, transkribiert und zusammenfasst sowie Echtzeit-Notizen liefert. Der dazugehörige „Limitless Pendant“ ist ein tragbares Gerät, das Audio automatisch aufnimmt und an die Cloud sendet. Das klingt zwar nützlich, allerdings auch wie ein enormes Datenschutzproblem … Quelle: The Verge
|
|
Weitere News in aller Kürze
Der Facebook-Konzern Meta will ab Mai häufiger Label für KI-generierte Inhalte anzeigen. Bislang gab es diese Kennzeichnung nur in sehr speziellen Fällen, berichtet Axios. Auch Snapchat setzt auf mehr Transparenz und strengere Richtlinien bei der Nutzung von KI. So bekommt jedes Bild, das mit Snap AI erzeugt wurde, ein neues Wasserzeichen. Quelle: TechCrunch Die EU und die USA wollen ihre Zusammenarbeit im Bereich KI verstärken, insbesondere in den Bereichen Sicherheit, Governance und Forschung zu Risiken und nützlichen Anwendungen. Sie fordern außerdem Plattformen auf, den Zugang zu Daten für Forscher zu erleichtern, um gesellschaftliche Risiken besser untersuchen zu können. Quelle: TechCrunch Die NSA veröffentlicht in Zusammenarbeit mit internationalen Partnern einen Leitfaden mit Best Practices für die sichere Bereitstellung und den Betrieb von KI-Systemen. Das Cybersecurity Information Sheet richtet sich primär an Betreiber nationaler Sicherheitssysteme und Unternehmen der Verteidigungsindustrie, ist aber auch für andere Organisationen relevant. Quelle: Hacker News Das KI-Startup Symbolica setzt auf einen neuartigen Ansatz, der KI-Modelle angeblich mit menschenähnlichen Denkfähigkeiten und bisher unerreichter Transparenz ausstatten soll. Das Unternehmen will nach eigener Aussage die „Alchemie“ heutiger KI-Systeme überwinden und eine wissenschaftliche Grundlage schaffen, die zu interpretierbaren, dateneffizienten und regulierbaren KI-Modellen führen soll. Quelle: VentureBeat Google-Forscher haben mit „Infini-attention“ eine Technik entwickelt, die es Sprachmodellen ermöglicht, Texte von theoretisch unendlicher Länge zu verarbeiten, ohne zusätzlichen Speicher- und Rechenaufwand zu benötigen. Quelle: VentureBeat Poe führt ein neues Einnahmemodell ein, bei dem die Ersteller von KI-Bots auf der Plattform einen Preis pro Nachricht festlegen können, um Geld zu verdienen, wenn Nutzer mit ihren Bots interagieren. Quelle: TechCrunch
|
|
LesetippS
Warum Unternehmen bei generativer KI so zurückhaltend sind
Wer dem Hype glaubt, könnte meinen, die Welt sei bereits komplett auf KI-Werkzeuge umgestiegen. Die Wirklichkeit aber sieht anders aus. Andreas Goeldi beschreibt bei b2venture, woher das kommt. So sind der „Hype Cycle“ mit seiner schnellen Begeisterung und die tatsächliche Implementation nicht deckungsgleich. Zu den Schwierigkeiten für Unternehmen gehöre es unter anderem, dass der Nutzen und die Fähigkeiten der KI-Tools schwer einzuschätzbar seien. In eine ähnliche Kerbe schlägt dabei das Content Marketing Institute: In seinem Beitrag regt es an, sich zuerst ums Change Management zu kümmern, anstatt sofort alle verfügbaren KI-Tools anzuschaffen. Ebenfalls relevant ist eine neue Publikation des deutschen Bundesamtes für Sicherheit in der Informationstechnik. Sie erklärt Chancen und Risiken generativer KI-Modelle für Unternehmen und Behörden.
|
|
Stanford University veröffentlicht neuen AI Index Report
Was können KI-Werkzeuge bereits und wie entwickelt sich die Industrie als Ganzes? Dem geht die neue Ausgabe des AI Index Reports der Stanford University ausführlich auf den Grund. Dabei stellen sie fest, dass KI heute bereits Menschen in einigen Aufgaben überlegen ist, aber längst nicht allen. Die meisten neuen KI-Modelle kommen derweil von Unternehmen (51) und nicht aus der Forschung (15). Das ist auch kein Wunder, denn es wird immer aufwändiger und damit teurer, leistungsfähigere Modelle zu entwickeln. Allein das Training von Google Gemini Ultra soll 191 Millionen US-Dollar an Rechenleistung verschlungen haben.
|
|
KI-Tools sind nicht nutzlos, aber sind sie es wert?
Und wer sich einmal mit einer durchdachten, skeptischen Sicht auf den KI-Hype auseinandersetzen möchte, sollte diesen Beitrag von Molly White lesen. Sie stellt in Frage, ob die heutigen KI-Werkzeuge wirklich wert sind, was sie kosten. Und damit meint sie nicht primär monetäre Kosten, sondern etwa Auswirkungen auf die Umwelt durch den enormen Energiebedarf und andere potenziell negative Effekte auf Menschen und Gesellschaft.
|
|
Fundstück
Kann ChatGPT Memes?
|
|
Redditor ForceTypical hat ChatGPT dazu aufgefordert, Memes zu generieren. Die Ergebnisse sind wie erwartet kurios.
|
|
Was bedeutet …
Open Weights
Manche KI-Anwendungen sind frei verfügbar. Man denke hier etwa an Sprachmodelle des französischen Anbieters Mistral oder an die Llama-Familie aus dem Hause Facebook/Meta. Allerdings ist es nicht korrekt, diese als „open source“ zu bezeichnen. Denn was man als Nutzer erhält, ist das Endergebnis des Trainings, der Kern eines Large Language Models, „Weights“ genannt. Nicht automatisch enthalten ist aber das Trainingsmaterial oder der Trainingsprozess. Mit anderen Worten: Solche KI-Modelle lassen sich zwar kostenlos nutzen und sogar in gewissen Grenzen abwandeln und verfeinern (siehe „Fine Tuning“ in Smart Content Report #2). Man bekommt aber nicht alle Bausteine, um daraus seine eigene KI von Grund auf zu erstellen. Deshalb wird oftmals der Begriff „open weights“ bevorzugt, um diesen wichtigen Unterschied kenntlich zu machen. Allerdings gibt es dafür noch keine allgemein anerkannte Definition.
|
|
Wir über uns
Gefällt dir dieser Newsletter? Dann empfiehl ihn doch weiter! Verweise dazu am besten auf https://upload-magazin.de/smart-content-report/ Wir haben zwei weitere Newsletter, die für dich relevant sind:
Das Content-Briefing liefert dir immer im Wechsel mit dem Smart Content Report einen praktischen Tipp für deine Content-Arbeit sowie Lesetipps andernorts. Ansehen …
Mit dem Update am Montag wiederum erfährst du einmal pro Woche, welche neuen Inhalte und Angebote du beim UPLOAD Magazin findest. Ansehen …
|
|
|