Außerdem: Meta beeindruckt mit Llama 3, Updates bei ChatGPT, myteriöser Chatbot sorgt für Aufregung, die ökonomischen Auswirkungen der KI und mehr ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏
Smart Content Report #9
Ausprobiert: Bilder generieren mit iStock
KI-Bildgeneratoren gibt es jede Menge. In Smart Content Report #4 findest du eine Auswahl. Aber oftmals haben sie ein Problem: Urheberrecht. Zum einen ist nicht immer klar, woher das Trainingsmaterial stammt. Zum anderen ist nicht gesichert, inwiefern man sich mit solchen Bildern selbst in rechtliche Schwierigkeiten bringt. Siehe Smart Content Report #2. Solche Bildgeneratoren kommen für Unternehmen und andere Organisationen oft nicht in Frage, denn ihre Einführung ist (oder scheint) zu riskant. Genau hier sehen Anbieter eine Chance, deren Geschäft durch KI-Bildgeneratoren direkt bedroht wird: Stockphoto-Plattformen. Ich konnte nun „Generative AI by iStock“ ausprobieren, eine Kooperation zwischen dem Bildergiganten Getty Images und dem Hardware-Spezialisten Nvidia. Er verspricht einen „integrierten Rechtsschutz“. Mir wurden Credits für 100 generierte Bilder zur Verfügung gestellt. Um die Qualität des Generators im Detail beurteilen zu können, müsste ich ihn noch länger und intensiver testen. Ich hatte den Eindruck, dass es sich auf dem aktuell erwartbaren Niveau bewegt. Mit anderen Worten: Es lassen sich gute Ergebnisse erzielen – manchmal mit mehr, manchmal mit weniger Aufwand. Typische Probleme, wie etwa inkorrekte Hände, sind ebenfalls anzutreffen. Nützlich sind Funktionen wie „Optimieren“, um bestimmte Teile eines Bildes zu verändern, und „Erweitern“, wenn man beispielsweise aus einer quadratischen Vorlage ein Ergebnis im Breitformat erstellen möchte. Diese Funktionen gibt es übrigens ebenfalls für Bilder aus dem klassischen Katalog von iStock. Das finde ich eine gute Idee, da es mir regelmäßig passiert, dass ein Bild nur beinahe passt, ich aber nicht die Ressourcen habe, um es entsprechend zu verändern. Gut gefiel mir die Benutzeroberfläche des Bildgenerators. Sie macht es einfach, das Bildformat auszuwählen oder die Farbstimmung. Eine hilfreiche Funktion ist es, ein bereits recht gut gelungenes Motiv mit einem Klick als Ausgangspunkt für weitere Varianten zu nutzen. Startpunkt ist wie meist üblich ein Prompt. Bei iStock gibt es hier Eingabefelder für „Hauptmotiv“, „Handlung“, „Umgebung“ und „visuelle Ästhetik“. Das sorgt dafür, dass man das gewünschte Ergebnis genau genug beschreibt. Auch ein negativer Prompt ist möglich, um bestimmte Elemente zu vermeiden. Laien wird es allerdings nicht immer leicht fallen, diese Felder auszufüllen. Wenn ich mich auf die Suche nach Stockphotos mache, habe ich oftmals nur eine vage Vorstellung, was ich eigentlich haben möchte. Ich nähere mich dem Endergebnis schrittweise an und lasse mich durch das anregen, was ich auf der Plattform finde. Auf Nachfrage erklärte Grant Farhall, Chief Product Officer bei Getty Images und iStock, dass sie für diesen Zweck ein „Lookbook“ eingeführt haben. Es versammelt Beispiele für Motive und Stile, die als Anregung dienen können. Im Mai ist außerdem geplant, dass Unternehmen Vorgaben festlegen können, damit die generierten Bilder besser dem internen Stylguide entsprechen. Fazit Der Bildgenerator von iStock ist schon in dieser frühen Version ein interessantes Angebot für Unternehmen. Er ist eine sinnvolle Ergänzung zur Stockphoto-Plattform. Eine Video-KI ist ebenfalls angekündigt – in Zusammenarbeit mit dem Startup Runway. - Jan Tißler, UPLOAD Magazin
|
|
ANZEIGE
neuroflash: Die Nr.1 KI Content Suite für Marketing Teams
|
|
neuroflash ist die führende KI-Software zur Contentgenerierung im deutschsprachigen Raum. Das ist auch kein Wunder: Kein anderes Tool hat eine so hohe Qualität bei deutschen Texten wie das Angebot aus Hamburg. Schließe dich über 1 Million professionellen Content Creators und Teams an und transformiere deine Arbeit mit KI!
|
|
|
Möchtest du hier erscheinen?
Schalte eine Anzeige in den Newslettern des UPLOAD Magazins und erreiche über 4.000 interessierte Leser:innen.
|
|
|
|
TOOLS
Metas beeindruckende ChatGPT-Alternative Llama 3
Meta stellt mit Llama 3 die neueste Generation seiner Sprachmodelle vor, die sie frei zum Download zur Verfügung stellen. Die Modelle sollen in puncto Leistung viele Konkurrenten übertreffen und selbst mit einigen der besten proprietären Modelle mithalten können. Llama 3 glänzt offenbar insbesondere bei Multiple-Choice-Fragen, Programmieraufgaben und mathematischen Problemen. Neben den Modellen selbst präsentiert Meta einen eigenständigen Chatbot, der auf Llama 3 basiert und als direkte Konkurrenz zu ChatGPT und anderen positioniert ist. Dieser Chatbot integriert Metas Bildgenerator „Imagine“.
|
|
ChatGPT-Update bringt „Gedächtnis“ und temporäre Chats
ChatGPT hat einige Updates erhalten. Besonders interessant scheint die Memory-Funktion, mit der sich ChatGPT Informationen merken kann, die Nutzer ihm mitteilen. So lassen sich beispielsweise Details über die eigene Person oder das Unternehmen speichern, auf die der Chatbot dann bei Bedarf zurückgreifen kann. Weitere Neuerungen sind die Möglichkeit, temporäre Chats zu führen, die nach 30 Tagen gelöscht werden, und eine verbesserte Verwaltung des Chatverlaufs.
|
|
Weitere Tools in aller Kürze
Mit den Gemini-Erweiterungen lassen sich nun auch in Deutschland Google-Dienste wie Maps, Flüge und Hotels direkt in Gemini nutzen. Das ermöglicht beispielsweise eine deutlich effizientere Reiseplanung, da Gemini relevante Informationen aus E-Mails und Google-Diensten kombiniert und aufbereitet. Das neue KI-Modell AdaKWS der Firma aiOla, einem Spezialisten für Spracherkennung, will durch seine Fähigkeit überzeugen, Sprache auch dann in korrekten Text umzuwandeln, wenn es sich um Fachjargon handelt. Das Modell erreicht eine Genauigkeit von 94,6% – besser als OpenAIs Whisper. Microsoft's VASA-1 kann menschliche Porträts zum Singen und Sprechen bringen. Er benötigt lediglich ein Standbild und eine Audiodatei mit Sprache, um bewegte Lippen, passende Mimik sowie Kopfbewegungen zu generieren. Microsoft betont, dass es sich dabei um eine reine Forschungsdemonstration handelt, ohne Pläne zur Markteinführung. Das Londoner Unternehmen Synthesia führt „Expressive Avatars“ ein, eine neue Generation von KI-Avataren, die ihre Mimik, Gestik und ihren Tonfall an den Kontext der gesprochenen Inhalte anpassen. Dies ermögliche es etwa, realistischere und emotionalere KI-Videos für Marketing, Schulungen oder Patientenkommunikation zu erstellen. VideoGigaGAN übertrifft bisherige Verfahren, um Videos hochzuskalieren, und erzeugt Videos mit hoher Detailgenauigkeit und Konsistenz. Der Ansatz basiert auf dem Bild-Hochskalierer GigaGAN und behebt dessen Probleme bei der Videoverarbeitung durch spezielle Techniken, die zu schärferen und gleichzeitig flüssigeren Videos führen. Quelle: Hacker News Microsoft stellt mit Phi-3 Mini sein bisher kleinstes KI-Modell vor, das trotz seiner geringen Größe mit großen Sprachmodellen wie GPT-3.5 mithalten kann und sich besonders für Unternehmen mit kleineren Datensätzen und begrenztem Budget eignet. Adobe integriert seine KI-Bildgenerierung Firefly direkt in Photoshop, sodass Nutzer Bilder per Texteingabe erstellen und diese anschließend mit den gewohnten Photoshop-Werkzeugen bearbeiten können. Apple veröffentlicht OpenELM, eine Reihe kleiner, frei angebotener KI-Modelle, die direkt auf Geräten wie Laptops oder Smartphones laufen können und Aufgaben wie Textgenerierung effizient ausführen. Obwohl OpenELM in seiner Leistung nicht branchenführend ist, bietet es eine solide Basis für zukünftige Forschung und Entwicklung im Bereich der On-Device-KI. Der KI-Chatbot Amazon Q ist ab sofort allgemein verfügbar und unterstützt Unternehmen bei Aufgaben wie Wissensabruf, Softwareentwicklung und Datenanalyse. Anthropic, Macher des ChatGPT-Konkurrenten Claude, stellt die Geschäftslösung „Team“ vor. Sie enthält u.a. Zugang zu den drei neuesten Claude-Modellen, hat erhöhte Nutzungslimits, außerdem Admin-Tools und Rechnungsverwaltung und bietet längere Kontextfenster, mit der sich umfangreiche Dokumente für die Verarbeitung hochladen lassen. Darüber hinaus gibt es nun eine iPhone-App. Snowflake stellt mit Arctic ein neues, offenes Sprachmodell vor, das speziell für komplexe Aufgaben in Unternehmen entwickelt ist, wie z.B. das Generieren von SQL-Abfragen und Code oder das Befolgen von Anweisungen. Cohere veröffentlicht ein Toolkit, um die Entwicklung von generativen KI-Anwendungen in Unternehmen zu beschleunigen. Mit vorgefertigten Anwendungen und einfach zu implementierenden Komponenten will das Toolkit die Entwicklungszeit verkürzen. Salesforce Einstein Copilot, ein KI-gestütztes Tool für Unternehmen, ist nun allgemein verfügbar und soll es Vertriebsteams ermöglichen, durch generierte Texte und automatisierte Aktionen produktiver zu arbeiten. Dabei kann Einstein Copilot komplexe Aufgaben in Einzelschritte zerlegen und diese ausführen, um beispielsweise die besten Verkaufschancen zu identifizieren und E-Mail-Entwürfe zu erstellen. OpenVoice erlaubt es Nutzern, Stimmen in verschiedenen Sprachen und Akzenten realistisch zu klonen und sogar Emotionen und Sprechstile zu steuern. Die neueste Version, OpenVoice V2, bietet eine verbesserte Audioqualität, native Unterstützung für mehrere Sprachen und ist für die kommerzielle Nutzung kostenlos verfügbar. Quelle: Hacker News
|
|
News
Mysteriöser Chatbot aufgetaucht und wieder verschwunden
Ein mysteriöser Chatbot namens „gpt2-chatbot“ sorgte diese Woche für Aufsehen unter Fachleuten. Seine Fähigkeiten schienen auf dem Niveau von GPT-4 zu liegen, doch seine Herkunft blieb unbekannt. Nach kurzer Zeit verschwand der Bot wieder von der Bildfläche, vermutlich aufgrund des hohen Interesses. Spekulationen über den Entwickler, darunter OpenAI, Google und Anthropic, schießen ins Kraut. Es bleibt abzuwarten, wer hinter dem „gpt2-chatbot“ steckt – ob nun ein neues KI-Modell oder gar ein neuer Entwickler.
|
|
Weitere News in aller Kürze
Forscher von Meta und der University of Southern California haben mit „Megalodon“ eine neue Architektur für KI-Modelle entwickelt. Es ermöglicht Sprachmodellen, deutlich größere Textmengen zu verarbeiten, ohne dabei viel Speicherplatz zu benötigen. Über die Hälfte der US-Amerikaner hat generative KI bereits ausprobiert, wobei die Mehrheit (82%) sie als Bereicherung für ihre Kreativität und zur Vereinfachung des Lebens ansieht. Besonders beliebt ist die Technologie für persönliche Projekte (81%) und zur Recherche sowie zum Brainstorming (64%). Das ergab eine Untersuchung von Adobe Analytics. Forscher von DeepMind haben herausgefunden, dass große Sprachmodelle durch hunderte oder sogar tausende von Beispielen im Prompt neue Fähigkeiten erlernen können, ohne dass ein Fine Tuning des Modells erforderlich ist. Diese Methode ermöglicht es Unternehmen, schnell Prototypen von KI-Anwendungen zu erstellen und zu entwickeln. Obwohl die Mehrheit der IT-Chefs weltweit künstliche Intelligenz als Top-Priorität einstuft, zeigt eine aktuelle Umfrage, dass die meisten Unternehmen noch nicht ausreichend auf deren Einsatz vorbereitet sind. Hemmnisse liegen vor allem in der fehlenden IT-Infrastruktur und unklaren Richtlinien zum ethischen Umgang mit KI. Die österreichische Verbraucherorganisation noyb verklagt OpenAI, weil ChatGPT falsche Informationen zu Personen verbreitet, was der DSGVO widerspricht. Google DeepMind entwickelt mit „Gecko“ einen neuen Standard, um die Fähigkeiten von KI-Bildgeneratoren genauer zu bewerten. Es soll dabei helfen, die Stärken und Schwächen der KI-Modelle besser zu verstehen und ihre Entwicklung voranzutreiben. Das KI-gestützte Suchtool Perplexity hat eine neue Finanzierungsrunde abgeschlossen und wird mit über einer Milliarde Dollar bewertet. Mit dem frischen Kapital und einem neuen Enterprise Pro Plan will das Unternehmen nun global expandieren und seinen sicheren, KI-gestützten Suchdienst für Unternehmen anbieten.
|
|
LesetippS
Cyc: Ein fast vergessenes KI-Projekt
Seit vier Jahrzehnten arbeitet das Cyc-Projekt daran, Maschinen mit logischem Denken auszustatten. Dazu haben die Forscher ein riesiges Wissensnetzwerk aus Millionen von Konzepten und Regeln aufgebaut. Cyc kann Schlussfolgerungen ziehen, Fragen beantworten und sogar widersprüchliche Informationen aus verschiedenen Bereichen miteinander vereinbaren. Trotz dieser beeindruckenden Leistungen ist Cyc heute weitgehend in Vergessenheit geraten. Neue, auf maschinellem Lernen basierende Ansätze haben die KI-Forschung revolutioniert. Doch das Cyc-Projekt gibt nicht auf und sucht nach Möglichkeiten, seine Stärken mit denen von Systemen wie ChatGPT zu kombinieren. Ob die Zeit der regelbasierten Systeme wie Cyc wiederkommt, bleibt abzuwarten.
|
|
Die ökonomischen Auswirkungen der KI
MIT-Forscher Andrew McAfee beschäftigt sich in seinem Report „The Economic Impact of Generative AI“ mit den möglichen Auswirkungen von KI-Tools auf die Wirtschaft. Obwohl generative KI einige Berufe verändern oder gar überflüssig machen könnte, prognostiziert der Autor insgesamt eine steigende Nachfrage nach Arbeitskräften – allerdings in neuen Berufsfeldern. Umfassende Weiterbildungsinitiativen werden daher unerlässlich sein, um den Wandel erfolgreich zu gestalten.
|
|
Ethische Fragen rund um menschlich scheinende KI-Anwendungen
Die zunehmende „Vermenschlichung“ von KI-Systemen wirft ethische und rechtliche Fragen auf. In einem lesenswerten Beitrag auf VentureBeat warnt James Thomason vor den Schattenseiten von menschenähnlicher KI. Besonders besorgniserregend sei der Einsatz von KI in sensiblen Bereichen wie Therapie und Bildung, wo menschliche Empathie und Verständnis unerlässlich seien. Thomason fordert Technologieunternehmen auf, ethische Richtlinien zu entwickeln und die Transparenz gegenüber Nutzern zu gewährleisten, um Vertrauen zu erhalten und rechtlichen Risiken vorzubeugen.
|
|
Fundstück
Wie sich ChatGPT das Innere eines Vulkans vorstellt
|
|
Ein Redditor fragte ChatGPT nach einer Illustration, die einen Querschnitt des aktiven Vulkans Mount Rainier im US-Bundesstaat Washington zeigt. Das Ergebnis sieht man oben – inklusive Tempel und Wasserfall. Andere Nutzer versuchten es ebenfalls, mit weiteren, höchst kuriosen Ergebnissen …
|
|
Was bedeutet …
Edge AI
KI-Anwendungen laufen heute vor allem in der „Cloud“, also auf mächtigen, spezialisierten Computern in Rechenzentren. Das aber wird nach Meinung von Fachleuten nicht immer so bleiben. Ergänzend dazu werde es mehr und mehr kleine Modelle geben, die direkt auf den Geräten der Anwender:innen funktionieren – vom PC bis zum Smartphone. Das hört auf den Namen Edge AI, in Anlehnung an den Begriff des Edge Computing. Es soll signalisieren, dass die eigentliche Arbeit am „Rand“ des Netzwerks stattfindet und nicht zentral. Möglich wird dies zum einen durch Fortschritte in der Chip-Technologie und zum anderen durch neue Methoden, um leistungsfähige KI-Modelle zu entwickeln, die deutlich weniger Ressourcen benötigen. Ein Ansatz ist es etwa, ein Modell für eine klar definierte Aufgabe zu trainieren anstatt als einen Alleskönner wie ChatGPT. Ein Vorteil ist, dass solche lokal laufenden KI-Modelle keinen Internetzugang benötigen und damit auch bei schlechtem Empfang auf dem Handy wie gewohnt funktionieren. Außerdem verbleiben die Daten der Nutzenden auf ihren Geräten und werden nicht zur Verarbeitung in die Cloud geschickt.
|
|
Wir über uns
Gefällt dir dieser Newsletter? Dann empfiehl ihn doch weiter! Verweise dazu am besten auf https://upload-magazin.de/smart-content-report/ Wir haben zwei weitere Newsletter, die für dich relevant sind:
Das Content-Briefing liefert dir immer im Wechsel mit dem Smart Content Report einen praktischen Tipp für deine Content-Arbeit sowie Lesetipps andernorts. Ansehen …
Mit dem Update am Montag wiederum erfährst du einmal pro Woche, welche neuen Inhalte und Angebote du beim UPLOAD Magazin findest. Ansehen …
|
|
|