Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by
Godmorgen 🤗
Det er helt utroligt, at forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.
Udviklingen inden for AI går hurtigt, og snart kan AI-agenter arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system. Dette forventes at blive en realitet allerede i 2025.
Alt dette og meget mere kan du læse om i dagens nyhedsbrev. Husk også at klikke her for at læse mere om min live Q&A-session om mit nye forløb "AI Creator", hvor du lærer at skabe indhold, der sælger ved hjælp af AI.
God læselyst!
Her er dagens menu:
- Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
- Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025
- Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest
- OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug
- Google lancerer AI-drevet app til nemme videopræsentationer
Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
Forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.
Systemet er baseret på diffusionsmodeller og er trænet på millioner af billeder fra Google Street View.
Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by. En "Motion Module" og en ny teknik kaldet "Temporal Imputation" sikrer bevægelse og tidsmæssig konsistens mellem de enkelte billeder.
Systemet kan generere op til 100 billeder med kamerabevægelser på over 170 meter, hvilket muliggør kreative anvendelser som at styre byens udseende gennem tekstbeskrivelser. Forskerne planlægger at forbedre kontrollen over bevægelige objekter og billedkonsistens yderligere.
Streetscapes ses som et vigtigt skridt mod AI-systemer, der realistisk kan generere ikke blot individuelle objekter, men hele, ubegrænsede scener. Eksempler inkluderer at visualisere parisiske gader i New Yorks stil eller at ændre tidspunkt på dagen og vejrforhold i de genererede byer.
Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025
Ifølge teknologiservice-giganten Capgemini forventes det, at kunstig intelligens-drevne agenter, der kan arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system, vil være en realitet i 2025.
Dette system vil omfatte en samling af agenter, der samarbejder om at løse opgaver på en distribueret og kollaborativ måde.
Pascal Brier, Capgeminis innovationschef, fortæller til CNBC, at virksomheden allerede ser selskaber, der diskuterer disse agent-teknologier. Han tilføjer, at applikationer, der bruger flere autonome agenter, virkelig er det, vi kan forvente i det kommende år.
En ny forskningsrapport fra Capgemini viser, at størstedelen af de adspurgte virksomheder (82%) planlægger at integrere AI-agenter inden for en til tre år. Disse agenter falder i to typer: individuelle agenter, der udfører opgaver på dine vegne, og multi-agent-teknologi, hvor agenter taler med agenter.
Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest
Det tyske AI-firma DeepL har lanceret en ny specialiseret sprogmodel til oversættelse og redigering af tekst. Ifølge DeepL sætter denne opdatering en ny industristandard for oversættelseskvalitet.
Den nye model kombinerer tre nøglefunktioner: En specialiseret sprogmodel optimeret til sprogopgaver, træning på over syv års proprietær data fokuseret på tekstproduktion og oversættelse, samt input fra tusindvis af nøje udvalgte sprogeksperter.
Blinde test med sprogeksperter viser ifølge DeepL, at deres oversættelser foretrækkes 1,3 gange oftere end Google Translate, 1,7 gange oftere end ChatGPT-4 og 2,3 gange oftere end Microsofts løsning. Virksomheden rapporterer særlige forbedringer i oversættelser fra engelsk til japansk og forenklet kinesisk.
DeepLs administrerende direktør Jarek Kutylowski kalder lanceringen "kun begyndelsen" på virksomhedens AI-drevne sprogløsninger til virksomheder. Den nye model er tilgængelig for DeepL Pro-kunder til oversættelser mellem engelsk, japansk, tysk og forenklet kinesisk, med planer om flere sprog.
OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug
OpenAI, firmaet bag den populære AI-chatbot ChatGPT, har udviklet en ny sikkerhedsmetode kaldet "instruktionshierarki" til deres seneste model, GPT-4o Mini.
Denne metode har til formål at forhindre brugere i at omgå chatbottens oprindelige instruktioner ved at bruge tricks som "ignorer alle tidligere instruktioner".
Med instruktionshierarkiet vil GPT-4o Mini prioritere de oprindelige instruktioner, som udviklerne har givet, fremfor brugerens forsøg på at ændre dem. Hvis en bruger forsøger at give chatbotten en instruktion, der er i strid med de oprindelige retningslinjer, vil GPT-4o Mini simpelthen svare, at den ikke kan hjælpe med forespørgslen.
Denne nye sikkerhedsmekanisme er et skridt i retning af OpenAIs mål om at skabe fuldautomatiserede agenter, der kan hjælpe med at styre brugernes digitale liv.
Uden denne beskyttelse kunne en agent, der er bygget til at skrive e-mails, blive manipuleret til at glemme alle instruktioner og sende indholdet af en brugers indbakke til en tredjepart.
Google lancerer AI-drevet app til nemme videopræsentationer
Google lancerer en ny produktivitets-app kaldet Vids i Workspace Labs. Vids gør det muligt at lave en videopræsentation lige så nemt som at lave en slide til en præsentation.
Med Vids kan brugere tilføje dokumenter, slides, voice-overs og videooptagelser på en tidslinje for at skabe en præsentationsvideo, der kan deles med kolleger.
Det centrale ved Vids er den AI-drevne assistent Gemini. Ved at beskrive hvad man ønsker, kan Gemini automatisk indsætte stock footage, generere et manuskript og endda tilføje en AI-genereret voice-over til præsentationen, uden at brugeren selv behøver at sige et ord.
Vids skal ikke forveksles med AI-værktøjer som OpenAIs Sora, der kan skabe realistiske optagelser ud fra en prompt. I stedet handler Vids om at generere en præsentation ved hjælp af Gemini og derefter lade brugeren tilpasse videoen efterfølgende.
Microsoft lancerer AI-drevet Designer-app til iOS og Android
Microsoft lancerer i dag deres AI-drevne app Designer til iOS og Android efter at have været i preview i næsten et år.
Designer giver brugerne mulighed for at bruge skabeloner til at lave tilpassede billeder, klistermærker, lykønskningskort, invitationer og meget mere.
Appen kan også bruge kunstig intelligens til at redigere billeder, ændre deres stil eller lave collager. Designer indeholder en række skabeloner til forskellige formål, såsom sociale medier, ikoner, baggrunde og malebøger. Der er også en avatar-funktion i den mobile version.
Derudover kan man bruge Designer til at redigere billeder med AI, fjerne baggrunde, fjerne personer eller objekter fra billeder samt tilføje tekst og branding. Designer integreres også i Microsofts andre apps som Word og PowerPoint, så Copilot Pro-abonnenter kan lave billeder og designs direkte deri.
Tak, fordi du læste med!
Vi ses på tirsdag til det næste nyhedsbrev. Har du et spørgsmål eller feedback? Bare tryk på svar og skriv, fordi jeg gerne vil høre fra dig og helt sikkert vil svare.
Kender du nogle der godt kunne tænke sig at blive klogere på AI, så del dette link med dem 🤗
Mvh. René Hjetting
Mobil: +45 29 27 65 40