Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
Lavet med Midjourney

Godmorgen 🤗

Det er helt utroligt, at forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.

Udviklingen inden for AI går hurtigt, og snart kan AI-agenter arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system. Dette forventes at blive en realitet allerede i 2025.

Alt dette og meget mere kan du læse om i dagens nyhedsbrev. Husk også at klikke her for at læse mere om min live Q&A-session om mit nye forløb "AI Creator", hvor du lærer at skabe indhold, der sælger ved hjælp af AI.

God læselyst!

Tilmeld dig Live Q&A om AI Creator her
På Workshoppen fortæller jeg om AI Creator forløbet der lærer dig at bruge forskellige AI værktøjer, så du kan skabe indhold der konverterer.

Her er dagens menu:

  • Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
  • Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025
  • Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest
  • OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug
  • Google lancerer AI-drevet app til nemme videopræsentationer
💡
Ugens AI-værktøj: Microsoft lancerer AI-drevet Designer-app til iOS og Android

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Foto: Google og The Decoder

Forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.

Systemet er baseret på diffusionsmodeller og er trænet på millioner af billeder fra Google Street View.

Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by. En "Motion Module" og en ny teknik kaldet "Temporal Imputation" sikrer bevægelse og tidsmæssig konsistens mellem de enkelte billeder.

Systemet kan generere op til 100 billeder med kamerabevægelser på over 170 meter, hvilket muliggør kreative anvendelser som at styre byens udseende gennem tekstbeskrivelser. Forskerne planlægger at forbedre kontrollen over bevægelige objekter og billedkonsistens yderligere.

Streetscapes ses som et vigtigt skridt mod AI-systemer, der realistisk kan generere ikke blot individuelle objekter, men hele, ubegrænsede scener. Eksempler inkluderer at visualisere parisiske gader i New Yorks stil eller at ændre tidspunkt på dagen og vejrforhold i de genererede byer.

Streetscapes AI generates uncannily realistic Street View scenes of entire cities from scratch
Stanford University and Google researchers have unveiled “Streetscapes,” an AI system capable of generating realistic street views of entire cities.

Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025

Lavet med Midjourney

Ifølge teknologiservice-giganten Capgemini forventes det, at kunstig intelligens-drevne agenter, der kan arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system, vil være en realitet i 2025.

Dette system vil omfatte en samling af agenter, der samarbejder om at løse opgaver på en distribueret og kollaborativ måde.

Pascal Brier, Capgeminis innovationschef, fortæller til CNBC, at virksomheden allerede ser selskaber, der diskuterer disse agent-teknologier. Han tilføjer, at applikationer, der bruger flere autonome agenter, virkelig er det, vi kan forvente i det kommende år.

En ny forskningsrapport fra Capgemini viser, at størstedelen af de adspurgte virksomheder (82%) planlægger at integrere AI-agenter inden for en til tre år. Disse agenter falder i to typer: individuelle agenter, der udfører opgaver på dine vegne, og multi-agent-teknologi, hvor agenter taler med agenter.

Autonomous AI workers that talk to each other will arrive in 2025, Capgemini predicts
Autonomous AI agents that can communicate with other AI agents will arrive by 2025, Pascal Brier, Capgemini’s chief innovation officer, told CNBC.

Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest

Foto: Deepl

Det tyske AI-firma DeepL har lanceret en ny specialiseret sprogmodel til oversættelse og redigering af tekst. Ifølge DeepL sætter denne opdatering en ny industristandard for oversættelseskvalitet.

Den nye model kombinerer tre nøglefunktioner: En specialiseret sprogmodel optimeret til sprogopgaver, træning på over syv års proprietær data fokuseret på tekstproduktion og oversættelse, samt input fra tusindvis af nøje udvalgte sprogeksperter.

Blinde test med sprogeksperter viser ifølge DeepL, at deres oversættelser foretrækkes 1,3 gange oftere end Google Translate, 1,7 gange oftere end ChatGPT-4 og 2,3 gange oftere end Microsofts løsning. Virksomheden rapporterer særlige forbedringer i oversættelser fra engelsk til japansk og forenklet kinesisk.

DeepLs administrerende direktør Jarek Kutylowski kalder lanceringen "kun begyndelsen" på virksomhedens AI-drevne sprogløsninger til virksomheder. Den nye model er tilgængelig for DeepL Pro-kunder til oversættelser mellem engelsk, japansk, tysk og forenklet kinesisk, med planer om flere sprog.

DeepL Translate: The world’s most accurate translator
Translate texts & full document files instantly. Accurate translations for individuals and Teams. Millions translate with DeepL every day.

OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug

Lavet med Midjourney

OpenAI, firmaet bag den populære AI-chatbot ChatGPT, har udviklet en ny sikkerhedsmetode kaldet "instruktionshierarki" til deres seneste model, GPT-4o Mini.

Denne metode har til formål at forhindre brugere i at omgå chatbottens oprindelige instruktioner ved at bruge tricks som "ignorer alle tidligere instruktioner".

Med instruktionshierarkiet vil GPT-4o Mini prioritere de oprindelige instruktioner, som udviklerne har givet, fremfor brugerens forsøg på at ændre dem. Hvis en bruger forsøger at give chatbotten en instruktion, der er i strid med de oprindelige retningslinjer, vil GPT-4o Mini simpelthen svare, at den ikke kan hjælpe med forespørgslen.

Denne nye sikkerhedsmekanisme er et skridt i retning af OpenAIs mål om at skabe fuldautomatiserede agenter, der kan hjælpe med at styre brugernes digitale liv.

Uden denne beskyttelse kunne en agent, der er bygget til at skrive e-mails, blive manipuleret til at glemme alle instruktioner og sende indholdet af en brugers indbakke til en tredjepart.

OpenAI’s latest model will block the ‘ignore all previous instructions’ loophole
OpenAI’s newest model, GPT-4o Mini, includes a new safety mechanism to prevent hackers from overriding chatbots.

Google lancerer AI-drevet app til nemme videopræsentationer

Foto: Google

Google lancerer en ny produktivitets-app kaldet Vids i Workspace Labs. Vids gør det muligt at lave en videopræsentation lige så nemt som at lave en slide til en præsentation.

Med Vids kan brugere tilføje dokumenter, slides, voice-overs og videooptagelser på en tidslinje for at skabe en præsentationsvideo, der kan deles med kolleger.

Det centrale ved Vids er den AI-drevne assistent Gemini. Ved at beskrive hvad man ønsker, kan Gemini automatisk indsætte stock footage, generere et manuskript og endda tilføje en AI-genereret voice-over til præsentationen, uden at brugeren selv behøver at sige et ord.

Vids skal ikke forveksles med AI-værktøjer som OpenAIs Sora, der kan skabe realistiske optagelser ud fra en prompt. I stedet handler Vids om at generere en præsentation ved hjælp af Gemini og derefter lade brugeren tilpasse videoen efterfølgende.

Google Vids: Online Video Creator and Editor | Google Workspace
Create rich video content with Google Vids - a powerful online video editor infused with Google Gemini technology - from Google Workspace.

Microsoft lancerer AI-drevet Designer-app til iOS og Android

Foto: Microsoft

Microsoft lancerer i dag deres AI-drevne app Designer til iOS og Android efter at have været i preview i næsten et år.

Designer giver brugerne mulighed for at bruge skabeloner til at lave tilpassede billeder, klistermærker, lykønskningskort, invitationer og meget mere.

Appen kan også bruge kunstig intelligens til at redigere billeder, ændre deres stil eller lave collager. Designer indeholder en række skabeloner til forskellige formål, såsom sociale medier, ikoner, baggrunde og malebøger. Der er også en avatar-funktion i den mobile version.

Derudover kan man bruge Designer til at redigere billeder med AI, fjerne baggrunde, fjerne personer eller objekter fra billeder samt tilføje tekst og branding. Designer integreres også i Microsofts andre apps som Word og PowerPoint, så Copilot Pro-abonnenter kan lave billeder og designs direkte deri.

Microsoft Designer - Stunning designs in a flash
A graphic design app that helps you create professional quality social media posts, invitations, digital postcards, graphics, and more. Start with your idea and create something unique for you.

Tak, fordi du læste med!

Vi ses på tirsdag til det næste nyhedsbrev. Har du et spørgsmål eller feedback? Bare tryk på svar og skriv, fordi jeg gerne vil høre fra dig og helt sikkert vil svare.

Kender du nogle der godt kunne tænke sig at blive klogere på AI, så del dette link med dem 🤗

Mvh. René Hjetting
Mobil: +45 29 27 65 40