Krótkie podsumowanie Google i/o 2024 i wyjaśnienie, dlaczego mnie złościło i dlaczego uważam, że było ogromnym rozczarowaniem.

Krótkie podsumowanie Google i/o 2024 i wyjaśnienie, dlaczego mnie złościło i dlaczego uważam, że było ogromnym rozczarowaniem.

Twitter
W linku oryginalna treść angielska, poniżej tłumaczenie. Moim zdaniem dobre podsumowanie sytuacji Google i tego jak się prezentują w tych przełomowych czasach. Jeśli nie zmieni się polityka i nie będą mieć dobrego pomysłu, to w tyle będą coraz bardziej i bardziej.

To nie przypadek, że OpenAI dzień wcześniej zdecydowało się opublikować 30-minutowe ogłoszenie na temat GPT4-o. Było to wyraźne wyzwanie dla Google, ujawnienie się. W żadnym wypadku nie jestem uproszczonym OpenAI. Wierzę jednak, że obecnie są najlepsi w badaniach i rozwoju sztucznej inteligencji. I wczorajsza prezentacja wpisuje się w to. 30 minut. Tyle czasu zajęło im zaprezentowanie na żywo (!) nowej funkcji audio GPT-4o na scenie. I jestem głęboko przekonany, że to naprawdę było na żywo. Ponieważ pojawiały się liczne błędy, a czasem głos się łamał. Wszystko wydawało się dość „beta”, ale nie umniejszało to prezentacji. Zrozumieliśmy, co przyniesie przyszłość. Zrozumiałeś, dokąd zmierza ta podróż i było to jasne spojrzenie w bardzo niedaleką przyszłość. 30 minut po wydarzeniu OpenAI wielu użytkowników, w tym ja, miało już dostęp do GPT-4-o (NIE „później w tym roku”). Nie nowa funkcja językowa, ale znacznie lepszy GPT-4o (przy czym mówiono, że wszystkie inne funkcje pojawią się za kilka tygodni). Jednak liczne inne funkcjonalności były dość bezpretensjonalne. Zostały one zaprezentowane mimochodem na stronie głównej (!). Nie powiedziano ani słowa o tym, że GPT-4-o umożliwia teraz generowanie obrazu w samym modelu. Ani słowa o tym, że można tworzyć animacje 3D. Nie było to warte wspomnienia, a pokazało imponująco, co jest ważne w OpenAI. 30 minut dla „Niej”, a dla całej reszty wpis na blogu. To skromność.

A teraz dzień później, dla kontrastu, Google i/o 2024. Ani słowa o skromności. O ile OpenAI nie wstydziło się błędów błędów „Jej”, o tyle fakt, że Gemini 1.5 Pro teraz o dostępie o 2 milionach, z których usłyszano 20 razy. Gdynia? nastąpi czas później w tym roku. Zaprezentowano także asystenta głosowego na wzór OpenAI. wydarzenie z tej okazji, które odbyło się legendarny Demis Hassabis – o ile wiem, po raz pierwszy. Udało nam się zobaczyć? Nie prezentacja na żywo, ale wideo ze scenariuszem. Bardzo przypomina poprzedni film, kiedy Gemini-Ultra przypisywano funkcjonalność Vision na żywo, ale tylko się to prostem oszustwem („oszukaj mnie raz, wstydź się; oszukaj mnie dwa razy, wstydź się”). Tutaj także nie można uruchomić się posmaku, że mamy coś, co nie jest jeszcze gotowe. Każdy, kto w to wątpi, powinien poważnie zadać sobie pytanie, dlaczego nie było prezentacji na żywo. Zapewnim: gdyby było dobre, to by zaprezentowali, dokładnie po to, aby zapewnić upokorzenia OpenAI.

To, co już mnie denerwuje, to to, że Demis Hassabis, jeden z najmądrzejszych badaczy na świecie, który przeszedł do historii z AlphaGo, został przywieziony jako maskotka reklamowa tylko po to, by nadać całości pewną autentyczność, nie będąc w stanie niczego pokazać. Dwa słowa o Gemini Flash, który jest bardzo tani, ale jest prezentowany bez benchmarku. Jeśli nie pokazano żadnych liczb, nieobecność mówi wiele. Zapowiedź niepowodzenia Gemmy jest tutaj zapowiedziana. Na koniec krótki filmik z „Vio”, który szczerze mówiąc wygląda na mocno rozpikselowany. Przykro mi, ale każdy, kto myśli, że to ta sama liga co Sora, jest w wielkim błędzie. To z pewnością imponująca technologia, nie ma co do tego wątpliwości. Ale w porównaniu do Sory jest rozmazany, rozmyty i też tak wycięty, że widać prawie tylko jasne kolory i tylko krótki wycinek z prawdziwymi obrazami. Jeśli porównasz to z mocnymi filmami Sory, takimi jak tłumy ludzi, tekstury w wysokiej rozdzielczości i odbicia w wodzie, to po prostu nie jest to ta sama liga.
I tyle. To było wszystko. I właśnie to mam na myśli.
Wszystko, co przyszło potem, to Google z 2010 roku. Bo bądźmy szczerzy: rozpoczęcie konferencji programistów ze Zdjęciami Google i zaprezentowanie najpierw, że można je teraz wyszukiwać za pomocą AI, mówi wiele (jako duży początek!). Wyszukiwanie zostało trochę ulepszone, również przestrzenie robocze i reklamowano wiele funkcji, które istniały już od dawna. I tak, nadal uważam za zawstydzające, że tak historyczna firma jak Google marnuje 5 minut na pokazywanie, jak znaleźć zajęcia z jogi za pomocą sztucznej inteligencji i map Google. To się nie przyjmie i nie ma to żadnego znaczenia. W porównaniu z tym, co zapewnia AlphaFold 3, jest to trywialne i głupie. Ponieważ TO jest prawdziwa sztuczna inteligencja, po to właśnie potrzebujemy sztucznej inteligencji i to jest przyszłość! Google i/o to konferencja programistów, a nie wydarzenie marketingowe dotyczące niepotrzebnych produktów („Spójrz na tego nowego, błyszczącego Pixela 8a!” Cringe af). Przynajmniej tak byś pomyślał, gdybyś miał choć odrobinę szacunku dla twórców (jeśli przyjrzałeś się tłumowi, z pewnością nie byli entuzjastycznie nastawieni). Podobnie było z przepisami na smoothie i spacerami z psami (oczywiście wszyscy z pomocą sztucznej inteligencji). Niepotrzebne i popadną w nieistotność, bez znaczenia i niepraktyczne.

I to jest właśnie sedno sprawy. Google znajduje się pod znaczną presją. Od lat 90. XX w. Google wypracował sobie monopol i dominuje w wyszukiwarkach internetowych. Mają najwięcej mocy obliczeniowej i najlepsze chipy AI (TPU) na świecie. Kupują najbystrzejsze umysły (Demis Hassabis i DeepMind) i marnują wszystkie zasoby na takie bzdury. Kompletnie nie udało im się nadrobić zaległości i wykorzystać swojej szansy.

Żadnego Gemini Ultra 2, żadnego Gemini Pro 2, żadnej nowej architektury. Brak odpowiedniego rozwoju. Nic. Zamiast tego produkty gorsze od konkurencji lub pozbawione sensu. Wręcz przeciwnie: wielokrotnie podkreślali, że Gemin 1.5 Pro będzie miał kontekst o długości 1 miliona. Coś, o czym wszyscy wiedzą od miesięcy. Po prostu nie mieli nic innego, czym mogliby przeciwstawić się OpenAI.

Plus głupie przerywniki pokazowe, które nie są godne konferencji deweloperów. Płacz, jak mówią dzisiejsze dzieci.

Jestem pewien, że Sundar Pichai nie pozostanie dłużej dyrektorem generalnym. Z tego, co słyszymy wewnętrznie, pomiędzy obozami toczą się bardzo zacięte walki. Obecnie inżynierowie AI są powstrzymywani przez etyków. To wyraźnie widać. Google powinien był dostarczyć dzisiaj. Kiedyś byli awangardą open source. Przekazali to już Meta. OpenSource nazywa się teraz Llama. Pozostaje masa obliczeń. I byłoby to lepiej oddane konkurencji. Bardziej zależy mi na Mistral, Anthropic i tym podobnych, zamiast na Google.

Jedna rzecz szczególnie zapada w pamięć. Nie tylko dlatego, że ledwo byli w stanie cokolwiek zaprezentować. Wszystko też jest niedostępne. To nadejdzie w pewnym momencie. Jeszcze w tym roku (TM).

To był ostatni gwóźdź do trumny. Ponieważ miesiące to dekady w erze sztucznej inteligencji. Google ma kilka miesięcy, a może nawet lat, aby nadrobić zaległości. Musiałby się wydarzyć cud.

#sztucznainteligencja #ai #si #nauka #technologia #ciekawostki #machinelearning #google #openai #chatgpt #eacc

Komentarze (13)

VonTrupka

Dałem radę przedrzeć się przez pierwszy akapit tłumaczenia. Przy drugim już wymiękłem.

Pewnie google translate ( ͡~ ͜ʖ ͡°)

NrmvY

@VonTrupka dla ludzi mających problem z czytaniem tekstu tłumaczonego translatorem na polski, jest oryginalna wersja angielska ( ͡° ͜ʖ ͡°)

ataxbras

@NrmvY Google to shit w AI - nowe, nie znałem.

KierownikW10

@NrmvY @VonTrupka Google nie tylko w AI ssie. Również w temacie tłumaczenia Google Translator to jest dno i metr mułu.


Dla przykładu tłumacz DeepL.com miażdży Google Translatora:

"Krótkie podsumowanie Google i/o 2024 oraz wyjaśnienie, dlaczego mnie to zdenerwowało i dlaczego uważam, że było to ogromne rozczarowanie.


To nie był przypadek, że OpenAI zdecydowało się na 30-minutowe ogłoszenie o GPT4-o dzień wcześniej. Było to wyraźne wyzwanie dla Google, ekspozycja. W żadnym wypadku nie jestem sympatykiem OpenAI. Uważam jednak, że są oni obecnie najlepsi w badaniach i rozwoju sztucznej inteligencji. I wczorajsza prezentacja się w to wpisuje. 30 minut. Tyle czasu zajęło im zaprezentowanie nowej funkcji audio GPT-4o na żywo (!) na scenie. I jestem święcie przekonany, że naprawdę na żywo. Pojawiły się bowiem liczne błędy, a czasem głos się urywał. Wszystko wydawało się dość "beta", ale nie umniejszało to prezentacji. Zrozumieliśmy, co przyniesie przyszłość. Zrozumiałeś, dokąd zmierza ta podróż i było to jasne spojrzenie w bardzo bliską przyszłość. 30 minut po wydarzeniu OpenAI wielu użytkowników, w tym ja, miało już dostęp do GPT-4-o (NIE "później w tym roku"). Nie nowej funkcji językowej, ale znacznie lepszego GPT-4o (przy czym powiedziano, że wszystkie inne funkcje pojawią się za kilka tygodni). Jednak liczne inne funkcje były dość bezpretensjonalne. Zostały one przedstawione mimochodem na stronie głównej (!). Nie wspomniano ani słowem o tym, że GPT-4-o umożliwia teraz generowanie obrazów w samym modelu. Ani słowa o tym, że można tworzyć animacje 3D. Nie warto było o tym wspominać i w imponujący sposób pokazuje, co jest ważne dla OpenAI. 30 minut dla "Her" i wpis na blogu dla całej reszty. To jest skromność.


A teraz dzień później, w całkowitym kontraście, Google i/o 2024. Ani słowa o skromności. Podczas gdy OpenAI nie wstydziło się pokazać błędów "Her", fakt, że Gemini 1.5 Pro będzie miał teraz długość kontekstu wynoszącą 2 miliony, był z pewnością słyszany 20 razy. Kiedy? Jeszcze w tym roku. Zaprezentowano również asystenta głosowego podobnego do OpenAI. Specjalnie w tym celu na scenie pojawił się legendarny Demis Hassabis - o ile mi wiadomo, po raz pierwszy. Co mogliśmy zobaczyć? Nie prezentację na żywo, ale oskryptowane wideo. Bardzo przypomina to poprzednie wideo, kiedy Gemini-Ultra przypisywano funkcjonalność Vision na żywo, ale okazało się to zwykłym oszustwem ("oszukaj mnie raz, wstydź się; oszukaj mnie dwa razy, wstydź się mnie"). I tutaj również nie można pozbyć się posmaku, że mamy zobaczyć coś, co jeszcze nie jest gotowe. Każdy, kto w to wątpi, powinien poważnie zadać sobie pytanie, dlaczego nie było prezentacji na żywo. Obiecuję: gdyby to było wystarczająco dobre, zaprezentowaliby to, choćby po to, by uniknąć upokorzenia OpenAI.

(...)"

VonTrupka

@KierownikW10 dzięki że wrzuciłeś w deepl. Pomyślałem o tym, ale to trzeba by dużo klikać, kopiować, wklejać, a tak to jednym kliknięciem wszedłem w oryginał i przeczytałem oryginalny rant na gógla


ja się tylko cieszę że nowi pchają się do zabawy i bardzo kibicuję żeby odgryźli tyle tortu aby wszystkim hegemonom utrzymującym gówniany stan rzeczy aż w pięty poszło.


Bo technologia która miała służyć ludziom, służy tylko do nabijania hajsu gigantom technologicznym niczego innowacyjnego nie wprowadzając.

Innowacyjne to jest wyłącznie pieprzenie o wspaniałej przyszłości.

Słyszę o tym już od 20 lat, ale jeszcze nic superinnowacyjnego w życiu szarego człowieka co by je ułatwiało nie zauważyłem. Chyba tylko robociki odkurzające i elektryfikowanie urządzeń transportu osobistego.

Ale to żadne rocket science.

KierownikW10

@VonTrupka przegiąłeś z tym brakiem innowacji w ostatnich 20 latach.


20 lat temu zasypiałem w łóżku słuchając radia, ustawiając budzik i nie mając jeszcze Internetu w domu.


Obecnie nie mam radia, bo Spotify, za budzik robi smartfon, place telefonem, dokumenty mam w telefonie. Często nie doceniamy tego, jaki przeskok w technologiach cyfrowych wykonał się w ostatniej dekadzie lub dwóch, trzeba najpierw przypomnieć sobie jak nasze życie wyglądało wcześniej, zanim było to wszystko do czego przywykliśmy.

VonTrupka

@KierownikW10

co jest innowacyjnego w płatnościach telefonem?

obecny telefon nie ma nic wspólnego z urządzeniami sprzed 20 lat

obecnie są to minikomputery z wbudowanym, dodatkowym modułem gsm do dzwonienia, choć to już tylko kwestia czasu gdy z gsm wypadną usługi transmisji głosu w krajach technicznie zaawansowanych

nie widzę tu żadnej innowacji, tylko ewolucję we wciąż postępującej miniaturyzacji


Nasze życie to była egzystencja w socjalistycznym chlewie, podczas gdy zachód europy rozwijał się technologicznie już od dawna. Francja miała płatności online i dostęp do bankowości elektronicznej już w latach 80.

KierownikW10

@VonTrupka no jeśli ty nie widzisz niczego innowacyjnego w:

- płatnosciach telefonem

- streamingu audio i video


To ja chyba podziękuję za dyskusje, bo dla mnie to jest oczywiste. Jak byłem szczylem pod koniec lat 90-tych komputer był obiektem marzeń a Internet był w sali komputerowej w szkole (wdzwaniany, nie stały). Wtedy nawet w marzeniach nie spodziewaliśmy się, że zaawansowane komputery, o ogromnych możliwościach w różnych dziedzinach będziemy nosić w kieszeniach.


Pracuję zdalnie. Jeszcze kilkanaście lat temu byłoby to całkowicie niemożliwe, a samo myślenie o pracy zmieniło się w trakcie pandemii, mimo że technologiczne możliwości były dostępne od ładnych paru lat.

VonTrupka

@KierownikW10 przedstawiasz mi swój punkt widzenia, gościa który 20 lat temu nie miał internetu, w temacie o technologiach nad jakimi pracuje gogiel w 2024, wciskając mi że nie masz ze mną o czym rozmawiać.

Bo dla ciebie streaming audio i video jest innowacją podczas gdy dla mnie "innowacją" mógł być co najwyżej 20 lat temu.

Dla ciebie płatności telefonem - nie wymieniłeś w ogóle jakiego rodzaju, a możliwości jest kilka - są innowacją. Dla mnie są tylko ewolucją systemu, który opracowano i wdrożono po raz pierwszy do działania dla klientów detalicznych circa 40 lat temu.


Wymieniasz pracę zdalną która kilkanaście lat temu byłaby całkowicie niemożliwa?

Bzdura. Kilkanaście lat temu to ja zdalnie pracowałem co najmniej 1 dzień w tygodniu.

Jeszcze wtedy nie nazywano tego pracą hybrydową, jeśli mowa jest w ogóle o etacie. Co więcej już z początkiem lat 2000 praca zdalna stała się możliwa, choć to jeszcze raczkowanie stanardów VPN.

Natomiast freelancerzy pracowali głównie zdalnie.


Wszystko o czym opowiadasz to jest tylko i wyłącznie twoje prywatne doświadczenie, a nie wiedza oparta na tworzonych i wdrażanych technologiach, co jest dla mnie przejawem twojej ignorancji. Mylisz pojęcia tego co było możliwe i było stosowane z tym co stosujesz ty, i jak postrzegasz technologie.

KierownikW10

@VonTrupka popełniasz podstawowe błędy logiczne i przeznaczasz moje słowa.


Napisałem o braku Internetu pod koniec lat 90-tych. Nie o czasie dokładnie 20 lat temu, bo w 2004 stałe łącze internetowe było już zasadniczo normą w wielu polskich domach, w tym moim.


Kolejno. I tak, jak rozmawiamy o porównaniu do czasu sprzed około 20 lat, to te rzeczy, o których napisałem są innowacją względem TEGO czasu. Teraz oczywiście nie są już niczym nadzwyczajnym. Rozumiesz?


Zarzucasz mi, że piszę o własnym doświadczeniu podczas gdy to ty piszesz o możliwości realizacji swojej pracy zdalnie 20 lat temu. To wyłącznie Twoje doświadczenie, nie zaś doświadczenie powszechne. Moja praca nie była możliwa do realizacji zdalnej 20 lat temu, praca mojej żony rownież, praca moich znajomych również nie, co więcej wiele z tych stanowisk 20 lat temu nie istniało w ogóle, bo technologie będące ich źródłem nie istniały. I to o czym mówię dotyczy większości ludzi pracujących obecnie zdalnie, 20 lat temu nie byłoby mowy o takiej pracy na ich stanowiskach, o ile takie stanowiska istniałyby.

NrmvY

@VonTrupka ok, twój punkt widzenia że nie ma innowacji wynika z tego, że współczesne technologie z 2024 miały swój początek w 40 lat temu, więc nie są żadną innowacją.


Czyli idąc dalej tym samym tokiem rozumowania, ChatGPT nie jest w ogóle bardziej innowacyjny od perceptronu, bo jest tylko jego daleką ewolucją.

VonTrupka

@NrmvY nie zająknąłem się o AI, ani też o robotyce

pierwsza jeszcze jest zbyt niedoskonała aby weszła do użytku codziennego. A o tym cały czas piszę.

Zaufałbyś w tym momencie całkowicie i bezkrytycznie decyzji AI gdyby dotyczyła podjęcia rzeczy związanej z twoim życiem?


Co do robotyki, mam tu na myśli to nad czym pracuje boston dynamics, nie stricte mechatronikę produkcyjną.

W oparciu i wykorzystaniu właśnie AI. Aczkolwiek spota można kupić.

Czy zatem to już oznacza dojrzałą technologię i robotyka wchodzi do życia codziennego oznaczając innowacyjność - tj. zmianę w postrzeganiu, nawykach i zmianie podejścia przy rozwiązywaniu problemów ?

Czy jest to wciąż tylko zabawka?

Vorlon2

Co do tłumaczenia-robiłem trochę testów i lepsze wyniki od Googla i DeepL daje tłumaczenie w chatach AI np. GPT, Claude, Bard.

Zaloguj się aby komentować