To już oficjalne. Apple przegrało światowy wyścig.
Ten tekst powstał na podstawie materiału wideo, który znajdziesz na naszym kanale YouTube. Zobacz film tutaj.
Siri, czyli technologia z innej epoki

Zacznijmy od rzeczy, która dziś łatwo umyka, ale jest absolutnie kluczowa. Siri nigdy nie była nowoczesną sztuczną inteligencją.
Od samego początku była systemem regułowym zbudowanym na drzewkach decyzyjnych i sztywnych ścieżkach logicznych.

W praktyce oznaczało to jedno: każde pytanie, każda możliwa interpretacja i każda intencja użytkownika musiały być ręcznie zaprogramowane przez inżynierów.
I tu ciekawostka, o której mało kto pamięta: fundamenty Siri wywodzą się z projektu wojskowo-badawczego finansowanego przez Pentagon.
Apple nie stworzyło tej technologii od zera, tylko przejęło gotową architekturę badawczą i próbowało przekształcić ją w produkt typowo konsumencki.
Zatem Apple kupiło gotowy prototyp. Nie stworzyło pod to własnych fundamentów i co więcej, nigdy ich realnie nie przebudowało.
To właśnie dlatego Siri nie rozumie języka, tylko próbuje rozpoznać wzorce zapytań.
Innymi słowy, jeśli nie umiesz we właściwy sposób zadać pytania, które wpisuje się w konkretny zaprogramowany wzorzec, to nie uzyskasz konkretnej odpowiedzi.

To dlatego czasami drobna zmiana składni potrafi już doprowadzić do błędu.
W 2024 roku głos zabrał były prezes Apple ds. AI, tłumacząc, że Siri nie rozumie użytkownika, jeśli ten nie sformułuje pytania w „idealny sposób”.
Czy czegoś wam to nie przypomina? Tak, jeśli dobrze pamiętacie, to słynny problem z zasięgiem w iPhone’ach 4 miał początkowo wynikać z tego, że użytkownicy nieprawidłowo trzymali telefon w rękach…
Współczesne zaawansowane modele językowe rozumieją semantykę, kontekst, znaczenie, czy relacje pojęciowe, zaś Siri jedynie mapuje frazę i w sposób zero jedynkowy szuka dla niej reguły.

Na przykład mamy taki oto ciąg logiczny: „parasol” → „deszcz” → „pogoda”. Jeśli więc użytkownik zapyta „Czy potrzebuję parasola?”, odpowiedź będzie powiązana z prognozą pogody.
Przypomnę, że każda taka ścieżka musiała być zaprogramowana ręcznie.

Jeśli więc użytkownik zapyta o coś, czego nie ma w regułach - w odpowiedzi usłyszy, to co zresztą słyszy najczęściej: „Przepraszam, nie rozumiem.”
Trudno się zatem dziwić, że marka od dobrych kilku lat planowała unowocześnić swój produkt i nadać mu nowe znaczenie, ale wbrew pozorom na drodze do sukcesu nie stało tylko stworzenie nowej technologii.
Syndrom produktu, który już istnieje
Jedna z najmniej oczywistych barier rozwoju Siri to… jej istnienie. Już tłumaczę o co chodzi.
Otóż w Apple działa silny mechanizm psychologiczny. Jeśli coś już jest produktem, to nie wolno tego zepsuć.

Przypomnę, że Siri jest wbudowana w iOS, jest zintegrowana z systemem i jest także elementem marketingu oraz z perspektywy samej marki symbolem innowacji.

Innymi słowy nie dało się jej tak po prostu wyłączyć i zbudować od nowa. W Apple funkcjonuje pojęcie tzw. product shame, czyli wstydu produktowego.
To sytuacja, w której zespół boi się przyznać, że coś wymaga restartu, bo oznacza to przyznanie się do wieloletnich błędów. Siri była dokładnie takim przypadkiem.
Kolejna przeszkoda, czyli DNA Apple

Steve Jobs ponoć nie wierzył w interfejsy konwersacyjne, a bardziej w gotową funkcjonalność, interakcję wizualną i ogólny projekt.
W jego idealnej wersji system miał nie zadawać pytań, nie rozmawiać, ani również nie powinien wymagać poleceń. Po prostu miał robić to co do niego należy.
To Apple miało pokazywać ludziom, czego powinni chcieć. Tego typu wizje i przekonania przekładały się potem na wiele systemowych niuansów.
Przykładem jest to, że iPhone przez wiele lat nie miał wyszukiwarki na ekranie głównym, podczas gdy w świecie Androida było to rzeczą oczywistą.

Interaktywne AI, które dzisiaj znamy, to absolutne zaprzeczenie tej filozofii.
Cały zgrzyt polega na tym, że chatbot oznacza przyznanie się, iż system na początku nie wie, czego chcesz, dopóki o to nie zapytasz. To z kolei ideologicznie nie pasuje do DNA Apple.
W następnych latach Amazon uruchomi Alexę i otworzy ją na deweloperów, a Google Assistant wystartuje jako system oparty na uczeniu maszynowym.
Dlaczego Apple bało się chmury

Apple do tej pory budowało całą swoją narrację na prywatności i jej ochronie, co też jest bardzo przynależne wizerunkowo do tej marki.
Problem jednak polega na tym, że zaawansowane modele językowe nie istnieją bez chmury.

Idąc dalej, AI bez wsparcia danymi traci swoje znaczenie, ponieważ uczenie modeli bez danych użytkowników jest po prostu nieefektywne.
Apple przez lata forsowało tzw. on-device intelligence, czyli wszystko przetwarza się lokalnie na urządzeniu, podczas gdy cały świat AI szedł w stronę inteligentnej chmury.

W efekcie Apple rozwijało modele lokalnie, zaś Google i OpenAi rozwijało i rozwija nadal swoje modele globalnie. Jak się więc łatwo domyśleć oba te podejścia dzielą tak naprawdę epoki.
Ten materiał mógł powstać dzięki wsparciu sklepu Pancernik — miejsca specjalizującego się w akcesoriach GSM, ochronie urządzeń mobilnych i praktycznych rozwiązaniach dla twojej technologii.
Problem talentu

To jest jedna z tych rzeczy, które nie przychodzą nam łatwo do głowy, gdy myślimy o fiasku Apple w świecie AI. Jak się okazuje, mogło to również mieć niebagatelny wpływ na rozwój całej sytuacji.
Rzecz w tym, że najlepsi badacze AI chcą publikować, być cytowani, uczestniczyć w konferencjach i budować swoją renomę, a Apple mówiąc zupełnie wprost … miało ponoć zabraniać takiego podejścia.

Z tego też powodu marka doczekała się reputacji „czarnej skrzynki”, czyli miejsca, gdzie wiedza znika, a nie krąży.
To z kolei miało sprawić, że wielu wybitnych badaczy wybierało angaż w DeepMind, OpenAI, Meta AI, czy Anthropic.

Apple zaś zostawało w dużej mierze z inżynierami integracji, a nie fundamentalnymi badaczami.
Każdy z tej branży wiedział, że AI rozwija się tylko dzięki tzw. open-source’owej kulturze badań, gdzie wiele zespołów testuje rozwiązania, a problemy są szybciej wykrywane.
Tymczasem zespoły AI w Apple nie wiedziały nawet, nad czym pracują inne zespoły. To zaś spowalniało rozwój i niszczyło współpracę.
A to wszystko w czasie, kiedy w branży nastał wielki boom na modele językowe i uczenie głębokie.
Moment w którym było już za późno
I teraz przechodzimy do momentu, kiedy dla Apple było już za późno. Otóż gdy pojawił się ChatGPT: OpenAI miało 6 lat przewagi, Google miało 10 lat badań, Meta miała infrastrukturę, a Apple miało … Siri.
Nie model. Nie architekturę. Nie dane. Tylko produkt - w dodatku silnie kojarzony z marką. Trzeba było więc podjąć strategiczną decyzję. Decyzję tak brawurową, że aż trudno w to uwierzyć.

Otóż od samego początku Apple Intelligence nie powstało jako projekt technologiczny. Powstało jako projekt … giełdowy.
Wbrew temu co mogliśmy zobaczyć podczas szumnych zapowiedzi i prezentacji, to nie był gotowy produkt kierowany do użytkowników.

To był przede wszystkim komunikat wysłany w stronę rynku, który oparto na konkretnych strategiach finansowych.
Po premierze ChatuGPT w 2022 roku zaczęło się coś, czego Apple bardzo długo nie doświadczało: zmiana narracji inwestorskiej.
AI stało się nową osią wyceny spółek technologicznych. Nie produkty. Nie hardware. Nie ekosystem. Tylko AI. Wszyscy duzi gracze jak Microsoft, Google, Meta, czy Nvidia miały już swoje infrastruktury AI.
Według relacji ludzi z branży, presja na stworzenie „AI brandu” w Apple przyszła nie z zespołów badawczych, tylko z: działu strategii, działu relacji inwestorskich, zarządu, czy wreszcie z działu finansów.
Nikt nie zadawał wtedy pytania: „Jaką AI możemy zbudować?”
Tylko: „Jaką narrację AI możemy zakomunikować rynkowi?”

Jak już wspomniałem Apple nie miało: jednego modelu, jednej architektury, jednego systemu, czy wreszcie jednego „silnika AI”.
Miało za to setki mikro-rozwiązań rozsianych po całym systemie i aplikacjach. Akcje stały w miejscu, konkurencja cały czas rosła, a wraz z nią presja i odpływające zaufanie do giganta z Cupertino.
Apple Intelligence stało się więc czystą koncepcją stworzoną pod narrację dla rynku finansowego i wizualizacją tego co wyobrażała sobie marka w przyszłości, bo przecież ma wizerunek innowatora.
Tyle tylko, że nie zobaczyliśmy konkretnego modelu, czy systemu, a jedynie wierzchnią warstwę w postaci ładnie wyglądającego i działającego interfejsu.

Jedynym realnym celem było uspokoić rynek, dać wyraźny sygnał, że marka również dołącza do AI i że stanowi ona ponownie duży potencjał choćby dla inwestorów.
Nikt z nas nie mógł wtedy przypuszczać, że tak naprawdę był to czysty teatr, a użytkownicy nie stanowili wcale docelowej publiki.

Po prezentacji Apple Intelligence akcje Apple w ciągu następnej doby urosły o siedem punktów procentowych, a do końca roku aż o 30.

Akcjonariusze więc byli zadowoleni i to było w tym wszystkim najważniejsze. Już mniej ważni byli sami użytkownicy, którzy od samego startu Apple Intelligence borykali się z wieloma problemami.
W tym czasie zapowiedziano nową Siri na początek 2025 roku by potem przesunąć datę premiery na rok 2026, tylko po to by ostatecznie ogłosić, że marka się poddaje.
Konsekwencje i widoki na przyszłość

Jak się więc okazuje Apple nie przegrało wyścigu AI, bo miało gorszych inżynierów, miało mniej pieniędzy, czy dlatego, że miało słabszą technologię.
W gruncie rzeczy stało się ofiarą własnego wizerunku i dotychczasowych rozwiązań.

Sprawiło to, że marka bała się uśmiercić produkt pt. Siri, korzystać z chmury, być bardziej otwarta, a wreszcie – utracić kontrolę.
Po prostu bała się porażki, która ostatecznie nadeszła, choć dziś jest ona obsługiwana w białych rękawiczkach.

AI z natury oznacza eksperyment, chaos, otwartość i mnóstwo błędów po drodze.
To najwyraźniej blokowało decydentów firmy, przyzwyczajonych do produktów budowanych na perfekcji, kontroli, zamknięciu i stabilności. To przecież dwa zupełnie różne światy.

Sprawy również nie ułatwiało to, że korporacja nie przeznaczała gigantycznych środków na rozwój swojego AI, bo dotychczas agresywnie inwestowała tylko wtedy, gdy znała finalny produkt.
AI działa zaś odwrotnie. Tu nie wiesz, czym jest produkt, dopóki nie zainwestujesz w niego pieniędzy.

Apple w to miejsce wolało małe funkcje AI jak na przykład wspomnienia ze zdjęć, czy predykcja tekstu, ale unikało dużych modeli językowych, bo te były drogie i nie miały jasnego zastosowania.
Nawet po premierze ChatuGPT w 2022 roku, Apple nie widziało w tym potencjału, a był to, jak się dzisiaj określa, przełom nie tylko technologiczny, ale także kulturowy.
Tymczasem w zeszłym miesiącu na stronie Google opublikowano oświadczenie.
Czytamy w nim: „Apple i Google zawarły wieloletnią współpracę. W jej ramach kolejna generacja modeli Apple Foundation będzie oparta na modelach Gemini Google w technologii chmurowej.”

Apple stoi dzisiaj przed poważnym dylematem. Albo zmieni swoją kulturę, albo stanie się firmą, która tworzy najlepsze urządzenia dla cudzych rozwiązań AI.
Integracja modeli Gemini pokazuje, że marka, przynajmniej narazie, wywiesiła białą chorągiew.

Obecnie najbardziej realistycznym scenariuszem jest że to, Apple będzie w najbliższych latach korzystać z modeli zewnętrznych, dla których to będzie budować swoje interfejsy.
Ale to, że Apple opiera swoje fundamenty AI na modelach Google, nie rozwiązuje, przynajmniej tymczasowo, problemu technologicznego. Na dodatek marka ponosi ogromne ryzyko strategiczne.
Historia nauczyła ich, a może nie, że bratanie się z Google może mieć poważne koszty w dłuższej perspektywie.
Przypomnijmy, że pierwsze wersje iPhone’a korzystały z danych Google Maps jako podstawy do własnej aplikacji Mapy. I wszystko było dobrze do momentu, aż Google stworzyło Androida.

Okazało się, że partner może stać się niemal w jednej chwili bezpośrednim konkurentem.
W tym wypadku oznaczało to celowe opóźnianie wdrażania nowych funkcji na iOS, ograniczanie dostępu do danych, różnicowanie jakości usług, a wreszcie rezerwowanie najlepszych technologii dla Androida.
Największą ironią tej historii jest to, że to właśnie Apple jako pierwsze pokazało światu asystenta głosowego. I jako pierwsze udowodniło,
że jeśli nie rozwijasz technologii, to technologia rozwija się bez ciebie.