ChatGPT, Bard, Bing czy Claude – który z popularnych chatbotów AI jest najlepszy?

websensa.com 1 rok temu

AI eksplodowała wraz z rozwojem Large Language Models – LLM. Modele te, szkolone na ogromnej ilości danych wejściowych, mogą generować treści i odpowiadać na pytania w formie konwersacyjnej. Stanowią podstawę algorytmiczną dla narzędzi GenAI, które są doskonalone w błyskawicznym tempie. Giganci technologiczni ścigają się w tej chwili w tworzeniu najlepszego chatbota AI. O miano pretendentów walczą: ChatGPT, Bard, Bing i Claude. Zapoznaj się z naszym zestawieniem tych 4 narzędzi.

1. ChatGPT

ChatGPT firmy OpenAI to jedyny produkt generatywnej AI dostępny z dwoma różnymi LLM, GPT-3 i GPT-4. Jego uruchomienie w listopadzie 2022 pobiło wszelkie rekordy popularności w zakresie systemu konsumenckiego i aplikacji internetowych.

To jeden z najbardziej zaawansowanych chatbotów AI, który może naśladować ludzkie rozmowy, zapewniając użytkownikom łatwą i spersonalizowaną obsługę. Jego zdolność do udzielania długich, dobrej jakości odpowiedzi oraz generowanie specjalistycznych tekstów na różne tematy, wyznaczyły wysoką poprzeczkę zarówno dla samego LLM, jak i konkurencji.

Firma OpenAI nie ustaje w rozwoju swojego produktu, regularnie dodając nowe funkcje. w tej chwili (listopad 2023) dzięki ChatGPT można skorzystać z:

przeszukiwania internetu (funkcja Browse with Bing);
generowania obrazów (funkcja DALL-E 3);
rozmów głosowych z chatem (dostępne w aplikacji mobilnej).

Więcej o ChatGPT w innym naszym artykule: ChatGPT i Generative AI – zrozum je teraz.

Możliwości:

duży wybór wtyczek do różnych zastosowań;
możliwość wpisania niestandardowych instrukcji (Custom instructions) dla lepszej personalizacji wyników;
przejrzyste API z dobrą dokumentacją;
funkcja przeszukiwania sieci (Browse with Bing) w wersji płatnej;
możliwość generowania obrazów dzięki wbudowanego modelu DALL-E 3;
rozmowy głosowe z chatem w aplikacji mobilnej (także w języku polskim).

Ograniczenia:

dane szkoleniowe ograniczone są do kwietnia 2023 roku, co, zgodnie z zapewnieniami OpenAI, ma być stopniowo poprawianechoć (częściowo rekompensuje to funkcja Browse with Bing);
zdarzające się błędne odpowiedzi i podatność na tzw. halucynacje;
interfejs użytkownika;
wersja darmowa nie obsługuje wielu funkcji.

2. Bard

Kiedy OpenAI udostępniło publicznie ChatGPT, Google w lutym 2023 roku pospiesznie wypuścił wersję tekstowego generatywnego produktu AI – Bard. Była to zarazem odpowiedź na integrację ChatGPT z Bing od Microsoft.

Chatbot Bard został zaprojektowany w celu symulowania rozmów z człowiekiem i generowania realistycznych odpowiedzi na pytania. Aby dostarczać jeszcze bardziej odpowiednie rekomendacje wyszukiwania, Bard przeszukuje na bieżąco cały Internet w czasie rzeczywistym. Od samego początku jest to jego flagowa funkcja.

Możliwości:

przyjazny interfejs użytkownika;
cytuje źródła i daje najbardziej aktualne odpowiedzi;
ma przycisk do tworzenia kopii zapasowych swoich wypowiedzi dzięki wyników wyszukiwania lub do wyjaśniania, gdy nie ma źródeł;
generuje tekst na zadany temat i oferuje opcje kontynuacji dla ukończonych wpisów – można się przełączać między alternatywnymi wersjami i wybrać optymalną dla siebie;
generuje i debuguje kod w 20 językach programistycznych oraz tłumaczy kod z jednego języka na inny.

Ograniczenia:

nie generuje i nie czyta dokumentów takich jak pliki PDF, obrazy itp.;
generowanie wyników bywa powolne.

3. Bing

Widząc ogromny sukces ChatGPT, Microsoft w marcu 2023 roku zintegrował podobne funkcje AI ze swoją wyszukiwarką internetową Bing (jedna z największych wyszukiwarek na świecie, z zaledwie 3% wyszukiwań). Utrzymując bliską współpracę techniczną i finansową z ChatGPT, stworzył Bing AI Chat.

Zbudowano go na LLM, ale ma dodatkowe funkcje czyniące go bardziej eksperymentalnym i dokładnym. Opiera się bowiem nie tylko na danych szkoleniowych, ale także na funkcjach indeksowania i tzw. web scraping, polegającym na zautomatyzowanym pobieraniu danych z Internetu. Dzięki temu może generować odpowiedzi w oparciu o aktualne dane.

Możliwości:

czytelne i przyjemne w użyciu narzędzie;
ma różne interfejsy użytkownika do rozmaitych celów;
wykazuje głębię i dokładność oraz interesujący i zabawny styl konwersacji;
domyślnie przeszukuje Internet;
cytuje swoje źródła;
generuje dobrej jakości obrazy przy użyciu silnika DALL-E 3.

Ograniczenia:

działa zasadniczo tylko w przeglądarce Microsoft Edge;
nadal jest podatny na błędy w wynikach – mogą być trafione lub chybione;
niezbyt dobrze radzi sobie z generowaniem lub wyświetlaniem kodu.

4. Claude

Claude to chatbot AI opracowany przez firmę badawczą Anthropic (założoną przez byłych członków OpenAI). Zaprojektowano go tak, aby był przyjazny dla użytkownika i łatwiejszy w użyciu niż np. ChatGPT. Przoduje w twórczym pisaniu i programowaniu przy pomocy Pythona, a także kładzie nacisk na bezpieczeństwo, kontrolę i etykę.

Ma służyć nie tylko do pisania treści przypominających ludzkie, ale też naśladowania niektórych pozakognitywnych cech behawioralnych. Nie jest ograniczony danymi historycznymi i dostarcza aktualne wyniki.

Przeszkolono go z użyciem tzw. konstytucyjnej sztucznej inteligencji. Oznacza to, iż skupia się na uczciwej konwersacji, aby uzyskać „mniej szkodliwe” wyniki, generując odpowiedzi, które są społecznie odpowiedzialne i etyczne. Jak dotąd wyniki okazały się zróżnicowane, a recenzenci podkreślali, iż przez cały czas generuje treści, które mogą być stronnicze, nieprawdziwe lub potencjalnie szkodliwe.

Obecne wersje Claude 1, Claude 2 i Claude Instant dostępne są od niedawna dla szerszej publiczności, wobec wcześniejszych – osiągalnych tylko dla firm.

Możliwości:

silne zdolności rozumowania opartego na zdrowym rozsądku, ale unika problematycznych odpowiedzi;
zaprojektowany tak, by jak najlepiej rozpoznawać, czy dana informacja jest prawdziwa;
funkcja załączania plików oraz analizowania ich (zadawania pytań na ich temat);
okno kontekstowe obsługuje do 100 000 tokenów (dla porównania: Bard – 1000).

Ograniczenia:

brak wielu multimedialnych i internetowych funkcji (wobec ChatGPT), np. generowania obrazów.

Architektura i technologia poszczególnych chatbotów AI

ChatGPT

Opiera się na architekturze głębokiego uczenia się zwanej Generative Pre-trained Transformer (GPT). Pozwala ona na generowanie dość dokładnych i wysoce spersonalizowanych odpowiedzi na zapytania użytkowników.

Architektura GPT wykorzystuje technikę zwaną uczeniem bez nadzoru – może uczyć się na danych oznaczonych i nieoznaczonych, aby upewnić się, iż rozumie zapytania. Dane oznaczone pozwalają chatbotowi dokładnie zidentyfikować intencje stojące za zapytaniami użytkowników i wygenerować adekwatne odpowiedzi.

Bard

Wykorzystuje technologię LaMDA oraz architekturę sieci neuronowej tak, aby udzielać odpowiedzi na złożone pytania użytkownika w czasie rzeczywistym. Uwzględnia przy tym kontekst, temat i poprzednie wypowiedzi. Dzięki zaawansowanym technikom uczenia maszynowego, LaMDA jest w stanie nauczyć się nowych koncepcji i być wykorzystywany w wielu różnych dziedzinach.

Transformer firmy Google, który jest podstawą innych narzędzi do generowania AI, jak model językowy GPT-3.5, używany jest też w ChatGPT. Mają one tendencję do naśladowania odpowiedzi, co może prowadzić do błędów i pomyłek. Naukowcy, którzy stworzyli model LaMDA, próbowali rozwiązać ów problem przez zwiększenie rozmiaru modelu. Stwierdzili jednak, iż podejście to nie działa w obszarach i branżach, w których fakty stale się zmieniają.

Bing

Działa na bazie zastrzeżonej przez Microsoft technologii Prometheus – modelu AI łączącym kompleksowy indeks wyszukiwania, rankingi i wyniki odpowiedzi z wyszukiwania Bing z kreatywnym wnioskowaniem najbardziej zaawansowanych modeli GPT OpenAI. Następnie łączy dane wyjściowe wygenerowane przez Bing i GPT w celu opracowania wewnętrznych zapytań z użyciem komponentu o nazwie Bing Orchestrator. Tak połączona odpowiedź jest prezentowana użytkownikowi w postaci tekstu przypominającego ludzki.

Zapytania wewnętrzne i wyszukiwanie Bing to najważniejsze elementy architektury Prometheusa. Dzięki nim dostarcza on aktualne informacje do podstawowego modelu języka, umożliwiając odpowiadanie na bieżące pytania i redukując niedokładności – metoda ta nazywa się uziemieniem.

Claude

Działanie Claude oparto na nowatorskim podejściu do AI określanym jako „architektura kognitywna”. Ma ono na celu odtworzenie sposobu, w jaki ludzki mózg przetwarza informacje, umożliwiając systemom AI uczenie się i rozumowanie w bardziej ludzki sposób.

Łącząc kognitywną architekturę z najnowocześniejszymi technikami uczenia maszynowego, Claude dąży do osiągnięcia poziomu inteligencji i zdolności adaptacyjnych, które prawdopodobnie znacznie przewyższą istniejące systemy AI.

Zasadnicze różnice

Podczas gdy Bard i Claude są wciąż na etapie ulepszania, ChatGPT i Bing już wykazują zaawansowaną inteligencję i użyteczność – informacje zwrotne wydają się na ogół bardziej zgodne z oczekiwaniami, a odpowiedzi bardziej wyrafinowane.
ChatGPT (mimo nowej funkcji generowania obrazów) i Claude specjalizują się głównie na interakcjach tekstowych, zaś Bing i Bard mają na celu zbudowanie półautomatycznej wyszukiwarki internetowej. Wczesne demonstracje sugerują, iż Bard ma pewne problemy z dokładnością wobec innych chatów, ale ogromny zasób Google może dać Bardowi przewagę w rozmowach opartych na faktach.
ChatGPT i Claude zdecydowanie przewyższają dwa inne chatboty pod względem wielkości okna kontekstowego. ChatGPT (GPT-4 Turbo) jest w tym momencie w stanie przetworzyć 128 000 tokenów (odpowiednik 300 stron tekstu), a Claude – 100 000 tokenów. Pozwala im to lepsze odczytywanie i generowanie odpowiedzi w kontekście, co sprawia, iż mają ogromny potencjał do zadań wymagających rozumienia i precyzji.

Gdzie najlepiej sprawdzą się poszczególne chatboty AI?

ChatGPT

Możliwość prowadzenia wieloturowych rozmów. Na tle innych chatbotów, działających w formacie pytanie-odpowiedź, ChatGPT może utrzymywać kontekst rozmowy i generować odpowiedzi, które są istotne dla poprzednich tur.
Silnik NLP ChatGPT zawiera komponent analizy nastrojów pozwalający zrozumieć emocje stojące za zapytaniami użytkowników. Funkcja ta jest przydatna dla firm chcących zapewnić empatyczną obsługę klienta, dostarczyć mu spersonalizowane rekomendacje dotyczące produktów, w oparciu o jego preferencje i historię zakupów.
Może pomóc firmom różnych branż automatyzować operacje obsługi klienta, zmniejszając obciążenie personelu i skracając czas reakcji.
Osoby prywatne mogą go użyć jako wirtualnego asystenta do doskonalenia umiejętności językowych – w naturalny sposób można z tym asystentem ćwiczyć nie tylko pisanie, ale i mówienie.

Bard

Dzięki temu, iż przeszukuje na bieżąco cały Internet i zbiera najświeższe dane z całego świata, jego odpowiedzi są zawsze aktualne i dodatkowo modyfikowane.
Ma nową funkcję przesyłania obrazów dzięki Obiektywu Google oraz otrzymywania odpowiedzi w formie obrazów z wyszukiwarki Google.
Można go użyć do zadań na żywo, np. do utworzenia dokumentu z planem podróży lub spotkania czy przygotowania reklamy online lub pisania artykułu na blog.
Google twierdzi, iż Bard jest świetny w pisaniu kodu – obsługuje ponad 20 języków programowania, jak: C++, Go, Java, JavaScript, Python, TypeScript.

Bing

Opracowany głównie do wyszukiwania i zoptymalizowany pod kątem lepszego zrozumienia przetwarzania języka naturalnego niż np. ChatGPT. I choć Bing jest od niego mniej elastyczny i kreatywny, ma kilka unikalnych funkcji, które wynikają z bezpośredniej integracji z wyszukiwarką internetową.
Funkcja generowania obrazów daje możliwość zachowania płynności „rozmowy”, dając uwagi na bieżąco, bez konieczności wpisywania za każdym razem kolejnych wymagań dotyczących obrazu.

Claude

Innowacyjne w nim jest jego uczenie się z wielu różnych źródeł danych – tekstu, obrazów, a także ludzkich zachowań. Pozwala to systemowi rozwinąć bogate zrozumienie świata i jego złożoności; może to przynieść znaczące implikacje dla branż takich jak obsługa klienta, by zapewnić im bardziej angażujące wsparcie.
Zdolność do szybkiego i dokładnego identyfikowania obiektów i wzorców na obrazach może okazać się w pewnych dziedzinach nieocenione, np. w obrazowaniu medycznym – systemy AI mogą pomóc lekarzom w dokładniejszym diagnozowaniu i leczeniu pacjentów.

Koszt i dostępność

ChatGPT

OpenAI oferuje trzy plany korzystania z niego:

podstawowy – darmowy, z dostępem do modelu GPT-3,5;
ChatGPT Plus – 20 USD miesięczne, z dostępem do modelu GPT-4, wtyczek, przeszukiwania internetu i generowania obrazu;
ChatGPT Enterprise – dedykowane rozwiązanie dla firm, z cenami ustalanymi indywidualnie przez dział sprzedażowy.

Bard

Jest całkowicie darmowy i mówi się, iż przynajmniej przez pewien czas tak pozostanie. Google planuje integrację tego narzędzia ze swoimi innymi produktami.

Początkowo był do dyspozycji w USA i Wielkiej Brytanii, zaś od lipca 2023 jest dostępny w całej Europie i ponad 40 językach, także w polskim.

Bing

Do niedawna był dostępny tylko w przeglądarce Microsoft Edge; z końcem sierpnia 2023 Bing AI trafił też do przeglądarki Google Chrome i powoli się adaptuje. Microsoft pracuje nad wprowadzeniem jego funkcji do innych przeglądarek na urządzeniach stacjonarnych i mobilnych.

Bing od początku stał się fenomenem w kwestii darmowego dostępu. Obecna innowacja utrzymuje ten stan – użytkownicy z różnych zakątków świata mają dostęp do obu wersji zaawansowanych narzędzi: Bing AI i Bing Image Creator. Dziennie można w Bing wygenerować 50 bezpłatnych grafik (mając konto Microsoft). Chatbot rozumie polecenia zarówno po angielsku, jak i po polsku.

Claude

Do niedawna Claude 2 dopuszczał użytkowników tylko z USA i Wielkiej Brytanii i oferował priorytetową płatną usługę (z ofertą pięciokrotnie większej liczby wiadomości w porównaniu do wersji darmowej). Jesienią br. firma otworzyła dostęp dla 95 państw na świecie – większości w Europie, także Azji, Afryki, Ameryki Płd. i Australii.

Informacji o nowym planie subskrypcji dla każdej z wersji, tj. Claude 1, Claude 2 i Claude Instant należy szukać na stronie Anthropic. Wiadomo na razie, iż różne poziomy cenowe umożliwiają dostosowanie dostępu do potrzeb.

Podsumowanie

Wymienione oferty chatbotów AI, a przede wszystkim ulepszanie ich poprzez dodawanie coraz nowszych wersji i rozwiązań użytkowania, są symbolem ich niewątpliwego znaczenia i ogromnego potencjału. Niezależne od tempa, w jakim powstają i są udoskonalane, wszystkie te LLM przez cały czas wymagają ostrożności w związku z potencjalną dezinformacją. przez cały czas jednak dają ekscytujący wgląd w przyszłość AI języka naturalnego. Fascynujące jest obserwowanie dalszego postępu tych rozwiązań w zakresie dokładności, wydajności i bezpieczeństwa.

Zmiany na rynku chatbotów i GenAI zachodzą tak dynamicznie, iż potrzeba dużo wysiłku i umiejętności oceny sytuacji, aby być na bieżąco. Jeśli szukasz wiarygodnego i aktualnego źródła wiedzy, zajrzyj na nasz kanał YouTube Beyond AI. Regularnie publikujemy tam informacje o najnowszych rozwiązaniach i praktycznym wykorzystaniu AI.

Idź do oryginalnego materiału