Co to HuggingChat? Bezpłatna i otwarta platforma czatu AI
Hugging Face, znane społeczności maszynowego uczenia się i platformie narzędzi AI, ogłosiło wydanie HuggingChat, otwartoźródłowego klona ChatGPT, którego każdy może używać lub pobrać dla siebie.
Hugging Face
Hugging Face to nie tylko firma, ale również społeczność AI. Zapewnia ona dostęp do darmowych, otwartoźródłowych narzędzi do tworzenia aplikacji związanych z uczeniem maszynowym i AI. Jednym z ostatnio ukończonych projektów Hugging Face jest duży model językowy o nazwie Bloom, oparty na 176 miliardach parametrów, dostępny dla każdego, kto zgodzi się przestrzegać ich licencji Responsible AI. Hugging Face oferuje dostęp do otwartoźródłowych modeli w różnych kategoriach, takich jak multimodalność, widzenie, audio, przetwarzanie języka naturalnego oraz uczenie przez wzmocnienie.
HuggingChat
Klon ChatGPT HuggingChat oparty jest na modelu konwersacyjnym AI Open Assistant. Open Assistant to projekt non-profit Large-scale Artificial Intelligence Open Network (LAION), globalnej organizacji non-profit, która dąży do udostępniania najnowocześniejszych technologii jako otwartego źródła.
HuggingChat – zestaw danych do szkolenia
HuggingChat został przeszkolony przy użyciu zestawu danych OpenAssistant Conversations Dataset (OASST1), który jest bardzo nowy i zawiera dane zebrane do 12 kwietnia 2023 roku. Model ten wykorzystuje tę samą metodologię szkolenia stworzoną przez OpenAI, która nazywa się „reinforcement learning from human feedback” (RLHF). RLHF to technika tworzenia wysokiej jakości zestawu danych anotowanych przez człowieka i ocenianych pod względem jakości pytań i odpowiedzi, które mogą być wykorzystane do szkolenia AI w celu wykonywania poleceń.
HuggingChat jest dostępny
HuggingChat jest już dostępny dla użytkowników. Rejestracja konta nie jest konieczna do korzystania z niego. Choć nie należy oczekiwać poziomu wyjścia na poziomie ChatGPT, usługa ta nie jest jeszcze na tym poziomie. Strona aplikacji podaje, że jest to wersja 0.0, co powinno dać pewne pojęcie o tym, jak dojrzała jest na tym etapie. Mimo to, jest to godne podziwu osiągnięcie i pierwsze kroki dla społeczności open source, a korzystanie z niego jest całkowicie darmowe.
Wiadomości te są ważne, ponieważ pokazują, jak rośnie i ewoluuje przestrzeń AI, zwłaszcza w kontekście demokratyzacji i otwartości. To świadczy o postępie, który dokonuje się nie tylko na poziomie technologicznym, ale także na poziomie dostępności i sprawiedliwości.
Zasoby Hugging Face
Hugging Face nie tylko udostępnia modele, ale także hostuje otwartoźródłowe zestawy danych i biblioteki, umożliwiając zespołom współpracę, w tym repozytorium, podobne do GitHuba. Wiele z tych usług jest dostępnych za darmo, ale istnieją również opcje pro i enterprise.
Wizja LAION
LAION, organizacja stojąca za Open Assistant, wyraźnie podkreśla swoje przekonanie, że badania nad uczeniem maszynowym i jego zastosowaniami mają potencjał do ogromnego pozytywnego wpływu na nasz świat i dlatego powinny być demokratyzowane. Jego główne cele to udostępnianie otwartych zestawów danych, kodu i modeli uczenia maszynowego, nauczanie podstaw badań nad uczeniem maszynowym w dużych skalach i zarządzanie danymi, a także promowanie efektywnego wykorzystania energii i zasobów obliczeniowych do stawienia czoła wyzwaniom zmian klimatu.
Ograniczenia zbierania danych
Warto zauważyć, że metoda tworzenia zestawów danych do szkolenia, jaką zastosowano w HuggingChat, choć powszechna, nie jest pozbawiona ograniczeń. Metoda ta polega na tzw. „crowdsourcingu”, czyli zbieraniu danych od ogromnej liczby osób na całym świecie. Choć jest to skuteczny sposób na generowanie wielojęzycznego zestawu danych, wprowadza także ograniczenia w postaci kulturowych i subiektywnych uprzedzeń osób tworzących i oceniających dane treningowe. Badacze zauważają, że osoby bardziej zaangażowane częściej dokonują ocen, co prowadzi do nierównomiernego rozkładu ich wartości i uprzedzeń.
Zasady jakości
Pomimo potencjalnych uprzedzeń, badacze stojący za HuggingChat podkreślają, że zadbali o jakość swojego zestawu danych. Ustanowili ścisłe wytyczne dla współpracowników, które muszą być przestrzegane, aby zapobiec dodawaniu szkodliwych treści do zestawu danych i zachęcić do generowania wysokiej jakości odpowiedzi.
Podsumowanie
Podsumowując, wydanie HuggingChat to ważny krok dla społeczności AI i otwartego źródła. Choć jest to dopiero początek, już teraz widać ogromny potencjał tej inicjatywy.
Hugging Face, od momentu swojego powstania, wykazało zdecydowany nacisk na demokratyzację sztucznej inteligencji. Firma stale stara się uczynić narzędzia AI dostępnymi dla jak najszerszego grona osób. Dzięki temu podejściu, Hugging Face zyskało uznanie w środowisku AI i jest obecnie jednym z liderów w dziedzinie otwartych źródeł dla uczenia maszynowego.
Źródła:
https://twitter.com/DrJimFan/status/1650910941687730176