12 października 2024

Dalej o AI (wywiad z panem Zarembą)

Obecnie działanie AI polega na trenowaniu i testowaniu na podstawie dostępnych danych. W ten sposób tworzy się określone modele AI. AI jest w stanie ogarniać olbrzymią ilość danych treningowych. Na początku trenowano AI na podstawie różnego zakresu danych. Było to związane z podejściem statystycznym. Ale okazało się, że w modelach opartych na statystyce nie ma możliwości rozwojowych. Dlatego rozwój AI przeszedł na systemy sieci neuronowych. To pozwoliło na wykorzystywanie nieograniczonych ilości danych. W wywiadzie padło stwierdzenie, że w przypadku transformerów (chyba chodzi właśnie o sieci neuronowe) nie ma ograniczeń. 

W przypadku człowieka mamy jeden proces obejmujący te dwie czynności. Człowiek trenuje się (chyba lepiej jest powiedzieć, że trenuje swoją wiedzę czy poznanie) na podstawie danych, które pochodzą z jego własnego doświadczenia. Natomiast komputer trenuje się na danych dostarczonych mu przez człowieka. Uproszczając powiemy, że człowiek uczy się na własnych danych, zaś komputer uczy się na danych człowieka. 

W interpretacji pana Zaremby można dostrzec utożsamianie uczenia się człowieka z uczeniem się AI. Pada takie stwierdzenie, że informacje wchodzą do mózgu jako bity. Można to chyba rozumieć w ten sposób, że mózg działa na zasadzie przepływów energetycznych (elektrycznych?). Otóż sieci neuronowe mają symulować strukturę połączeń mózgowych. To by pozwalało na swobodne przebieganie pomiędzy różnymi danymi i łączenie ich na zasadzie analogii. Dlatego nie pojawiają się ograniczenia w manipulowaniu danymi. To pozwalało na trenowanie AI (chata) na wszystkich danych z internetu. 

Specjalista wyróżnił dwa procesy wkładania wiedzy do modeli AI. Pierwszy polega na zgromadzeniu dużej ilości danych z internetu. Chodzi o to, aby model nauczył się pojmować to, co my znamy i co zostało utrwalone. Za tym idzie proces testowania, gdzie sprawdza się, jak model pojmuje dostarczone dane (np. pytamy, jak interpretuje jakiś obrazek). Pojawia się problem, czy w ten sposób trenujemy rozumienie danych, czy tylko ich opis? Drugi proces polega na tym, że testowany model otrzymuje nagrodę za właściwe zachowanie (ale czy to jest równoznaczne z rozumieniem). 

Wiadomo, że człowiek tworzy pewne wartości w oparciu o zdobywane informacje. Komputer tego nie wykona, ale podobno można tworzyć modele replikujące ludzkie wartości. Czy będą się one nimi posługiwały? Raczej nie wiadomo. Ale już w dzisiejszym działaniu AI (chatGPT) okazuje się, że działające modele są w stanie tworzyć (czy może wymyślać?) coś, czego my nie znaliśmy (podawany przykład ruchów w Go albo przykłady tłumaczenia podawane przez Dukaja)

Brak komentarzy:

Prześlij komentarz