Przewodnik po AI dla początkujących
Ostatnia aktualizacja 13 listopada, 2023
Sztuczna inteligencja w ciągu ostatniego roku została odmieniona przez wszystkie przypadki. Stało się to szczególnie za sprawą udostępnienia użytkownikom jednego z bardziej znanych modeli językowych. W ciągu tego czasu, szczególnie owocnego dla rozwoju AI, ChatGPT rozbudowano o kilka przydatnych funkcji. Nie jest to jednak jedyne narzędzie korzystające z ogólnie pojętej sztucznej inteligencji. Niniejszy przewodnik ma na celu wprowadzenie początkujących w podstawowe koncepcje AI. Postaramy się wyjaśnić, co to jest uczenie maszynowe, głębokie uczenie, czy też sieci neuronowe. Poniżej zawarte informacje kierujemy szczególnie do osób, które dopiero rozpoczynają swoją przygodę z programowaniem, ale wiedzą, że będą chciały podążyć w kierunku pracy związanej z AI.
Sztuczna inteligencja to zbiór wielu dziedzin
Co to jest AI? Zacznijmy od tego, że mówiąc o sztucznej inteligencji, mamy na myśli tak naprawdę kilka zróżnicowanych, lecz połączonych ze sobą specjalizacji. AI to dziedzina informatyki, która skupia się na tworzeniu systemów zdolnych do wykonywania zadań zwykle wymagających ludzkiej inteligencji. Obejmuje to zdolności takie jak rozpoznawanie mowy, uczenie się, planowanie, rozumowanie i przetwarzanie języka naturalnego. AI można podzielić na dwa główne typy: symboliczną i opartą na uczeniu. Obie różnią się podejściem do przetwarzania i reprezentacji wiedzy.
Co to jest AI? To symbole w reprezentacji problemów
Symboliczna sztuczna inteligencja znana jest także jako AI oparta na regułach. Polega na wykorzystaniu symboli do reprezentacji problemów i rozumowania.
W tym podejściu inteligencja jest wynikiem manipulowania symbolami według zdefiniowanych reguł. Systemy oparte na AI symbolicznej wykorzystują jasno zdefiniowane reguły i logikę do symulowania procesów rozumowania ludzkiego. Są one skuteczne w rozwiązywaniu problemów, w których zasady są jasno zdefiniowane i niezmienne, np. w systemach eksperckich lub grach logicznych. Ich ograniczeniem jest jednak konieczność ręcznego definiowania reguł i wiedzy. Może to być czasochłonne i nieefektywne w bardziej złożonych lub szybko zmieniających się środowiskach.
Deep learning i machine learning
AI oparta na uczeniu, znana jest także jako uczenie maszynowe i głębokie uczenie, i różni się od podejścia symbolicznego. W deep learningu i machine learningu, maszyny uczą się z danych, identyfikując wzorce i podejmując decyzje z minimalną interwencją człowieka.
Uczenie maszynowe wykorzystuje algorytmy, które uczą się z danych wejściowych i poprawiają swoją wydajność w miarę otrzymywania nowych danych.
Głębokie uczenie, poddziedzina uczenia maszynowego, wykorzystuje wielowarstwowe sieci neuronowe do analizy dużych zbiorów danych. AI oparta na uczeniu jest szczególnie skuteczna w:
- rozpoznawaniu wzorców,
- przetwarzaniu języka naturalnego,
- rozpoznawaniu obrazów,
- innych zadaniach, które wymagają analizy skomplikowanych i często niestrukturalnych danych.
Zarówno deep learning, jak i machine learning wymagają jednak dużych zbiorów danych do treningu. W wyniku takiego ogromu materiału do przerobienia, może być mniej przejrzysta niż symboliczna AI. Niejednokrotnie stanowi to wyzwanie związane z problemami w interpretacji wyników oraz w zaufaniu do tego, co otrzymaliśmy. Najbardziej oczywistym przykładem są halucynacje ChataGPT, który tworzy semantycznie poprawne teksty, jednak w przypadku merytoryki nadal trzeba mieć rękę na pulsie.
Dalsza część tekstu znajduje się pod materiałem wideo:
Sieci neuronowe to mechanizm inspirowany działaniem ludzkiego mózgu
Sieci neuronowe stanowią podstawową strukturę używaną w głębokim uczeniu. Inspiracją dla nich jest działanie ludzkiego mózgu, który składa się z miliardów neuronów komunikujących się ze sobą za pośrednictwem impulsów elektrycznych. Analogicznie w sieciach neuronowych używa się sztucznych neuronów – węzłów przetwarzających informacje.
Podstawową jednostką sieci neuronowej jest neuron, który odbiera sygnały wejściowe (dane), przetwarza je i przekazuje dalej. Neurony są organizowane w warstwy: wejściową, jedną lub więcej warstw ukrytych oraz warstwę wyjściową. Sygnał przechodzi przez sieć od warstwy wejściowej, przez warstwy ukryte, aż do warstwy wyjściowej, gdzie jest generowany ostateczny wynik.
Proces uczenia w sieci neuronowej
Każde połączenie między neuronami ma przypisaną wagę, która determinuje znaczenie danego sygnału. W trakcie procesu uczenia, sieć neuronowa dostosowuje wagi połączeń w oparciu o dane wejściowe i odpowiedzi, które otrzymuje. Proces ten nazywany jest propagacją wsteczną (backpropagation) i jest podstawą uczenia się sieci. Dzięki niemu sieć jest w stanie uczyć się na błędach i poprawiać swoją wydajność.
Sieci neuronowe znajdują zastosowanie w wielu różnych obszarach, m.in. w rozpoznawaniu mowy, analizie obrazów, prognozowaniu finansowym itd. Są szczególnie efektywne w rozwiązywaniu problemów, które wymagają rozpoznawania złożonych wzorców lub przetwarzania dużych ilości danych.
Jedną z unikatowych cech sieci neuronowych jest ich zdolność do uczenia się reprezentacji danych. W przeciwieństwie do tradycyjnych algorytmów, które wymagają ręcznego określenia cech danych, sieci neuronowe są w stanie samodzielnie odkrywać te cechy, co czyni je niezwykle potężnym narzędziem w analizie danych.
Czytaj także: