Różnica między głębokim uczeniem się a uczeniem się wzmocnienia

Różnica między głębokim uczeniem się a uczeniem się wzmocnienia

Zarówno głębokie, jak i wzmacniające uczenie się są wysoce związane z siłą obliczeniową sztucznej inteligencji (AI). Są to autonomiczne funkcje uczenia maszynowego, które torują sposób komputerów do tworzenia własnych zasad podczas wymyślania rozwiązań. Te dwa rodzaje uczenia się mogą również współistnieć w kilku programach. Zasadniczo głębokie uczenie się wykorzystuje aktualne dane, a uczenie się wzmocnienia wykorzystuje metodę prób i błędów w ustaleniu prognoz. Poniższe dyskusje dodatkowo zagłębiają się w takie rozróżnienia.

Czym jest głębokie uczenie się?

Głębokie uczenie się jest również określane jako głęboko ustrukturyzowane uczenie się lub hierarchiczne uczenie się. Zostało to po raz pierwszy wprowadzone w 1986 roku przez Rina DeChter, profesor informatyki. Wykorzystuje aktualne informacje w algorytmach nauczania w poszukiwaniu odpowiednich wzorców, które są niezbędne w prognozowaniu danych. Taki system wykorzystuje różne poziomy sztucznych sieci neuronowych podobnych do makijażu neuronalnego ludzkiego mózgu. Za pomocą złożonych linków algorytm może być w stanie przetwarzać miliony informacji i strefy w bardziej szczegółowej prognozie.

Tego rodzaju nauka może być stosowana, gdy programiści chcieliby, aby oprogramowanie dostrzegło kolorowe fiolet na różnych zdjęciach. Program byłby następnie karmiony wieloma obrazami (stąd „głęboka” uczenie się) z kolorami fioletowymi i bez. Poprzez grupowanie program będzie mógł zidentyfikować wzory i nauczyć się, kiedy oznaczyć kolor jako fiolet. Głębokie uczenie się jest stosowane w różnych programach rozpoznawania, takich jak analizy obrazów i zadania prognozujące, takie jak prognozy szeregów czasowych.

Czym jest uczenie się wzmocnienia?

Uczenie się wzmocnienia ogólnie określa prognozy poprzez próbę i błąd. Jeśli chodzi o swoją historię z perspektywy AI, został opracowany pod koniec lat 80. XX wieku; Opierał się na wynikach eksperymentów na zwierzętach, pojęciach dotyczących optymalnej kontroli i metod różnic czasowych. Oprócz nadzorowanego i bez nadzoru uczenia się, wzmocnienie jest jednym z podstawowych paradygmatów w uczeniu maszynowym. Jak sama nazwa wskazuje, algorytm jest szkolony przez nagrody.

Na przykład AI jest opracowywana do gry z ludźmi w pewnej grze mobilnej. Za każdym razem, gdy AI przegrywa, algorytm jest zmieniany, aby zmaksymalizować swój wynik. Tak więc tego rodzaju technika uczy się na podstawie błędów. Po licznych cyklach AI ewoluowała i stała się lepsza w pokonaniu ludzkich graczy. Uczenie się wzmocnienia jest stosowane w różnych najnowocześniejszych technologiach, takich jak poprawa robotyki, wydobycie tekstu i opieka zdrowotna.

Różnica między głębokim uczeniem się a uczeniem się wzmocnienia

Technika uczenia się

Głębokie uczenie się jest w stanie wykonać zachowanie docelowe, analizując istniejące dane i stosując to, czego nauczył się nowy zestaw informacji. Z drugiej strony uczenie się wzmocnienia jest w stanie zmienić swoją odpowiedź, dostosowując ciągłe informacje zwrotne.

Istnienie danych

Głębokie uczenie się działa z już istniejącymi danymi, ponieważ jest to konieczne w szkoleniu algorytmu. Jeśli chodzi o uczenie się wzmocnienia, ma charakter eksploracyjny i można go opracować bez bieżącego zestawu danych, ponieważ uczy się za pośrednictwem prób i błędów.

Aplikacja

Głębokie uczenie się jest wykorzystywane w rozpoznawaniu obrazu i mowy, głębokiej sieci wstępnej i zadaniach redukcji wymiarów. Dla porównania, uczenie się wzmocnienia jest wykorzystywane do interakcji z bodźcami zewnętrznymi z optymalną kontrolą, takimi jak w robotyce, harmonogramie wind, telekomunikacji, gier komputerowych i opiece zdrowotnej AI.

Znany również jako

Głębokie uczenie się jest również znane jako uczenie się hierarchiczne lub głęboko ustrukturyzowane uczenie się, podczas gdy uczenie się wzmocnienia nie ma innych powszechnie znanych terminów.

Nauczanie maszynowe

Głębokie uczenie się jest jednym z wielu metod uczenia maszynowego. Z drugiej strony uczenie się wzmocnienia jest obszarem uczenia maszynowego; Jest to jeden z trzech podstawowych paradygmatów.

Ludzki mózg

W porównaniu z głębokim uczeniem się, uczenie się wzmocnienia jest bliższe możliwościom ludzkiego mózgu, ponieważ tego rodzaju inteligencja można poprawić poprzez informacje zwrotne. Głębokie uczenie się służy głównie do rozpoznawania i jest mniej powiązane z interakcją.

Historia

Głębokie uczenie się zostało po raz pierwszy wprowadzone w 1986 r. Przez Rina DeChter, podczas gdy uczenie się wzmocnienia zostało opracowane pod koniec lat 80. XX wieku w oparciu o koncepcje eksperymentów na zwierzętach, optymalnej kontroli i metod różnic czasowych.

Głębokie uczenie się a uczenie się wzmocnienia

Streszczenie

  • Głębokie i wzmacniające uczenie się to autonomiczne funkcje uczenia maszynowego, które umożliwiają komputerom tworzenie własnych zasad w opracowywaniu rozwiązań.
  • Głębokie uczenie się wykorzystuje aktualne informacje w algorytmach nauczania w poszukiwaniu odpowiednich wzorców, które są niezbędne w prognozowaniu danych.
  • Uczenie się wzmocnienia ogólnie określa prognozy poprzez próbę i błąd.
  • Głębokie uczenie się stosuje wyuczone wzorce do nowego zestawu danych, a przyrosty uczenia się wzmocnienia z informacji zwrotnej.
  • Głębokie uczenie się wymaga już istniejącego zestawu danych, podczas gdy uczenie się wzmocnienia nie wymaga bieżącego zestawu danych, aby się nauczyć.
  • Zastosowanie głębokiego uczenia się jest częściej w zakresie rozpoznawania i redukcji obszaru, podczas gdy uczenie się wzmocnienia jest zwykle powiązane z interakcją środowiska z optymalną kontrolą.
  • Głębokie uczenie się jest również znane jako uczenie się hierarchiczne lub głęboko ustrukturyzowane uczenie się, podczas gdy uczenie się wzmocnienia nie ma innego terminu.
  • Głębokie uczenie się jest jedną z wielu metod uczenia maszynowego, podczas gdy uczenie się wzmocnienia jest jednym z trzech podstawowych paradygmatów uczenia maszynowego.
  • Głębokie uczenie się zostało wprowadzone w 1986 roku, podczas gdy uczenie się wzmocnienia zostało opracowane pod koniec lat 80.