Машыннае навучанне![]() Машыннае навучанне (англ.: Machine learning, ML) — галіна штучнага інтэлекту, якая займаецца стварэннем і вывучэннем статыстычных алгарытмаў , здольных вучыцца выконваць задачы на аснове набору даных і абагульняць гэты навык на новыя даныя па-за вызначаным наборам без яўных інструкцый[1]. Падыходы машыннага навучання прымяняюцца для стварэння вялікіх моўных мадэляў , мадэляў камп’ютэрнага зроку, распазнавання маўлення, фільтравання электроннай пошты і іншых. Гэтыя мадэлі дапамагаюць аўтаматызаваць руцінныя задачы ў многіх сферах, напрыклад у сельскай гаспадарцы і медыцыне тады, калі цяжка ці немагчыма распрацаваць звычайныя алгарытмы для выканання неабходных задач[2][3]. Праграма, заснаваная на алгарытмах машыннага навучання, завецца мадэллю, а працэс прымянення такіх алгарытмаў да навучальнага набору даных — навучаннем мадэлі[4][5]. Машыннае навучанне грунтуецца на метадах матэматычнай аптымізацыі (матэматычнага праграмавання). Роднасная вобласць даследавання, здабыванне даных , канцэнтруецца на выведным аналізе даных праз некіраванае навучанне[6]. Апошнім часам генератыўныя штучныя нейронныя сеткі змаглі перасягнуць многія папярэднія падыходы ў эфектыўнасці для многіх тыповых задач[7][8]. Параўнанне з класічнымі алгарытмаміПраграмы машыннага навучання могуць выконваць задачы без яўнага іх на гэта праграмавання. Камп’ютары навучаюцца рабіць гэта з дапамогай пэўнага набору даных. Для простых задач можна яўна запраграмаваць алгарытмы, што паведамляюць машыне, якія крокі неабходна выканаць для развязання пастаўленай задачы; з боку камп’ютара навучанне не патрабуецца. Для больш складаных задач чалавеку можа быць цяжка самастойна сфармуляваць неабходны набор інструкцый. На практыцы для праграміста можа быць больш эфектыўным дапамагчы машыне распрацаваць уласны алгарытм, чым уручную пазначаць кожны неабходны крок[9]. Напрыклад, пры распазнаванні спаму класічны алгарытм працуе паводле загадзя вызначаных праграмістам правілах. Электронны ліст можа лічыцца спамам, калі ўтрымлівае пэўныя ключавыя словы («выйграй», «бясплатна», «хуткія грошы» і г.д.) або прыходзіць з падазроных адрасоў. Такі падыход патрабуе пастаяннага ручнога знаходжання і абнаўлення адпаведных правіл. Спамерам лягчэй абыходзіць простыя правілы, а складаныя правілы цяжэй праграмаваць і падтрымліваць. У сваю чаргу, метад машыннага навучання здольны самастойна вылучыць прыкметы спаму з тысяч раней пазначаных лістоў, стварыць статыстычную мадэль для ацэнкі імавернасці таго, што новы ліст з’яўляецца спамам на падставе шматлікіх фактараў, у тым ліку незаметных для чалавека заканамернасцей. Працэс паўторнага навучання або данавучання мадэлі на новых даных можа быць аўтаматызаваны, што дазваляе мадэлі адаптавацца да новых тыпаў спаму з прыходам новых даных без умяшання чалавека і робіць такі падыход больш эфектыўным у доўгатэрміновай перспектыве. Машыннае навучанне грунтуецца на дапушчэнні, што стратэгіі, алгарытмы і высновы, якія добра працавалі ў мінулым (для навучальных даных), верагодна, будуць добра працаваць і ў будучыні (для новых даных)[10]. Для многіх задач машыннае навучанне менш эфектыўна за класічныя алгарытмы або ўвогуле непрымяніма. Напрыклад, разлік даты Вялікадня апісваецца адносна простым наборам матэматычных аперацый, таму класічны алгарытм развязання гэтай задачы дае дакладны вынік і выкарыстоўвае для гэтага менш вылічальных рэсурсаў. Машыннае навучанне патрабуе збору даных, як правіла спажывае больш рэсурсаў, і мае статыстычную прыроду, таму заўсёды прысутнічае імавернасць памылкі. ПадыходыПадыходы да машыннага навучання традыцыйна падзяляюцца на тры шырокія катэгорыі, якія адпавядаюць парадыгмам навучання паводле характару «сігналу» або «зваротнай сувязі», даступнай сістэме навучання:
У некаторых выпадках, метады з розных падыходаў камбінуюцца для дасягнення патрэбнага эфекту. Напрыклад, мадэль у аснове ChatGPT спачатку праходзіць этап некіраванага навучання на вялікім наборы тэкстаў, у ходзе якога мадэль вывучае моўныя канструкцыі і граматыку для генерацыі тэксту, падобнага да натуральнай мовы. Пасля здольнасці мадэлі весці дыялог паляпшаюцца з дапамогай навучання з падмацаваннем, дзе ўзнагародай выступае зваротная сувязь ад карыстальнікаў мадэлі. Мадэль імкнецца зменшыць колькасць адмоўнай зваротнай сувязі і павялічыць колькасць станоўчай[12]. Кіраванае навучанне![]() Алгарытмы кіраванага навучання ствараюць матэматычную мадэль з набору даных, які змяшчае як запыты, так і пажаданыя адказы (разметку). Такія даныя называюцца навучальнымі і складаюцца з набору навучальных прыкладаў[13]. Кожны навучальны прыклад змяшчае адзін ці больш запытаў і пажаданых адказаў, таксама вядомы як кіроўны сігнал. У матэматычнай мадэлі кожны навучальны прыклад прадстаўлены масівам або вектарам, які часам называюць вектарам прыкмет, а навучальныя даныя часта прадстаўленыя ў выглядзе матрыцы. Праз ітэратыўную аптымізацыю алгарытмы кіраванага навучання пакрысе паляпшаюць функцыю, якая можа быць выкарыстана для атрымання адказаў на новыя запыты, якія не ўваходзілі ў навучальны набор[14]. Пра алгарытм, які пакрысе паляпшае правільнасць сваіх адказаў, кажуць, што ён навучаецца выконваць пэўную задачу[15]. Тыпамі алгарытмаў кіраванага навучання ёсць класіфікацыя і рэгрэсія[16]. Класіфікацыя выкарыстоўваецца тады, калі адказы абмежаваныя канечным наборам значэнняў, а рэгрэсія тады, калі адказы прымаюць якія заўгодна лікавыя значэнні ў пэўным дыяпазоне. Напрыклад для алгарытму класіфікацыі электронных лістоў запытам будзе сам уваходны ліст, а адказам — імя папкі, у якую гэты ліст мусіць быць пакладзены. Навучанне падабенству — галіна кіраванага навучання, цесна звязаная з класіфікацыяй і рэгрэсіяй, але яе мэтай ёсць навучанне на прыкладах функцыі падабенства паміж аб’ектамі. Навучанне падабенству мае прымяненні ў рангаванні , рэкамендацыйных сістэмах , адсочванні візуальнай ідэнтычнасці, верыфікацыі твараў і голасу. Некіраванае навучаннеАлгарытмы некіраванага навучання працуюць з данымі без разметкі і знаходзяць у іх структуру, напрыклад, групы ці кластары аб’ектаў. Замест таго, каб рэагаваць на зваротную сувязь, алгарытмы некіраванага навучання вызначаюць агульныя рысы ў даных і рэагуюць на наяўнасць або адсутнасць такіх агульных рыс у кожнай новай порцыі даных. Некіраванае навучанне знаходзіць сваё асноўнае прымяненне ў задачы ацэнкі шчыльнасці размеркавання ў статыстыцы[17]. Пры гэтым некіраванае навучанне ахоплівае і іншыя прадметныя вобласці, звязаныя з абагульненнем і тлумачэннем прыкмет даных. Кластарны аналіз — гэта разбіццё назіранняў на падмноствы (якія завуцца кластарамі) такім чынам, што назіранні ўнутры аднаго кластара падобныя паводле аднаго ці больш абраных крытэраў, у той час як назіранні з розных кластараў у сярэднім менш падобныя паміж сабой. Розныя тэхнікі кластарызацыі грунтуюцца на розных дапушчэннях пра структуру даных, часта вызначаную пэўнай метрыкай падабенства, і ацэньваюцца, напрыклад, унутранай кампактнасцю, ці падабенствам паміж аб’ектамі ўнутры кластара, і сепарацыяй, розніцай паміж кластарамі. Іншыя метады грунтуюцца на ацэнках шчыльнасці і звязнасці графаў. Паўкіраванае навучаннеПаўкіраванае навучанне ляжыць паміж некіраваным навучаннем (без аніякай разметкі) і кіраваным навучаннем (з поўнасцю размечанымі навучальнымі данымі). У паўкіраваным навучанні некаторыя з навучальных прыкладаў не маюць разметкі, пры гэтым многія даследчыкі машыннага навучання прыйшлі да высновы, што неразмечаныя даныя ў спалучэнні з невялікай колькасцю размечаных могуць значна палепшыць якасць мадэлі. У слаба кіраваным навучанні навучальная разметка шумная, абмежаваная або недакладная. Часта такую разметку прасцей і танней здабыць, і гэта дае магчымасць павялічыць колькасць навучальных даных[18]. Навучанне з падмацаваннемНавучанне з падмацаваннем даследуе тое, як павінны паводзіць сябе праграмныя агенты ў пэўным асяроддзі, каб максімізаваць сукупную ўзнагароду. Праз універсальнасць гэтага падыходу яго вывучаюць у мностве іншых дысцыплін, такіх як тэорыя гульняў, тэорыя кіравання , даследаванне аперацый , тэорыя інфармацыі, аптымізацыя праз сімуляцыю , шматагентныя сістэмы , роевы інтэлект , статыстыка і генетычныя алгарытмы . У машынным навучанні асяроддзе звычайна прадстаўлена як маркаўскі працэс прыняцця рашэнняў . Многія алгарытмы навучання з падмацаваннем выкарыстоўваюць тэхнікі дынамічнага праграмавання[19]. Алгарытмы навучання з падмацаваннем не патрабуюць ведання дакладнай матэматычнай мадэлі асяроддзя і выкарыстоўваюцца, калі стварыць дакладную мадэль немагчыма. Прыклад такога алгарытму — праграма для гульні ў го, шахматы і сёгі AlphaZero. Уплыў на экалогіюВыкарыстанне сучасных сістэм машыннага навучання, асабліва нейронных сетак , патрабуе вялікай колькасці рэсурсаў. Так, праз распрацоўкі ў галіне генератыўнага штучнага інтэлекту, у 2022 годзе ў Microsoft спажыванне вады вырасла на 34 %, а ў Google — на 20 %. Вада выкарыстоўваецца для ахаладжэння дата-цэнтраў , дзе адбываецца навучанне нейронных сетак. Вялікі цэнтр апрацоўкі даных можа штодзень спажываць да 19 мільёнаў літраў вады, што параўнальна з горадам насельніцтвам у 10-50 тысяч чалавек[20]. Гл. таксамаЗноскі
Літаратура
|
Portal di Ensiklopedia Dunia