Машыннае навучанне

Прыклад работы алгарытма машыннага навучання DeepMoji для вызначэння найбольш дарэчнага эмодзі для розных фраз. На ўваходзе алгарытму — фраза, на выхадзе — імавернасці спалучэння фразы з кожным эмодзі. На відарысе выдзелены пяць найбольш імаверных эмодзі паводле мадэлі.

Машыннае навучанне (англ.: Machine learning, ML) — галіна штучнага інтэлекту, якая займаецца стварэннем і вывучэннем статыстычных алгарытмаў[en], здольных вучыцца выконваць задачы на аснове набору даных і абагульняць[en] гэты навык на новыя даныя па-за вызначаным наборам без яўных інструкцый[1].

Падыходы машыннага навучання прымяняюцца для стварэння вялікіх моўных мадэляў[en], мадэляў камп’ютэрнага зроку, распазнавання маўлення, фільтравання электроннай пошты[en] і іншых. Гэтыя мадэлі дапамагаюць аўтаматызаваць руцінныя задачы ў многіх сферах, напрыклад у сельскай гаспадарцы і медыцыне тады, калі цяжка ці немагчыма распрацаваць звычайныя алгарытмы для выканання неабходных задач[2][3].

Праграма, заснаваная на алгарытмах машыннага навучання, завецца мадэллю, а працэс прымянення такіх алгарытмаў да навучальнага набору даных[en] — навучаннем мадэлі[4][5].

Машыннае навучанне грунтуецца на метадах матэматычнай аптымізацыі[en] (матэматычнага праграмавання). Роднасная вобласць даследавання, здабыванне даных[en], канцэнтруецца на выведным аналізе даных[en] праз некіраванае навучанне[en][6].

Апошнім часам генератыўныя штучныя нейронныя сеткі[en] змаглі перасягнуць многія папярэднія падыходы ў эфектыўнасці для многіх тыповых задач[7][8].

Параўнанне з класічнымі алгарытмамі

Праграмы машыннага навучання могуць выконваць задачы без яўнага іх на гэта праграмавання. Камп’ютары навучаюцца рабіць гэта з дапамогай пэўнага набору даных.

Для простых задач можна яўна запраграмаваць алгарытмы, што паведамляюць машыне, якія крокі неабходна выканаць для развязання пастаўленай задачы; з боку камп’ютара навучанне не патрабуецца. Для больш складаных задач чалавеку можа быць цяжка самастойна сфармуляваць неабходны набор інструкцый. На практыцы для праграміста можа быць больш эфектыўным дапамагчы машыне распрацаваць уласны алгарытм, чым уручную пазначаць кожны неабходны крок[9].

Напрыклад, пры распазнаванні спаму класічны алгарытм працуе паводле загадзя вызначаных праграмістам правілах. Электронны ліст можа лічыцца спамам, калі ўтрымлівае пэўныя ключавыя словы («выйграй», «бясплатна», «хуткія грошы» і г.д.) або прыходзіць з падазроных адрасоў. Такі падыход патрабуе пастаяннага ручнога знаходжання і абнаўлення адпаведных правіл. Спамерам лягчэй абыходзіць простыя правілы, а складаныя правілы цяжэй праграмаваць і падтрымліваць. У сваю чаргу, метад машыннага навучання здольны самастойна вылучыць прыкметы спаму з тысяч раней пазначаных лістоў, стварыць статыстычную мадэль для ацэнкі імавернасці таго, што новы ліст з’яўляецца спамам на падставе шматлікіх фактараў, у тым ліку незаметных для чалавека заканамернасцей. Працэс паўторнага навучання або данавучання мадэлі на новых даных можа быць аўтаматызаваны, што дазваляе мадэлі адаптавацца да новых тыпаў спаму з прыходам новых даных без умяшання чалавека і робіць такі падыход больш эфектыўным у доўгатэрміновай перспектыве.

Машыннае навучанне грунтуецца на дапушчэнні, што стратэгіі, алгарытмы і высновы, якія добра працавалі ў мінулым (для навучальных даных), верагодна, будуць добра працаваць і ў будучыні (для новых даных)[10].

Для многіх задач машыннае навучанне менш эфектыўна за класічныя алгарытмы або ўвогуле непрымяніма. Напрыклад, разлік даты Вялікадня апісваецца адносна простым наборам матэматычных аперацый, таму класічны алгарытм развязання гэтай задачы дае дакладны вынік і выкарыстоўвае для гэтага менш вылічальных рэсурсаў. Машыннае навучанне патрабуе збору даных, як правіла спажывае больш рэсурсаў, і мае статыстычную прыроду, таму заўсёды прысутнічае імавернасць памылкі.

Падыходы

Падыходы да машыннага навучання традыцыйна падзяляюцца на тры шырокія катэгорыі, якія адпавядаюць парадыгмам навучання паводле характару «сігналу» або «зваротнай сувязі», даступнай сістэме навучання:

  • Кіраванае навучанне[en]: камп’ютар мае прыклады запытаў і пажаданых адказаў на іх (так званая разметка), і на прыкладах навучаецца правілу, паводле якога запыт можа быць пераўтвораны ў правільны адказ.
  • Некіраванае навучанне[en]: камп’ютар атрымлівае даныя без разметкі, каб вызначыць іх структуру і заканамернасці. Некіраванае навучанне можа быць самамэтай (выяўленне невядомай структуры ў даных) або інструментам для іншых падыходаў (навучанне прыкметам[en]).
  • Навучанне з падмацаваннем[en]: камп’ютар узаемадзейнічае з дынамічным асяроддзем, у якім павінна быць выкананая пэўная задача (напрыклад, кіраванне аўтамабілем[en] або гульня з апанентам). У працэсе даследавання асяроддзя камп’ютар атрымлівае зваротную сувязь у выглядзе ўзнагарод за правільныя дзеянні і навучаецца іх максімізаваць[11].

У некаторых выпадках, метады з розных падыходаў камбінуюцца для дасягнення патрэбнага эфекту. Напрыклад, мадэль у аснове ChatGPT спачатку праходзіць этап некіраванага навучання на вялікім наборы тэкстаў, у ходзе якога мадэль вывучае моўныя канструкцыі і граматыку для генерацыі тэксту, падобнага да натуральнай мовы. Пасля здольнасці мадэлі весці дыялог паляпшаюцца з дапамогай навучання з падмацаваннем, дзе ўзнагародай выступае зваротная сувязь ад карыстальнікаў мадэлі. Мадэль імкнецца зменшыць колькасць адмоўнай зваротнай сувязі і павялічыць колькасць станоўчай[12].

Кіраванае навучанне

Метад апорных вектараў[en] — мадэль кіраванага навучання, якая падзяляе прастору даных на рэгіёны лінейнай мяжой. На малюнку лінейная мяжа аддзяляе чорныя меткі ад белых.

Алгарытмы кіраванага навучання ствараюць матэматычную мадэль з набору даных, які змяшчае як запыты, так і пажаданыя адказы (разметку). Такія даныя называюцца навучальнымі і складаюцца з набору навучальных прыкладаў[13]. Кожны навучальны прыклад змяшчае адзін ці больш запытаў і пажаданых адказаў, таксама вядомы як кіроўны сігнал. У матэматычнай мадэлі кожны навучальны прыклад прадстаўлены масівам[en] або вектарам, які часам называюць вектарам прыкмет, а навучальныя даныя часта прадстаўленыя ў выглядзе матрыцы. Праз ітэратыўную аптымізацыю алгарытмы кіраванага навучання пакрысе паляпшаюць функцыю, якая можа быць выкарыстана для атрымання адказаў на новыя запыты, якія не ўваходзілі ў навучальны набор[14]. Пра алгарытм, які пакрысе паляпшае правільнасць сваіх адказаў, кажуць, што ён навучаецца выконваць пэўную задачу[15].

Тыпамі алгарытмаў кіраванага навучання ёсць класіфікацыя і рэгрэсія[en][16]. Класіфікацыя выкарыстоўваецца тады, калі адказы абмежаваныя канечным наборам значэнняў, а рэгрэсія тады, калі адказы прымаюць якія заўгодна лікавыя значэнні ў пэўным дыяпазоне. Напрыклад для алгарытму класіфікацыі электронных лістоў запытам будзе сам уваходны ліст, а адказам — імя папкі, у якую гэты ліст мусіць быць пакладзены.

Навучанне падабенству[en] — галіна кіраванага навучання, цесна звязаная з класіфікацыяй і рэгрэсіяй, але яе мэтай ёсць навучанне на прыкладах функцыі падабенства паміж аб’ектамі. Навучанне падабенству мае прымяненні ў рангаванні[en], рэкамендацыйных сістэмах[en], адсочванні візуальнай ідэнтычнасці, верыфікацыі твараў і голасу.

Некіраванае навучанне

Алгарытмы некіраванага навучання працуюць з данымі без разметкі і знаходзяць у іх структуру, напрыклад, групы ці кластары аб’ектаў. Замест таго, каб рэагаваць на зваротную сувязь, алгарытмы некіраванага навучання вызначаюць агульныя рысы ў даных і рэагуюць на наяўнасць або адсутнасць такіх агульных рыс у кожнай новай порцыі даных. Некіраванае навучанне знаходзіць сваё асноўнае прымяненне ў задачы ацэнкі шчыльнасці[en] размеркавання ў статыстыцы[17]. Пры гэтым некіраванае навучанне ахоплівае і іншыя прадметныя вобласці, звязаныя з абагульненнем і тлумачэннем прыкмет даных.

Кластарны аналіз — гэта разбіццё назіранняў на падмноствы (якія завуцца кластарамі) такім чынам, што назіранні ўнутры аднаго кластара падобныя паводле аднаго ці больш абраных крытэраў, у той час як назіранні з розных кластараў у сярэднім менш падобныя паміж сабой. Розныя тэхнікі кластарызацыі грунтуюцца на розных дапушчэннях пра структуру даных, часта вызначаную пэўнай метрыкай падабенства, і ацэньваюцца, напрыклад, унутранай кампактнасцю, ці падабенствам паміж аб’ектамі ўнутры кластара, і сепарацыяй, розніцай паміж кластарамі. Іншыя метады грунтуюцца на ацэнках шчыльнасці і звязнасці графаў.

Паўкіраванае навучанне

Паўкіраванае навучанне ляжыць паміж некіраваным навучаннем (без аніякай разметкі) і кіраваным навучаннем (з поўнасцю размечанымі навучальнымі данымі). У паўкіраваным навучанні некаторыя з навучальных прыкладаў не маюць разметкі, пры гэтым многія даследчыкі машыннага навучання прыйшлі да высновы, што неразмечаныя даныя ў спалучэнні з невялікай колькасцю размечаных могуць значна палепшыць якасць мадэлі.

У слаба кіраваным навучанні[en] навучальная разметка шумная, абмежаваная або недакладная. Часта такую разметку прасцей і танней здабыць, і гэта дае магчымасць павялічыць колькасць навучальных даных[18].

Навучанне з падмацаваннем

Навучанне з падмацаваннем даследуе тое, як павінны паводзіць сябе праграмныя агенты[en] ў пэўным асяроддзі, каб максімізаваць сукупную ўзнагароду. Праз універсальнасць гэтага падыходу яго вывучаюць у мностве іншых дысцыплін, такіх як тэорыя гульняў, тэорыя кіравання[en], даследаванне аперацый[en], тэорыя інфармацыі, аптымізацыя праз сімуляцыю[en], шматагентныя сістэмы[en], роевы інтэлект[en], статыстыка і генетычныя алгарытмы[en]. У машынным навучанні асяроддзе звычайна прадстаўлена як маркаўскі працэс прыняцця рашэнняў[en]. Многія алгарытмы навучання з падмацаваннем выкарыстоўваюць тэхнікі дынамічнага праграмавання[en][19]. Алгарытмы навучання з падмацаваннем не патрабуюць ведання дакладнай матэматычнай мадэлі асяроддзя і выкарыстоўваюцца, калі стварыць дакладную мадэль немагчыма. Прыклад такога алгарытму — праграма для гульні ў го, шахматы і сёгі AlphaZero.

Уплыў на экалогію

Выкарыстанне сучасных сістэм машыннага навучання, асабліва нейронных сетак[en], патрабуе вялікай колькасці рэсурсаў. Так, праз распрацоўкі ў галіне генератыўнага штучнага інтэлекту, у 2022 годзе ў Microsoft спажыванне вады вырасла на 34 %, а ў Google — на 20 %. Вада выкарыстоўваецца для ахаладжэння дата-цэнтраў[en], дзе адбываецца навучанне нейронных сетак. Вялікі цэнтр апрацоўкі даных можа штодзень спажываць да 19 мільёнаў літраў вады, што параўнальна з горадам насельніцтвам у 10-50 тысяч чалавек[20].

Гл. таксама

Зноскі

  1. Азначэнне «без яўнага праграмавання» часта прыпісваюць Артуру Самуэлю, які стварыў тэрмін «машыннае навучанне» ў 1959, але даслоўная цытата не знойдзена ў гэтай публікацыі і можа быць пазнейшай парафразай. Гл. «Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?» у Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). "Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming". Artificial Intelligence in Design '96. Artificial Intelligence in Design '96(англ.). Springer, Dordrecht. pp. 151–170. doi:10.1007/978-94-009-0279-4_9. ISBN 978-94-010-6610-5.
  2. Hu, Junyan; Niu, Hanlin; Carrasco, Joaquin; Lennox, Barry; Arvin, Farshad (2020). "Voronoi-Based Multi-Robot Autonomous Exploration in Unknown Environments via Deep Reinforcement Learning". IEEE Transactions on Vehicular Technology. 69 (12): 14413–14423. doi:10.1109/tvt.2020.3034800. ISSN 0018-9545. S2CID 228989788.
  3. Yoosefzadeh-Najafabadi, Mohsen; Hugh, Earl; Tulpan, Dan; Sulik, John; Eskandari, Milad (2021). "Application of Machine Learning Algorithms in Plant Breeding: Predicting Yield From Hyperspectral Reflectance in Soybean?". Front. Plant Sci. 11: 624273. doi:10.3389/fpls.2020.624273. ISSN 1664-462X. PMC 7835636. PMID 33510761.
  4. What are Machine Learning Models? (англ.). Databricks. Праверана 15 снежня 2023.
  5. Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.
  6. Friedman, Jerome H. (1998). "Data Mining and Statistics: What's the connection?". Computing Science and Statistics. 29 (1): 3–9.
  7. What is Machine Learning?(нявызн.). IBM. Праверана 27 чэрвеня 2023.
  8. Zhou, Victor. Machine Learning for Beginners: An Introduction to Neural Networks (англ.). Medium (20 снежня 2019). Архівавана з першакрыніцы 9 сакавіка 2022. Праверана 15 жніўня 2021.
  9. Ethem Alpaydin (2020). Introduction to Machine Learning (Fourth ed.). MIT. pp. xix, 1–3, 13–18. ISBN 978-0262043793.
  10. Domingos 2015, Chapter 6, Chapter 7.
  11. Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
  12. Understanding ChatGPT Reinforcement Learning: A Comprehensive Guide to AI Conversations.
  13. Russell, Stuart J.; Norvig, Peter (2010). Artificial Intelligence: A Modern Approach (Third ed.). Prentice Hall. ISBN 9780136042594.
  14. Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Foundations of Machine Learning. The MIT Press. ISBN 9780262018258.
  15. Mitchell, T. (1997). Machine Learning. McGraw Hill. pp. 2. ISBN 978-0-07-042807-2.
  16. Alpaydin, Ethem (2010). Introduction to Machine Learning. MIT Press. p. 9. ISBN 978-0-262-01243-0.
  17. Jordan, Michael I.; Bishop, Christopher M. (2004). "Neural Networks". In Allen B. Tucker (рэд.). Computer Science Handbook, Second Edition (Section VII: Intelligent Systems). Boca Raton, Florida: Chapman & Hall/CRC Press LLC. ISBN 978-1-58488-360-9.
  18. Weak Supervision: A New Programming Paradigm for Machine Learning. The Stanford AI Lab Blog. Праверана 7 студзеня 2023.
  19. van Otterlo, M.; Wiering, M. (2012). Reinforcement learning and Markov decision processes. Adaptation, Learning, and Optimization. Vol. 12. pp. 3–42. doi:10.1007/978-3-642-27645-3_1. ISBN 978-3-642-27644-6. {{cite book}}: |journal= ігнараваны (даведка)
  20. "Лічбавая засуха: распрацоўка АІ патрабуе ўсё больш вады, якой становіцца ўсё менш". dev.by. 2013-09-23. Праверана 2023-10-02.

Літаратура

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya