데이터 랭글링데이터 랭글링(data wrangling) 혹은 데이터 먼징(data munging)은 원자료(raw data)를 보다 쉽게 접근하고 분석할 수 있도록 데이터를 정리하고 통합하는 과정이다.[1] 이를 통해서 반자동화 도구의 도움으로 데이터를 좀 더 편리하게 소비한다. 데이터 랭글링에는 먼징(munging), 데이터 시각화, 데이터 집합, 통계 모형 학습 뿐만 아니라 많은 다른 잠재적 용도도 포함된다. 일반적으로 데이터 먼징은 일반적인 단계를 따르는데 데이터 원천(Data Source)으로부터 원래 최초 형태로 자료를 추출하는 것으로 시작한다. 알고리듬(예로, 정렬)을 사용해서 원자료를 "먼징(munging)"하거나 사전 정의된 자료구조로 데이터를 파싱(parsing)한다. 그리고 나서 마지막으로 저장이나 미래 사용을 위해서 작업 완료한 콘텐츠를 데이터 싱크(data sink)에 놓아둔다. 인터넷의 급격한 확산으로 이러한 기술이 가용한 데이터 양이 증가하고 있는 기관에서는 점점 중요해지고 있다. 데이터 랭글러(Data Wrangler)는 랭글링을 수행하는 사람이다. 같이 보기각주 |
Index:
pl ar de en es fr it arz nl ja pt ceb sv uk vi war zh ru af ast az bg zh-min-nan bn be ca cs cy da et el eo eu fa gl ko hi hr id he ka la lv lt hu mk ms min no nn ce uz kk ro simple sk sl sr sh fi ta tt th tg azb tr ur zh-yue hy my ace als am an hyw ban bjn map-bms ba be-tarask bcl bpy bar bs br cv nv eml hif fo fy ga gd gu hak ha hsb io ig ilo ia ie os is jv kn ht ku ckb ky mrj lb lij li lmo mai mg ml zh-classical mr xmf mzn cdo mn nap new ne frr oc mhr or as pa pnb ps pms nds crh qu sa sah sco sq scn si sd szl su sw tl shn te bug vec vo wa wuu yi yo diq bat-smg zu lad kbd ang smn ab roa-rup frp arc gn av ay bh bi bo bxr cbk-zam co za dag ary se pdc dv dsb myv ext fur gv gag inh ki glk gan guw xal haw rw kbp pam csb kw km kv koi kg gom ks gcr lo lbe ltg lez nia ln jbo lg mt mi tw mwl mdf mnw nqo fj nah na nds-nl nrm nov om pi pag pap pfl pcd krc kaa ksh rm rue sm sat sc trv stq nso sn cu so srn kab roa-tara tet tpi to chr tum tk tyv udm ug vep fiu-vro vls wo xh zea ty ak bm ch ny ee ff got iu ik kl mad cr pih ami pwn pnt dz rmy rn sg st tn ss ti din chy ts kcg ve
Portal di Ensiklopedia Dunia