Курација на податоциКурација на податоците е организација и интеграција на податоците собрани од различни извори. Тоа вклучува прибелешка, објавување и презентирање на податоците така што вредноста на податоците се одржува со текот на времето, а податоците остануваат достапни за повторна употреба и зачувување. Курацијата на податоците ги вклучува „сите процеси потребни за принципиелно и контролирано создавање, одржување и управување со податоци, заедно со капацитетот за додавање вредност на податоците“.[1] Во науката, курацијата на податоците може да укаже на процес на извлекување на важни информации од научни текстови, како што се написи за истражување од експерти, да се претворат во електронски формат, како што е внесување на биолошка база на податоци.[2] Во модерната ера на големи податоци, курацијата на податоците стана поистакната, особено за софтверска обработка со висок волумен и сложени системи на податоци.[3] Терминот се користи и во историски прилики и хуманистички науки,[4] каде што зголемувањето на културните и научните податоци од дигиталните хуманистички проекти бара експертиза и аналитички практики на курацијата на податоците.[5] Во широка смисла, курацијата значи низа активности и процеси направени за да се создаде, управува, одржува и потврдува компонента.[6] Поточно, курацијата на податоците е обид да се утврди која информација вреди да се зачува и колку долго.[7] Историја и праксаКорисникот, наместо самата база на податоци, обично иницира курација на податоци и одржува метаподатоци. Според Факултетот за библиотека и информатика на Универзитетот во Илиноис, „Курацијата на податоците е активно и тековно управување со податоците преку својот животен циклус од интерес и корисност за стипендиите, науката и образованието; кураторските активности овозможуваат откривање и враќање на податоците, одржувајте го квалитетот, додавајте вредност и обезбедете повторна употреба со текот на времето “.[8] Работниот тек на курацијата на податоците се разликува од управувањето со квалитетот на податоците, заштитата на податоците, управувањето со животниот циклус и движењето на податоците.[9] Податоците за пописот се достапни во форма на табеларни панч-картички од почетокот на 20 век и се електронски од 1960-тите.[10] Интер-универзитетскиот конзорциум за политички и социјални истражувања (ICPSR) ја означува 1962 година како датум на нивната прва архива на податоци од истражувањето.[11] Длабока позадина за библиотеките со податоци се појави во издание на списанието во Илиноис, Библиотечни трендови во 1982 година.[12] За историска позадина на движењето за архивата на податоците, видете „Потреби од социјални научни информации за бројчени податоци: Еволуција на инфраструктурата за меѓународна архива на податоци“.[13] Точниот процес на курација преземен во рамките на која било организација зависи од обемот на податоци, колкава бучава содржат податоците и што значи очекуваната идна употреба на податоците за нивно ширење.[3] Кризите во вселенските податоци доведоа до создавање на моделот Отворен архивски информативен систем (OAIS) во 1999 година,[14] управуван од Консултативниот комитет за системи за вселенски податоци (CCSDS), формиран во 1982 година.[15] Терминот курација на податоци понекогаш се користи во контекст на биолошки бази на податоци, каде што специфичните биолошки информации прво се добиваат од низа истражувачки написи, а потоа се чуваат во одредена категорија база на податоци. На пример, информации за антидепресивни лекови може да се добијат од различни извори и, откако ќе се провери дали се достапни како база на податоци или не, тие се зачувуваат во категоријата антидепресиви во базата на податоци на лекови. Претпријатијата исто така користат податоци за курацијата во рамките на нивните оперативни и стратешки процеси за да обезбедат квалитет и точност на податоците. Проекти и студииПроектот за дисеминација на информативни пакети (ДИПС) за повторна употреба на информациите (ДИПИР) ги проучува податоците од истражувањето произведени и користени од квантитативни социјални научници, археолози и зоолози Наменетата публика е истражувачи кои користат секундарни податоци и дигитални куратори, менаџери за дигитални складишта, вработени во центарот за податоци и други кои собираат, управуваат и чуваат дигитални информации.[16] Анкетата за дигитално небо на Слоун започна да го испитува ноќното небо во 2000 година.[17] Компјутерскиот научник Jimим Греј, додека работел на архитектурата на податоците на SDSS, се залагал за идејата за куратор на податоци во науките.[18] DataNet беше програма за истражување на Канцеларијата за компјутерска инфраструктура на Националната фондација за наука на САД, која финансираше проекти за управување со податоци во науките.[19] DataONE (мрежа за набудување на податоци за Земјата) е еден од проектите финансирани преку DataNet, помагајќи им на заедницата за наука за животната средина да ги зачува и споделува податоците.[20] Поврзано
Наводи
Надворешни врски
|
Portal di Ensiklopedia Dunia