Hierarchical Data Format![]() Hierarchical Data Format (HDF, HDF4, ou HDF5) é o nome para dun conxunto de formatos de ficheiros e librarías creadas para a organización e almacenamento de grandes cantidades de datos numéricos, algo que se precisa na investigación sobre a aprendizaxe automática. Trátase dun formato en licenza aberta (como as BSD) coas súas especificacións públicas, capaz de obter información sobre os datos que almacena sen recorrer a fontes externas e con capacidade de estandarización sobre os datos de natureza aberta que admite para gardar en memoria. HDF ten implementacións en varias linguaxes ou plataformas de software comerciais e non-comerciais, como IDL, Java, MATLAB, Octave, Python, R ou Scilab. As dúas principais versións do HDF son HDF4 e HDF5, bastante diferentes en estrutura e API. HDF está composto basicamente pola libraría, unha consola como liña de comando, unha ferramenta de probas, unha interface Java e polo visor HDF Viewer.[1] HistoriaNa procura dun formato flexíbel e independente da plataforma de uso, con capacidade de almacenamento da crecente e heteroxénea variedade de datos na investigación comezou a desenvolverse o formato HDF nos laboratorios da NCSA (National Center for Supercomputing Applications) a partir do ano 1988, manténdose na actualidade polo equipo de desenvolvemento de HDF, que depende da Universidade de Illinois. Actualmente, este formato utilízase por múltiples organismos, tanto públicos como privados, para a difusión de datos e resultados científicos, entre as que se atopa a NASA, ou a Axencia Europea do Espazo (ESA), en, por exemplo, as lecturas dos sensores MODIS, MERIS ou ETM+, entre outros.[2] EstruturaA estrutura dos arquivos HDF permite o almacenamento de diversos tipos de datos, tales como:
Acceso aos datosExisten diversas formas de acceder aos datos contidos baixo un ficheiro HDF. Unha delas é o acceso a nivel binario, coñecendo a estrutura do ficheiro público, ou ben a través de aplicacións dispoñíbeis que soporten este formato. O formato de organización dos datos no HDF5 pódese entender como un sistema de ficheiros descrito nun único arquivo HDF5. Similar aos cartafoles ou contedores virtuais nun ordenador persoal pero sendo considerados na linguaxe HDF5 como "datasets" (conxuntos de datos). Isto resulta nunha xerarquía organizativa, de feito os valores dun arquivo HDF5 poden ser lidos usando sintaxe POSIX /ruta/ao/valor. Ligazóns externas
Notas
|
Portal di Ensiklopedia Dunia