O CiTIUS lévanos da man ás verdades e mentiras da Data Science
martes, 12 de maio do 2015
O Centro de Investigación
en Tecnoloxías da Información da USC (CiTIUS) está a organizar un
curso formativo na temática do Big Data e Data Science. A
actividade celebrarase os días 27 e 28 de maio e constará dun
relatorio e un obradoiro formativo, ambos impartidos por Jordi Vitrià
(Universitat de Barcelona). Na páxina web do CiTIUS podemos
consultar xa o horario
e programa completo do curso, que se celebra na Escola Técnica
Superior de Enxeñaría de Santiago. O centro sinala que pode ser “de
gran interese” para investigadores e profesionais das novas
tecnoloxías, a computación e os ámbitos científicos onde é
preciso manexar inxentes cantidades de información.
O curso celébrase baixo
o seguinte epígrafe: Data Science, ou como facer fronte ás
verdades e mentiras dos datos. Segundo indican os organizadores
da achega formativa acerca dos obxectivos que se buscan coa mesma,
non hai dúbida xa da importancia actual da Data Science, ou
sexa dos grandes volumes de información destinados ao traballo
científico e das metodoloxías postas en xogo para acubillalos,
manexalos, tratalos, xestionalos e preservalos do mellor xeito
posíbel. Segundo lembra o CiTIUS hai unha chea de desafíos
pendentes ao abeiro da dita temática. Así, “malia termos as
ferramentas para almacenar e acceder a enormes cantidades de
información, a extracción de coñecemento útil e a súa tradución
en decisións optimizadas segue sendo un reto que precisa dunha nova
xeración de profesionais que foron chamados Data Scientists”,
explica o centro da Universidade de Santiago.
O curso artéllase en
dúas partes: un relatorio e un obradoiro práctico. O relatorio
presentará unha visión xeral do eido da Data Science
mediante a análise das súas semellanzas co método científico.
Tamén se afondará nas conexións da Data Science co Big
Data. A última parte da charla adicarase a identificar algúns
dos erros máis frecuentes cando se aplica a ciencia de datos e como
facer fronte a este problema. Pola súa banda, no taller
presentaranse as seguintes ferramentas para Data Science:
1) Ferramentas de Python
para Data Science e Big Data: IPython, NumPy, Pandas, Blaze.
2) Estimación
estatística de frecuencias: limitacións e consecuencias para o Big
Data
3) Estimación
estatística bayesiana
4) Programación
probabilística: PyMC
O relator
Jordi Vitrià é
investigador senior e catedrático da Universitat de Barcelona.
Doutorouse na Universitat Autónoma de Barcelona en 1990. Ten máis
de 20 anos de experiencia traballando en Visión por Computador e as
súas aplicacións a varios eidos. A súa investigación, cando os
computadores persoais tiñan 128KB de memoria, orientouse
inicialmente cara á análise dixital de imaxes e como extraer
información cuantitativa delas, mais axiña evolucionou cara a
problemas de visión por computador. Despois dun ano como
investigador post-doutoral na Universidade de California en Berkeley
en 1993, centrouse nos métodos bayesianos para os métodos de
visión por computador. Na actualidade, dirixe un grupo de
investigación que traballa na comprensión visual de obxectos.