O CiTIUS lévanos da man ás verdades e mentiras da Data Science

martes, 12 de maio do 2015 Redacción

O Centro de Investigación en Tecnoloxías da Información da USC (CiTIUS) está a organizar un curso formativo na temática do Big Data e Data Science. A actividade celebrarase os días 27 e 28 de maio e constará dun relatorio e un obradoiro formativo, ambos impartidos por Jordi Vitrià (Universitat de Barcelona). Na páxina web do CiTIUS podemos consultar xa o horario e programa completo do curso, que se celebra na Escola Técnica Superior de Enxeñaría de Santiago. O centro sinala que pode ser “de gran interese” para investigadores e profesionais das novas tecnoloxías, a computación e os ámbitos científicos onde é preciso manexar inxentes cantidades de información.
O curso celébrase baixo o seguinte epígrafe: Data Science, ou como facer fronte ás verdades e mentiras dos datos. Segundo indican os organizadores da achega formativa acerca dos obxectivos que se buscan coa mesma, non hai dúbida xa da importancia actual da Data Science, ou sexa dos grandes volumes de información destinados ao traballo científico e das metodoloxías postas en xogo para acubillalos, manexalos, tratalos, xestionalos e preservalos do mellor xeito posíbel. Segundo lembra o CiTIUS hai unha chea de desafíos pendentes ao abeiro da dita temática. Así, “malia termos as ferramentas para almacenar e acceder a enormes cantidades de información, a extracción de coñecemento útil e a súa tradución en decisións optimizadas segue sendo un reto que precisa dunha nova xeración de profesionais que foron chamados Data Scientists”, explica o centro da Universidade de Santiago.
O curso artéllase en dúas partes: un relatorio e un obradoiro práctico. O relatorio presentará unha visión xeral do eido da Data Science mediante a análise das súas semellanzas co método científico. Tamén se afondará nas conexións da Data Science co Big Data. A última parte da charla adicarase a identificar algúns dos erros máis frecuentes cando se aplica a ciencia de datos e como facer fronte a este problema. Pola súa banda, no taller presentaranse as seguintes ferramentas para Data Science:
1) Ferramentas de Python para Data Science e Big Data: IPython, NumPy, Pandas, Blaze.
2) Estimación estatística de frecuencias: limitacións e consecuencias para o Big Data
3) Estimación estatística bayesiana
4) Programación probabilística: PyMC
O relator
Jordi Vitrià é investigador senior e catedrático da Universitat de Barcelona. Doutorouse na Universitat Autónoma de Barcelona en 1990. Ten máis de 20 anos de experiencia traballando en Visión por Computador e as súas aplicacións a varios eidos. A súa investigación, cando os computadores persoais tiñan 128KB de memoria, orientouse inicialmente cara á análise dixital de imaxes e como extraer información cuantitativa delas, mais axiña evolucionou cara a problemas de visión por computador. Despois dun ano como investigador post-doutoral na Universidade de California en Berkeley en 1993, centrouse nos métodos bayesianos para os métodos de visión por computador. Na actualidade, dirixe un grupo de investigación que traballa na comprensión visual de obxectos.

PUBLICIDADE