On Github gabelula / csv
Por Gabriela Rodríguez / @gaba
Knight-Mozilla Open News Fellow at La Nacion, Argentina
Presentación en http://gabelula.github.io/csv/
programadora de Open News en La Nacion este es un taller con manos en la masa - asacar compuses un conjunto herramientas para trabajar con archivos CSV, manejarlos, limpiarlos, unirlos, convertirlos a otros formatos, etc
ejemplo para jugar en http://gabelula.github.io/cvs/datos/
$ in2csv EleccionesHistoricasUY.xlsx > data.csv
$ csvlook acceso-informacion-publica-2013.csv ... $ csvlook -e iso-8859-13 Fallecidos_2013.csv | head ...
$ csvcut -n acceso-informacion-publica-2013.csv 1: id_solicitante 2: expediente 3: dependencia 4: fecha 5: tema 6: categoria_tema 7: dependencia_ministerio 8: ministerio 9: vencimiento_1 10: vencimiento_2 11: prorroga 12: estado 13: termino 14: fecha_respuesta
$ csvcut -c 2,5,12 acceso-informacion-publica-2013.csv expediente,tema,estado 240768,DATOS VARIOS CON RESPECTO A LICITACIONES DE OBRAS DE ESPACIOS VERDES ,Finalizado fuera de término 240791,DATOS VARIOS CON RESPECTO AL FUNCIONAMIENTO DE LAS ESTACIONES SAN JOSE DE FLORES Y NAZCA,Finalizado en término ...
$ csvcut -c 2,5,12 acceso-informacion-publica-2013.csv | csvlook | head
$ csvstat acceso-informacion-publica-2013.csv Unique values: 1143 5 most frequent values: 245,7442737,MGEYA,2013-12-27,REITERA: 4 290,628690,MGEYA,2013-02-22,DATOS: 2 290,628690,MGEYA,2013-02-22,INFORMACION: 2 84,355174,MGEYA,2013-01-28,"ACTUACIONES: 1 1,240805,MGEYA,2013-01-18,FUNCIONES: 1 Max length: 44 Row count: 1148
$ csvgrep -c estado -m "Pendiente" datos/acceso-informacion-publica-2013.csv | head
$ csvgrep -c expediente -r "24\d{4}" datos/acceso-informacion-publica-2013.csv | head
$ csvjoin -c Tipo_vehiculo,Codigo multas_transito_2006_2010/multas2008.csv multas_transito_2006_2010/tipos_de_vehiculo.csv --left
$ csvjson --key Codigo --indent 4 multas_transito_2006_2010/tipos_de_vehiculo.csv
$ csvstack multas2008.csv tipos_de_vehiculo.csv
$ csvclean acceso-informacion-publica-2013.csv 271 errors logged to acceso-informacion-publica-2013_err.csv
$ csvsql -i postgresql multas_transito_2006_2010/tipos_de_vehiculo.csv CREATE TABLE tipos_de_vehiculo ( "Codigo" INTEGER NOT NULL, "Nombre" VARCHAR(29) NOT NULL );
$ less, head, tail, cat
Agradecimientos: Christopher Groskopf por escribir CSVKit.
Presentación en http://gabelula.github.io/csv/
CSVKit en https://csvkit.readthedocs.org/