arquivos CSV ( CSV ) compreendem um formato comum de dados utilizado para a troca ou planilha de informações de banco de dados entre diferentes aplicações em um formato fácil de ler. Tudo é texto e diferentes campos são separados por vírgulas. Se você quiser remover esta formatação, isto pode ser feito facilmente usando a ferramenta " sed " - instalado por padrão no Linux , Unix e Mac OS X e está disponível como um download gratuito para Windows - ou a linguagem de programação VBScript , que é instalado por padrão no Windows . Instruções
Utilizando Sed
1
Abra um terminal. Em Unix ou Linux, normalmente haverá um ícone do terminal na barra de menu ou desktop. No Mac OS X , você pode abrir um terminal , clicando no ícone "Spotlight" na barra de menu e digitando "Terminal ". No Windows, desde que você tenha o sed para Windows instalado, você pode abri-lo clicando no botão "Iniciar" , clique em "Executar" e digitando
2
Digite o seguinte comando " cmd ". :
sed 's /\\ " [ ] *, [ ] * \\ " /\\ "\\" /g' arquivo.csv > file.txt
Isso irá substituir todas as vírgulas no arquivo CSV com espaços e escrever os resultados em um arquivo chamado "arquivo.txt ", desde que as vírgulas estão diretamente entre duas aspas - assegurando que vírgulas incorporadas dentro dos dados em si não são removidos
< br. > 3
Imprima os novos dados , digitando o seguinte comando:
cat file.txt
Usando VBScript
4
Abra um editor de texto .
5
cole o seguinte em seu editor de texto :
dim fso , arquivo outFile , RXP
dim fso = CreateObject (" Scripting.FileSystemObject " )
dim file = fso.OpenTextFile ( WScript.Arguments (0) , 1)
fraca outFile = fso.OpenTextFile ( WScript.Arguments (1), 2)
definir RXP = new RegExp
rxp.Global = True
rxp.Multiline = False
rxp.Pattern = "" " [ ] *, [ ] * " ""
fazer enquanto não file.atEndOfStream
text = file.ReadLine
outFile.WriteLine rxp.Replace (texto, "" "" "")
laço
Este script lê dois argumentos na linha de comando . A primeira para o arquivo CSV eo segundo para o arquivo de saída . Em seguida, aplica-se o mesmo padrão " RegularExpression ", como foi usado na parte sed do tutorial para tirar as vírgulas e escrever os dados para o arquivo de texto de saída.
6
Salve seu trabalho como " csvkill . . vbs "
7
Abra um terminal usando as instruções na parte 1 da seção sed e digite o seguinte :
csvkill.vbs arquivo.csv file.txt
Isto irá ler o arquivo " arquivo.csv " e escrever os resultados para o arquivo "arquivo.txt ".