CSV,TSVってなに?

CSVもTSVもファイル形式のことです。

例えばあるお店Aで支払いをしたリストがあったとします。

このデータをデータベースに登録しようとすると、まずはデータを取り込む必要があります。そのさいデータの形式がばらばらだと、どのデータが何かわかりません。そこでCSVやTSVといった形式に統一し、何行目に何のデータがあるか決めることで正確に取り込むことができます。

このようにファイル形式が決まっているとデータをあれこれするときに便利です。

 

CSVとは?


CSVとはデータをカンマ区切りで並べた形式のものになります。拡張子は.csvです。最初に見てもらったデータをCSV形式にすると以下のようになります。

データとデータの間にカンマが入っているのがわかると思います。

 

TSVとは?


一方TSVはタブで区切られた形式になります。拡張子は.tsvです。

上記のようにタブで区切られています。ちなみにパソコンのTabボタンを押すとタブが挿入されます。

TSVのほうはあまりなじみがないかもしれませんが、結構使いどころがあります。例えば金額のデータがあった場合、データの中にカンマが入る可能性があります(1,000円のように)。

カンマが入ると区切りと認識してしまうため”1,000″のようにダブルクォーテーションで囲むこともありますが、タブ形式にすると解決できるのでそういう時に使ったりします。カンマが入るデータがある可能性があればTSVにしておくという手も有効です。

 

取り込む時の注意


ここからは余談ですが、CSVやTSVのデータを取り込むときは1行目にヘッダー(見出し)が入るかどうか確認が必要です。上記のデータは全て1行目に見出しがありますが、仕様によっては見出しではなく1行目からデータが入ってくることがあります。その場合何行目から読み込みをスタートするのか注意しましょう。

soon
  • soon
  • 1986年生まれのjavaプログラマー。28歳の時に7年働いた販売士からプログラマーに転職をする。常駐先を転々としながら日々生きています。