![]() |
Какие превосходства у CSV (Comma separated values) перед TSV (Tab-separated values)?
Всем привет.
Отвечая на свой же вопрос: у CSV есть визуальное разделение (запятая, вместо невидимой табуляции) если смотреть на сам исходным файл, а не любоваться результатами работы парсера. И то, данное превосходство можно нивелировать, если смотреть в текстовом редакторе/процессоре у которого есть возможность отображать не печатные символы. MS Word->Отобразить все знаки А так для CSV нужно дополнительно обрабатывать данные - заключать в кавычки значения, в которых требуются применять запятую, дабы дать парсеру понять, что это не служебная запятая и бить на колонки в данном случаи не требуется. До создания темы даже не знал что аббревиатура TSV применяется. Дело в том что когда с Екселя копируешь табличные значения и вставляешь их в Блокнот как раз разбитие через табуляцию, и это тоже табличное представляет данных на что призван CSV для которого с Екселя требуется проделать Файл – Сохранить. Этим же путём можно сохранить и табулированный файл тот же TSV. Кто не в курсе то Парсер - это программа или часть программы, выполняющая синтаксический анализ. http://ru.wikipedia.org/wiki/Синтаксический анализ Несмотря на это распространенность CSV весьма значительная по сравнению с TSV. Почему? |
Цитата:
Цитата:
|
Если данный в таблице примерно одной размерности, то TSV будет представлен ровными колонками, а не сплошным текстом, как CSV. Так что на счёт визуального представления не согласен.
|
Цитата:
|
Табуляция понятие довольно растяжимое, в частности в программировании редакторы могут настраиваться, а могут и нет, на замену символа табулиции определенным числом пробелов. Будь то 8, 4 или 2. Основное применение - форматирование текста.
При переносе исходников в другой редактор наперед не известно, как он работает с табуляцией. Пологаю что и в данном случае также не известно, как идет сохранение файла. Будет ли редактор вставлять символ табуляции или же заменит неким числом пробелов. CSV - четко определен разделяющий символ Цитата:
Также попробую предопложить что с CSV удобнее работать в анализаторах текста gawk, perl, и т.п. |
dascon позиция ясна. Так же и при выводе на печать, в случаи не равномерных данных, будет видно где закончились колонки. Впрочем по типу приводимых данных это тоже можно сделать.
Busla я как раз TSV использую, хоть и не знал что он так называется, всегда называл как его называет Ексель - текстовый файл с разделителями табуляции или просто табулированный текст. Про превосходство визуализации предположил как идею возникновения CSV. С CSV столкнулся на форуме в виде предложения сохранить в нём PM, чуть не спутав его с CVS (Concurrent Versions System) про который слышал ранее благодаря ресурсу sourceforge.net Данную путаницу встретил и в теме Для чего нудны csv-файлы? где на 4м и 5м посте распутали. lxa85 с пробелами тоже можно решить вопрос, если их точно будет больше одного. Это и будет отличием от одинарного, который может быть в полях данных. Да но информативная нагрузка на пользователя, работающего с сырыми данными и видящего служебные запятые и кавычки обрамляющие данные где это требуется. Хотя как вариант можно заключить в кавычки все поля с данными с целью однородности. В случаи анализаторов текста вполне возможно, ведь тогда можно управлять данными с консоли (если я правильно понял идею применения gawc в ключе с CSV), а табуляцию консоль не воспримет, в отличии от запятой. |
lxa85, понятие, как раз, довольно чёткое, а кривые реализации к сожалению, существуют практически для всего :-)
|
Время: 19:45. |
Время: 19:45.
© OSzone.net 2001-