PDA

Показать полную графическую версию : Семантический анализ текста(Подсчёт количества одинаковых строк в списке)


Валодя1111
10-09-2017, 17:57
Привет всем это снова я помогите мне у меня имеется база примерно в 2 гб не больше но не суть
в виде списка и необходимо бесплатную программу или скрипт
что бы ее проанализировать вот о чем я говорю НЕ РЕКЛАМА (http://dorohoff.net/tools/repeats-calculator)
нужен аналог этого сайта только в виде программы/скрипта ибо этот сайт зависает в месте с компом при загрузке базы
даже в 70 мб

хелп плиз
кому лень переходить вот пример
скриншот

Iska
10-09-2017, 18:20
у меня имеется база »
SELECT Field, Count(Field) AS Total FROM Table GROUP BY Field ORDER BY Total DESC

Busla
10-09-2017, 22:17
Валодя1111, список, и даже таблица - это далеко ещё не база данных. А анализ - скорее статистический, уж точно не семантический.
Однократно можно банально Эксэлем - Pivot Tables как раз и предназначены для больших таблиц

Ну или на PowerShell поэкспериментировать с готовыми решениями (https://stackoverflow.com/questions/32385611/sort-very-large-text-file-in-powershell).

Iska
10-09-2017, 23:25
С двумя гигабайтами? На PowerShell? Не-не-не. Или OLE DB, или Log Parser.




© OSzone.net 2001-2012