Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Скриптовые языки администрирования Windows (http://forum.oszone.net/forumdisplay.php?f=102)
-   -   [решено] Поиск и замена (http://forum.oszone.net/showthread.php?t=312852)

user689 18-03-2016 10:44 2617332

Поиск и замена
 
Добрый день.
Имеется тектовый файл, размером более 5000 строк. Вида:

pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26916,1000,3750,'','','11',null,NULL,1)
pla (IdPl,EncLevel,IdSection) Values (26916,2,21)
pla(IdPl,EncLevel,IdSection) Values (26916,1,1065)

Pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26917,2900,3750,'','','11',null,NULL,1)
Pla(IdPl,EncLevel,IdSection) Values (26917,2,21)
Pla (IdPl,EncLevel,IdSection) Values (26917,1,1065)

Pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26918,1050,3750,'','','11',null,NULL,1)
Pla (IdPl,EncLevel,IdSection) Values (26918,2,21)
Pla (IdPl,EncLevel,IdSection) Values (26918,1,1065)

Pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26919,1100,3750,'','','11',null,NULL,1)
Pla (IdPl,EncLevel,IdSection) Values (26919,2,21)
Pla (IdPl,EncLevel,IdSection) Values (26919,1,1065)


Задача состоит в том, что-бы заменить все Выделенные жирным цветом значения(они меняются +1 каждую четвертую строчку), на отрицательные цифры по порядку: 26916 == -1 , 26917 == -2 , 26918 == -3 ...

greg zakharov 18-03-2016 19:08 2617573

user689, уважаемый, Вы в своем уме? Обрабатывать файл в пять тысяч строк на командном языке - что-то из разряда утонченного извращения. PowerShell'то достаточно долго думал, к слову, решение на нем будет выглядеть примерно так:
Код:

gc file | % {$a=-1;$b=0}{$_ -replace '(\d{5})', $a;$b++;if($b -eq 4){$b=0;$a+=-1}}
Наименее затратным по времени оказался Perl:
Код:

perl -pe 's/(\d{5})/-($1-26915)/e' file
Чуть более затратным оказался Python, далее - Ruby. sed'ом еще не пробовал, но, нужно полагать, он немногим уступает тому же Python'у или Perl'у.

Foreigner 18-03-2016 20:16 2617589

На PowerShell можно еще так:
Код:

$a=0; (gc file.txt -read 4) | foreach { $_ -replace '\d{5}', --$a } | sc file.txt
или, если это будет "затратно", то сначала создать временный файл, а потом уже заменить им исходный.

greg zakharov 18-03-2016 20:36 2617594

Foreigner, тогда уж лучше:
Код:

gc file -r 4|%{$a=0}{$_ -replace '\d{5}', --$a}
Но все равно медленне Perl'а.

Foreigner 18-03-2016 21:07 2617603

Цитата:

Цитата greg zakharov
Но все равно медленне Perl'а. »

Ничего не попишешь. А Perl какой и под какую платформу?

greg zakharov 18-03-2016 22:01 2617617

В принципе, если гибридить JScript с командным языком, то:
Код:

0</* :
@cscript /nologo /e:jscript "%~f0" %*&exit /b */0;
(function(file) {
  with (new ActiveXObject('Scripting.FileSystemObject')) {
    if (!FileExists(file)) {
      WScript.echo('File not found or does not exist.');
      return;
    }

    var fs = OpenTextFile(GetAbsolutePathName(file), 1);
    while (!fs.atEndOfStream) {
      var s = fs.ReadLine();
      if (s !== null) {
        WScript.echo(s.replace(/\d{5}/, "-" + (s.match(/\d{5}/)-26915)));
      }
    }
    fs.Close();
  }
}(
  WScript.Arguments.length !== 1
  ? (function() {
    WScript.echo('Usage: ' + WScript.ScriptName + ' <file>');
    WScript.echo('.e.g.: ' + WScript.ScriptName + ' E:\\sandbox\\file.txt');
    WScript.Quit(1);
  }()) : WScript.Arguments.Unnamed(0)
));

По скорости все же быстрее PowerShell'а. Правда операции над группами при замене не пракатывают, приходится еще и match задействовать.
gawk при замерах также показывает неплохой результат.
Код:

gawk 'match($0,/(.*\()([0-9]{5})(,.*)/,a) {$0=a[1]"-"a[2]-26915a[3]} 1' file

user689 21-03-2016 06:34 2618143

Спасибо за ответы!
PowerShell справился с задачей.
А как быть если в тексте встречаются дополнительные строки, количество их может быть разное, например:

pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26916,1000,3750,'','','11',null,NULL,1)
pla (IdPl,EncLevel,IdSection) Values (26916,2,21)
pla(IdPl,EncLevel,IdSection) Values (26916,1,1065)
go

Pl (IdPl,X,Y,TitleLine,Name,Description,idRowMetric,idPlMetric,Person) Values (26917,2900,3750,'','','11',null,NULL,1)
Pla(IdPl,EncLevel,IdSection) Values (26917,2,21)
Pla (IdPl,EncLevel,IdSection) Values (26917,1,1065)
commit
go

...
...
...

Однако перед каждым заменяемым значением всегда присутствуют "Values ("

Iska 21-03-2016 07:15 2618146

Цитата:

Цитата user689
А как быть если… »

Лучшим было бы прикладывать образец реального файла, упакованного в архив.

user689 21-03-2016 08:52 2618156

Вложений: 1
Пример файла во вложении.
Файл 135122

Foreigner 21-03-2016 10:00 2618170

user689, Попробуйте такой вариант:
Код:

$a = sls '\d{5}' ttv.txt
$b = gc ttv.txt

# $a.matches.value[0]..$a.matches.value[($a.matches.value.count-1)] |  # если версия PowerShell ниже четвертой

$a.matches.value[0]..$a.matches.value[-1] |
foreach { $n=0 } { $b = $b -replace $_, --$n }

$b | sc ttv-new.txt


user689 21-03-2016 10:44 2618187

PS C:\Documents and Settings\Администратор> $a.matches.value[0]..$a.matches.value[-1] | foreach { $n=0 } { $b = $b -repl
ace $_, --$n }
Не удается индексировать в массив NULL.
строка:1 знак:18
+ $a.matches.value[ <<<< 0]..$a.matches.value[-1] | foreach { $n=0 } { $b = $b -replace $_, --$n }
+ CategoryInfo : InvalidOperation: (0:Int32) [], RuntimeException
+ FullyQualifiedErrorId : NullArray

Foreigner 21-03-2016 12:52 2618232

user689, У меня все отработало. И если запускать, как скрипт и если интерактивно -- в консоли:



Попробуйте обращаться к индексу последнего элемента массива через свойство count, как показано на скриншоте:
Код:

$a.matches.value.count-1

user689 21-03-2016 14:33 2618272

на сервере версия 2.0 - не сработало, в 4.0 - все хорошо.
Спасибо!


Время: 04:08.

Время: 04:08.
© OSzone.net 2001-