Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Скриптовые языки администрирования Windows (http://forum.oszone.net/forumdisplay.php?f=102)
-   -   как удалить тэг script содержащий несколько строк (http://forum.oszone.net/showthread.php?t=353150)

ruslaw 28-02-2023 00:24 3004272

как удалить тэг script содержащий несколько строк
 
web-страница содержит различные script-теги такие что <scipt и </script> могут находится как в пределах одной строки, так и на разных строках. Необходимо удалить сами теги и их содержание.
Для однострочных есть несколько RegEx'ов :
<script.*?<\/script>
<script[^>]*?>.*?</script>
\s?<script[^>]*?>.*?<\/script>\s?
Прошу подсказать вариант охватывающий так же и многострочные скриптовые блоки

Sham 28-02-2023 06:59 3004277

node или cscript? Во обоих случаях вместо точки "." можно указать символьный класс [\S\s], а в node можно добавить флаг s.

DJ Mogarych 28-02-2023 10:05 3004291

Надо считать файл как одно целое, а не массив строк, удалить переносы строк и потом применить regex
Код:

<script.*?script>
Например, Powershell
Код:

(gc D:\Downloads\file.html -Raw) -replace "`n" -replace "<script.*?script>"

ruslaw 28-02-2023 22:16 3004330

Спасибо!


Время: 20:25.

Время: 20:25.
© OSzone.net 2001-