Как получить только исхоный код страницы по HTTP (без картинок и тд - только текст)?
Добрый день! Нужно получить один только HTML веб страницы (именно HTTP запросом, потому что это гораздо быстрее, чем грузить через браузер, а потом пользоваться _IEDocReadHTML). Пробую, пишу код:
читать дальше »
Код:
$sURL="http://rambler.ru/"
$sPath=@DesktopDir & "\HTML.html"
FileOpen($sPath,2)
FileWrite($sPath,_GetHTML($URL))
ShellExecuteWait($sPath)
Func _GetHTML($sURL,$sSendParam="")
if StringLeft($sURL,7)<>"http://" then $sURL="http://" & $sURL
Local $oHTTP = ObjCreate("WinHttp.WinHttpRequest.5.1")
$oHTTP.Open("GET",$sURL,false)
$oHTTP.SetRequestHeader("Content-Type", "text/html")
$oHTTP.SetRequestHeader("Accept", "application/x-ms-application, application/x-ms-xbap, application/vnd.ms-xpsdocument, application/xaml+xml")
$oHTTP.SetRequestHeader("User-Agent", "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; WebMoney Advisor; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; OperaEmbedded Web Browser; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; AskTB5.3)")
$oHTTP.SetRequestHeader("Cache-Control", "no-cache")
$oHTTP.SetRequestHeader("Accept-Language", "ru")
$oHTTP.Send($sSendParam)
Return $oHTTP.ResponseText
EndFunc
Когда полученный код открывается через браузер, почему-то отображаются и картинки. Что изменить, чтобы картинок не было (ведь они получается скачиваются при запросе GET?) ? Я пробовал удалять все, что содержало Image из заголовка "Accept" - не помогло.
|