使用.NET,如何以编程方式获取浏览器中显示的html代码(并且可以通过“另存为”命令从Chrome或Opera等浏览器中保存)**?
使用HtmlDocument.Load()
或wget
是无济于事的-我不会得到我想要的。
另请参见讨论here。
编辑
不幸的是,.Net WebClient
(或者更确切地说,新的.Net.Http.HttpClient
)类没有帮助(请参阅 bdcoder 的答案)。我得到了与HtmlDocument.Load()
或wget
相同的结果。而不是浏览器保存的html代码。
let myHtml =
async
{
let client = new System.Net.Http.HttpClient()
let! responseBody =
client.GetStringAsync("https://www.kodis.cz/lines/region?tab=232-293")
|> Async.AwaitTask
return responseBody
} |> Async.RunSynchronously
3条答案
按热度按时间2nbm6dog1#
如果你在浏览器开发工具的网络面板中查看,你可以看到JavaScript正在调用的端点来获取PDF数据。你可以使用HttpClient请求相同的数据,然后解析JSON来获取PDF链接。
pqwbnv8z2#
你试过.Net WebClient类吗?你应该能够从任何URL获取页面,保存结果,然后相应地处理HTML代码。
希望能帮上忙。
vhipe2zx3#
我的问题的另一个可能的解决方案是here(Tomáš Petříček的答案)。