我想提取MS表单上的第二行文本,并将其保存为桌面上的文本文件。
我尝试了以下方法:
子下载头文本AsTXT()Dim objHTTP作为新的WinHttp. WinHttp请求Dim objText文件作为对象Dim objHTML作为MSHTML. HTML文档Dim strText作为字符串
objHTTP.Open "GET", "https://forms.office.com/Pages/ResponsePage.aspx?id=awcO9aWG80WHsD9NDsXpTtJCpW-P-dRKnllcB9VlAENUMEk4SU5PQ1BOSjZXM0lZREw0RjNRVFJRMy4u", False
objHTTP.Send
strHTML = objHTTP.responseText
Set objHTML = New MSHTML.HTMLDocument
objHTML.body.innerHTML = strHTML
For Each element In objHTML.all
If element.tagName = "header" Then
strText = element.innerText
Exit For
End If
Next
Set objTextFile = CreateObject("Scripting.FileSystemObject").CreateTextFile(Environ("USERPROFILE") & "\Documents\text.txt", True)
objTextFile.Write strText
objTextFile.Close
If strText <> "" Then
MsgBox "The text was successfully downloaded as a .txt file to C:\headertext.txt"
Else
MsgBox "The text was not found on the webpage"
End If
末端子组件
但是这不起作用,我想提取表格上的第二行文本。在这种情况下,文本是20222,我想将其复制并粘贴为计算机上的文本文件。
1条答案
按热度按时间kokeuurv1#
这确实是一个关于网页抓取的问题,但无论如何:
尝试在此URL中查找实际表单内容:
https://forms.office.com/handlers/ResponsePageStartup.ashx?id=awcO9aWG80WHsD9NDsXpTtJCpW-P-dRKnllcB9VlAENUMEk4SU5PQ1BOSjZXM0lZREw0RjNRVFJRMy4u
其中包括(除其他外):
<b><span>20222</span></b>
.我是如何发现这个的(这是在火狐浏览器中,但其他浏览器应该是类似的):
1.转到显示表单的URL。
1.按F12打开开发人员工具。
1.转到网络选项卡。
1.按f5重新载入页面。
1.单击放大镜在左边的第二栏从这顶部到搜索资源.
1.键入"20222"并按Enter键搜索此文本。
1.包含文本的资源的URL应在列表中突出显示。