我有一个HTML DOM解析器。它的工作...它试图从一个有类的div中获取文本。
查看主文件
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="content-type" content="text/html" />
<script type="text/javascript" src="//ajax.googleapis.com/ajax/libs/jquery/1.10.2/jquery.min.js">
</script>
<script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jqueryui/1.8.18/jquery-ui.min.js">
</script>
<style>
#txt_out {
border: 2px solid #C2C2C2;
color: #2E2E2E;
background: #EDEDED;
width: 97%;
padding: 5px;
font-size: 12px;
font-family: monospace;
outline: none;
height: 800px;
margin: 10px 0;
}
</style>
<title>Get Ranks</title>
<script type="text/javascript" >
$(document).on("click", ".go", function (event) {
var ID = $(".rank").val();
console.log("Loading rank: " + ID);
loadData(ID);
});
function loadData(ID) {
var getRank = ID;
var dataString = 'getRank=' + getRank;
$.ajax({
type: "POST",
url: "otherTest.php",
data: dataString,
cache: false,
success: function (html) {
$("#txt_out").append(html);
}
});
}
</script>
</head>
<body>
<h1>Get Mens Rankings</h1>
<input value="233" class="rank" />
<button class="go">Get stats</button>
<textarea readonly="readonly" id="txt_out"></textarea>
</body>
</html>
点击“get stats”按钮后,它会调用(通过AJAX)这个页面:
<?php
include_once ('simple_html_dom.php');
$rank = $_POST['getRank'];
$URL = "http://fifa.com/worldranking/rankingtable/gender=m/rank=".$rank."/confederation=25998/page=1/_ranking_table.html";
$html = file_get_html($URL);
$test = trim($html->find('.rnkdate', 0)->innertext);
echo "Date published: " . $test;
?>
它试图从这个URL中提取发布日期:http://www.fifa.com/worldranking/rankingtable/gender=m/rank=233/confederation=25998/page=1/_ranking_table.html
其中rank=XXX
是不同月份的不同表。
不管怎样,当我这样做的时候,我得到了这样的结果:
问题是它在另一个DIV里面,因此...我猜它不会显示在<textarea>
里面。那么.我如何进入那个div并提取文本本身呢?
1条答案
按热度按时间kx5bkwkv1#
如果你使用的是http://simplehtmldom.sourceforge.net/,那么根据http://simplehtmldom.sourceforge.net/manual_api.htm,似乎你应该使用“plaintext”,而不是“innertext”(因为innertext似乎是JavaScript开发人员称之为innerHTML的东西,而“plaintext”似乎是js中.textContent的等价物。这个simplehtmldom库似乎是由那些不是web开发人员的人写的。无论如何(Anyway)