Chrome扩展历史记录API不显示所有结果?

ht4b089n  于 2023-09-28  发布在  Go
关注(0)|答案(2)|浏览(140)

我试图使用Chrome扩展历史API根据输入的搜索词获取用户的历史记录。但在某些情况下,搜索无法正常工作。例如,当我输入术语“bi”时,没有结果给出,但当我搜索“bit”时,给出了一些结果,但不是全部,我通过在Chrome历史搜索中验证它来检查这个,它显示了更多的结果。这是历史API的工作方式还是我做错了什么?这是我的代码-

window.onload = function() {

function getHistory() {
  var list = document.getElementById('list');
  var box = document.getElementById("box").value;
  if (box === '') {
    list.innerHTML = '';
    list.innerHTML = list.innerHTML + 'Nothing To Search.';
  }
  else {
    var microseconds = 1000 * 60 * 60 * 24 * 365 * 45;
    var start = (new Date).getTime() - microseconds;
  chrome.history.search({text: box, startTime: 0, maxResults: 50000}, function(data) {
    if(Object.keys(data).length === 0) {
    list.innerHTML = '';
      list.innerHTML = list.innerHTML + 'Nothing Found.';
    }
    else {
      list.innerHTML = '';
        data.forEach(function(page) {
        list.innerHTML = list.innerHTML + '<li><p>'+page.title+'</p> <a href='+page.url+' target="_blank"><p>'+page.url+'</p></a></li> <hr>';
    });
   }
  });
 }
}

document.getElementById('search').onclick = getHistory;
}

谢谢

ryhaxcpt

ryhaxcpt1#

我看到了同样的行为与我正在编写的扩展。这真的很烦人,所以我去挖掘Chromium的源代码,看看它到底在做什么来匹配历史结果。

**简短的回答:**从源代码来看,这种行为似乎是有意的,所以如果我们想检索文本查询的所有匹配项,我们就只能检索所有的历史结果,然后自己在JavaScript中搜索匹配项。另外,不要忘记仔细检查开始/结束时间,并确保您的“maxResults”属性足够大,因为任何这些属性的错误值都可能会给您带来意想不到的结果。
长回答

免责声明:我没有太多的C++经验,所以如果我的评估是错误的,请纠正。
在使用非空文本查询调用chrome.history.search之后,最终会调用以下函数(在history_backend.cc中)。

bool URLDatabase::GetTextMatchesWithAlgorithm(
    const base::string16& query,
    query_parser::MatchingAlgorithm algorithm,
    URLRows* results) {
  query_parser::QueryNodeVector query_nodes;
  query_parser_.ParseQueryNodes(query, algorithm, &query_nodes);

  results->clear();
  sql::Statement statement(GetDB().GetCachedStatement(SQL_FROM_HERE,
      "SELECT" HISTORY_URL_ROW_FIELDS "FROM urls WHERE hidden = 0"));

  while (statement.Step()) {
    query_parser::QueryWordVector query_words;
    base::string16 url = base::i18n::ToLower(statement.ColumnString16(1));
    query_parser_.ExtractQueryWords(url, &query_words);
    GURL gurl(url);
    if (gurl.is_valid()) {
      // Decode punycode to match IDN.
      base::string16 ascii = base::ASCIIToUTF16(gurl.host());
      base::string16 utf = url_formatter::IDNToUnicode(gurl.host());
      if (ascii != utf)
        query_parser_.ExtractQueryWords(utf, &query_words);
    }
    base::string16 title = base::i18n::ToLower(statement.ColumnString16(2));
    query_parser_.ExtractQueryWords(title, &query_words);

    if (query_parser_.DoesQueryMatch(query_words, query_nodes)) {
      URLResult info;
      FillURLRow(statement, &info);
      if (info.url().is_valid())
        results->push_back(info);
    }
  }
  return !results->empty();
}

传递给这个函数的算法query_parser::MatchingAlgorithm引用下面显示的枚举(来自query_parser. h),并且从我所知道的来看从未显式设置,因此它将是DEFAULT值。

enum class MatchingAlgorithm {
  // Only words long enough are considered for prefix search. Shorter words are
  // considered for exact matches.
  DEFAULT,
  // All words are considered for a prefix search.
  ALWAYS_PREFIX_SEARCH,
};

阅读DEFAULT选项上方的注解-
“前缀搜索只考虑足够长的单词。较短的单词被认为是精确匹配”
算法本身(query_parser.cc)将文本查询和原始URL结果分解为由空格或标点符号分隔的“单词”列表,并检查每对之间的“前缀匹配”。这就解释了为什么如果你的历史记录中有几个页面的URL中有文本“chromium”,如果你搜索“hromium”,你将得不到任何结果,但如果你搜索“chro”,你会得到所有的结果。
在你的例子中,我认为搜索“bi”不会返回任何结果,因为算法只会寻找精确的单词匹配的短词,这意味着“bi”需要在URL/标题中白色或标点符号包围。如果你在谷歌上搜索“bi”,然后再次查询“bi”的历史记录,这一点就得到了证实。Google搜索历史记录项将被匹配,因为在Google搜索的URL中,“bi”被标点符号和白色包围:
https://www.google.ca/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=bi

来源

wz8daaqr

wz8daaqr2#

chrome.history.search并不一定意味着所有页面都将被检索。文档指出,它将搜索与查询匹配的每个页面的最后访问时间。这可能是为什么它看起来不完整的原因。
至于为什么当有2个字符时没有结果,当有3个字符时返回一些结果,我不能确定。这可能是由于设置了其他参数,如startTime。它应该有一个纪元时间值,将其设置为0将尝试搜索自1970年以来的数据(这可能是您打算做的)。

相关问题