selenium 使用Python从URL提取唯一ID

ahy6op9u  于 2023-01-30  发布在  Python
关注(0)|答案(2)|浏览(160)

我有一个网址是这样的:

url = 'https://hp.wd5.myworkdayjobs.com/en-US/ExternalCareerSite/job/Enterprise-Business-Planning-Analyst_3103928-1'
x= 'Enterprise-Business-Planning-Analyst_3103928-1'

我想在url的最后提取id,你可以从上面的字符串中说出x部分来获得唯一的id。
任何有关这方面的帮助将不胜感激。

_parsed_url.path.split("/")[-1].split('-')[-1]

我正在使用这个,但它给出了错误。

pw9qyyiw

pw9qyyiw1#

Python的urllib.parsepathlib内置库可以在这里提供帮助。

url = 'https://hp.wd5.myworkdayjobs.com/en-US/ExternalCareerSite/job/Enterprise-Business-Planning-Analyst_3103928-1'

from urllib.parse import urlparse
from pathlib import PurePath

x = PurePath(urlparse(url).path).name

print(x)
# Enterprise-Business-Planning-Analyst_3103928-1
kh212irz

kh212irz2#

要打印文本 Enterprise-Business-Planning-Analyst_3103928-1,您可以对/字符执行split()操作:

url = 'https://hp.wd5.myworkdayjobs.com/en-US/ExternalCareerSite/job/Enterprise-Business-Planning-Analyst_3103928-1'
print(url.split("/")[-1])

# Enterprise-Business-Planning-Analyst_3103928-1

要打印文本 3103928,您可以将_字符替换为-,并且可以针对-字符执行split()

url = 'https://hp.wd5.myworkdayjobs.com/en-US/ExternalCareerSite/job/Enterprise-Business-Planning-Analyst_3103928-1'
print(url.replace("_", "-").split("-")[-2])

# 3103928

相关问题