上下文
我有下面这段话:
text = """
בביהכנ"ס - בבית הכנסת דו"ח - דין וחשבון הת"ד - התיקוני דיקנא
בגו"ר - בגשמיות ורוחניות ה"א - ה' אלוקיכם התמי' - התמיהה
בהנ"ל - בהנזכר לעיל ה"א - ה' אלקיך ואח"כ - ואחר כך
בהשי״ת - בהשם יתברך ה"ה - הרי הוא / הוא הדין ואת"ה - ואיגוד תלמידי
"""
这一段与希伯来语单词及其首字母缩写词结合在一起。
单词包含引号("
)。
例如,有些词可以是:
[
'בביהכנ"ס',
'דו"ח',
'הת"ד'
]
现在,我可以用这个正则表达式来匹配所有的单词:
(\b[\u05D0-\u05EA]*\"\b[\u05D0-\u05EA]*\b)
问题
但是,我怎样才能将所有对应的首字母缩写词作为一个单独的组来匹配呢?(首字母缩写词是不匹配的,所以不是图中的绿色)。
缩写词示例如下:
[
'בבית הכנסת',
'דין וחשבון',
'התיקוני דיקנא'
]
预期输出
预期输出应为字典,单词为keys
,缩写为values
:
{
'בביהכנס': 'בבית הכנסת',
'דו"ח': 'דין וחשבון',
'הת"ד': 'התיקוני דיקנא'
}
我的尝试
我试着匹配所有的单词(如上图):
(\b[\u05D0-\u05EA]*\"\b[\u05D0-\u05EA]*\b)
然后匹配所有内容,直到模式再次显示为.*\1
,因此整个正则表达式将为:
(\b[\u05D0-\u05EA]*\"\b[\u05D0-\u05EA]*\b).*\1
但正如你所见,这行不通:
- 我如何将单词和首字母缩写词匹配起来,用单词/首字母缩写词组成字典?
备注
当你打印输出时,它可能是按从左到右的顺序打印的。但实际上应该是从右到左。所以如果你想从右到左打印,请看下面的答案:
right-to-left languages in Python
1条答案
按热度按时间slsn1g291#
您可以尝试:
打印(注意键/值已交换)