您的功能请求是否与问题相关?请描述。
我想拆分源代码,例如Java、Python文件,langchain(Python)支持它:
https://python.langchain.com/v0.2/docs/how_to/code_splitter
但是我的服务是用Java编写的,所以我无法使用原始的Python langchain语言拆分器。
描述您希望的解决方案
支持用Java版本的代码拆分器。
您的功能请求是否与问题相关?请描述。
我想拆分源代码,例如Java、Python文件,langchain(Python)支持它:
https://python.langchain.com/v0.2/docs/how_to/code_splitter
但是我的服务是用Java编写的,所以我无法使用原始的Python langchain语言拆分器。
描述您希望的解决方案
支持用Java版本的代码拆分器。
4条答案
按热度按时间czfnxgou1#
相关:
#1081
#1227
ktecyv1j2#
我能试一下吗?
mzaanser3#
@Kugaaa sure, go ahead! What exactly do you plan to implement?
4dc9hkyq4#
@Kugaaa sure, go ahead! What exactly do you plan to implement?
I have learned about the practices in LangChain, the essence of spliting code by
TextSplitter
I would like to reference the approach used in LangChain to implement the abstract class
HierarchicalDocumentSplitter
DocumentByKeywordsSplitter
, It will recursively split based on the given keyword list if it exceeds the setchunk size
.DocumentByCodeSplitter
, it extendsDocumentByKeywordsSplitter
and sets its keyword list to the relevant content related to the corresponding syntax.