.. _advanced_usage: 高级使用 ======== Deepwriter ^^^^^^^^^^^^^^^^ 根据查询生成结构化报告。 .. code-block:: bash python tests/deepwriter/test_deepwriter.py 高级检索功能 ^^^^^^^^^^^^^^^^ 灵活分块 ~~~~~~~~~~~~~~~~~~~~ - 固定文档长度分块(fixed_doc) .. code-block:: bash python tests/chunk_test/test_chunk_reports.py \ --chunk_mode fixed_doc \ --chunk_size 300 \ --chunk_overlap 50 - 固定页面长度分块(fixed_page) .. code-block:: bash python tests/chunk_test/test_chunk_reports.py \ --chunk_mode fixed_page \ --chunk_size 400 \ --chunk_overlap 40 - 基础分块(base) .. code-block:: bash python tests/chunk_test/test_chunk_reports.py \ --chunk_mode base \ --chunk_size 256 \ --chunk_overlap 32 - 语义分块(semantic) .. code-block:: bash python tests/chunk_test/test_chunk_reports.py \ --chunk_mode semantic \ --chunk_size 300 \ --chunk_overlap 50 \ --breakpoint_type percentile \ --breakpoint_amount 85 参数说明 .. code-block:: bash python tests/chunk_test/test_chunk_reports.py --help 问题重写 ~~~~~~~~~~~~~~~~~~~~ - 使用查询改写功能 + 重排序 .. code-block:: bash python tests/query_rewrite/test_query_rewrite.py \ --root_path src/resources/data \ --parent_document_retrieval \ --top_n_retrieval 14 \ --query_rewrite_model qwen2.5:72b \ --max_query_variations 3 \ --vector_db milvus \ --rerank_model bge-reranker-large - 仅使用查询改写功能 .. code-block:: bash python tests/query_rewrite/test_query_rewrite.py \ --root_path src/resources/data \ --parent_document_retrieval \ --top_n_retrieval 14 \ --query_rewrite_model qwen2.5:72b \ --max_query_variations 3 \ --vector_db milvus 重排序 ~~~~~~~~~~~~~~~~~~~~ 使用重排序技术提高检索精度: 下载相关模型以及详细的使用方法,请查看 :ref:`rerank` 章节。 - 从 huggingface 中下载模型进行重排序 .. code-block:: bash # 使用 bge-reranker-large 模型进行重排序 python tests/rerank/test_rerank_huggingface.py \ --root_path src/resources/data \ --parent_document_retrieval \ --top_n_retrieval 14 \ --vector_db milvus \ --rerank_model bge-reranker-large - 使用 VLLM 部署的模型进行重排序 .. code-block:: bash python tests/rerank/test_rerank_VLLM.py \ --root_path src/resources/data \ --parent_document_retrieval \ --top_n_retrieval 14 \ --vector_db milvus 混合检索 ~~~~~~~~~~~~~~~~~~~~ HRAG 支持 **向量检索** 与 **关键词检索** 策略的组合: .. code-block:: bash # 批量评测 python tests/hybrid_retrieval/test_hybrid_weighted_retrieval.py \ --alpha 0.5 \ --top_k 14 \ --collection_name "challenge_data" \ --parent_document_retrieval 深度搜索(DeepSearch) ^^^^^^^^^^^^^^^^^^^^^^^ 支持深度搜索的单问题智能问答: .. code-block:: bash python tests/deepsearch/test_single_question.py 深度搜索可视化展示: .. tip:: 初次使用请安装相关库,详见:ref:`_examples_deepsearch` 部分。 .. code-block:: bash streamlit run tests/deepsearch/test_deepsearch.py