Sentence-Transformer是怎么让两个句子‘看懂’彼此相似的？它背后有哪些好用的预训练模型？

Sentence-Transformer是一个提供众多预训练模型的工具，可用于语义文本相似度（STS）等任务。在STS任务中，有表现良好的模型，如roberta-large-nli-stsb-mean-tokens（STSb性能为86.39）、roberta-base-nli-stsb-mean-tokens（STSb性能为85.44）、bert-large-nli-stsb-mean-tokens（STSb性能为85.29）、distilbert-base-nli-stsb-mean-tokens（STSb性能为85.16）[^4]。 Sentence - BERT模型是基于Transformer的大模型，能够对句子进行高精度的语义表示，Sentence - Transformer与之相关，可帮助实现句子的语义表示相关任务[^2]。关于其使用，在相关教程中可学习Sentence - Transformer的使用及fine - tune方法。官网为SentenceTransformers Documentation，还有mathor的博客（https://mathor.blog.csdn.net/ ）也提供了相关内容 [^3]。另外，有文章对Sentence - Transformer库进行了全面介绍，涵盖核心概念和联系、核心算法原理和具体操作步骤、数学模型、公式、案例分析和常见问题解答、项目实践（包括开发环境搭建、源代码实现、代码解读和分析、运行结果展示等）、实际应用场景和未来应用展望、相关学习资源、开发工具和参考文献等内容 [^1]。以下是一个简单使用Sentence - Transformer计算句子相似度的Python代码示例： ```python from sentence_transformers import SentenceTransformer from sklearn.metrics.pairwise import cosine_similarity # 加载预训练模型 model = SentenceTransformer('roberta-large-nli-stsb-mean-tokens') # 定义句子 sentences = ["This is an example sentence", "Each sentence is converted"] # 生成句子的嵌入 embeddings = model.encode(sentences) # 计算句子之间的余弦相似度 similarity = cosine_similarity([embeddings[0]], [embeddings[1]]) print(similarity) ```

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python里list.index(2)遇到重复元素时，到底返回哪个位置？

目录

Sentence-Transformer是怎么让两个句子‘看懂’彼此相似的？它背后有哪些好用的预训练模型？

Python内容推荐

Python-SentenceTransformers使用BERTXLNet进行句子嵌入

Python-使用BERT模型作为句子编码服务将可变长度句子映射到固定长度向量

Python-大规模transformer语言模型包括BERT

【Python编程】Python单元测试与测试驱动开发实践

【Python编程】Python迭代器与生成器机制剖析

【Python编程】Python容器化部署与Docker最佳实践

Python程序设计基础项目化教程 教案 31 Python爬虫.rar

BERT预训练模型字向量提取工具–使用BERT编码句子

基于torch transformers 直接加载bert预训练模型计算句子相似度

官方bert中文预训练模型

bert模型句子向量化

ChatGPT背后的大模型最新有哪些？最新最全《Transformer预训练模型分类》论文，pdf.pdf

sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

NLP预训练模型.pptx

Universal Sentence Encoder

预训练模型.pptx————电子版_pptx版

sentence_classification:句子分类

预训练语言模型预训练语言模型预训练语言模型预训练语言模型

预训练模型BERT介绍

bert-base-chinese (pytorch版本预训练模型)

BERT预训练模型字向量提取工具–使用BERT编码句子

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析

告别遮挡！UniApp中WebView与原生导航栏的和谐共处方案（附完整可运行代码）

OSPF是怎么在企业网里自动找最优路径并分区域管理的？

Python程序设计基础项目化教程教案 31 Python爬虫.rar