扣子(Coze):构建智能助手并嵌入个人网站的新选择
本文讨论了作者放弃使用MaxKB搭建个人知识库并集成到个人网站的原因,包括硬件资源限制、知识库维护困难和可拓展性弱。随后,作者介绍了扣子(Coze),一个新一代AI应用开发平台,它允许用户无论是否有编程基础都能快速搭建基于大模型的智能体,并将其部署到社交平台、通讯软件或网站等。文章概述了扣子的功能和优势,包括灵活的工作流设计、无限拓展的能力集、丰富的数据源和持久化的记忆能力。最后,作者简要记录了如何使用扣子创建智能体,并将其嵌入到第三方网站中,以Halo 2.x为例,展示了具体的实现步骤和代码示例。
使用MaxKB搭建知识库问答系统并接入halo
本文介绍了MaxKB,一个基于大语言模型和RAG技术的开源知识库问答系统。MaxKB适用于企业内部知识库、客户服务等场景,能够自动化知识采集、入库、构建,并提高知识搜索的准确性。产品优势包括开箱即用、快速接入第三方业务系统、灵活编排和模型中立性。作者选择MaxKB的原因是其易于集成到个人博客网站,以提升用户体验。文章详细记录了MaxKB的部署、创建应用、知识库设置和集成到第三方应用的过程,并分享了在集成过程中遇到的技术问题及解决方案。最终,作者成功将MaxKB集成到个人博客中,提升了博客的互动性和知识检索能力。
人工智能
未读
【精品】NLP自然语言处理学习路线(知识体系)
本文根据自然语言处理主要的几个子领域及其包含的主要任务简单总结了一份NLP的学习路线,也可以说是知识体系。后续个人的技术文章也将主要围绕NLP去展开,大致也会按照这个路线去记录相关的基础知识、方法、技术、工具及实践案例等等。所以本文不仅仅是整理了一份学习路线,更是个人未来很长一段时间的学习规划。
正则表达式清洗文本数据
正则表达式正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为元字符)。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
词频统计与TF-IDF
TF-IDF和词频是脱不了关系的,所以在这里再记录一下关于词频的内容。其实在词云图那块儿就已经完成了词频统计,这里记录另一种方法,即利用NLTK包实现统计与可视化。