2025年8月3日至9月6日,外国语学院“驿语荟智”实践团队各团员深入广西、广东、山西、甘肃、江苏等地,开展以“语汇乡情,智联文旅”为主题的暑期社会实践。团队立足本专业基础,聚焦乡村文旅发展的语言服务国际化传播需求,创新性地采用本地部署大语言模型(LLM,Large Language Model)与检索增强技术(RAG, Retrieval-Augmented Generation),以实地搜集的乡村特色语料为依托,通过严谨的“实地考察、语料收集、模型训练、实地验证”四步闭环,探索低成本、高相关、易扩展的智慧语言服务新模式,为乡村振兴注入科技动能与青年智慧。
扎根乡土,精准捕捉需求
实践伊始,“驿语荟智”团队各成员分别深入全国各地旅游的旅游景区、文化场馆、民宿客栈等乡村旅游资源集聚处,进行扎实的前期调研。队员们细致拍摄景区标识牌、导览手册、特色产品说明等现有翻译素材,记录其内容、语种及使用场景。

图为团队成员在贺州某乡村旅游景区实地收集语料
通过实地走访和访谈,团队精准锁定了乡村文旅场景中翻译不准确、信息更新滞后、地方语言服务匮乏等关键问题。依照实际痛点与需求为导向,团队锚定了“低成本、地方化、标准化”的研究方向,探索乡村文旅国际化传播的新路径。
广纳乡音,构建专属语库
解决语言服务难题,高质量语料是基石。“驿语荟智”团队展开了密集的语料收集工作。队员们广泛搜集当地文旅相关的官方文本、宣传资料、历史典故、民间传说、特色物产介绍等,并利用录音设备记录当地导游讲解、村民口述故事、特色方言词汇等鲜活口语材料。

图为团队成员正在提取、清洗语料,搭建语料库
随后,团队成员分工协作,将这些收集到的文字、音频资料进行系统化的清洗、分类、标注,构建起服务于本地文旅场景的“乡情语料库”,为后续模型训练提供精准、丰富的养分。
精炼乡识,赋能本地模型
依托前期构建的“乡情语料库”,“驿语荟智”团队的核心技术工作——本地大语言模型(以Deepseek-R1 1B为实验平台)的微调与优化正式启动。团队充分利用Ollama平台的内置检索增强生成(RAG)技术和高效嵌入模型(embedding model), 在指导老师悉心指导下,团队成员的精确调校后,将具有地方特色与文化负载的本地语料库进行配置,并进行针对性的训练与迭代。

图为团队成员在指导教师的指导下校对已收集语料
这一过程旨在让模型深刻理解本地文旅语境、专有名词和文化内涵,显著提升其在景点解说、特色翻译、智能问答、个性化推荐等场景下的表现力、准确性和文化相关性,打造真正“懂地方”、“接地气”的语言智能体。
检验乡效,智慧服务落地
模型的训练效果最终需要回归实地检验。团队带着初步优化的本地LLM解决方案,重返乡村文旅场景进行验证测试。

图为团队成员在广西米粉博物馆采访游客

图为团队成员在五台山景区对照翻译成果取证
队员们选取典型场景,如模拟游客查询、对比模型生成的景点介绍与实际需求、测试多轮对话能力等,记录模型表现,分析优缺点。 这些一手验证数据成为模型进一步优化和未来部署方案设计的关键依据。
青春代码,链通智慧未来
此次“驿语荟智”之行,团队成员将专业知识与前沿技术深度融合,深耕乡村振兴沃土。 通过构建本地化、低成本、高相关的语言智能服务新模式,团队不仅探索了人工智能赋能乡村文旅的可行路径,更在实践中锤炼了人机协同、乡村旅游传译等本领。

未来,团队将持续优化模型,积极推动成果转化,让“会说话的AI”真正成为连接八方游客与魅力乡村的智慧桥梁,以青年之智,助力乡村文化传播与产业振兴跑出“加速度”。(初审:陈彦洁 复审:吕雅芬 终审:覃慧敏)