大模型的本机部署 大模型的本机部署 1 介绍 用于方便在个人电脑上快速启动一个大语言聊天模型。支持命令行聊天和网页端聊天两种方式。最低配置可以支持纯 CPU,有独立显卡会有更好的体验。 本项目基于目前非常火的大模型微调开源项目 LLaMA-Factory1,大家可以点进去给给 Star 支持一下学长的工作。 网页端演示: 网页端演示 命令行演示: 命令行演示 2 环境配置 首先安装 Python,请使用 2024-04-29 教程系列 #LLM #NLP
Pip 常用操作 Pip 常用操作 1 安装和卸载 安装最新版本 1pip install package 安装指定版本 1pip install package==ver 安装最小版本 1pip install 'package>=ver' 一定要加引号,不然会被当成输出重定向。 安装指定源(以清华源为例) 1pip install pa 2024-03-14 python学习笔记 #开发工具 #Python #pip
【论文翻译】Towards LLM-driven Dialogue State Tracking 在任务型对话(TOD)系统中,对话状态跟踪(DST)是确保用户意图和系统行为得到精确追踪的核心环节。随着以 GPT3 和 ChatGPT 为代表的大型语言模型(LLM)的崛起,它们在不同场景和任务中的表现引发了广泛关注。本研究对 ChatGPT 在 DST 中的性能进行了初步研究。评估结果展示了 ChatGPT 在此任务中的出色表现,为研究人员提供了关于其能力的深刻认识,同时也为对话系统的设计和优 2024-03-03 NLP笔记 #LLM #NLP #论文笔记 #Fine-Tuning #LoRA #任务型对话
基于hexo+fluid+腾讯云COS的博客搭建教程(二) 基于hexo+fluid+腾讯云COS的博客搭建教程(二) 上回说到,hexo 框架和 fluid 主题的安装和搭建,这次继续学习 fluid 主题的配置和图片的存放,以及 COS 部署的知识。 6 主题配置概述 这一章节我们主要讲 fluid 主题的使用,大家除了看本教程,还应该参考主题的官方文档:配置指南 | Hexo Fluid 用户手册 (fluid-dev.com)。 主题的官方仓库 2024-01-17 教程系列 #hexo
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调 LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调 引言 大语言模型微调一直都是一个棘手的问题,不仅因为需要大量的计算资源,而且微调的方法也很多。在尝试每种方法过程中,配置环境和第三方库也颇为麻烦。。而 LLaMA Factory1 是一个高效的大语言模型训练和推理的框架,不仅集成多种高效训练方法,而且能持续适配国内外各种开源大模型。该框架还提供了能够一站式实 2024-01-14 教程系列 #LLM #NLP #Fine-Tuning #LoRA
基于hexo+fluid+腾讯云COS的博客搭建教程(一) 如大家所见现在的 onlyar.site 是我在 2022 年暑假正式搭建的。在这之前我一直在博客园发表我的文章,但是我觉得博客园还是不够 geek 而选择了自建博客。一开始我尝试的是 hugo 框架,后来因为当时网上的资料比较少,出了 bug 难以修复而放弃,最后我选择了现在的 hexo 框架。 2024-01-11 教程系列 #hexo
简单神经网络实现手写数字识别 简单神经网络实现手写数字识别 突然发现已经来实验室半年了还没有写过 Pytorch 代码,觉得既然是做深度学习还是有必要学一下的吧。那么今天下定决心自己(照着教程)写一个手写数字识别的任务。 0. 环境搭建 0.1 python 环境准备 大多数人使用的是 conda 管理环境,但是这次我使用的是 PyCharm+venv+Jupyter 的组合。具体操作如下: PyCharm 中点击:新建项目 2024-01-09 python学习笔记 #Pytorch #Python #深度学习
任务型对话数据集调研——其他 任务型对话数据集调研——其他 上回说到了任务型对话的数据集的构建方式主要有 machine-to-machine、human-to-machine 和 human-to-human 三种,并介绍了一下 human-to-human 数据集的代表 MultiWOZ 系列,那么今天就再讲一讲在任务型对话中的使用其他构造方法构造的常用的数据集。 1 SGD 数据集 SGD 数据集是 dstc8 大赛公布 2023-12-15 NLP笔记 #NLP #任务型对话
任务型对话数据集调研——MultiWOZ 篇 任务型对话数据集调研——MultiWOZ 篇 最近为了毕设在做任务型对话(Task-Oriented Dialogue)方面的研究,也写了一篇关于任务型对话的小小介绍:任务型对话系统简介 - Only(AR)'s blog (onlyar.site)。然后几周都在忙着调研大模型在任务型对话中的应用和谈恋爱,一直对动手操作也没有什么头绪。慢慢我明白了,做一个方向的研究要从数据集开始下手,于是下定决心 2023-12-12 NLP笔记 #NLP #任务型对话