训练集alpaca、sharegpt格式
LLaMA-Factory微调支持的格式
支持 alpaca 格式和 sharegpt 格式的数据集。
Alpaca格式
格式:
[
{
"instruction": "人类指令(必填)",
"input": "人类输入(选填)",
"output": "模型回答(必填)",
"system": "系统提示词(选填)",
"history": [
["第一轮指令(选填)", "第一轮回答(选填)"],
["第二轮指令(选填)", "第二轮回答(选填)"]
]
}
]
instruction:指令,即需要做的事情的抽象(如总结一句话);
input:具体要做的事情(如具体是什么话);
output:模型的回答;
system:系统提示词&