Skip to content

训练的数据问题 #31

@fortune-ai

Description

@fortune-ai

感谢开源你的模型,有两个问题请教下:
1、目前开源的仅仅是预训练模型(codes1b、codes3b、codes7b、codes15b)对吧?sft微调的数据方便开源么?
2、在训练过程,sql 2个epoch,text2code 1个eopch,text 1个epoch,这三部分数据是放到一起训练,还是先训练sql,然后text2code、最后text,每次在一个数据上训练完,选个最好的模型使用下一个数据继续训练;
谢谢

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions