MoE-CL

Mixture-of-Experts for Continual Learning on MTL5 benchmark.

Environment Setup

pip install -r requirements.txt

Model Preparation

Download the Llama-2-7b-hf model into the ../model/Llama-2-7b-hf/ directory.

Training

Run the full continual learning training (including random initialization baseline + continual learning sequence DBPedia → Amazon → Yahoo → AGNews):

bash scripts/mtl5/run_moe-cl.sh

Evaluation Metrics

After training, calculate the continual learning metrics (ACC, BWT, FWT):

# Calculate metrics for order1
python calculate_bwt_fwt.py \
    --log_file results/moe-cl/mtl5/order1/log.txt \
    --order order1

# With random initialization baseline for FWT calculation
python calculate_bwt_fwt.py \
    --log_file results/moe-cl/mtl5/order1/log.txt \
    --order order1 \
    --random_init_log results/moe-cl/mtl5/rand_init/log.txt

Metrics Explanation

Metric	Description
ACC	Average accuracy across all tasks after learning the final task
BWT	Backward Transfer — measures forgetting (negative = forgetting occurred)
FWT	Forward Transfer — measures knowledge transfer to new tasks (positive = helpful)

Available Task Orders

order1: DBPedia → Amazon → Yahoo → AGNews
order2: DBPedia → Amazon → AGNews → Yahoo
order3: Yahoo → Amazon → AGNews → DBPedia

Output

Training results and model checkpoints: results/ directory
Training logs: logs/ directory

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
configs/mtl5		configs/mtl5
mlora		mlora
scripts/mtl5		scripts/mtl5
README.md		README.md
cal_skipping.py		cal_skipping.py
calculate_accuracy_and_recall.py		calculate_accuracy_and_recall.py
calculate_bwt_fwt.py		calculate_bwt_fwt.py
generate.py		generate.py
mlora.py		mlora.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MoE-CL

Environment Setup

Model Preparation

Training

Evaluation Metrics

Metrics Explanation

Available Task Orders

Output

About

Uh oh!

Releases

Packages

Languages

BAI-LAB/MoE-CL

Folders and files

Latest commit

History

Repository files navigation

MoE-CL

Environment Setup

Model Preparation

Training

Evaluation Metrics

Metrics Explanation

Available Task Orders

Output

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages