LLaDA-8B-Instruct evaluation using Opencompass #111

xushaoxuan123 · 2025-09-23T08:14:43Z

Add LLaDA-Instruct Evaluation Toolkit

Added evaluation toolkit for LLaDA-Instruct and LLaMA-Instruct models based on OpenCompass.

bash eval_llada_instruct.sh
bash eval_llama_instruct.sh

xushaoxuan123 added 4 commits September 23, 2025 14:30

use opencompass to eval llada-8B-instruct

7c5a592

fix the reference

3d8c9f4

using bsz=1

efe3080

modify some comments

6fcb8f4