Dongwon Jo's picture

3 10

Dongwon Jo

dongwonjo

·

AI & ML interests

Efficient AI, Model Compression, Quantization, Pruning, Generative Model, Large Language Model, Diffusion

Recent Activity

upvoted a paper 3 days ago

Squeezing Large-Scale Diffusion Models for Mobile

upvoted a paper 3 days ago

SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

upvoted a paper 3 days ago

LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning

View all activity

Organizations

Papers 6

arxiv:2602.03216

arxiv:2508.09001

arxiv:2505.13866

arxiv:2502.01068

models 5

dongwonjo/Llama-1-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024

dongwonjo/Llama-1-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024 • 1

dongwonjo/Llama-2-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024

dongwonjo/Llama-1-30B-BinaryMoS-E4

33B • Updated Sep 9, 2024

dongwonjo/Llama-2-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024

datasets 0

None public yet

dongwonjo (Dongwon Jo)

Dongwon Jo's picture

3 10

Dongwon Jo

dongwonjo

·

AI & ML interests

Efficient AI, Model Compression, Quantization, Pruning, Generative Model, Large Language Model, Diffusion

Recent Activity

upvoted a paper 3 days ago

Squeezing Large-Scale Diffusion Models for Mobile

upvoted a paper 3 days ago

SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

upvoted a paper 3 days ago

LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning

View all activity

Organizations

Papers 6

arxiv:2602.03216

arxiv:2508.09001

arxiv:2505.13866

arxiv:2502.01068

models 5

dongwonjo/Llama-1-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024

dongwonjo/Llama-1-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024 • 1

dongwonjo/Llama-2-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024

dongwonjo/Llama-1-30B-BinaryMoS-E4

33B • Updated Sep 9, 2024

dongwonjo/Llama-2-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024

datasets 0

None public yet