Roadmap¶

This document outlines the planned features and improvements for OptiPFair.

Mid-term Goals (0-6 months)¶

Version 0.1.3 (Released)¶

Bias Visualization: Implemented tools for visualizing bias in transformer models ✓
Mean activation differences across layers
Heatmap visualizations for detailed pattern analysis
PCA analysis for dimensional reduction
Quantitative bias metrics

Version 0.1.4 (Released)¶

Depth pruning (Remove entire layer blocks) implementation.

Version 0.2.0 (Released - October 2025) ✅¶

Data-Driven Width Pruning: Hybrid importance calculation using activation statistics
CFSP Integration: Implementation based on research paper methodology
Extended API: Optional dataloader parameter for calibration
Comprehensive Documentation: Full guides and examples for data-driven pruning

Version 0.3.0¶

Attention Mechanism Pruning: Implement pruning techniques for attention layers
Comprehensive Benchmarks: Add integration with common LLM benchmarks
NO GLU Models: Implement pruning techniques for older models (no GLU)
Improved Documentation: Add more examples and tutorials

Long-term Goals (6+ months)¶

Version 0.4.0¶

Configuration Presets: Provide optimized pruning configurations for different model families
Visualization Tools: Add tools for visualizing neuron importance and pruning impact

Version 0.5.0¶

Fairness prunning: consider bias in pruning.

Version 1.0.0¶

Distributed Pruning: Support for pruning very large models across multiple GPUs
Dynamic Pruning: Techniques for runtime pruning based on inference context
Knowledge Distillation: Integration with knowledge distillation techniques
Non-transformer Models: Extend support to other model architectures
Automated Pruning: Implement algorithms to automatically determine optimal pruning parameters
Iterative Pruning: Support for gradual pruning over multiple iterations
Fine-tuning Integration: Direct integration with fine-tuning workflows

Community Suggestions¶

We welcome community input on our roadmap! If you have suggestions for features or improvements, please submit them as issues on our GitHub repository with the label "enhancement".