Feat/fp16 embeddings #69

mikepapadim · 2025-11-17T09:49:42Z

No description provided.

… and kernels. - Adapt tensors, task graphs, and layer planners to support `HalfFloatArray`. - Replace FP32 arrays with FP16-compatible implementations in key inference states (`wrapX`). - Add new FP16-specific kernels for data transfer and activation computations. - Optimize Q8_0 quantized operations with FP16 tensor support for improved efficiency. - Update `State` classes and TornadoVM integrations to utilize FP16 data structures for key activation paths.

…maintainability by adding step-by-step comments and simplifying scaled output computation.

…n and remove obsolete hacky methods. - Replace `loadTornadoTensorAsFP32` with `loadTornadoTensor` for cleaner tensor loading. - Add logging for tensor loading details in `loadTornadoTensor`. - Remove `copyHack` method and associated comments from compute kernels and logits layer. - Update `wrapX` state in inference to utilize `asHalfFloatArray` for FP16 support. - Cleanup redundant initialization and tasks in FP16 logits layer.

mikepapadim added 3 commits November 16, 2025 12:38

Refactor reductionOneBlock2WithLogits for improved readability and …

23fedde

…maintainability by adding step-by-step comments and simplifying scaled output computation.

mikepapadim requested review from mairooni and orionpapadakis November 17, 2025 13:03

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Feat/fp16 embeddings #69

Feat/fp16 embeddings #69

Uh oh!

mikepapadim commented Nov 17, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Feat/fp16 embeddings #69

Are you sure you want to change the base?

Feat/fp16 embeddings #69

Uh oh!

Conversation

mikepapadim commented Nov 17, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants