Docker Image ―
OpenAI API-Compatible Pre-loaded LLM Server

Docker images are based on Nvidia CUDA images. LLMs are pre-loaded and served via vLLM.

Environment Variables

TENSOR_PARALLEL_SIZE: Number of GPUs to use. Default: 1.

Port

The OpenAI API is exposed on port 8000.

Tags & Deployment Links

Note

The VRAM column is the minimum required amount of VRAM used by the model on a single GPU.

Tag	Model	RunPod	Vast.ai	VRAM
`ivangabriele/llm:lmsys__vicuna-13b-v1.5-16k`				26GB
`ivangabriele/llm:open-orca__llongorca-13b-16k`				26GB

Roadmap

Add more popular models.
Start the server in background to allow for SSH access.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
.github		.github
model		model
.commitlintrc		.commitlintrc
.editorconfig		.editorconfig
.env.sample		.env.sample
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
LICENSE.md		LICENSE.md
Makefile		Makefile
README.hub.md		README.hub.md
README.md		README.md
SECURITY.md		SECURITY.md
build.sh		build.sh
docker-compose.yml		docker-compose.yml
entrypoint.sh		entrypoint.sh
load.py		load.py
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
test.py		test.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Docker Image ―
OpenAI API-Compatible Pre-loaded LLM Server

Environment Variables

Port

Tags & Deployment Links

Roadmap

About

Uh oh!

Uh oh!

Languages

License

ivangabriele/docker-llm

Folders and files

Latest commit

History

Repository files navigation

Docker Image ―OpenAI API-Compatible Pre-loaded LLM Server

Environment Variables

Port

Tags & Deployment Links

Roadmap

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Uh oh!

Languages

Docker Image ―
OpenAI API-Compatible Pre-loaded LLM Server