Learning API Preview VM Plan

Goal

Run per-PR Learning API preview environments on one provisioned VM, with clean integration into existing core-api preview environments.

Host learning-api preview stacks (api + worker + redis) per PR.
Expose each PR stack behind Cloudflare (Tunnel + DNS).
Wire each PR stack URL into matching core-api preview (LEARNING_API_BASE_URL).
Create/update on PR open/sync, destroy on PR close.

Parser service is disabled for default preview stacks.
No GPU requirement in default previews.
Supabase preview branch lifecycle remains managed by Supabase GitHub integration.

Current defaults in repo are heavy for previews:

API Dockerfile uses gunicorn -w 8 (apps/learning-api/api/Dockerfile).
Worker Dockerfile uses Celery --concurrency=16 (apps/learning-api/workers/learning_agents/Dockerfile).

Preview-safe per-PR budget (after tuning):

Single-VM sizing recommendations:

Planning formulas:

Recommended starting point:

Per-PR URL pattern:

Core API integration:

Set LEARNING_API_BASE_URL in that PR’s core-api preview secrets to the URL above.

Resolve PR number + branch slug.
Render stack env file (.env.pr-<n>) with:
- base secrets from Infisical /learning-api/ in staging
- Supabase preview URL/service role key overrides
- API key aligned with core-api preview (LEARNING_API_KEY)
- internal wiring overrides:
  - API_URL=http://api:8000
  - REDIS_URL=redis://redis:6379/0
  - CELERY_BROKER_URL=redis://redis:6379/0
  - CELERY_RESULT_BACKEND=redis://redis:6379/0
Start stack with compose project namespace:
- docker compose -p pr-<n> up -d
Traefik auto-discovers the stack route from Docker labels:
- Host(<preview-host>) && PathPrefix(/pr-<n>)
Update core-api preview secrets:
- LEARNING_API_BASE_URL=https://<preview-base-host>/pr-<n>
Comment preview URL on PR.

Pull latest images / build if needed.
Recreate only that PR namespace:
- docker compose -p pr-<n> up -d --force-recreate
Keep same URL and route.
Refresh core-api preview secret only if URL changes (normally no change).

Stop and remove PR namespace:
- docker compose -p pr-<n> down -v --remove-orphans
Route automatically disappears when container is removed.
Remove any local env/artifact files for that PR.
Keep nightly janitor job to clean orphaned stacks/routes.

Default preview:

Optional parser preview:

Add VM bootstrap scripts (Docker, compose plugin, cloudflared, systemd units).
Add GitHub Actions jobs:
- deploy-learning-api-preview on opened/reopened/synchronize
- cleanup-learning-api-preview on closed
Add URL wiring step into existing core-api preview job.
Add nightly cleanup workflow for stale PR stacks.
Add basic observability:
- health check endpoint polling
- stack count + resource usage report in workflow summary.