Add LowVRAM option parameter (#642)

mudler · web-flow · commit 2f5feb48418b · 2023-06-20T20:33:47.000+02:00
diff --git a/api/config.go b/api/config.go
@@ -35,6 +35,7 @@ type Config struct {
 	NGPULayers     int               `yaml:"gpu_layers"`
 	MMap           bool              `yaml:"mmap"`
 	MMlock         bool              `yaml:"mmlock"`
+	LowVRAM        bool              `yaml:"low_vram"`
 
 	TensorSplit           string `yaml:"tensor_split"`
 	MainGPU               string `yaml:"main_gpu"`
diff --git a/api/prediction.go b/api/prediction.go
@@ -48,6 +48,10 @@ func defaultLLamaOpts(c Config) []llama.ModelOption {
 		llamaOpts = append(llamaOpts, llama.SetNBatch(512))
 	}
 
+	if c.LowVRAM {
+		llamaOpts = append(llamaOpts, llama.EnabelLowVRAM)
+	}
+
 	return llamaOpts
 }
 

Original file line number	Diff line number	Diff line change
`@@ -48,6 +48,10 @@ func defaultLLamaOpts(c Config) []llama.ModelOption {`
`48`	`48`	`llamaOpts = append(llamaOpts, llama.SetNBatch(512))`
`49`	`49`	`}`
`50`	`50`
	`51`	`+ if c.LowVRAM {`
	`52`	`+ llamaOpts = append(llamaOpts, llama.EnabelLowVRAM)`
	`53`	`+ }`
	`54`	`+`
`51`	`55`	`return llamaOpts`
`52`	`56`	`}`
`53`	`57`