PlatformNetwork · echobt · Feb 18, 2026 · Feb 18, 2026 · Feb 18, 2026 · Feb 18, 2026
diff --git a/bins/validator-node/src/main.rs b/bins/validator-node/src/main.rs
@@ -376,6 +376,7 @@ async fn main() -> Result<()> {
         enable_fuel: args.wasm_enable_fuel,
         fuel_limit: args.wasm_fuel_limit,
         storage_host_config: wasm_runtime_interface::StorageHostConfig::default(),
+        storage_backend: std::sync::Arc::new(wasm_runtime_interface::InMemoryStorageBackend::new()),
     }) {
         Ok(executor) => {
             info!(

diff --git a/bins/validator-node/src/wasm_executor.rs b/bins/validator-node/src/wasm_executor.rs
@@ -8,23 +8,30 @@ use std::time::Instant;
 use tracing::{debug, info};
 use wasm_runtime_interface::{
     ConsensusPolicy, ExecPolicy, InMemoryStorageBackend, InstanceConfig, NetworkHostFunctions,
-    NetworkPolicy, NoopStorageBackend, RuntimeConfig, SandboxHostFunctions, SandboxPolicy,
-    StorageHostConfig, StorageHostState, TerminalPolicy, TimePolicy, WasmModule, WasmRuntime,
-    WasmRuntimeError,
+    NetworkPolicy, RuntimeConfig, SandboxHostFunctions, SandboxPolicy, StorageBackend,
+    StorageHostConfig, TerminalPolicy, TimePolicy, WasmModule, WasmRuntime, WasmRuntimeError,
 };
 
 #[derive(Clone, Debug, Serialize, Deserialize)]
 pub struct EvaluationInput {
     pub agent_data: Vec<u8>,
     pub challenge_id: String,
     pub params: Vec<u8>,
+    #[serde(default)]
+    pub task_definition: Option<Vec<u8>>,
+    #[serde(default)]
+    pub environment_config: Option<Vec<u8>>,
 }
 
 #[derive(Clone, Debug, Serialize, Deserialize)]
 pub struct EvaluationOutput {
     pub score: i64,
     pub valid: bool,
     pub message: String,
+    #[serde(default)]
+    pub metrics: Option<Vec<u8>>,
+    #[serde(default)]
+    pub details: Option<Vec<u8>>,
 }
 
 impl EvaluationOutput {
@@ -34,6 +41,8 @@ impl EvaluationOutput {
             score,
             valid: true,
             message: String::from(message),
+            metrics: None,
+            details: None,
         }
     }
 
@@ -43,6 +52,8 @@ impl EvaluationOutput {
             score: 0,
             valid: false,
             message: String::from(message),
+            metrics: None,
+            details: None,
         }
     }
 }
@@ -53,6 +64,7 @@ pub struct WasmExecutorConfig {
     pub enable_fuel: bool,
     pub fuel_limit: Option<u64>,
     pub storage_host_config: StorageHostConfig,
+    pub storage_backend: Arc<dyn StorageBackend>,
 }
 
 impl Default for WasmExecutorConfig {
@@ -63,6 +75,7 @@ impl Default for WasmExecutorConfig {
             enable_fuel: false,
             fuel_limit: None,
             storage_host_config: StorageHostConfig::default(),
+            storage_backend: Arc::new(InMemoryStorageBackend::new()),
         }
     }
 }
@@ -143,6 +156,8 @@ impl WasmChallengeExecutor {
             agent_data: agent_data.to_vec(),
             challenge_id: challenge_id.to_string(),
             params: params.to_vec(),
+            task_definition: None,
+            environment_config: None,
         };
 
         let serialized =
@@ -162,6 +177,15 @@ impl WasmChallengeExecutor {
             validator_id: "validator".to_string(),
             restart_id: String::new(),
             config_version: 0,
+            storage_host_config: StorageHostConfig {
+                allow_direct_writes: true,
+                require_consensus: false,
+                ..self.config.storage_host_config.clone()
+            },
+            storage_backend: Arc::clone(&self.config.storage_backend),
+            fixed_timestamp_ms: None,
+            consensus_policy: ConsensusPolicy::default(),
+            terminal_policy: TerminalPolicy::default(),
             ..Default::default()
         };
 
@@ -170,12 +194,6 @@ impl WasmChallengeExecutor {
             .instantiate(&module, instance_config, Some(network_host_fns))
             .map_err(|e| anyhow::anyhow!("WASM instantiation failed: {}", e))?;
 
-        let _storage_state = StorageHostState::new(
-            challenge_id.to_string(),
-            self.config.storage_host_config.clone(),
-            Arc::new(NoopStorageBackend),
-        );
-
         let initial_fuel = instance.fuel_remaining();
 
         let ptr = self.allocate_input(&mut instance, &serialized)?;
@@ -261,6 +279,8 @@ impl WasmChallengeExecutor {
             agent_data: agent_data.to_vec(),
             challenge_id: challenge_id.to_string(),
             params: params.to_vec(),
+            task_definition: None,
+            environment_config: None,
         };
 
         let serialized =
@@ -280,6 +300,15 @@ impl WasmChallengeExecutor {
             validator_id: "validator".to_string(),
             restart_id: String::new(),
             config_version: 0,
+            storage_host_config: StorageHostConfig {
+                allow_direct_writes: true,
+                require_consensus: false,
+                ..self.config.storage_host_config.clone()
+            },
+            storage_backend: Arc::clone(&self.config.storage_backend),
+            fixed_timestamp_ms: None,
+            consensus_policy: ConsensusPolicy::default(),
+            terminal_policy: TerminalPolicy::default(),
             ..Default::default()
         };
 
@@ -288,12 +317,6 @@ impl WasmChallengeExecutor {
             .instantiate(&module, instance_config, Some(network_host_fns))
             .map_err(|e| anyhow::anyhow!("WASM instantiation failed: {}", e))?;
 
-        let _storage_state = StorageHostState::new(
-            challenge_id.to_string(),
-            self.config.storage_host_config.clone(),
-            Arc::new(NoopStorageBackend),
-        );
-
         let initial_fuel = instance.fuel_remaining();
 
         let ptr = self.allocate_input(&mut instance, &serialized)?;
@@ -396,6 +419,7 @@ impl WasmChallengeExecutor {
             fixed_timestamp_ms: None,
             consensus_policy: ConsensusPolicy::default(),
             terminal_policy: TerminalPolicy::default(),
+            ..Default::default()
         };
 
         let mut instance = self
@@ -405,21 +429,17 @@ impl WasmChallengeExecutor {
 
         let initial_fuel = instance.fuel_remaining();
 
-        let result_ptr = instance
-            .call_return_i32("get_tasks")
+        let result = instance
+            .call_return_i64("get_tasks")
             .map_err(|e| anyhow::anyhow!("WASM get_tasks call failed: {}", e))?;
 
-        let result_data = if result_ptr > 0 {
-            let len = instance
-                .call_return_i32("get_tasks_result_len")
-                .unwrap_or(0);
-            if len > 0 {
-                instance
-                    .read_memory(result_ptr as usize, len as usize)
-                    .unwrap_or_default()
-            } else {
-                Vec::new()
-            }
+        let out_len = (result >> 32) as i32;
+        let out_ptr = (result & 0xFFFF_FFFF) as i32;
+
+        let result_data = if out_ptr > 0 && out_len > 0 {
+            instance
+                .read_memory(out_ptr as usize, out_len as usize)
+                .unwrap_or_default()
         } else {
             Vec::new()
         };
@@ -478,6 +498,7 @@ impl WasmChallengeExecutor {
             fixed_timestamp_ms: None,
             consensus_policy: ConsensusPolicy::default(),
             terminal_policy: TerminalPolicy::default(),
+            ..Default::default()
         };
 
         let mut instance = self

diff --git a/crates/challenge-sdk-wasm/Cargo.toml b/crates/challenge-sdk-wasm/Cargo.toml
@@ -14,3 +14,4 @@ bincode = { version = "1.3", default-features = false }
 [features]
 default = []
 large-arena = []  # 4 MiB arena instead of the default 1 MiB
+huge-arena = []  # 16 MiB arena for complex challenges with large payloads
diff --git a/crates/challenge-sdk-wasm/src/alloc_impl.rs b/crates/challenge-sdk-wasm/src/alloc_impl.rs
@@ -1,9 +1,12 @@
 use core::cell::UnsafeCell;
 
-#[cfg(feature = "large-arena")]
+#[cfg(feature = "huge-arena")]
+const ARENA_SIZE: usize = 16 * 1024 * 1024;
+
+#[cfg(all(feature = "large-arena", not(feature = "huge-arena")))]
 const ARENA_SIZE: usize = 4 * 1024 * 1024;
 
-#[cfg(not(feature = "large-arena"))]
+#[cfg(not(any(feature = "large-arena", feature = "huge-arena")))]
 const ARENA_SIZE: usize = 1024 * 1024;
 
 struct BumpAllocator {

diff --git a/crates/challenge-sdk-wasm/src/lib.rs b/crates/challenge-sdk-wasm/src/lib.rs
@@ -12,6 +12,7 @@ pub use types::{
     score_f64_scaled, SandboxExecRequest, SandboxExecResponse, TaskDefinition, TaskResult,
     TermEvaluationParams,
 };
+pub use types::{ContainerRunRequest, ContainerRunResponse};
 pub use types::{EvaluationInput, EvaluationOutput};
 
 pub trait Challenge {

diff --git a/crates/challenge-sdk-wasm/src/types.rs b/crates/challenge-sdk-wasm/src/types.rs
@@ -128,3 +128,24 @@ pub struct TermEvaluationParams {
     pub timeout_ms: u64,
     pub environment_config: Option<Vec<u8>>,
 }
+
+#[derive(Clone, Debug, Serialize, Deserialize)]
+pub struct ContainerRunRequest {
+    pub image: String,
+    pub command: Vec<String>,
+    pub env_vars: Vec<(String, String)>,
+    pub working_dir: Option<String>,
+    pub stdin: Option<Vec<u8>>,
+    pub memory_limit_mb: Option<u64>,
+    pub cpu_limit: Option<u32>,
+    pub network_mode: Option<String>,
+    pub timeout_ms: u64,
+}
+
+#[derive(Clone, Debug, Serialize, Deserialize)]
+pub struct ContainerRunResponse {
+    pub exit_code: i32,
+    pub stdout: Vec<u8>,
+    pub stderr: Vec<u8>,
+    pub duration_ms: u64,
+}
diff --git a/crates/wasm-runtime-interface/src/bridge.rs b/crates/wasm-runtime-interface/src/bridge.rs
@@ -95,7 +95,7 @@ pub fn output_to_response(
     execution_time_ms: i64,
 ) -> EvalResponse {
     if output.valid {
-        let score = output.score as f64 / 100.0;
+        let score = output.score as f64 / 10_000.0;
         let results = serde_json::json!({ "message": output.message });
         EvalResponse::success(request_id, score, results).with_time(execution_time_ms)
     } else {
@@ -185,7 +185,7 @@ mod tests {
 
     #[test]
     fn test_output_to_response_success() {
-        let output = EvaluationOutput::success(100, "perfect");
+        let output = EvaluationOutput::success(10000, "perfect");
         let resp = output_to_response(&output, "req-1", 42);
         assert!(resp.success);
         assert_eq!(resp.request_id, "req-1");