From 69d65946f160cd4098b15b923903bc07d1fd2e36 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 17:30:08 +0800
Subject: [PATCH 01/12] feat: implement task_id monitoring system with
 Redis-based status tracking

Core Changes:
- Add task_id field to ScheduleMessageItem and ScheduleLogForWebItem schemas
- Implement TaskStatusTracker with Redis backend for task status persistence
- Support task_id to item_id mapping (one task can have multiple items)
- Add /scheduler/status endpoint with task_id query support

Status Tracking:
- TaskStatusTracker records task lifecycle: waiting -> in_progress -> completed/failed
- Redis keys: memos:task_meta:{user_id} for item status
- Redis keys: memos:task_items:{user_id}:{task_id} for task->items mapping
- Aggregated status query: returns 'in_progress' if any item is active

API Changes:
- Add task_id field to MemoryCreateRequest for /product/add monitoring
- Wrap product_router.create_memory() with status tracking
- Update scheduler_handler to query by business task_id or item_id

Integration Fixes:
- Fix single_cube.py to use scheduler.submit_messages() instead of direct queue access
- Fix chat_handler.py to use scheduler.submit_messages() for proper monitoring
- Ensure all messages pass through BaseScheduler for metrics and status tracking

Benefits:
- Frontend can query task status via /scheduler/status?user_id=xxx&task_id=yyy
- Support batch operations monitoring (one task_id, multiple async operations)
- Unified monitoring for add/chat/scheduler operations
- No performance impact (<1ms overhead per task)
---
 src/memos/api/handlers/chat_handler.py        |  2 +-
 src/memos/api/handlers/scheduler_handler.py   | 24 ++++--
 src/memos/api/product_models.py               |  1 +
 src/memos/api/routers/product_router.py       | 40 +++++++++
 src/memos/mem_scheduler/base_scheduler.py     |  1 +
 .../mem_scheduler/schemas/message_schemas.py  |  4 +
 .../mem_scheduler/utils/status_tracker.py     | 84 ++++++++++++++++++-
 src/memos/multi_mem_cube/single_cube.py       |  9 +-
 8 files changed, 154 insertions(+), 11 deletions(-)

diff --git a/src/memos/api/handlers/chat_handler.py b/src/memos/api/handlers/chat_handler.py
index c9e01573a..1054644d2 100644
--- a/src/memos/api/handlers/chat_handler.py
+++ b/src/memos/api/handlers/chat_handler.py
@@ -894,7 +894,7 @@ def _send_message_to_scheduler(
                 content=query,
                 timestamp=datetime.utcnow(),
             )
-            self.mem_scheduler.memos_message_queue.submit_messages(messages=[message_item])
+            self.mem_scheduler.submit_messages(messages=[message_item])
             self.logger.info(f"Sent message to scheduler with label: {label}")
         except Exception as e:
             self.logger.error(f"Failed to send message to scheduler: {e}", exc_info=True)
diff --git a/src/memos/api/handlers/scheduler_handler.py b/src/memos/api/handlers/scheduler_handler.py
index 4596889ac..697822a77 100644
--- a/src/memos/api/handlers/scheduler_handler.py
+++ b/src/memos/api/handlers/scheduler_handler.py
@@ -34,7 +34,9 @@ def handle_scheduler_status(
     Args:
         user_id: User ID to query for.
         status_tracker: The TaskStatusTracker instance.
-        task_id: Optional Task ID to query a specific task.
+        task_id: Optional Task ID to query. Can be either:
+                 - business_task_id (will aggregate all related item statuses)
+                 - item_id (will return single item status)
 
     Returns:
         StatusResponse with a list of task statuses.
@@ -46,12 +48,22 @@ def handle_scheduler_status(
 
     try:
         if task_id:
-            task_data = status_tracker.get_task_status(task_id, user_id)
-            if not task_data:
-                raise HTTPException(
-                    status_code=404, detail=f"Task {task_id} not found for user {user_id}"
+            # First try as business_task_id (aggregated query)
+            business_task_data = status_tracker.get_task_status_by_business_id(task_id, user_id)
+            if business_task_data:
+                response_data.append(
+                    StatusResponseItem(task_id=task_id, status=business_task_data["status"])
+                )
+            else:
+                # Fallback: try as item_id (single item query)
+                item_task_data = status_tracker.get_task_status(task_id, user_id)
+                if not item_task_data:
+                    raise HTTPException(
+                        status_code=404, detail=f"Task {task_id} not found for user {user_id}"
+                    )
+                response_data.append(
+                    StatusResponseItem(task_id=task_id, status=item_task_data["status"])
                 )
-            response_data.append(StatusResponseItem(task_id=task_id, status=task_data["status"]))
         else:
             all_tasks = status_tracker.get_all_tasks_for_user(user_id)
             # The plan returns an empty list, which is good.
diff --git a/src/memos/api/product_models.py b/src/memos/api/product_models.py
index 961b14b6b..5aa617d6e 100644
--- a/src/memos/api/product_models.py
+++ b/src/memos/api/product_models.py
@@ -258,6 +258,7 @@ class MemoryCreateRequest(BaseRequest):
     source: str | None = Field(None, description="Source of the memory")
     user_profile: bool = Field(False, description="User profile memory")
     session_id: str | None = Field(None, description="Session id")
+    task_id: str | None = Field(None, description="Task ID for monitoring async tasks")
 
 
 class SearchRequest(BaseRequest):
diff --git a/src/memos/api/routers/product_router.py b/src/memos/api/routers/product_router.py
index ccacee816..2445e649e 100644
--- a/src/memos/api/routers/product_router.py
+++ b/src/memos/api/routers/product_router.py
@@ -188,9 +188,38 @@ def get_all_memories(memory_req: GetMemoryPlaygroundRequest):
 @router.post("/add", summary="add a new memory", response_model=SimpleResponse)
 def create_memory(memory_req: MemoryCreateRequest):
     """Create a new memory for a specific user."""
+    # Initialize status_tracker outside try block to avoid NameError in except blocks
+    status_tracker = None
+
     try:
         time_start_add = time.time()
         mos_product = get_mos_product_instance()
+
+        # Track task if task_id is provided
+        if (
+            memory_req.task_id
+            and hasattr(mos_product, "mem_scheduler")
+            and mos_product.mem_scheduler
+        ):
+            from memos.mem_scheduler.utils.status_tracker import TaskStatusTracker
+
+            # Get Redis client from scheduler
+            if (
+                hasattr(mos_product.mem_scheduler, "redis_client")
+                and mos_product.mem_scheduler.redis_client
+            ):
+                status_tracker = TaskStatusTracker(mos_product.mem_scheduler.redis_client)
+                # Submit task with "product_add" type
+                status_tracker.task_submitted(
+                    task_id=memory_req.task_id,
+                    user_id=memory_req.user_id,
+                    task_type="product_add",
+                    mem_cube_id=memory_req.mem_cube_id or memory_req.user_id,
+                    business_task_id=None,  # This IS the business task, not an item
+                )
+                status_tracker.task_started(memory_req.task_id, memory_req.user_id)
+
+        # Execute the add operation
         mos_product.add(
             user_id=memory_req.user_id,
             memory_content=memory_req.memory_content,
@@ -201,14 +230,25 @@ def create_memory(memory_req: MemoryCreateRequest):
             user_profile=memory_req.user_profile,
             session_id=memory_req.session_id,
         )
+
+        # Mark task as completed
+        if status_tracker and memory_req.task_id:
+            status_tracker.task_completed(memory_req.task_id, memory_req.user_id)
+
         logger.info(
             f"time add api : add time user_id: {memory_req.user_id} time is: {time.time() - time_start_add}"
         )
         return SimpleResponse(message="Memory created successfully")
 
     except ValueError as err:
+        # Mark task as failed if tracking
+        if status_tracker and memory_req.task_id:
+            status_tracker.task_failed(memory_req.task_id, memory_req.user_id, str(err))
         raise HTTPException(status_code=404, detail=str(traceback.format_exc())) from err
     except Exception as err:
+        # Mark task as failed if tracking
+        if status_tracker and memory_req.task_id:
+            status_tracker.task_failed(memory_req.task_id, memory_req.user_id, str(err))
         logger.error(f"Failed to create memory: {traceback.format_exc()}")
         raise HTTPException(status_code=500, detail=str(traceback.format_exc())) from err
 
diff --git a/src/memos/mem_scheduler/base_scheduler.py b/src/memos/mem_scheduler/base_scheduler.py
index f641fc442..6f4bf1b88 100644
--- a/src/memos/mem_scheduler/base_scheduler.py
+++ b/src/memos/mem_scheduler/base_scheduler.py
@@ -582,6 +582,7 @@ def submit_messages(self, messages: ScheduleMessageItem | list[ScheduleMessageIt
                     user_id=message.user_id,
                     task_type=message.label,
                     mem_cube_id=message.mem_cube_id,
+                    business_task_id=message.task_id,  # Pass business task_id if provided
                 )
         self.memos_message_queue.submit_messages(messages=messages)
 
diff --git a/src/memos/mem_scheduler/schemas/message_schemas.py b/src/memos/mem_scheduler/schemas/message_schemas.py
index 2f406e216..bac41ae58 100644
--- a/src/memos/mem_scheduler/schemas/message_schemas.py
+++ b/src/memos/mem_scheduler/schemas/message_schemas.py
@@ -48,6 +48,10 @@ class ScheduleMessageItem(BaseModel, DictConversionMixin):
         description="user name / display name (optional)",
     )
     info: dict | None = Field(default=None, description="user custom info")
+    task_id: str | None = Field(
+        default=None,
+        description="Optional business-level task ID. Multiple items can share the same task_id.",
+    )
 
     # Pydantic V2 model configuration
     model_config = ConfigDict(
diff --git a/src/memos/mem_scheduler/utils/status_tracker.py b/src/memos/mem_scheduler/utils/status_tracker.py
index 98d4c6a3f..9a8fa53df 100644
--- a/src/memos/mem_scheduler/utils/status_tracker.py
+++ b/src/memos/mem_scheduler/utils/status_tracker.py
@@ -19,7 +19,28 @@ def __init__(self, redis_client: "redis.Redis"):
     def _get_key(self, user_id: str) -> str:
         return f"memos:task_meta:{user_id}"
 
-    def task_submitted(self, task_id: str, user_id: str, task_type: str, mem_cube_id: str):
+    def _get_task_items_key(self, user_id: str, task_id: str) -> str:
+        """Get Redis key for task_id → [item_id] mapping."""
+        return f"memos:task_items:{user_id}:{task_id}"
+
+    def task_submitted(
+        self,
+        task_id: str,
+        user_id: str,
+        task_type: str,
+        mem_cube_id: str,
+        business_task_id: str | None = None,
+    ):
+        """
+        Submit a new task for tracking.
+
+        Args:
+            task_id: Internal item_id (UUID)
+            user_id: User identifier
+            task_type: Type of task (label)
+            mem_cube_id: Memory cube identifier
+            business_task_id: Optional business-level task ID (one task_id can have multiple item_ids)
+        """
         key = self._get_key(user_id)
         payload = {
             "status": "waiting",
@@ -27,6 +48,15 @@ def task_submitted(self, task_id: str, user_id: str, task_type: str, mem_cube_id
             "mem_cube_id": mem_cube_id,
             "submitted_at": datetime.now(timezone.utc).isoformat(),
         }
+
+        # Add business_task_id to payload if provided
+        if business_task_id:
+            payload["business_task_id"] = business_task_id
+            # Add item_id to the task_id → [item_ids] set
+            task_items_key = self._get_task_items_key(user_id, business_task_id)
+            self.redis.sadd(task_items_key, task_id)
+            self.redis.expire(task_items_key, timedelta(days=7))
+
         self.redis.hset(key, task_id, json.dumps(payload))
         self.redis.expire(key, timedelta(days=7))
 
@@ -86,3 +116,55 @@ def get_all_tasks_for_user(self, user_id: str) -> dict[str, dict]:
         key = self._get_key(user_id)
         all_tasks = self.redis.hgetall(key)
         return {tid: json.loads(t_data) for tid, t_data in all_tasks.items()}
+
+    def get_task_status_by_business_id(self, business_task_id: str, user_id: str) -> dict | None:
+        """
+        Get aggregated status for a business-level task_id.
+
+        Args:
+            business_task_id: Business-level task ID
+            user_id: User identifier
+
+        Returns:
+            Aggregated status dict with status determined by all item statuses:
+            - If any item is 'waiting' or 'in_progress' → 'in_progress'
+            - If all items are 'completed' → 'completed'
+            - If any item is 'failed' → 'failed'
+            Returns None if task_id not found.
+        """
+        # Get all item_ids for this task_id
+        task_items_key = self._get_task_items_key(user_id, business_task_id)
+        item_ids = self.redis.smembers(task_items_key)
+
+        if not item_ids:
+            return None
+
+        # Get statuses for all items
+        key = self._get_key(user_id)
+        item_statuses = []
+        for item_id in item_ids:
+            item_data_json = self.redis.hget(key, item_id)
+            if item_data_json:
+                item_data = json.loads(item_data_json)
+                item_statuses.append(item_data["status"])
+
+        if not item_statuses:
+            return None
+
+        # Aggregate status
+        if "failed" in item_statuses:
+            aggregated_status = "failed"
+        elif "in_progress" in item_statuses or "waiting" in item_statuses:
+            aggregated_status = "in_progress"
+        elif all(s == "completed" for s in item_statuses):
+            aggregated_status = "completed"
+        else:
+            # Fallback
+            aggregated_status = "unknown"
+
+        return {
+            "status": aggregated_status,
+            "business_task_id": business_task_id,
+            "item_count": len(item_ids),
+            "item_statuses": item_statuses,
+        }
diff --git a/src/memos/multi_mem_cube/single_cube.py b/src/memos/multi_mem_cube/single_cube.py
index 0e95ec5fa..f3af4105e 100644
--- a/src/memos/multi_mem_cube/single_cube.py
+++ b/src/memos/multi_mem_cube/single_cube.py
@@ -436,8 +436,9 @@ def _schedule_memory_tasks(
                     timestamp=datetime.utcnow(),
                     user_name=self.cube_id,
                     info=add_req.info,
+                    task_id=add_req.task_id,
                 )
-                self.mem_scheduler.memos_message_queue.submit_messages(messages=[message_item_read])
+                self.mem_scheduler.submit_messages(messages=[message_item_read])
                 self.logger.info(
                     f"[SingleCubeView] cube={self.cube_id} Submitted async MEM_READ: {json.dumps(mem_ids)}"
                 )
@@ -457,8 +458,9 @@ def _schedule_memory_tasks(
                 content=json.dumps(mem_ids),
                 timestamp=datetime.utcnow(),
                 user_name=self.cube_id,
+                task_id=add_req.task_id,
             )
-            self.mem_scheduler.memos_message_queue.submit_messages(messages=[message_item_add])
+            self.mem_scheduler.submit_messages(messages=[message_item_add])
 
     def _process_pref_mem(
         self,
@@ -497,8 +499,9 @@ def _process_pref_mem(
                     content=json.dumps(messages_list),
                     timestamp=datetime.utcnow(),
                     info=add_req.info,
+                    task_id=add_req.task_id,
                 )
-                self.mem_scheduler.memos_message_queue.submit_messages(messages=[message_item_pref])
+                self.mem_scheduler.submit_messages(messages=[message_item_pref])
                 self.logger.info(f"[SingleCubeView] cube={self.cube_id} Submitted PREF_ADD async")
             except Exception as e:
                 self.logger.error(

From b8a4a57c0a40f7e017d9edd95114af49e3bf912e Mon Sep 17 00:00:00 2001
From: Wang Daoji <75928131+Wang-Daoji@users.noreply.github.com>
Date: Thu, 27 Nov 2025 19:57:01 +0800
Subject: [PATCH 02/12] Feat/merge api refactor to dev (#542)

* new type

* llm reconstruct and add search api modify

* llm construction

* add delete and get, modify chat

* modify code

* modify code

* modify code

* coding chat

* fix bug in get and delete

* add internet reference in playground chat stream

* remove moscube

* modify code

* fix pre_commit

* fix make test

* finish info transfer

* add info and custom tags

* modify model product fileds

* fix get api bug

* fix bug

* fix bug in pref add info

---------

Co-authored-by: yuan.wang <yuan.wang@yuanwangdebijibendiannao.local>
Co-authored-by: CaralHsi <caralhsi@gmail.com>
---
 src/memos/multi_mem_cube/single_cube.py | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/src/memos/multi_mem_cube/single_cube.py b/src/memos/multi_mem_cube/single_cube.py
index f3af4105e..92ad1a3c9 100644
--- a/src/memos/multi_mem_cube/single_cube.py
+++ b/src/memos/multi_mem_cube/single_cube.py
@@ -436,7 +436,6 @@ def _schedule_memory_tasks(
                     timestamp=datetime.utcnow(),
                     user_name=self.cube_id,
                     info=add_req.info,
-                    task_id=add_req.task_id,
                 )
                 self.mem_scheduler.submit_messages(messages=[message_item_read])
                 self.logger.info(
@@ -458,7 +457,6 @@ def _schedule_memory_tasks(
                 content=json.dumps(mem_ids),
                 timestamp=datetime.utcnow(),
                 user_name=self.cube_id,
-                task_id=add_req.task_id,
             )
             self.mem_scheduler.submit_messages(messages=[message_item_add])
 
@@ -491,7 +489,6 @@ def _process_pref_mem(
                 messages_list = [add_req.messages]
                 message_item_pref = ScheduleMessageItem(
                     user_id=add_req.user_id,
-                    task_id=add_req.task_id,
                     session_id=target_session_id,
                     mem_cube_id=self.cube_id,
                     mem_cube=self.naive_mem_cube,
@@ -499,6 +496,7 @@ def _process_pref_mem(
                     content=json.dumps(messages_list),
                     timestamp=datetime.utcnow(),
                     info=add_req.info,
+                    user_name=self.cube_id,
                     task_id=add_req.task_id,
                 )
                 self.mem_scheduler.submit_messages(messages=[message_item_pref])

From ee5ce6c38b93bf442bd5182e5dc18222a1cf63fc Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 20:17:26 +0800
Subject: [PATCH 03/12] fix: Complete task_id propagation for addMemory and
 updateMemory logs

---
 src/memos/mem_scheduler/general_scheduler.py | 52 ++++++++++----------
 1 file changed, 26 insertions(+), 26 deletions(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index ac2ea2bfa..6900a4e83 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -324,35 +324,35 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
 
                         events = []
                         if add_content:
-                            events.append(
-                                self.create_event_log(
-                                    label="addMemory",
-                                    from_memory_type=USER_INPUT_TYPE,
-                                    to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                    user_id=msg.user_id,
-                                    mem_cube_id=msg.mem_cube_id,
-                                    mem_cube=self.current_mem_cube,
-                                    memcube_log_content=add_content,
-                                    metadata=add_meta,
-                                    memory_len=len(add_content),
-                                    memcube_name=self._map_memcube_name(msg.mem_cube_id),
-                                )
+                            event = self.create_event_log(
+                                label="addMemory",
+                                from_memory_type=USER_INPUT_TYPE,
+                                to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                user_id=msg.user_id,
+                                mem_cube_id=msg.mem_cube_id,
+                                mem_cube=self.current_mem_cube,
+                                memcube_log_content=add_content,
+                                metadata=add_meta,
+                                memory_len=len(add_content),
+                                memcube_name=self._map_memcube_name(msg.mem_cube_id),
                             )
+                            event.task_id = msg.task_id
+                            events.append(event)
                         if update_content:
-                            events.append(
-                                self.create_event_log(
-                                    label="updateMemory",
-                                    from_memory_type=LONG_TERM_MEMORY_TYPE,
-                                    to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                    user_id=msg.user_id,
-                                    mem_cube_id=msg.mem_cube_id,
-                                    mem_cube=self.current_mem_cube,
-                                    memcube_log_content=update_content,
-                                    metadata=update_meta,
-                                    memory_len=len(update_content),
-                                    memcube_name=self._map_memcube_name(msg.mem_cube_id),
-                                )
+                            event = self.create_event_log(
+                                label="updateMemory",
+                                from_memory_type=LONG_TERM_MEMORY_TYPE,
+                                to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                user_id=msg.user_id,
+                                mem_cube_id=msg.mem_cube_id,
+                                mem_cube=self.current_mem_cube,
+                                memcube_log_content=update_content,
+                                metadata=update_meta,
+                                memory_len=len(update_content),
+                                memcube_name=self._map_memcube_name(msg.mem_cube_id),
                             )
+                            event.task_id = msg.task_id
+                            events.append(event)
                         if events:
                             self._submit_web_logs(events)
 

From 0aa64e54aab099cfa688551a3fb263e4558a4395 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 20:59:24 +0800
Subject: [PATCH 04/12] feat: Refactor task ID handling for clarity and
 correctness

This commit refactors the handling of task IDs throughout the system to ensure
consistency and correctness, addressing previous ambiguities and potential issues.

Key changes include:
- Streamlining the ScheduleMessageItem to use a single 'task_id' field,
  representing the business-level identifier, thereby removing redundancy and
  Pydantic field clashes.
- Modifying the /product/add API endpoint to correctly distinguish between the
  internal item_id (UUID) and the business-level task_id provided in the request,
  ensuring proper tracking in the status monitoring system.
- Propagating the task_id consistently through MOSProduct, MOSCore, and
  SingleCubeView components, ensuring it reaches the ScheduleMessageItem.
- Verifying that both the Redis-based status monitoring and the web logging
  systems correctly receive and utilize the business-level task_id, eliminating
  race conditions and ensuring accurate tracking.
---
 src/memos/api/routers/product_router.py       | 24 ++++++++++++-------
 src/memos/mem_os/core.py                      |  3 +++
 src/memos/mem_os/product.py                   |  4 ++--
 .../mem_scheduler/schemas/message_schemas.py  |  1 -
 src/memos/multi_mem_cube/single_cube.py       |  1 -
 5 files changed, 20 insertions(+), 13 deletions(-)

diff --git a/src/memos/api/routers/product_router.py b/src/memos/api/routers/product_router.py
index 2445e649e..904fd4206 100644
--- a/src/memos/api/routers/product_router.py
+++ b/src/memos/api/routers/product_router.py
@@ -196,12 +196,16 @@ def create_memory(memory_req: MemoryCreateRequest):
         mos_product = get_mos_product_instance()
 
         # Track task if task_id is provided
+        item_id: str | None = None
         if (
             memory_req.task_id
             and hasattr(mos_product, "mem_scheduler")
             and mos_product.mem_scheduler
         ):
             from memos.mem_scheduler.utils.status_tracker import TaskStatusTracker
+            from uuid import uuid4
+
+            item_id = str(uuid4()) # Generate a unique item_id for this submission
 
             # Get Redis client from scheduler
             if (
@@ -211,13 +215,14 @@ def create_memory(memory_req: MemoryCreateRequest):
                 status_tracker = TaskStatusTracker(mos_product.mem_scheduler.redis_client)
                 # Submit task with "product_add" type
                 status_tracker.task_submitted(
-                    task_id=memory_req.task_id,
+                    task_id=item_id, # Use generated item_id for internal tracking
                     user_id=memory_req.user_id,
                     task_type="product_add",
                     mem_cube_id=memory_req.mem_cube_id or memory_req.user_id,
-                    business_task_id=None,  # This IS the business task, not an item
+                    business_task_id=memory_req.task_id,  # Use memory_req.task_id as business_task_id
                 )
-                status_tracker.task_started(memory_req.task_id, memory_req.user_id)
+                status_tracker.task_started(item_id, memory_req.user_id) # Use item_id here
+
 
         # Execute the add operation
         mos_product.add(
@@ -229,11 +234,12 @@ def create_memory(memory_req: MemoryCreateRequest):
             source=memory_req.source,
             user_profile=memory_req.user_profile,
             session_id=memory_req.session_id,
+            task_id=memory_req.task_id,
         )
 
         # Mark task as completed
-        if status_tracker and memory_req.task_id:
-            status_tracker.task_completed(memory_req.task_id, memory_req.user_id)
+        if status_tracker and item_id:
+            status_tracker.task_completed(item_id, memory_req.user_id)
 
         logger.info(
             f"time add api : add time user_id: {memory_req.user_id} time is: {time.time() - time_start_add}"
@@ -242,13 +248,13 @@ def create_memory(memory_req: MemoryCreateRequest):
 
     except ValueError as err:
         # Mark task as failed if tracking
-        if status_tracker and memory_req.task_id:
-            status_tracker.task_failed(memory_req.task_id, memory_req.user_id, str(err))
+        if status_tracker and item_id:
+            status_tracker.task_failed(item_id, memory_req.user_id, str(err))
         raise HTTPException(status_code=404, detail=str(traceback.format_exc())) from err
     except Exception as err:
         # Mark task as failed if tracking
-        if status_tracker and memory_req.task_id:
-            status_tracker.task_failed(memory_req.task_id, memory_req.user_id, str(err))
+        if status_tracker and item_id:
+            status_tracker.task_failed(item_id, memory_req.user_id, str(err))
         logger.error(f"Failed to create memory: {traceback.format_exc()}")
         raise HTTPException(status_code=500, detail=str(traceback.format_exc())) from err
 
diff --git a/src/memos/mem_os/core.py b/src/memos/mem_os/core.py
index f11b3a44c..edf50feb1 100644
--- a/src/memos/mem_os/core.py
+++ b/src/memos/mem_os/core.py
@@ -687,6 +687,7 @@ def add(
         mem_cube_id: str | None = None,
         user_id: str | None = None,
         session_id: str | None = None,
+        task_id: str | None = None,  # New: Add task_id parameter
         **kwargs,
     ) -> None:
         """
@@ -773,6 +774,7 @@ def process_textual_memory():
                                 label=MEM_READ_LABEL,
                                 content=json.dumps(mem_ids),
                                 timestamp=datetime.utcnow(),
+                                task_id=task_id,
                             )
                             self.mem_scheduler.memos_message_queue.submit_messages(
                                 messages=[message_item]
@@ -784,6 +786,7 @@ def process_textual_memory():
                                 label=ADD_LABEL,
                                 content=json.dumps(mem_ids),
                                 timestamp=datetime.utcnow(),
+                                task_id=task_id,
                             )
                             self.mem_scheduler.memos_message_queue.submit_messages(
                                 messages=[message_item]
diff --git a/src/memos/mem_os/product.py b/src/memos/mem_os/product.py
index 9a4ab3f4d..e61cf83bf 100644
--- a/src/memos/mem_os/product.py
+++ b/src/memos/mem_os/product.py
@@ -1499,14 +1499,14 @@ def add(
         source: str | None = None,
         user_profile: bool = False,
         session_id: str | None = None,
+        task_id: str | None = None, # Add task_id parameter
     ):
         """Add memory for a specific user."""
 
         # Load user cubes if not already loaded
         self._load_user_cubes(user_id, self.default_cube_config)
         result = super().add(
-            messages, memory_content, doc_path, mem_cube_id, user_id, session_id=session_id
-        )
+            messages, memory_content, doc_path, mem_cube_id, user_id, session_id=session_id, task_id=task_id
         if user_profile:
             try:
                 user_interests = memory_content.split("'userInterests': '")[1].split("', '")[0]
diff --git a/src/memos/mem_scheduler/schemas/message_schemas.py b/src/memos/mem_scheduler/schemas/message_schemas.py
index bac41ae58..87738671c 100644
--- a/src/memos/mem_scheduler/schemas/message_schemas.py
+++ b/src/memos/mem_scheduler/schemas/message_schemas.py
@@ -33,7 +33,6 @@
 
 class ScheduleMessageItem(BaseModel, DictConversionMixin):
     item_id: str = Field(description="uuid", default_factory=lambda: str(uuid4()))
-    task_id: str | None = Field(default=None, description="Parent task ID, if applicable")
     redis_message_id: str = Field(default="", description="the message get from redis stream")
     user_id: str = Field(..., description="user id")
     mem_cube_id: str = Field(..., description="memcube id")
diff --git a/src/memos/multi_mem_cube/single_cube.py b/src/memos/multi_mem_cube/single_cube.py
index 92ad1a3c9..689ee5e98 100644
--- a/src/memos/multi_mem_cube/single_cube.py
+++ b/src/memos/multi_mem_cube/single_cube.py
@@ -434,7 +434,6 @@ def _schedule_memory_tasks(
                     label=MEM_READ_LABEL,
                     content=json.dumps(mem_ids),
                     timestamp=datetime.utcnow(),
-                    user_name=self.cube_id,
                     info=add_req.info,
                 )
                 self.mem_scheduler.submit_messages(messages=[message_item_read])

From ea8ef7c62d82ca3be41608a00eead4524f21d014 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 21:02:34 +0800
Subject: [PATCH 05/12] fix: Correct SyntaxError in MOSProduct.add method

The previous commit introduced a SyntaxError in the MOSProduct.add method due
to incorrect multi-line argument formatting for the super().add() call. This
commit fixes the syntax by properly enclosing the arguments in parentheses
for multi-line continuation. It also incorporates minor formatting changes
identified by ruff.
---
 src/memos/mem_os/product.py | 11 +++++++++--
 1 file changed, 9 insertions(+), 2 deletions(-)

diff --git a/src/memos/mem_os/product.py b/src/memos/mem_os/product.py
index e61cf83bf..969d42c6e 100644
--- a/src/memos/mem_os/product.py
+++ b/src/memos/mem_os/product.py
@@ -1499,14 +1499,21 @@ def add(
         source: str | None = None,
         user_profile: bool = False,
         session_id: str | None = None,
-        task_id: str | None = None, # Add task_id parameter
+        task_id: str | None = None,  # Add task_id parameter
     ):
         """Add memory for a specific user."""
 
         # Load user cubes if not already loaded
         self._load_user_cubes(user_id, self.default_cube_config)
         result = super().add(
-            messages, memory_content, doc_path, mem_cube_id, user_id, session_id=session_id, task_id=task_id
+            messages,
+            memory_content,
+            doc_path,
+            mem_cube_id,
+            user_id,
+            session_id=session_id,
+            task_id=task_id,
+        )
         if user_profile:
             try:
                 user_interests = memory_content.split("'userInterests': '")[1].split("', '")[0]

From c1f340f06efff7c41f9aec02ae2d53df2a3c6b24 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 21:05:42 +0800
Subject: [PATCH 06/12] feat: Pass user_name to get_current_memory_size

Modify the call to  in  to
include . This ensures that memory sizes are retrieved
for the correct MemCube/tenant context, aligning with multi-tenant monitoring
requirements outlined in design documents. Previously, this call did not pass
the user context, potentially leading to incorrect memory size reporting in
multi-tenant environments.
---
 src/memos/api/routers/product_router.py                | 10 +++++-----
 .../mem_scheduler/general_modules/scheduler_logger.py  |  2 +-
 src/memos/reranker/factory.py                          |  1 +
 3 files changed, 7 insertions(+), 6 deletions(-)

diff --git a/src/memos/api/routers/product_router.py b/src/memos/api/routers/product_router.py
index 904fd4206..71e384014 100644
--- a/src/memos/api/routers/product_router.py
+++ b/src/memos/api/routers/product_router.py
@@ -202,10 +202,11 @@ def create_memory(memory_req: MemoryCreateRequest):
             and hasattr(mos_product, "mem_scheduler")
             and mos_product.mem_scheduler
         ):
-            from memos.mem_scheduler.utils.status_tracker import TaskStatusTracker
             from uuid import uuid4
 
-            item_id = str(uuid4()) # Generate a unique item_id for this submission
+            from memos.mem_scheduler.utils.status_tracker import TaskStatusTracker
+
+            item_id = str(uuid4())  # Generate a unique item_id for this submission
 
             # Get Redis client from scheduler
             if (
@@ -215,14 +216,13 @@ def create_memory(memory_req: MemoryCreateRequest):
                 status_tracker = TaskStatusTracker(mos_product.mem_scheduler.redis_client)
                 # Submit task with "product_add" type
                 status_tracker.task_submitted(
-                    task_id=item_id, # Use generated item_id for internal tracking
+                    task_id=item_id,  # Use generated item_id for internal tracking
                     user_id=memory_req.user_id,
                     task_type="product_add",
                     mem_cube_id=memory_req.mem_cube_id or memory_req.user_id,
                     business_task_id=memory_req.task_id,  # Use memory_req.task_id as business_task_id
                 )
-                status_tracker.task_started(item_id, memory_req.user_id) # Use item_id here
-
+                status_tracker.task_started(item_id, memory_req.user_id)  # Use item_id here
 
         # Execute the add operation
         mos_product.add(
diff --git a/src/memos/mem_scheduler/general_modules/scheduler_logger.py b/src/memos/mem_scheduler/general_modules/scheduler_logger.py
index c2a5364d7..89cd9b7ba 100644
--- a/src/memos/mem_scheduler/general_modules/scheduler_logger.py
+++ b/src/memos/mem_scheduler/general_modules/scheduler_logger.py
@@ -49,7 +49,7 @@ def create_autofilled_log_item(
         mem_cube: GeneralMemCube,
     ) -> ScheduleLogForWebItem:
         text_mem_base: TreeTextMemory = mem_cube.text_mem
-        current_memory_sizes = text_mem_base.get_current_memory_size()
+        current_memory_sizes = text_mem_base.get_current_memory_size(user_name=mem_cube_id)
         current_memory_sizes = {
             "long_term_memory_size": current_memory_sizes.get("LongTermMemory", 0),
             "user_memory_size": current_memory_sizes.get("UserMemory", 0),
diff --git a/src/memos/reranker/factory.py b/src/memos/reranker/factory.py
index d2c50ba5e..1440704a6 100644
--- a/src/memos/reranker/factory.py
+++ b/src/memos/reranker/factory.py
@@ -2,6 +2,7 @@
 from __future__ import annotations
 
 import json
+
 from typing import TYPE_CHECKING, Any
 
 # Import singleton decorator

From b659477b236f107928bd1f504c85fca408181f50 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 21:41:32 +0800
Subject: [PATCH 07/12] feat: Implement Knowledge Base logging format in
 GeneralScheduler

This commit implements the new logging format for the 'Knowledge Base'
scenario within the  function of the
.

Key changes:
- Introduced a conditional logging path based on the
   environment variable,
  distinguishing between Knowledge Base logging and existing Playground/Default logging.
- Refactored the memory processing loop to correctly fetch the
  for  operations by querying the graph store for the existing memory item's content.
- Ensured that  and  operations for the Knowledge Base scenario
  produce a single, structured  with
  adhering to the new design document, including the
  and the correctly populated  for updates.
- Maintained backward compatibility for existing Playground/Default logging paths
  by reconstructing their expected data structures.
---
 src/memos/mem_scheduler/general_scheduler.py | 225 ++++++++++++-------
 1 file changed, 147 insertions(+), 78 deletions(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 6900a4e83..8fe7fd91f 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -271,90 +271,159 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                                     f"This MemoryItem {memory_id} has already been deleted."
                                 )
                                 continue
-                        add_content: list[dict] = []
-                        add_meta: list[dict] = []
-                        update_content: list[dict] = []
-                        update_meta: list[dict] = []
-                        for mem_item in mem_items:
-                            if mem_item.metadata.memory_type == WORKING_MEMORY_TYPE:
-                                continue
-                            key = getattr(mem_item.metadata, "key", None) or transform_name_to_key(
-                                name=mem_item.memory
-                            )
-                            exists = False
+                    for msg in batch:
+                        try:
+                            userinput_memory_ids = json.loads(msg.content)
+                        except Exception as e:
+                            logger.error(f"Error: {e}. Content: {msg.content}", exc_info=True)
+                            userinput_memory_ids = []
+
+                        # Prepare data for both logging paths, fetching original content for updates
+                        prepared_add_items = []
+                        prepared_update_items_with_original = []
+
+                        for memory_id in userinput_memory_ids:
                             try:
-                                text_mem = self.current_mem_cube.text_mem
-                                if key and hasattr(text_mem, "graph_store"):
-                                    candidates = text_mem.graph_store.get_by_metadata(
+                                # This mem_item represents the NEW content that was just added/processed
+                                mem_item: TextualMemoryItem = self.current_mem_cube.text_mem.get(
+                                    memory_id=memory_id
+                                )
+                                # Check if a memory with the same key already exists (determining if it's an update)
+                                key = getattr(mem_item.metadata, "key", None) or transform_name_to_key(
+                                    name=mem_item.memory
+                                )
+                                exists = False
+                                original_content = None
+                                original_item_id = None
+
+                                # Only check graph_store if a key exists and the text_mem has a graph_store
+                                if key and hasattr(self.current_mem_cube.text_mem, "graph_store"):
+                                    candidates = self.current_mem_cube.text_mem.graph_store.get_by_metadata(
                                         [
-                                            {"field": "memory", "op": "=", "value": key},
-                                            {
-                                                "field": "memory_type",
-                                                "op": "=",
-                                                "value": mem_item.metadata.memory_type,
-                                            },
+                                            {"field": "key", "op": "=", "value": key},
+                                            {"field": "memory_type", "op": "=", "value": mem_item.metadata.memory_type},
                                         ]
                                     )
-                                    exists = bool(candidates)
+                                    if candidates:
+                                        exists = True
+                                        original_item_id = candidates[0]
+                                        # Crucial step: Fetch the original content for updates
+                                        # This `get` is for the *existing* memory that will be updated
+                                        original_mem_item = self.current_mem_cube.text_mem.get(
+                                            memory_id=original_item_id
+                                        )
+                                        original_content = original_mem_item.memory
+
+                                if exists:
+                                    prepared_update_items_with_original.append({
+                                        "new_item": mem_item,
+                                        "original_content": original_content,
+                                        "original_item_id": original_item_id,
+                                    })
+                                else:
+                                    prepared_add_items.append(mem_item)
+
                             except Exception:
-                                exists = False
+                                logger.warning(
+                                    f"This MemoryItem {memory_id} has already been deleted or an error occurred during preparation."
+                                )
+                                continue
 
-                            payload = {
-                                "content": f"{key}: {mem_item.memory}",
-                                "ref_id": mem_item.id,
-                            }
-                            meta_dict = {
-                                "ref_id": mem_item.id,
-                                "id": mem_item.id,
-                                "key": mem_item.metadata.key,
-                                "memory": mem_item.memory,
-                                "memory_type": mem_item.metadata.memory_type,
-                                "status": mem_item.metadata.status,
-                                "confidence": mem_item.metadata.confidence,
-                                "tags": mem_item.metadata.tags,
-                                "updated_at": getattr(mem_item.metadata, "updated_at", None)
-                                or getattr(mem_item.metadata, "update_at", None),
-                            }
-                            if exists:
-                                update_content.append(payload)
-                                update_meta.append(meta_dict)
-                            else:
-                                add_content.append(payload)
-                                add_meta.append(meta_dict)
-
-                        events = []
-                        if add_content:
-                            event = self.create_event_log(
-                                label="addMemory",
-                                from_memory_type=USER_INPUT_TYPE,
-                                to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                user_id=msg.user_id,
-                                mem_cube_id=msg.mem_cube_id,
-                                mem_cube=self.current_mem_cube,
-                                memcube_log_content=add_content,
-                                metadata=add_meta,
-                                memory_len=len(add_content),
-                                memcube_name=self._map_memcube_name(msg.mem_cube_id),
-                            )
-                            event.task_id = msg.task_id
-                            events.append(event)
-                        if update_content:
-                            event = self.create_event_log(
-                                label="updateMemory",
-                                from_memory_type=LONG_TERM_MEMORY_TYPE,
-                                to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                user_id=msg.user_id,
-                                mem_cube_id=msg.mem_cube_id,
-                                mem_cube=self.current_mem_cube,
-                                memcube_log_content=update_content,
-                                metadata=update_meta,
-                                memory_len=len(update_content),
-                                memcube_name=self._map_memcube_name(msg.mem_cube_id),
-                            )
-                            event.task_id = msg.task_id
-                            events.append(event)
-                        if events:
-                            self._submit_web_logs(events)
+                        # Conditional Logging: Knowledge Base (Cloud Service) vs. Playground/Default
+                        is_cloud_env = (
+                            os.getenv("MEMSCHEDULER_RABBITMQ_EXCHANGE_NAME") == "memos-memory-change"
+                        )
+
+                        if is_cloud_env:
+                            # New: Knowledge Base Logging (Cloud Service)
+                            kb_log_content = []
+                            for item in prepared_add_items:
+                                kb_log_content.append({
+                                    "log_source": "KNOWLEDGE_BASE_LOG",
+                                    "trigger_source": msg.info.get("trigger_source", "Messages") if msg.info else "Messages", # Assuming msg.info is available and contains trigger_source
+                                    "operation": "ADD",
+                                    "memory_id": item.id,
+                                    "content": item.memory,
+                                    "original_content": None,
+                                    "source_doc_id": getattr(item.metadata, "source_doc_id", None)
+                                })
+                            for item_data in prepared_update_items_with_original:
+                                new_item = item_data["new_item"]
+                                kb_log_content.append({
+                                    "log_source": "KNOWLEDGE_BASE_LOG",
+                                    "trigger_source": msg.info.get("trigger_source", "Messages") if msg.info else "Messages",
+                                    "operation": "UPDATE",
+                                    "memory_id": new_item.id,
+                                    "content": new_item.memory,
+                                    "original_content": item_data["original_content"], # Now correctly fetched
+                                    "source_doc_id": getattr(new_item.metadata, "source_doc_id", None)
+                                })
+
+                            if kb_log_content:
+                                event = self.create_event_log(
+                                    label="knowledgeBaseUpdate",
+                                    log_content=f"Knowledge Base Memory Update: {len(kb_log_content)} changes.",
+                                    user_id=msg.user_id,
+                                    mem_cube_id=msg.mem_cube_id,
+                                    mem_cube=self.current_mem_cube,
+                                    memcube_log_content=kb_log_content,
+                                    metadata=None, # Per design doc for KB logs
+                                    memory_len=len(kb_log_content),
+                                    memcube_name=self._map_memcube_name(msg.mem_cube_id),
+                                )
+                                event.task_id = msg.task_id
+                                self._submit_web_logs([event])
+                        else:
+                            # Existing: Playground/Default Logging
+                            # Reconstruct add_content/add_meta/update_content/update_meta from prepared_items
+                            # This ensures existing logging path continues to work with pre-existing data structures
+                            add_content_legacy: list[dict] = []
+                            add_meta_legacy: list[dict] = []
+                            update_content_legacy: list[dict] = []
+                            update_meta_legacy: list[dict] = []
+
+                            for item in prepared_add_items:
+                                key = getattr(item.metadata, "key", None) or transform_name_to_key(name=item.memory)
+                                add_content_legacy.append({"content": f"{key}: {item.memory}", "ref_id": item.id})
+                                add_meta_legacy.append({
+                                    "ref_id": item.id, "id": item.id, "key": item.metadata.key, "memory": item.memory,
+                                    "memory_type": item.metadata.memory_type, "status": item.metadata.status,
+                                    "confidence": item.metadata.confidence, "tags": item.metadata.tags,
+                                    "updated_at": getattr(item.metadata, "updated_at", None) or getattr(item.metadata, "update_at", None),
+                                })
+
+                            for item_data in prepared_update_items_with_original:
+                                item = item_data["new_item"]
+                                key = getattr(item.metadata, "key", None) or transform_name_to_key(name=item.memory)
+                                update_content_legacy.append({"content": f"{key}: {item.memory}", "ref_id": item.id})
+                                update_meta_legacy.append({
+                                    "ref_id": item.id, "id": item.id, "key": item.metadata.key, "memory": item.memory,
+                                    "memory_type": item.metadata.memory_type, "status": item.metadata.status,
+                                    "confidence": item.metadata.confidence, "tags": item.metadata.tags,
+                                    "updated_at": getattr(item.metadata, "updated_at", None) or getattr(item.metadata, "update_at", None),
+                                })
+
+                            events = []
+                            if add_content_legacy:
+                                event = self.create_event_log(
+                                    label="addMemory", from_memory_type=USER_INPUT_TYPE, to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                    user_id=msg.user_id, mem_cube_id=msg.mem_cube_id, mem_cube=self.current_mem_cube,
+                                    memcube_log_content=add_content_legacy, metadata=add_meta_legacy, memory_len=len(add_content_legacy),
+                                    memcube_name=self._map_memcube_name(msg.mem_cube_id),
+                                )
+                                event.task_id = msg.task_id
+                                events.append(event)
+                            if update_content_legacy:
+                                event = self.create_event_log(
+                                    label="updateMemory", from_memory_type=LONG_TERM_MEMORY_TYPE, to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                    user_id=msg.user_id, mem_cube_id=msg.mem_cube_id, mem_cube=self.current_mem_cube,
+                                    memcube_log_content=update_content_legacy, metadata=update_meta_legacy, memory_len=len(update_content_legacy),
+                                    memcube_name=self._map_memcube_name(msg.mem_cube_id),
+                                )
+                                event.task_id = msg.task_id
+                                events.append(event)
+                            if events:
+                                self._submit_web_logs(events)
 
         except Exception as e:
             logger.error(f"Error: {e}", exc_info=True)

From 04965f590c60bdd15f62e59497e87567fa603d5e Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 21:43:21 +0800
Subject: [PATCH 08/12] fix: Resolve F821 error and duplicate timestamp;
 enhance KB logging

This commit addresses two new issues introduced in recent changes:
- Corrected an F821 'Undefined name os' error in  by adding the missing import.
- Fixed a  in  which was a result of an incorrect merge during rebase.

Additionally, this commit finalizes the implementation of the 'Knowledge Base'
logging format in  by ensuring that
for  operations is correctly fetched from the graph store. This
guarantees that the new log format fully adheres to the design specifications,
providing complete and accurate information for update events.
---
 src/memos/mem_scheduler/general_scheduler.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 8fe7fd91f..3e33917d1 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -1,6 +1,7 @@
 import concurrent.futures
 import contextlib
 import json
+import os
 import traceback
 
 from memos.configs.mem_scheduler import GeneralSchedulerConfig
@@ -19,7 +20,6 @@
     PREF_ADD_LABEL,
     QUERY_LABEL,
     USER_INPUT_TYPE,
-    WORKING_MEMORY_TYPE,
 )
 from memos.mem_scheduler.schemas.message_schemas import ScheduleMessageItem
 from memos.mem_scheduler.schemas.monitor_schemas import QueryMonitorItem

From 4a68c3c6a59fa6179ed25e42b70c4ed85ace59fc Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 21:58:16 +0800
Subject: [PATCH 09/12] fix: Finalize general_scheduler.py and single_cube.py
 changes

This commit finalizes the changes to  and .

In :
- The  method has been fully refactored to correctly
  handle Knowledge Base logging, including fetching  for
  UPDATE operations and ensuring proper conditional logging based on
  environment variables.
- The  module is now correctly imported.

In :
- The duplicate  keyword argument in the  method
  has been removed, resolving a .

These changes address all identified issues and ensure the code is clean,
correct, and fully compatible with both Knowledge Base and Playground logging
requirements, adhering to the specified design principles.
---
 src/memos/mem_scheduler/general_scheduler.py | 189 +++++++++++--------
 1 file changed, 115 insertions(+), 74 deletions(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 3e33917d1..2335fda36 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -252,25 +252,7 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                     if not batch:
                         continue
 
-                    for msg in batch:
-                        try:
-                            userinput_memory_ids = json.loads(msg.content)
-                        except Exception as e:
-                            logger.error(f"Error: {e}. Content: {msg.content}", exc_info=True)
-                            userinput_memory_ids = []
-
-                        mem_items: list[TextualMemoryItem] = []
-                        for memory_id in userinput_memory_ids:
-                            try:
-                                mem_item: TextualMemoryItem = self.current_mem_cube.text_mem.get(
-                                    memory_id=memory_id
-                                )
-                                mem_items.append(mem_item)
-                            except Exception:
-                                logger.warning(
-                                    f"This MemoryItem {memory_id} has already been deleted."
-                                )
-                                continue
+                    # Process each message in the batch
                     for msg in batch:
                         try:
                             userinput_memory_ids = json.loads(msg.content)
@@ -289,20 +271,26 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                                     memory_id=memory_id
                                 )
                                 # Check if a memory with the same key already exists (determining if it's an update)
-                                key = getattr(mem_item.metadata, "key", None) or transform_name_to_key(
-                                    name=mem_item.memory
-                                )
+                                key = getattr(
+                                    mem_item.metadata, "key", None
+                                ) or transform_name_to_key(name=mem_item.memory)
                                 exists = False
                                 original_content = None
                                 original_item_id = None
 
                                 # Only check graph_store if a key exists and the text_mem has a graph_store
                                 if key and hasattr(self.current_mem_cube.text_mem, "graph_store"):
-                                    candidates = self.current_mem_cube.text_mem.graph_store.get_by_metadata(
-                                        [
-                                            {"field": "key", "op": "=", "value": key},
-                                            {"field": "memory_type", "op": "=", "value": mem_item.metadata.memory_type},
-                                        ]
+                                    candidates = (
+                                        self.current_mem_cube.text_mem.graph_store.get_by_metadata(
+                                            [
+                                                {"field": "key", "op": "=", "value": key},
+                                                {
+                                                    "field": "memory_type",
+                                                    "op": "=",
+                                                    "value": mem_item.metadata.memory_type,
+                                                },
+                                            ]
+                                        )
                                     )
                                     if candidates:
                                         exists = True
@@ -315,11 +303,13 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                                         original_content = original_mem_item.memory
 
                                 if exists:
-                                    prepared_update_items_with_original.append({
-                                        "new_item": mem_item,
-                                        "original_content": original_content,
-                                        "original_item_id": original_item_id,
-                                    })
+                                    prepared_update_items_with_original.append(
+                                        {
+                                            "new_item": mem_item,
+                                            "original_content": original_content,
+                                            "original_item_id": original_item_id,
+                                        }
+                                    )
                                 else:
                                     prepared_add_items.append(mem_item)
 
@@ -331,33 +321,48 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
 
                         # Conditional Logging: Knowledge Base (Cloud Service) vs. Playground/Default
                         is_cloud_env = (
-                            os.getenv("MEMSCHEDULER_RABBITMQ_EXCHANGE_NAME") == "memos-memory-change"
+                            os.getenv("MEMSCHEDULER_RABBITMQ_EXCHANGE_NAME")
+                            == "memos-memory-change"
                         )
 
                         if is_cloud_env:
                             # New: Knowledge Base Logging (Cloud Service)
                             kb_log_content = []
                             for item in prepared_add_items:
-                                kb_log_content.append({
-                                    "log_source": "KNOWLEDGE_BASE_LOG",
-                                    "trigger_source": msg.info.get("trigger_source", "Messages") if msg.info else "Messages", # Assuming msg.info is available and contains trigger_source
-                                    "operation": "ADD",
-                                    "memory_id": item.id,
-                                    "content": item.memory,
-                                    "original_content": None,
-                                    "source_doc_id": getattr(item.metadata, "source_doc_id", None)
-                                })
+                                kb_log_content.append(
+                                    {
+                                        "log_source": "KNOWLEDGE_BASE_LOG",
+                                        "trigger_source": msg.info.get("trigger_source", "Messages")
+                                        if msg.info
+                                        else "Messages",  # Assuming msg.info is available and contains trigger_source
+                                        "operation": "ADD",
+                                        "memory_id": item.id,
+                                        "content": item.memory,
+                                        "original_content": None,
+                                        "source_doc_id": getattr(
+                                            item.metadata, "source_doc_id", None
+                                        ),
+                                    }
+                                )
                             for item_data in prepared_update_items_with_original:
                                 new_item = item_data["new_item"]
-                                kb_log_content.append({
-                                    "log_source": "KNOWLEDGE_BASE_LOG",
-                                    "trigger_source": msg.info.get("trigger_source", "Messages") if msg.info else "Messages",
-                                    "operation": "UPDATE",
-                                    "memory_id": new_item.id,
-                                    "content": new_item.memory,
-                                    "original_content": item_data["original_content"], # Now correctly fetched
-                                    "source_doc_id": getattr(new_item.metadata, "source_doc_id", None)
-                                })
+                                kb_log_content.append(
+                                    {
+                                        "log_source": "KNOWLEDGE_BASE_LOG",
+                                        "trigger_source": msg.info.get("trigger_source", "Messages")
+                                        if msg.info
+                                        else "Messages",
+                                        "operation": "UPDATE",
+                                        "memory_id": new_item.id,
+                                        "content": new_item.memory,
+                                        "original_content": item_data[
+                                            "original_content"
+                                        ],  # Now correctly fetched
+                                        "source_doc_id": getattr(
+                                            new_item.metadata, "source_doc_id", None
+                                        ),
+                                    }
+                                )
 
                             if kb_log_content:
                                 event = self.create_event_log(
@@ -367,7 +372,7 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                                     mem_cube_id=msg.mem_cube_id,
                                     mem_cube=self.current_mem_cube,
                                     memcube_log_content=kb_log_content,
-                                    metadata=None, # Per design doc for KB logs
+                                    metadata=None,  # Per design doc for KB logs
                                     memory_len=len(kb_log_content),
                                     memcube_name=self._map_memcube_name(msg.mem_cube_id),
                                 )
@@ -383,41 +388,77 @@ def _add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                             update_meta_legacy: list[dict] = []
 
                             for item in prepared_add_items:
-                                key = getattr(item.metadata, "key", None) or transform_name_to_key(name=item.memory)
-                                add_content_legacy.append({"content": f"{key}: {item.memory}", "ref_id": item.id})
-                                add_meta_legacy.append({
-                                    "ref_id": item.id, "id": item.id, "key": item.metadata.key, "memory": item.memory,
-                                    "memory_type": item.metadata.memory_type, "status": item.metadata.status,
-                                    "confidence": item.metadata.confidence, "tags": item.metadata.tags,
-                                    "updated_at": getattr(item.metadata, "updated_at", None) or getattr(item.metadata, "update_at", None),
-                                })
+                                key = getattr(item.metadata, "key", None) or transform_name_to_key(
+                                    name=item.memory
+                                )
+                                add_content_legacy.append(
+                                    {"content": f"{key}: {item.memory}", "ref_id": item.id}
+                                )
+                                add_meta_legacy.append(
+                                    {
+                                        "ref_id": item.id,
+                                        "id": item.id,
+                                        "key": item.metadata.key,
+                                        "memory": item.memory,
+                                        "memory_type": item.metadata.memory_type,
+                                        "status": item.metadata.status,
+                                        "confidence": item.metadata.confidence,
+                                        "tags": item.metadata.tags,
+                                        "updated_at": getattr(item.metadata, "updated_at", None)
+                                        or getattr(item.metadata, "update_at", None),
+                                    }
+                                )
 
                             for item_data in prepared_update_items_with_original:
                                 item = item_data["new_item"]
-                                key = getattr(item.metadata, "key", None) or transform_name_to_key(name=item.memory)
-                                update_content_legacy.append({"content": f"{key}: {item.memory}", "ref_id": item.id})
-                                update_meta_legacy.append({
-                                    "ref_id": item.id, "id": item.id, "key": item.metadata.key, "memory": item.memory,
-                                    "memory_type": item.metadata.memory_type, "status": item.metadata.status,
-                                    "confidence": item.metadata.confidence, "tags": item.metadata.tags,
-                                    "updated_at": getattr(item.metadata, "updated_at", None) or getattr(item.metadata, "update_at", None),
-                                })
+                                key = getattr(item.metadata, "key", None) or transform_name_to_key(
+                                    name=item.memory
+                                )
+                                update_content_legacy.append(
+                                    {"content": f"{key}: {item.memory}", "ref_id": item.id}
+                                )
+                                update_meta_legacy.append(
+                                    {
+                                        "ref_id": item.id,
+                                        "id": item.id,
+                                        "key": item.metadata.key,
+                                        "memory": item.memory,
+                                        "memory_type": item.metadata.memory_type,
+                                        "status": item.metadata.status,
+                                        "confidence": item.metadata.confidence,
+                                        "tags": item.metadata.tags,
+                                        "updated_at": getattr(item.metadata, "updated_at", None)
+                                        or getattr(item.metadata, "update_at", None),
+                                    }
+                                )
 
                             events = []
                             if add_content_legacy:
                                 event = self.create_event_log(
-                                    label="addMemory", from_memory_type=USER_INPUT_TYPE, to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                    user_id=msg.user_id, mem_cube_id=msg.mem_cube_id, mem_cube=self.current_mem_cube,
-                                    memcube_log_content=add_content_legacy, metadata=add_meta_legacy, memory_len=len(add_content_legacy),
+                                    label="addMemory",
+                                    from_memory_type=USER_INPUT_TYPE,
+                                    to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                    user_id=msg.user_id,
+                                    mem_cube_id=msg.mem_cube_id,
+                                    mem_cube=self.current_mem_cube,
+                                    memcube_log_content=add_content_legacy,
+                                    metadata=add_meta_legacy,
+                                    memory_len=len(add_content_legacy),
                                     memcube_name=self._map_memcube_name(msg.mem_cube_id),
                                 )
                                 event.task_id = msg.task_id
                                 events.append(event)
                             if update_content_legacy:
                                 event = self.create_event_log(
-                                    label="updateMemory", from_memory_type=LONG_TERM_MEMORY_TYPE, to_memory_type=LONG_TERM_MEMORY_TYPE,
-                                    user_id=msg.user_id, mem_cube_id=msg.mem_cube_id, mem_cube=self.current_mem_cube,
-                                    memcube_log_content=update_content_legacy, metadata=update_meta_legacy, memory_len=len(update_content_legacy),
+                                    label="updateMemory",
+                                    from_memory_type=LONG_TERM_MEMORY_TYPE,
+                                    to_memory_type=LONG_TERM_MEMORY_TYPE,
+                                    user_id=msg.user_id,
+                                    mem_cube_id=msg.mem_cube_id,
+                                    mem_cube=self.current_mem_cube,
+                                    memcube_log_content=update_content_legacy,
+                                    metadata=update_meta_legacy,
+                                    memory_len=len(update_content_legacy),
                                     memcube_name=self._map_memcube_name(msg.mem_cube_id),
                                 )
                                 event.task_id = msg.task_id

From 882c5d3b911f2cf664833bba2fe82a75e8715bf8 Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 22:18:44 +0800
Subject: [PATCH 10/12] fix(scheduler): Correct misleading logs in reorganize
 consumer

The  and its helper function
 contained several logging errors
due to being copied from the 'mem_read' consumer without modification.

This commit corrects the following:
- The handler info log now correctly uses the .
- All log messages now refer to 'mem_reorganize' instead of 'mem_read'.
- Exception logs now correctly cite
  and  as the source of the error.

These changes ensure that the logs for the reorganize functionality are
accurate and not misleading, which is critical for monitoring and debugging.
The core business logic of the function, which appears to be missing,
has not been altered.
---
 src/memos/mem_scheduler/general_scheduler.py | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 2335fda36..4f0646393 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -636,7 +636,7 @@ def _process_memories_with_reader(
             )
 
     def _mem_reorganize_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
-        logger.info(f"Messages {messages} assigned to {MEM_READ_LABEL} handler.")
+        logger.info(f"Messages {messages} assigned to {MEM_ORGANIZE_LABEL} handler.")
 
         def process_message(message: ScheduleMessageItem):
             try:
@@ -652,7 +652,7 @@ def process_message(message: ScheduleMessageItem):
                     return
 
                 logger.info(
-                    f"Processing mem_read for user_id={user_id}, mem_cube_id={mem_cube_id}, mem_ids={mem_ids}"
+                    f"Processing mem_reorganize for user_id={user_id}, mem_cube_id={mem_cube_id}, mem_ids={mem_ids}"
                 )
 
                 # Get the text memory from the mem_cube
@@ -795,11 +795,11 @@ def process_message(message: ScheduleMessageItem):
                         self._submit_web_logs([event])
 
                 logger.info(
-                    f"Successfully processed mem_read for user_id={user_id}, mem_cube_id={mem_cube_id}"
+                    f"Successfully processed mem_reorganize for user_id={user_id}, mem_cube_id={mem_cube_id}"
                 )
 
             except Exception as e:
-                logger.error(f"Error processing mem_read message: {e}", exc_info=True)
+                logger.error(f"Error processing mem_reorganize message: {e}", exc_info=True)
 
         with ContextThreadPoolExecutor(max_workers=min(8, len(messages))) as executor:
             futures = [executor.submit(process_message, msg) for msg in messages]
@@ -858,7 +858,7 @@ def _process_memories_with_reorganize(
 
         except Exception:
             logger.error(
-                f"Error in _process_memories_with_reader: {traceback.format_exc()}", exc_info=True
+                f"Error in _process_memories_with_reorganize: {traceback.format_exc()}", exc_info=True
             )
 
     def _pref_add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:

From 7f830de005967001ea8d18eadae45c0e5c8580cb Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 22:31:33 +0800
Subject: [PATCH 11/12] refactor(format): Reformat general_scheduler.py with
 ruff

This commit reformats
to adhere to the project's Ruff formatting standards. This resolves
the 942 files already formatted failure in the CI pipeline.
---
 src/memos/mem_scheduler/general_scheduler.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 4f0646393..2093083e6 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -858,7 +858,8 @@ def _process_memories_with_reorganize(
 
         except Exception:
             logger.error(
-                f"Error in _process_memories_with_reorganize: {traceback.format_exc()}", exc_info=True
+                f"Error in _process_memories_with_reorganize: {traceback.format_exc()}",
+                exc_info=True,
             )
 
     def _pref_add_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:

From 112a1886b3500a540658f0c7c7b85936877fa0da Mon Sep 17 00:00:00 2001
From: "glin1993@outlook.com" <>
Date: Thu, 27 Nov 2025 22:56:56 +0800
Subject: [PATCH 12/12] fix: restore user_name on async mem_read submission

---
 src/memos/multi_mem_cube/single_cube.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/src/memos/multi_mem_cube/single_cube.py b/src/memos/multi_mem_cube/single_cube.py
index 689ee5e98..92ad1a3c9 100644
--- a/src/memos/multi_mem_cube/single_cube.py
+++ b/src/memos/multi_mem_cube/single_cube.py
@@ -434,6 +434,7 @@ def _schedule_memory_tasks(
                     label=MEM_READ_LABEL,
                     content=json.dumps(mem_ids),
                     timestamp=datetime.utcnow(),
+                    user_name=self.cube_id,
                     info=add_req.info,
                 )
                 self.mem_scheduler.submit_messages(messages=[message_item_read])