{"episode_id": "SQ1_FP_A_0084", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0084.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260713, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-09T14:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器在住户外出期间(14:57-15:03)出现两次短暂的幽灵触发,且卧室窗户传感器全天无任何上报记录,疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:26 出门(关灯、锁门、门传感器开关),18:17 回家(开锁、进门),期间家中应无人。\",\n \"推理步骤2: 但在 14:57:00 和 15:02:20,卧室运动传感器分别触发了占用状态(Occupancy=1),且每次持续时间极短(约45秒和50秒),之后立即恢复为0。住户不在家时不应有人体活动,且没有对应的开灯、开门等关联事件,排除正常入室行为。\",\n \"推理步骤3: 这种短暂、孤立的触发模式更符合传感器误触发(如热源干扰、昆虫经过、传感器灵敏度漂移)而非真实入侵。真实入侵通常伴随门窗传感器变化或持续的占用信号,但日志中均无此类证据。\",\n \"推理步骤4: 卧室窗户传感器(bedroom_window_contact)在整个24小时日志中没有任何状态上报。其他 contact_sensor(front_door_contact、kitchen_window_contact)均有正常上报。该传感器可能已离线、电池耗尽或通信故障。\",\n \"推理步骤5: 卧室温度传感器和卧室灯、窗帘等设备工作正常,温度曲线合理(夜间约22°C,午间升至约24.8°C),灯光和窗帘响应与住户作息一致,无异常。\"\n ],\n \"key_evidence\": [\n \"14:57:00 和 15:02:20 卧室运动传感器在无人在家时两次短暂触发(各持续不到1分钟),无任何关联设备事件(无开灯、无门窗变化)\",\n \"bedroom_window_contact 全天零上报,与其他同类型传感器(front_door_contact、kitchen_window_contact)有正常上报形成对比\"\n ],\n \"recommended_actions\": [\n \"检查卧室运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、宠物或热源干扰,必要时调低灵敏度\",\n \"检查卧室窗户传感器(bedroom_window_contact)的电池电量和在线状态,确认其是否正常连接到网络\",\n \"持续观察卧室运动传感器是否在无人时反复误触发,若频繁出现建议更换设备或固件升级\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器在住户外出期间(14:57-15:03)出现两次短暂的幽灵触发,且卧室窗户传感器全天无任何上报记录,疑似离线或故障。", "reasoning": ["推理步骤1: 住户于 07:26 出门(关灯、锁门、门传感器开关),18:17 回家(开锁、进门),期间家中应无人。", "推理步骤2: 但在 14:57:00 和 15:02:20,卧室运动传感器分别触发了占用状态(Occupancy=1),且每次持续时间极短(约45秒和50秒),之后立即恢复为0。住户不在家时不应有人体活动,且没有对应的开灯、开门等关联事件,排除正常入室行为。", "推理步骤3: 这种短暂、孤立的触发模式更符合传感器误触发(如热源干扰、昆虫经过、传感器灵敏度漂移)而非真实入侵。真实入侵通常伴随门窗传感器变化或持续的占用信号,但日志中均无此类证据。", "推理步骤4: 卧室窗户传感器(bedroom_window_contact)在整个24小时日志中没有任何状态上报。其他 contact_sensor(front_door_contact、kitchen_window_contact)均有正常上报。该传感器可能已离线、电池耗尽或通信故障。", "推理步骤5: 卧室温度传感器和卧室灯、窗帘等设备工作正常,温度曲线合理(夜间约22°C,午间升至约24.8°C),灯光和窗帘响应与住户作息一致,无异常。"], "key_evidence": ["14:57:00 和 15:02:20 卧室运动传感器在无人在家时两次短暂触发(各持续不到1分钟),无任何关联设备事件(无开灯、无门窗变化)", "bedroom_window_contact 全天零上报,与其他同类型传感器(front_door_contact、kitchen_window_contact)有正常上报形成对比"], "recommended_actions": ["检查卧室运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、宠物或热源干扰,必要时调低灵敏度", "检查卧室窗户传感器(bedroom_window_contact)的电池电量和在线状态,确认其是否正常连接到网络", "持续观察卧室运动传感器是否在无人时反复误触发,若频繁出现建议更换设备或固件升级"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.296522617340088, "api_error": null} {"episode_id": "SQ1_FP_A_0080", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0080.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20260709, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-15T17:51:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器存在周期性异常跳变,在住户外出期间每隔约30分钟突然上报约25.00°C的读数,与实际环境温度趋势严重不符,疑似传感器固件缺陷或硬件间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 梳理卧室温度传感器的整体趋势。凌晨0:00-5:30期间,卧室温度稳定在21.90-22.10°C,符合夜间无空调的自然温度。6:00起随日照升温,至12:30达到峰值约24.80°C,午后逐步回落,晚间回到22-23°C区间。这条主趋势曲线与客厅、厨房的温度走势高度一致,是合理的。\",\n \"推理步骤2: 但在17:51、18:21、18:51、19:21四个时间点,卧室温度传感器分别上报了2500、2502、2498、2501(即25.00、25.02、24.98、25.01°C)。这四个读数出现在住户外出期间(07:15出门、18:24回家),且间隔几乎精确为30分钟。\",\n \"推理步骤3: 对比同时段的正常半小时整点读数:17:30为23.73°C、18:00为23.56°C、18:30为23.52°C、19:00为23.36°C,呈持续下降趋势。而异常读数约25.00°C比周围正常值高出约1.5°C,且四次读数几乎恒定在25.00°C附近,不随环境温度变化。\",\n \"推理步骤4: 17:51时客厅空调刚开启(可能是远程/定时操作),但空调在客厅,对卧室的影响应是缓慢渐进的,不可能让卧室温度瞬间从约23.7°C跳到25.0°C,更不可能在空调制冷模式下反而升温。且18:00的正常读数23.56°C证实卧室实际温度并未上升。\",\n \"推理步骤5: 四次异常值高度集中在25.00°C(±0.02°C),这个数值恰好是一个常见的默认/校准参考温度值。结合其精确的30分钟周期性,极有可能是传感器在某种自检、校准或错误恢复流程中输出了默认值,而非真实测量值。\",\n \"推理步骤6: 卧室的运动传感器(occupancy)和窗户传感器(window_contact)在日志中表现正常——运动传感器在住户起床和睡前正确触发,窗户传感器全天无异常事件。因此异常仅限于温度传感器。\"\n ],\n \"key_evidence\": [\n \"17:51上报2500,而17:30正常值为2373、18:00正常值为2356,瞬间跳变约+1.5°C后又回落\",\n \"18:21上报2502,18:51上报2498,19:21上报2501——四次异常值均集中在25.00°C±0.02°C,呈现非自然的恒定特征\",\n \"四次异常上报间隔均为30分钟(17:51→18:21→18:51→19:21),具有明显的周期性定时特征\",\n \"19:11厨房温度传感器也出现了MeasuredValue=None的异常,提示系统中可能存在传感器通信或固件层面的共性问题\"\n ],\n \"recommended_actions\": [\n \"检查卧室温度传感器的固件版本,确认是否有已知的周期性自检输出默认值的bug,如有新固件则进行升级\",\n \"观察未来几天该传感器是否持续出现类似的30分钟周期异常跳变,以确认问题的可复现性\",\n \"检查Matter网络中传感器的通信质量(如RSSI、丢包率),排除无线信号不稳定导致的数据错乱\",\n \"在自动化规则中对卧室温度传感器增加异常值过滤逻辑:当读数与前后正常读数偏差超过1°C且持续时间极短时,标记为可疑数据不参与联动决策\",\n \"同步关注厨房温度传感器的None值问题,排查是否为同一批次设备或同一通信链路的共性故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卧室温度传感器存在周期性异常跳变,在住户外出期间每隔约30分钟突然上报约25.00°C的读数,与实际环境温度趋势严重不符,疑似传感器固件缺陷或硬件间歇性故障。", "reasoning": ["推理步骤1: 梳理卧室温度传感器的整体趋势。凌晨0:00-5:30期间,卧室温度稳定在21.90-22.10°C,符合夜间无空调的自然温度。6:00起随日照升温,至12:30达到峰值约24.80°C,午后逐步回落,晚间回到22-23°C区间。这条主趋势曲线与客厅、厨房的温度走势高度一致,是合理的。", "推理步骤2: 但在17:51、18:21、18:51、19:21四个时间点,卧室温度传感器分别上报了2500、2502、2498、2501(即25.00、25.02、24.98、25.01°C)。这四个读数出现在住户外出期间(07:15出门、18:24回家),且间隔几乎精确为30分钟。", "推理步骤3: 对比同时段的正常半小时整点读数:17:30为23.73°C、18:00为23.56°C、18:30为23.52°C、19:00为23.36°C,呈持续下降趋势。而异常读数约25.00°C比周围正常值高出约1.5°C,且四次读数几乎恒定在25.00°C附近,不随环境温度变化。", "推理步骤4: 17:51时客厅空调刚开启(可能是远程/定时操作),但空调在客厅,对卧室的影响应是缓慢渐进的,不可能让卧室温度瞬间从约23.7°C跳到25.0°C,更不可能在空调制冷模式下反而升温。且18:00的正常读数23.56°C证实卧室实际温度并未上升。", "推理步骤5: 四次异常值高度集中在25.00°C(±0.02°C),这个数值恰好是一个常见的默认/校准参考温度值。结合其精确的30分钟周期性,极有可能是传感器在某种自检、校准或错误恢复流程中输出了默认值,而非真实测量值。", "推理步骤6: 卧室的运动传感器(occupancy)和窗户传感器(window_contact)在日志中表现正常——运动传感器在住户起床和睡前正确触发,窗户传感器全天无异常事件。因此异常仅限于温度传感器。"], "key_evidence": ["17:51上报2500,而17:30正常值为2373、18:00正常值为2356,瞬间跳变约+1.5°C后又回落", "18:21上报2502,18:51上报2498,19:21上报2501——四次异常值均集中在25.00°C±0.02°C,呈现非自然的恒定特征", "四次异常上报间隔均为30分钟(17:51→18:21→18:51→19:21),具有明显的周期性定时特征", "19:11厨房温度传感器也出现了MeasuredValue=None的异常,提示系统中可能存在传感器通信或固件层面的共性问题"], "recommended_actions": ["检查卧室温度传感器的固件版本,确认是否有已知的周期性自检输出默认值的bug,如有新固件则进行升级", "观察未来几天该传感器是否持续出现类似的30分钟周期异常跳变,以确认问题的可复现性", "检查Matter网络中传感器的通信质量(如RSSI、丢包率),排除无线信号不稳定导致的数据错乱", "在自动化规则中对卧室温度传感器增加异常值过滤逻辑:当读数与前后正常读数偏差超过1°C且持续时间极短时,标记为可疑数据不参与联动决策", "同步关注厨房温度传感器的None值问题,排查是否为同一批次设备或同一通信链路的共性故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.6341233253479, "api_error": null} {"episode_id": "SQ1_FP_A_0100", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0100.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260729, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-22T21:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器存在异常:住户在卧室期间多次短暂报告占用后立即清零,且卧室灯在关闭状态下仍收到亮度调节指令,提示传感器灵敏度或联动逻辑可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 卧室运动传感器(bedroom_occupancy)在 21:24:00 报告 Occupancy=1,仅 45 秒后(21:24:45)就变为 0,随后 21:29:20 再次检测到占用,21:30:10 又清零。这种短时间内反复触发/清除的模式不符合正常人在卧室活动的行为特征(如整理床铺、换衣服等应持续数分钟)。\",\n \"推理步骤2: 对比 22:11:24 住户正式进入卧室准备睡觉的场景——传感器报告占用后,住户开灯、关窗帘、锁门,一系列操作持续到 22:31 灯关闭,22:32:14 传感器才报告无人。这才是正常的占用时长模式,说明传感器本身能正常工作,但在 21:24-21:30 期间的短暂触发可能是灵敏度边界问题或传感器视角边缘误触发。\",\n \"推理步骤3: 22:31:00 卧室灯被关闭(OnOff=False),但 22:34:00 又收到 LevelControl.CurrentLevel=40 的指令。灯在关闭状态下设置亮度级别,虽然在 Matter 协议中技术上是允许的(预设下次开灯亮度),但结合当时住户已准备入睡的场景,这更可能是自动化规则的逻辑错误,或者是传感器误触发导致的联动异常。\",\n \"推理步骤4: 卧室温度传感器(bedroom_temp_sensor)工作正常。全天温度从夜间约 22.0°C 随日照升至中午约 24.9°C,再回落至夜间 22.3°C,变化平滑合理,与客厅/厨房温度趋势一致但始终偏低约 1°C,符合卧室窗帘遮挡和朝向差异的预期。\",\n \"推理步骤5: 卧室窗户传感器(bedroom_window_contact)全天无状态变化报告,说明窗户始终保持同一状态,未见异常。综合来看,温度传感器和窗户传感器正常,但运动传感器存在可疑的短时触发模式。\"\n ],\n \"key_evidence\": [\n \"21:24:00-21:24:45 运动传感器仅 45 秒即从占用变为无人,21:29:20-21:30:10 再次仅约 50 秒即清零,短暂触发模式异常\",\n \"22:31:00 卧室灯关闭后,22:34:00 仍收到 LevelControl.CurrentLevel=40 指令,灯关闭状态下的亮度调节指令存在联动逻辑疑问\",\n \"对比 22:11:24-22:32:14 正常占用持续约 11 分钟,21:24 时段的超短占用明显偏离正常模式\"\n ],\n \"recommended_actions\": [\n \"检查卧室运动传感器的安装位置和灵敏度设置,确认是否存在视角边缘误触发(如客厅活动被部分检测到)\",\n \"审查与 bedroom_occupancy 关联的自动化规则,排查灯关闭后仍下发亮度指令的逻辑问题\",\n \"持续观察数天的运动传感器日志,确认短暂触发是偶发还是反复出现,若反复出现建议更换传感器或调整检测区域\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器存在异常:住户在卧室期间多次短暂报告占用后立即清零,且卧室灯在关闭状态下仍收到亮度调节指令,提示传感器灵敏度或联动逻辑可能存在故障。", "reasoning": ["推理步骤1: 卧室运动传感器(bedroom_occupancy)在 21:24:00 报告 Occupancy=1,仅 45 秒后(21:24:45)就变为 0,随后 21:29:20 再次检测到占用,21:30:10 又清零。这种短时间内反复触发/清除的模式不符合正常人在卧室活动的行为特征(如整理床铺、换衣服等应持续数分钟)。", "推理步骤2: 对比 22:11:24 住户正式进入卧室准备睡觉的场景——传感器报告占用后,住户开灯、关窗帘、锁门,一系列操作持续到 22:31 灯关闭,22:32:14 传感器才报告无人。这才是正常的占用时长模式,说明传感器本身能正常工作,但在 21:24-21:30 期间的短暂触发可能是灵敏度边界问题或传感器视角边缘误触发。", "推理步骤3: 22:31:00 卧室灯被关闭(OnOff=False),但 22:34:00 又收到 LevelControl.CurrentLevel=40 的指令。灯在关闭状态下设置亮度级别,虽然在 Matter 协议中技术上是允许的(预设下次开灯亮度),但结合当时住户已准备入睡的场景,这更可能是自动化规则的逻辑错误,或者是传感器误触发导致的联动异常。", "推理步骤4: 卧室温度传感器(bedroom_temp_sensor)工作正常。全天温度从夜间约 22.0°C 随日照升至中午约 24.9°C,再回落至夜间 22.3°C,变化平滑合理,与客厅/厨房温度趋势一致但始终偏低约 1°C,符合卧室窗帘遮挡和朝向差异的预期。", "推理步骤5: 卧室窗户传感器(bedroom_window_contact)全天无状态变化报告,说明窗户始终保持同一状态,未见异常。综合来看,温度传感器和窗户传感器正常,但运动传感器存在可疑的短时触发模式。"], "key_evidence": ["21:24:00-21:24:45 运动传感器仅 45 秒即从占用变为无人,21:29:20-21:30:10 再次仅约 50 秒即清零,短暂触发模式异常", "22:31:00 卧室灯关闭后,22:34:00 仍收到 LevelControl.CurrentLevel=40 指令,灯关闭状态下的亮度调节指令存在联动逻辑疑问", "对比 22:11:24-22:32:14 正常占用持续约 11 分钟,21:24 时段的超短占用明显偏离正常模式"], "recommended_actions": ["检查卧室运动传感器的安装位置和灵敏度设置,确认是否存在视角边缘误触发(如客厅活动被部分检测到)", "审查与 bedroom_occupancy 关联的自动化规则,排查灯关闭后仍下发亮度指令的逻辑问题", "持续观察数天的运动传感器日志,确认短暂触发是偶发还是反复出现,若反复出现建议更换传感器或调整检测区域"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.253220319747925, "api_error": null} {"episode_id": "SQ1_FP_A_0102", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0102.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260731, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-09T14:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的传感器(温度传感器、运动传感器)工作正常,未发现故障或异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无缺失。数值从凌晨约23.0°C逐步升至中午约25.9°C,再随傍晚降温回落至约23.3°C,符合夏季昼夜温度变化的自然规律。\",\n \"推理步骤2: 客厅温度传感器的读数与同一时刻卧室、厨房温度传感器的趋势高度一致(客厅和厨房接近,卧室略低),三个传感器之间无矛盾性偏差,说明客厅温度传感器读数可信。\",\n \"推理步骤3: 14:44 空调远程开启后,客厅温度出现小幅波动(约25.0°C上下),18:01 住户回家后再次开启空调(制冷模式 SystemMode=3),温度从约24.6°C逐步下降至晚间约23.3°C,空调对温度的影响在传感器读数中得到合理体现。\",\n \"推理步骤4: 客厅运动传感器在18:01:18检测到有人(住户开门进入),20:04:05再次确认有人在客厅,与入户门解锁、玄关灯亮、客厅灯亮等事件时间线吻合,触发时机合理,无误报或漏报迹象。\",\n \"推理步骤5: 温度传感器全天未出现 None 值(厨房传感器在19:06和19:55出现过 None),也未出现突变或不合理跳跃,数据连续性和一致性良好。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点均正常上报,无缺失或 None 值,数值范围 2290-2590(22.9°C-25.9°C)符合夏季室内温度\",\n \"客厅运动传感器在18:01:18和20:04:05的触发与入户门开锁、灯光开启等事件在时间上严格对应,行为逻辑一致\",\n \"空调开启后温度变化方向和幅度合理:14:44开启后温度从约25.3°C小幅下降,18:01制冷模式开启后从24.6°C持续降至23.3°C\"\n ],\n \"recommended_actions\": [\n \"客厅传感器当前无需处理,建议保持定期巡检\",\n \"可关注厨房温度传感器在19:06和19:55出现的 None 值异常,排查该传感器是否存在故障隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的传感器(温度传感器、运动传感器)工作正常,未发现故障或异常。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无缺失。数值从凌晨约23.0°C逐步升至中午约25.9°C,再随傍晚降温回落至约23.3°C,符合夏季昼夜温度变化的自然规律。", "推理步骤2: 客厅温度传感器的读数与同一时刻卧室、厨房温度传感器的趋势高度一致(客厅和厨房接近,卧室略低),三个传感器之间无矛盾性偏差,说明客厅温度传感器读数可信。", "推理步骤3: 14:44 空调远程开启后,客厅温度出现小幅波动(约25.0°C上下),18:01 住户回家后再次开启空调(制冷模式 SystemMode=3),温度从约24.6°C逐步下降至晚间约23.3°C,空调对温度的影响在传感器读数中得到合理体现。", "推理步骤4: 客厅运动传感器在18:01:18检测到有人(住户开门进入),20:04:05再次确认有人在客厅,与入户门解锁、玄关灯亮、客厅灯亮等事件时间线吻合,触发时机合理,无误报或漏报迹象。", "推理步骤5: 温度传感器全天未出现 None 值(厨房传感器在19:06和19:55出现过 None),也未出现突变或不合理跳跃,数据连续性和一致性良好。"], "key_evidence": ["客厅温度传感器全天48个采样点均正常上报,无缺失或 None 值,数值范围 2290-2590(22.9°C-25.9°C)符合夏季室内温度", "客厅运动传感器在18:01:18和20:04:05的触发与入户门开锁、灯光开启等事件在时间上严格对应,行为逻辑一致", "空调开启后温度变化方向和幅度合理:14:44开启后温度从约25.3°C小幅下降,18:01制冷模式开启后从24.6°C持续降至23.3°C"], "recommended_actions": ["客厅传感器当前无需处理,建议保持定期巡检", "可关注厨房温度传感器在19:06和19:55出现的 None 值异常,排查该传感器是否存在故障隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.58224368095398, "api_error": null} {"episode_id": "SQ1_FP_A_0109", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0109.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20260738, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-03T17:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调运行期间出现周期性异常回升,疑似传感器采样或报告故障。\",\n \"reasoning\": [\n \"推理步骤1: 客厅空调于 17:44 首次开启,18:25 住户回家后再次确认开启并设为制冷模式(SystemMode=3)。从 18:30 起客厅温度整体呈下降趋势,这是正常的。\",\n \"推理步骤2: 但在空调持续运行期间,温度传感器出现了三次明显的逆趋势回升——18:14 读数 2502(前值 2459)、18:44 读数 2498(前值 2451)、19:14 读数 2501(前值 2425)。每次回升幅度约 40-75 个单位(约 0.4-0.75°C),且间隔恰好为 30 分钟。\",\n \"推理步骤3: 这些回升发生在空调制冷运行、室内无额外热源的条件下,且卧室和厨房传感器在同时段并未出现类似的周期性逆向波动,说明这不是环境因素导致的。\",\n \"推理步骤4: 三次异常回升的时间间隔高度规律(均为 30 分钟整),且回升值都集中在 2498-2502 范围,像是传感器在正常采样之间插入了一个固定或延迟的读数,可能是固件 bug 导致的重复上报旧缓存值,或传感器自身校准周期干扰了实时测量。\",\n \"推理步骤5: 客厅运动传感器和客厅灯等其他设备工作正常,住户活动轨迹合理,因此问题定位在温度传感器本身。\"\n ],\n \"key_evidence\": [\n \"18:00 温度 2459 → 18:14 异常回升至 2502,随后 18:30 回落至 2451\",\n \"18:30 温度 2451 → 18:44 异常回升至 2498,随后 19:00 回落至 2425\",\n \"19:00 温度 2425 → 19:14 异常回升至 2501,随后 19:30 回落至 2444\",\n \"三次异常回升间隔均为 30 分钟,回升值高度一致(约 2500),呈现非自然的周期性模式\",\n \"同时段卧室和厨房传感器无类似异常波动,排除环境因素\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器固件版本,确认是否存在已知的缓存值重复上报 bug,必要时升级固件\",\n \"对比传感器的上报时间戳与实际采样时间戳,确认是否存在旧数据延迟推送的问题\",\n \"短期内可在自动化规则中过滤掉这些周期性异常尖峰,避免空调控制逻辑受干扰\",\n \"若固件更新后问题持续,考虑更换该温度传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调运行期间出现周期性异常回升,疑似传感器采样或报告故障。", "reasoning": ["推理步骤1: 客厅空调于 17:44 首次开启,18:25 住户回家后再次确认开启并设为制冷模式(SystemMode=3)。从 18:30 起客厅温度整体呈下降趋势,这是正常的。", "推理步骤2: 但在空调持续运行期间,温度传感器出现了三次明显的逆趋势回升——18:14 读数 2502(前值 2459)、18:44 读数 2498(前值 2451)、19:14 读数 2501(前值 2425)。每次回升幅度约 40-75 个单位(约 0.4-0.75°C),且间隔恰好为 30 分钟。", "推理步骤3: 这些回升发生在空调制冷运行、室内无额外热源的条件下,且卧室和厨房传感器在同时段并未出现类似的周期性逆向波动,说明这不是环境因素导致的。", "推理步骤4: 三次异常回升的时间间隔高度规律(均为 30 分钟整),且回升值都集中在 2498-2502 范围,像是传感器在正常采样之间插入了一个固定或延迟的读数,可能是固件 bug 导致的重复上报旧缓存值,或传感器自身校准周期干扰了实时测量。", "推理步骤5: 客厅运动传感器和客厅灯等其他设备工作正常,住户活动轨迹合理,因此问题定位在温度传感器本身。"], "key_evidence": ["18:00 温度 2459 → 18:14 异常回升至 2502,随后 18:30 回落至 2451", "18:30 温度 2451 → 18:44 异常回升至 2498,随后 19:00 回落至 2425", "19:00 温度 2425 → 19:14 异常回升至 2501,随后 19:30 回落至 2444", "三次异常回升间隔均为 30 分钟,回升值高度一致(约 2500),呈现非自然的周期性模式", "同时段卧室和厨房传感器无类似异常波动,排除环境因素"], "recommended_actions": ["检查客厅温度传感器固件版本,确认是否存在已知的缓存值重复上报 bug,必要时升级固件", "对比传感器的上报时间戳与实际采样时间戳,确认是否存在旧数据延迟推送的问题", "短期内可在自动化规则中过滤掉这些周期性异常尖峰,避免空调控制逻辑受干扰", "若固件更新后问题持续,考虑更换该温度传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.62675404548645, "api_error": null} {"episode_id": "SQ1_FP_A_0113", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0113.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260742, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-09T15:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器存在异常跳变现象,在无人且无设备运行的空房间内多次出现突发性温度飙升,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度在凌晨00:00至05:30期间稳定在21.91°C~22.10°C范围内,波动极小(约0.2°C),这是正常的夜间无人房间表现。\",\n \"推理步骤2: 从06:00开始,卧室温度随日间升温自然上升,与客厅、厨房趋势一致,到12:00达到约24.90°C,这属于正常的日间温升。\",\n \"推理步骤3: 住户07:13出门后家中无人,但在15:24卧室温度突然从24.21°C跳升至25.00°C,而同一时刻客厅(25.12°C)和厨房(25.24°C)并无类似突变。此时空调刚开启且在客厅,不可能导致卧室瞬间升温。\",\n \"推理步骤4: 类似的异常跳变在15:54(25.02°C)、16:24(24.98°C)、16:54(25.01°C)反复出现,呈现约30分钟一次的周期性脉冲式跳变,每次都从正常的~24°C突然跳到~25°C,然后在下一个常规读数时回落。\",\n \"推理步骤5: 这些异常读数出现在常规30分钟采样间隔之外(:24和:54分),说明传感器在非标准时间点触发了额外上报,这本身就是异常行为。\",\n \"推理步骤6: 对比同期客厅和厨房传感器,它们的温度变化平滑连续,没有出现类似的脉冲式跳变,排除了环境因素导致的可能性。\",\n \"推理步骤7: 卧室在此期间无人(住户07:13出门,18:13回家),窗帘在06:27已打开(0%),窗户传感器无开关记录,没有任何外部因素能解释这种突发温升。\"\n ],\n \"key_evidence\": [\n \"15:24 卧室温度从常规趋势的~24.13°C突跳至25.00°C,而客厅和厨房无对应突变\",\n \"15:54、16:24、16:54 连续出现类似的脉冲式跳变(25.02°C、24.98°C、25.01°C),均约为25.00°C\",\n \"这些异常读数出现在非标准采样时间点(:24和:54分),正常采样为整点和:30分\",\n \"异常期间卧室无人、无设备运行,排除人为或设备热源影响\"\n ],\n \"recommended_actions\": [\n \"检查卧室温度传感器硬件状态,重点排查传感器接线松动或元件老化导致的间歇性读数跳变\",\n \"观察该传感器是否持续在非标准时间点(:24/:54)上报数据,确认是否存在固件异常触发额外采样的问题\",\n \"尝试重启或重置卧室温度传感器,观察异常跳变是否消失\",\n \"如问题持续,建议更换传感器或联系厂商检查固件版本是否需要更新\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卧室温度传感器存在异常跳变现象,在无人且无设备运行的空房间内多次出现突发性温度飙升,疑似传感器故障。", "reasoning": ["推理步骤1: 卧室温度在凌晨00:00至05:30期间稳定在21.91°C~22.10°C范围内,波动极小(约0.2°C),这是正常的夜间无人房间表现。", "推理步骤2: 从06:00开始,卧室温度随日间升温自然上升,与客厅、厨房趋势一致,到12:00达到约24.90°C,这属于正常的日间温升。", "推理步骤3: 住户07:13出门后家中无人,但在15:24卧室温度突然从24.21°C跳升至25.00°C,而同一时刻客厅(25.12°C)和厨房(25.24°C)并无类似突变。此时空调刚开启且在客厅,不可能导致卧室瞬间升温。", "推理步骤4: 类似的异常跳变在15:54(25.02°C)、16:24(24.98°C)、16:54(25.01°C)反复出现,呈现约30分钟一次的周期性脉冲式跳变,每次都从正常的~24°C突然跳到~25°C,然后在下一个常规读数时回落。", "推理步骤5: 这些异常读数出现在常规30分钟采样间隔之外(:24和:54分),说明传感器在非标准时间点触发了额外上报,这本身就是异常行为。", "推理步骤6: 对比同期客厅和厨房传感器,它们的温度变化平滑连续,没有出现类似的脉冲式跳变,排除了环境因素导致的可能性。", "推理步骤7: 卧室在此期间无人(住户07:13出门,18:13回家),窗帘在06:27已打开(0%),窗户传感器无开关记录,没有任何外部因素能解释这种突发温升。"], "key_evidence": ["15:24 卧室温度从常规趋势的~24.13°C突跳至25.00°C,而客厅和厨房无对应突变", "15:54、16:24、16:54 连续出现类似的脉冲式跳变(25.02°C、24.98°C、25.01°C),均约为25.00°C", "这些异常读数出现在非标准采样时间点(:24和:54分),正常采样为整点和:30分", "异常期间卧室无人、无设备运行,排除人为或设备热源影响"], "recommended_actions": ["检查卧室温度传感器硬件状态,重点排查传感器接线松动或元件老化导致的间歇性读数跳变", "观察该传感器是否持续在非标准时间点(:24/:54)上报数据,确认是否存在固件异常触发额外采样的问题", "尝试重启或重置卧室温度传感器,观察异常跳变是否消失", "如问题持续,建议更换传感器或联系厂商检查固件版本是否需要更新"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.301379919052124, "api_error": null} {"episode_id": "SQ1_FP_A_0118", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0118.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20260747, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-26T18:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调运行期间出现周期性异常回升,疑似传感器读数漂移或安装位置受干扰。\",\n \"reasoning\": [\n \"推理步骤1: 客厅空调于 18:13 开启(后于 18:21 再次确认开启,制冷模式 SystemMode=3),温度从 2500 开始整体下降趋势符合预期。\",\n \"推理步骤2: 但在空调持续运行期间,温度出现多次异常回升——18:30 降至 2454,18:43 突然回升至 2502;19:00 降至 2443,19:13 又回升至 2498;19:30 降至 2444,19:43 再次回升至 2501。回升幅度约 50-60(即 0.5-0.6°C),呈现约 30 分钟的周期性锯齿波动。\",\n \"推理步骤3: 同时段卧室和厨房温度传感器均呈平稳单调下降趋势,没有类似的周期性波动,说明这不是环境温度的真实变化。\",\n \"推理步骤4: 这种周期性回升模式更像是传感器自身问题——可能是安装位置靠近空调出风口导致冷热气流交替影响,或传感器存在间歇性读数漂移。\",\n \"推理步骤5: 客厅运动传感器和占用传感器工作正常(18:21 检测到人进入,19:59 仍检测到占用),无异常。客厅其他设备(主灯、台灯、窗帘)在日志中的行为也符合正常使用模式。\"\n ],\n \"key_evidence\": [\n \"空调制冷运行期间,客厅温度在 18:30→18:43、19:00→19:13、19:30→19:43 三次出现约 50-60 单位的异常回升(2454→2502、2443→2498、2444→2501)\",\n \"同时段卧室温度从 2354 单调下降至 2316,厨房温度(排除做饭时段)也呈单调下降,均无类似波动\",\n \"回升呈现约 13-15 分钟间隔的周期性规律,不符合自然温度变化特征\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的安装位置,确认是否受空调出风口直吹或阳光直射等干扰\",\n \"对比其他房间传感器读数,对客厅温度传感器进行校准测试\",\n \"如问题持续,考虑更换传感器或调整安装位置至更能代表室温的区域\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调运行期间出现周期性异常回升,疑似传感器读数漂移或安装位置受干扰。", "reasoning": ["推理步骤1: 客厅空调于 18:13 开启(后于 18:21 再次确认开启,制冷模式 SystemMode=3),温度从 2500 开始整体下降趋势符合预期。", "推理步骤2: 但在空调持续运行期间,温度出现多次异常回升——18:30 降至 2454,18:43 突然回升至 2502;19:00 降至 2443,19:13 又回升至 2498;19:30 降至 2444,19:43 再次回升至 2501。回升幅度约 50-60(即 0.5-0.6°C),呈现约 30 分钟的周期性锯齿波动。", "推理步骤3: 同时段卧室和厨房温度传感器均呈平稳单调下降趋势,没有类似的周期性波动,说明这不是环境温度的真实变化。", "推理步骤4: 这种周期性回升模式更像是传感器自身问题——可能是安装位置靠近空调出风口导致冷热气流交替影响,或传感器存在间歇性读数漂移。", "推理步骤5: 客厅运动传感器和占用传感器工作正常(18:21 检测到人进入,19:59 仍检测到占用),无异常。客厅其他设备(主灯、台灯、窗帘)在日志中的行为也符合正常使用模式。"], "key_evidence": ["空调制冷运行期间,客厅温度在 18:30→18:43、19:00→19:13、19:30→19:43 三次出现约 50-60 单位的异常回升(2454→2502、2443→2498、2444→2501)", "同时段卧室温度从 2354 单调下降至 2316,厨房温度(排除做饭时段)也呈单调下降,均无类似波动", "回升呈现约 13-15 分钟间隔的周期性规律,不符合自然温度变化特征"], "recommended_actions": ["检查客厅温度传感器的安装位置,确认是否受空调出风口直吹或阳光直射等干扰", "对比其他房间传感器读数,对客厅温度传感器进行校准测试", "如问题持续,考虑更换传感器或调整安装位置至更能代表室温的区域"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.051714181900024, "api_error": null} {"episode_id": "SQ1_FP_A_0119", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0119.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20260748, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-01T06:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"卧室区域传感器工作正常,所有数据符合预期模式。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器全天持续每30分钟上报一次数据,无缺失、无 None 值。夜间(00:00-05:30)稳定在 21.9-22.1°C,白天随外温升高至最高 24.8°C,傍晚后逐步回落,曲线平滑合理,无异常跳变。\",\n \"推理步骤2: 卧室运动传感器在 06:23 检测到住户起床(Occupancy=1),随后在 06:37 离开卧室去卫生间,06:42 和 06:47 短暂回卧室取物(各持续不到1分钟),符合晨起活动模式。晚间 21:47 检测到住户回到卧室,22:41 之后 Occupancy 归零,与关灯就寝时间吻合。白天住户外出期间(07:27-18:07)卧室无任何占用事件,完全合理。\",\n \"推理步骤3: 卧室窗帘在 06:23 被打开(LiftPercent100ths=0,即全开),晚间 21:47 被关闭(LiftPercent100ths=10000,即全关),与起床/就寝节奏一致。\",\n \"推理步骤4: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,无异常开启。\",\n \"推理步骤5: 卧室灯在 06:23 开启、07:27 外出时关闭、21:47 回卧室时再次开启、22:17 调暗至 Level=27(约10%亮度,睡前阅读场景)、22:41 关闭,整个使用模式完全符合正常生活习惯。\",\n \"推理步骤6: 综合来看,卧室所有传感器(温度、运动、窗帘、窗户接触、灯光)的数据上报频率正常、数值范围合理、设备间联动逻辑一致,未发现传感器故障、数据丢失或异常行为。\"\n ],\n \"key_evidence\": [\n \"温度传感器全天48个采样点均正常上报,无 None 值或异常跳变,日变化曲线(21.9°C → 24.8°C → 22.4°C)平滑合理\",\n \"运动传感器的占用/离开事件与灯光开关、窗帘动作、门锁事件在时间上高度吻合,设备间状态一致性良好\",\n \"窗户接触传感器全天无变化事件,窗户保持关闭,无异常\",\n \"灯光亮度调节(22:17 调暗至 Level=27)体现了正常的睡前行为模式\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,卧室区域所有传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "卧室区域传感器工作正常,所有数据符合预期模式。", "reasoning": ["推理步骤1: 卧室温度传感器全天持续每30分钟上报一次数据,无缺失、无 None 值。夜间(00:00-05:30)稳定在 21.9-22.1°C,白天随外温升高至最高 24.8°C,傍晚后逐步回落,曲线平滑合理,无异常跳变。", "推理步骤2: 卧室运动传感器在 06:23 检测到住户起床(Occupancy=1),随后在 06:37 离开卧室去卫生间,06:42 和 06:47 短暂回卧室取物(各持续不到1分钟),符合晨起活动模式。晚间 21:47 检测到住户回到卧室,22:41 之后 Occupancy 归零,与关灯就寝时间吻合。白天住户外出期间(07:27-18:07)卧室无任何占用事件,完全合理。", "推理步骤3: 卧室窗帘在 06:23 被打开(LiftPercent100ths=0,即全开),晚间 21:47 被关闭(LiftPercent100ths=10000,即全关),与起床/就寝节奏一致。", "推理步骤4: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,无异常开启。", "推理步骤5: 卧室灯在 06:23 开启、07:27 外出时关闭、21:47 回卧室时再次开启、22:17 调暗至 Level=27(约10%亮度,睡前阅读场景)、22:41 关闭,整个使用模式完全符合正常生活习惯。", "推理步骤6: 综合来看,卧室所有传感器(温度、运动、窗帘、窗户接触、灯光)的数据上报频率正常、数值范围合理、设备间联动逻辑一致,未发现传感器故障、数据丢失或异常行为。"], "key_evidence": ["温度传感器全天48个采样点均正常上报,无 None 值或异常跳变,日变化曲线(21.9°C → 24.8°C → 22.4°C)平滑合理", "运动传感器的占用/离开事件与灯光开关、窗帘动作、门锁事件在时间上高度吻合,设备间状态一致性良好", "窗户接触传感器全天无变化事件,窗户保持关闭,无异常", "灯光亮度调节(22:17 调暗至 Level=27)体现了正常的睡前行为模式"], "recommended_actions": ["无需采取任何措施,卧室区域所有传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.5611515045166, "api_error": null} {"episode_id": "SQ1_FP_A_0120", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0120.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20260749, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-08T13:12:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器在住户外出期间出现短暂、反复的误触发,疑似传感器故障或灵敏度异常。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器工作正常——夜间约22.0°C,午间峰值约24.8°C,随室外气温自然升降,与客厅/厨房趋势一致,无异常跳变或丢数据(未出现 None),判定温度传感器正常。\",\n \"推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,传感器本身未报异常,判定正常。\",\n \"推理步骤3: 卧室运动传感器在 13:12:00 和 13:17:20 出现了两次短暂触发(分别持续约45秒和50秒),但此时住户已于 07:18 出门且门锁已自动上锁,家中无人。直到 18:25 住户才回家。\",\n \"推理步骤4: 在无人在家的时段,卧室不应有运动事件。两次触发间隔约5分钟,持续时间极短,不符合人类活动模式(真正的入侵者活动通常持续更长且会触发更多设备)。\",\n \"推理步骤5: 入户门锁在此期间无任何开锁事件,门传感器也无开关记录,客厅运动传感器同样无触发,排除有人从正门进入的可能性。卧室窗户传感器也未报告开启,排除窗户入侵。\",\n \"推理步骤6: 综合判断,这两次短暂触发更可能是传感器误报(如灵敏度过高、宠物/昆虫干扰、温度变化导致的红外误检测等),而非真实入侵。属于设备层面的异常。\"\n ],\n \"key_evidence\": [\n \"13:12:00 卧室运动传感器触发 Occupancy=1,13:12:45 恢复为0(住户07:18已离家)\",\n \"13:17:20 卧室运动传感器再次触发 Occupancy=1,13:18:10 恢复为0\",\n \"07:18:16 入户门锁已自动上锁(LockState=1),18:25:00 才再次开锁,期间无任何门锁/门传感器事件\",\n \"同时段客厅运动传感器无触发,卧室窗户传感器无开启记录\"\n ],\n \"recommended_actions\": [\n \"检查卧室运动传感器的灵敏度设置,适当降低灵敏度以减少误报\",\n \"排查卧室内是否有可能触发红外传感器的因素(宠物、窗帘随风摆动、阳光直射等)\",\n \"持续观察后续几天该传感器在无人时段是否仍有类似误触发,若频繁出现建议更换传感器\",\n \"可考虑增加联动规则:无人在家时卧室运动传感器触发需同时满足其他条件(如门窗开启)才发出入侵警报,避免误报扰民\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器在住户外出期间出现短暂、反复的误触发,疑似传感器故障或灵敏度异常。", "reasoning": ["推理步骤1: 卧室温度传感器工作正常——夜间约22.0°C,午间峰值约24.8°C,随室外气温自然升降,与客厅/厨房趋势一致,无异常跳变或丢数据(未出现 None),判定温度传感器正常。", "推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,传感器本身未报异常,判定正常。", "推理步骤3: 卧室运动传感器在 13:12:00 和 13:17:20 出现了两次短暂触发(分别持续约45秒和50秒),但此时住户已于 07:18 出门且门锁已自动上锁,家中无人。直到 18:25 住户才回家。", "推理步骤4: 在无人在家的时段,卧室不应有运动事件。两次触发间隔约5分钟,持续时间极短,不符合人类活动模式(真正的入侵者活动通常持续更长且会触发更多设备)。", "推理步骤5: 入户门锁在此期间无任何开锁事件,门传感器也无开关记录,客厅运动传感器同样无触发,排除有人从正门进入的可能性。卧室窗户传感器也未报告开启,排除窗户入侵。", "推理步骤6: 综合判断,这两次短暂触发更可能是传感器误报(如灵敏度过高、宠物/昆虫干扰、温度变化导致的红外误检测等),而非真实入侵。属于设备层面的异常。"], "key_evidence": ["13:12:00 卧室运动传感器触发 Occupancy=1,13:12:45 恢复为0(住户07:18已离家)", "13:17:20 卧室运动传感器再次触发 Occupancy=1,13:18:10 恢复为0", "07:18:16 入户门锁已自动上锁(LockState=1),18:25:00 才再次开锁,期间无任何门锁/门传感器事件", "同时段客厅运动传感器无触发,卧室窗户传感器无开启记录"], "recommended_actions": ["检查卧室运动传感器的灵敏度设置,适当降低灵敏度以减少误报", "排查卧室内是否有可能触发红外传感器的因素(宠物、窗帘随风摆动、阳光直射等)", "持续观察后续几天该传感器在无人时段是否仍有类似误触发,若频繁出现建议更换传感器", "可考虑增加联动规则:无人在家时卧室运动传感器触发需同时满足其他条件(如门窗开启)才发出入侵警报,避免误报扰民"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.946014165878296, "api_error": null} {"episode_id": "SQ1_FP_B_0082", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0082.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20260711, "scenario_id": "DF-03", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-11T22:07:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 1.8937411308288574, "api_error": "400 Client Error: Bad Request for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ1_FP_A_0125", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_A_0125.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260754, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-22T13:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器在住户外出期间出现短暂、反复的误触发,疑似传感器故障或灵敏度异常。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器全天工作正常——夜间约21.9°C,午间峰值约24.8°C,变化平滑且与客厅/厨房趋势一致,无异常跳变或丢数据(无 None 值),排除温度传感器故障。\",\n \"推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,工作正常。\",\n \"推理步骤3: 卧室运动传感器在 13:09:00~13:15:10 期间出现两次短暂触发(13:09:00→13:09:45 持续45秒,13:14:20→13:15:10 持续50秒),但此时住户已于 07:26 出门且门锁已自动上锁,家中应无人。\",\n \"推理步骤4: 这两次触发间隔约5分钟,持续时间极短,不符合真人活动模式(无灯光开启、无门锁解锁、无其他区域联动),也不符合入侵特征(入侵者通常会触发更多设备或持续活动)。\",\n \"推理步骤5: 更可能的解释是传感器灵敏度过高导致误触发(如阳光直射变化、窗帘随风微动、小动物等),属于设备故障/配置问题而非安全威胁。\"\n ],\n \"key_evidence\": [\n \"住户 07:26 出门并锁门,直到 18:21 才回家,期间门锁未被解锁\",\n \"13:09:00 和 13:14:20 卧室运动传感器两次短暂触发(各不到1分钟),无任何其他设备联动(无灯光、无门锁、无其他区域运动)\",\n \"卧室温度传感器和窗户传感器全天数据正常,无异常\"\n ],\n \"recommended_actions\": [\n \"检查卧室运动传感器的灵敏度设置,适当降低灵敏度以减少误报\",\n \"确认卧室是否有阳光直射、窗帘随风摆动或宠物等可能触发传感器的因素\",\n \"如误触发持续出现,考虑更换传感器或调整安装位置/角度\",\n \"可在自动化规则中增加「住户离家模式下运动传感器触发需持续一定时长才告警」的过滤逻辑,减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器在住户外出期间出现短暂、反复的误触发,疑似传感器故障或灵敏度异常。", "reasoning": ["推理步骤1: 卧室温度传感器全天工作正常——夜间约21.9°C,午间峰值约24.8°C,变化平滑且与客厅/厨房趋势一致,无异常跳变或丢数据(无 None 值),排除温度传感器故障。", "推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,工作正常。", "推理步骤3: 卧室运动传感器在 13:09:00~13:15:10 期间出现两次短暂触发(13:09:00→13:09:45 持续45秒,13:14:20→13:15:10 持续50秒),但此时住户已于 07:26 出门且门锁已自动上锁,家中应无人。", "推理步骤4: 这两次触发间隔约5分钟,持续时间极短,不符合真人活动模式(无灯光开启、无门锁解锁、无其他区域联动),也不符合入侵特征(入侵者通常会触发更多设备或持续活动)。", "推理步骤5: 更可能的解释是传感器灵敏度过高导致误触发(如阳光直射变化、窗帘随风微动、小动物等),属于设备故障/配置问题而非安全威胁。"], "key_evidence": ["住户 07:26 出门并锁门,直到 18:21 才回家,期间门锁未被解锁", "13:09:00 和 13:14:20 卧室运动传感器两次短暂触发(各不到1分钟),无任何其他设备联动(无灯光、无门锁、无其他区域运动)", "卧室温度传感器和窗户传感器全天数据正常,无异常"], "recommended_actions": ["检查卧室运动传感器的灵敏度设置,适当降低灵敏度以减少误报", "确认卧室是否有阳光直射、窗帘随风摆动或宠物等可能触发传感器的因素", "如误触发持续出现,考虑更换传感器或调整安装位置/角度", "可在自动化规则中增加「住户离家模式下运动传感器触发需持续一定时长才告警」的过滤逻辑,减少误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.20514440536499, "api_error": null} {"episode_id": "SQ1_FP_B_0088", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0088.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20260717, "scenario_id": "DF-03", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-10T15:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"次卧传感器工作正常,温度和运动数据均在合理范围内\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器全天每30分钟稳定上报数据,无缺失或 None 值。温度从夜间约22.9°C逐步升至中午峰值约25.7°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化曲线。\",\n \"推理步骤2: 次卧温度与同时段客厅、主卧、厨房温度高度一致,各房间温差始终在1°C以内,不存在单个传感器偏移或漂移的迹象。\",\n \"推理步骤3: 次卧运动传感器在15:11和15:16出现两次短暂的占用检测(各持续不到1分钟),时间点在白天下午,且住户已于07:10出门。这种短时触发可能是宠物活动、窗帘被风吹动等常见原因,属于正常的间歇性触发,不构成入侵特征(入侵通常伴随门窗传感器变化、持续运动等关联事件)。\",\n \"推理步骤4: 次卧窗户传感器全天无状态变化报告,说明窗户保持关闭状态,排除了外部入侵的可能性。\",\n \"推理步骤5: 综合来看,次卧的温度传感器和运动传感器均按预期工作,数据连续、合理,无设备故障特征(如数据缺失、异常跳变、持续离线等)。\"\n ],\n \"key_evidence\": [\n \"温度传感器全天48个采样点均正常上报,数值在2292-2572范围内(约22.9°C-25.7°C),与其他房间一致\",\n \"运动传感器15:11和15:16的两次短暂触发(各约45-50秒)为孤立事件,无门窗开启、灯光变化等关联异常事件\",\n \"次卧窗户传感器全天无变化,窗户保持关闭\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,所有传感器工作正常\",\n \"如对下午短暂运动触发有疑虑,可查看是否有宠物或确认是否为传感器灵敏度过高,必要时调整运动传感器灵敏度阈值\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "次卧传感器工作正常,温度和运动数据均在合理范围内", "reasoning": ["推理步骤1: 次卧温度传感器全天每30分钟稳定上报数据,无缺失或 None 值。温度从夜间约22.9°C逐步升至中午峰值约25.7°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化曲线。", "推理步骤2: 次卧温度与同时段客厅、主卧、厨房温度高度一致,各房间温差始终在1°C以内,不存在单个传感器偏移或漂移的迹象。", "推理步骤3: 次卧运动传感器在15:11和15:16出现两次短暂的占用检测(各持续不到1分钟),时间点在白天下午,且住户已于07:10出门。这种短时触发可能是宠物活动、窗帘被风吹动等常见原因,属于正常的间歇性触发,不构成入侵特征(入侵通常伴随门窗传感器变化、持续运动等关联事件)。", "推理步骤4: 次卧窗户传感器全天无状态变化报告,说明窗户保持关闭状态,排除了外部入侵的可能性。", "推理步骤5: 综合来看,次卧的温度传感器和运动传感器均按预期工作,数据连续、合理,无设备故障特征(如数据缺失、异常跳变、持续离线等)。"], "key_evidence": ["温度传感器全天48个采样点均正常上报,数值在2292-2572范围内(约22.9°C-25.7°C),与其他房间一致", "运动传感器15:11和15:16的两次短暂触发(各约45-50秒)为孤立事件,无门窗开启、灯光变化等关联异常事件", "次卧窗户传感器全天无变化,窗户保持关闭"], "recommended_actions": ["无需采取措施,所有传感器工作正常", "如对下午短暂运动触发有疑虑,可查看是否有宠物或确认是否为传感器灵敏度过高,必要时调整运动传感器灵敏度阈值"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.03503441810608, "api_error": null} {"episode_id": "SQ1_FP_B_0092", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0092.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260721, "scenario_id": "DF-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-30T18:45:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 1.145761251449585, "api_error": "400 Client Error: Bad Request for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ1_FP_B_0090", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0090.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260719, "scenario_id": "DF-03", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-18T16:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧在住户外出期间出现短暂、反复的运动检测事件,且无任何关联的人为活动佐证,疑似运动传感器误触发。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:21 通过入户门手动开锁离家,门锁随后自动上锁,此后家中应无人直到 18:14 住户回家。\",\n \"推理步骤2: 在 16:10:00~16:16:10 期间,次卧运动传感器连续触发了两次短暂的占用事件(16:10:00→16:10:45 持续45秒,16:15:20→16:16:10 持续50秒),而此时入户门仍处于锁定状态,门传感器未报告开门。\",\n \"推理步骤3: 这两次运动事件没有任何关联行为支撑——次卧灯未开启、窗帘未动、窗户传感器无变化、其他房间运动传感器均无触发,说明并非真人在室内活动。\",\n \"推理步骤4: 16:17 住户才通过入户门回家(手动开锁+门传感器触发+玄关运动传感器触发),时间上晚于次卧运动事件约1分钟,且住户回家后触发的是玄关传感器而非次卧传感器,进一步排除是住户本人触发。\",\n \"推理步骤5: 次卧温度传感器全天数据与其他房间高度一致,变化趋势正常(夜间约23°C,午间峰值约25.7°C),无异常读数或数据缺失,温度传感器工作正常。\",\n \"推理步骤6: 次卧窗户传感器全天无状态变化报告,说明窗户始终保持关闭,排除外部入侵可能。\",\n \"推理步骤7: 综合判断,运动传感器的两次短暂误触发更可能是传感器本身的问题(如对热源变化、光线变化或电磁干扰的误检测),而非真实入侵或人员活动。\"\n ],\n \"key_evidence\": [\n \"16:10:00 和 16:15:20 次卧运动传感器两次短暂触发(各持续不到1分钟),发生在住户外出、入户门锁定期间\",\n \"两次运动事件期间,次卧灯、窗帘、窗户传感器均无任何状态变化\",\n \"其他房间(客厅、主卧、玄关)的运动传感器在同一时段均无触发\",\n \"入户门直到 16:17 才被手动开锁,晚于次卧运动事件,且触发的是玄关传感器\",\n \"次卧温度传感器全天数据正常,无异常波动或缺失\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否对准窗户方向(午后阳光直射可能导致PIR传感器误触发)\",\n \"查看传感器灵敏度设置,适当降低灵敏度以减少误报\",\n \"持续观察该传感器是否在无人时段反复出现类似短暂触发,若频繁发生建议更换传感器或进行固件更新\",\n \"可考虑增加一段延迟确认逻辑(如占用持续超过2分钟才报警),过滤掉此类瞬时误触发\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧在住户外出期间出现短暂、反复的运动检测事件,且无任何关联的人为活动佐证,疑似运动传感器误触发。", "reasoning": ["推理步骤1: 住户于 07:21 通过入户门手动开锁离家,门锁随后自动上锁,此后家中应无人直到 18:14 住户回家。", "推理步骤2: 在 16:10:00~16:16:10 期间,次卧运动传感器连续触发了两次短暂的占用事件(16:10:00→16:10:45 持续45秒,16:15:20→16:16:10 持续50秒),而此时入户门仍处于锁定状态,门传感器未报告开门。", "推理步骤3: 这两次运动事件没有任何关联行为支撑——次卧灯未开启、窗帘未动、窗户传感器无变化、其他房间运动传感器均无触发,说明并非真人在室内活动。", "推理步骤4: 16:17 住户才通过入户门回家(手动开锁+门传感器触发+玄关运动传感器触发),时间上晚于次卧运动事件约1分钟,且住户回家后触发的是玄关传感器而非次卧传感器,进一步排除是住户本人触发。", "推理步骤5: 次卧温度传感器全天数据与其他房间高度一致,变化趋势正常(夜间约23°C,午间峰值约25.7°C),无异常读数或数据缺失,温度传感器工作正常。", "推理步骤6: 次卧窗户传感器全天无状态变化报告,说明窗户始终保持关闭,排除外部入侵可能。", "推理步骤7: 综合判断,运动传感器的两次短暂误触发更可能是传感器本身的问题(如对热源变化、光线变化或电磁干扰的误检测),而非真实入侵或人员活动。"], "key_evidence": ["16:10:00 和 16:15:20 次卧运动传感器两次短暂触发(各持续不到1分钟),发生在住户外出、入户门锁定期间", "两次运动事件期间,次卧灯、窗帘、窗户传感器均无任何状态变化", "其他房间(客厅、主卧、玄关)的运动传感器在同一时段均无触发", "入户门直到 16:17 才被手动开锁,晚于次卧运动事件,且触发的是玄关传感器", "次卧温度传感器全天数据正常,无异常波动或缺失"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否对准窗户方向(午后阳光直射可能导致PIR传感器误触发)", "查看传感器灵敏度设置,适当降低灵敏度以减少误报", "持续观察该传感器是否在无人时段反复出现类似短暂触发,若频繁发生建议更换传感器或进行固件更新", "可考虑增加一段延迟确认逻辑(如占用持续超过2分钟才报警),过滤掉此类瞬时误触发"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.680367708206177, "api_error": null} {"episode_id": "SQ1_FP_B_0096", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0096.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260725, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "second_bedroom", "injection_time": "2026-06-04T10:00:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧温度传感器在10:00-11:30期间出现双重读数,且第二组读数与环境温度趋势严重偏离,疑似传感器故障或数据上报异常。\",\n \"reasoning\": [\n \"推理步骤1: 从10:00开始,second_bedroom_temp_sensor在同一时间戳出现两次不同的温度读数。例如10:00同时报告2514和2500,10:30报告2513和2502,11:00报告2553和2498,11:30报告2559和2501。\",\n \"推理步骤2: 第二组读数(2500、2502、2498、2501)几乎恒定在25.00°C附近,与同期其他房间温度持续上升的趋势完全不符(其他房间从25°C升至25.5°C以上)。\",\n \"推理步骤3: 正常传感器在同一采样周期内不应产生两个不同的测量值。这种双重上报行为在其他三个温度传感器上均未出现。\",\n \"推理步骤4: 12:00之后该异常消失,传感器恢复正常单次上报,说明这是一个间歇性故障,可能与固件bug、通信干扰或传感器硬件间歇性失灵有关。\"\n ],\n \"key_evidence\": [\n \"10:00-11:30期间second_bedroom_temp_sensor每个采样点出现两次读数(如10:00: 2514和2500,11:00: 2553和2498)\",\n \"第二组读数恒定在~2500,与全屋升温趋势不一致,疑似传感器回报了一个固定的默认值或缓存值\",\n \"该异常仅出现在次卧传感器上,其他房间传感器同期工作正常\"\n ],\n \"recommended_actions\": [\n \"检查次卧温度传感器固件版本,考虑升级或重置设备\",\n \"检查该传感器的Matter通信链路是否存在干扰或丢包重传问题\",\n \"持续监控该传感器,若双重上报再次出现则考虑更换硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧温度传感器在10:00-11:30期间出现双重读数,且第二组读数与环境温度趋势严重偏离,疑似传感器故障或数据上报异常。", "reasoning": ["推理步骤1: 从10:00开始,second_bedroom_temp_sensor在同一时间戳出现两次不同的温度读数。例如10:00同时报告2514和2500,10:30报告2513和2502,11:00报告2553和2498,11:30报告2559和2501。", "推理步骤2: 第二组读数(2500、2502、2498、2501)几乎恒定在25.00°C附近,与同期其他房间温度持续上升的趋势完全不符(其他房间从25°C升至25.5°C以上)。", "推理步骤3: 正常传感器在同一采样周期内不应产生两个不同的测量值。这种双重上报行为在其他三个温度传感器上均未出现。", "推理步骤4: 12:00之后该异常消失,传感器恢复正常单次上报,说明这是一个间歇性故障,可能与固件bug、通信干扰或传感器硬件间歇性失灵有关。"], "key_evidence": ["10:00-11:30期间second_bedroom_temp_sensor每个采样点出现两次读数(如10:00: 2514和2500,11:00: 2553和2498)", "第二组读数恒定在~2500,与全屋升温趋势不一致,疑似传感器回报了一个固定的默认值或缓存值", "该异常仅出现在次卧传感器上,其他房间传感器同期工作正常"], "recommended_actions": ["检查次卧温度传感器固件版本,考虑升级或重置设备", "检查该传感器的Matter通信链路是否存在干扰或丢包重传问题", "持续监控该传感器,若双重上报再次出现则考虑更换硬件"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.15615963935852, "api_error": null} {"episode_id": "SQ1_FP_B_0094", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0094.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260723, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "second_bedroom", "injection_time": "2026-06-04T17:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧温度传感器出现周期性异常跳变,疑似传感器故障或信号干扰。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器在正常的每30分钟整点上报之外,额外出现了多次非整点的上报记录(17:44、18:14、18:44、19:14),上报间隔恰好为30分钟,形成了一个独立的异常上报周期。\",\n \"推理步骤2: 这些非整点上报的温度值明显偏离同时段的正常读数。例如17:44读数2500、18:14读数2502、18:44读数2498、19:14读数2501,均在2498-2502范围内窄幅波动,而同时段整点上报值在2435-2469之间,两组数据存在约30-70(即0.3-0.7°C)的系统性偏差。\",\n \"推理步骤3: 其他三个房间的温度传感器(客厅、主卧、厨房)在同一时段内均无此类非整点异常上报,排除了全屋系统性问题的可能。\",\n \"推理步骤4: 异常上报的温度值高度集中在2500附近,像是一个固定的默认值或校准基准值被错误输出,这是传感器固件bug或硬件故障的典型表现。\",\n \"推理步骤5: 该异常从17:44开始出现,恰好与客厅空调首次开启(17:44)时间吻合,可能存在电磁干扰或供电波动触发了传感器的异常行为。\"\n ],\n \"key_evidence\": [\n \"次卧温度传感器在17:44、18:14、18:44、19:14出现4次非整点异常上报,值分别为2500、2502、2498、2501\",\n \"同时段整点正常上报值为2458-2469(18:00-18:30),与异常值偏差约30-70个单位\",\n \"其他房间传感器无类似非整点上报现象\",\n \"异常上报值高度集中在2500附近,疑似默认值/基准值泄漏\",\n \"异常首次出现时间与客厅空调开启时间(17:44)完全一致\"\n ],\n \"recommended_actions\": [\n \"检查次卧温度传感器的固件版本,尝试升级至最新固件以修复可能的上报逻辑bug\",\n \"检查传感器的供电情况(电池电量或供电线路),排除供电不稳导致的异常\",\n \"将传感器暂时移至其他位置测试,排除特定环境电磁干扰的影响\",\n \"如问题持续,建议更换次卧温度传感器硬件\",\n \"在系统侧增加对非整点异常上报数据的过滤规则,避免异常值影响自动化联动决策\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧温度传感器出现周期性异常跳变,疑似传感器故障或信号干扰。", "reasoning": ["推理步骤1: 次卧温度传感器在正常的每30分钟整点上报之外,额外出现了多次非整点的上报记录(17:44、18:14、18:44、19:14),上报间隔恰好为30分钟,形成了一个独立的异常上报周期。", "推理步骤2: 这些非整点上报的温度值明显偏离同时段的正常读数。例如17:44读数2500、18:14读数2502、18:44读数2498、19:14读数2501,均在2498-2502范围内窄幅波动,而同时段整点上报值在2435-2469之间,两组数据存在约30-70(即0.3-0.7°C)的系统性偏差。", "推理步骤3: 其他三个房间的温度传感器(客厅、主卧、厨房)在同一时段内均无此类非整点异常上报,排除了全屋系统性问题的可能。", "推理步骤4: 异常上报的温度值高度集中在2500附近,像是一个固定的默认值或校准基准值被错误输出,这是传感器固件bug或硬件故障的典型表现。", "推理步骤5: 该异常从17:44开始出现,恰好与客厅空调首次开启(17:44)时间吻合,可能存在电磁干扰或供电波动触发了传感器的异常行为。"], "key_evidence": ["次卧温度传感器在17:44、18:14、18:44、19:14出现4次非整点异常上报,值分别为2500、2502、2498、2501", "同时段整点正常上报值为2458-2469(18:00-18:30),与异常值偏差约30-70个单位", "其他房间传感器无类似非整点上报现象", "异常上报值高度集中在2500附近,疑似默认值/基准值泄漏", "异常首次出现时间与客厅空调开启时间(17:44)完全一致"], "recommended_actions": ["检查次卧温度传感器的固件版本,尝试升级至最新固件以修复可能的上报逻辑bug", "检查传感器的供电情况(电池电量或供电线路),排除供电不稳导致的异常", "将传感器暂时移至其他位置测试,排除特定环境电磁干扰的影响", "如问题持续,建议更换次卧温度传感器硬件", "在系统侧增加对非整点异常上报数据的过滤规则,避免异常值影响自动化联动决策"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.851235389709473, "api_error": null} {"episode_id": "SQ1_FP_B_0098", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0098.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20260727, "scenario_id": "DF-03", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-29T09:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在住户外出期间出现短暂异常触发,疑似传感器故障或误报。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:17 手动开锁出门,门锁自动上锁,此后家中应无人,直到 18:05 住户回家开门。\",\n \"推理步骤2: 在住户外出期间(09:01 和 09:06),次卧运动传感器两次短暂触发(occupancy=1),每次持续不到1分钟即恢复为0,且未伴随任何灯光开启、门窗状态变化或其他房间的运动检测。\",\n \"推理步骤3: 如果是真实入侵,通常会伴随入户门或窗户传感器的触发,但次卧窗户传感器和入户门传感器在该时段均无变化,排除入侵可能性。\",\n \"推理步骤4: 两次触发间隔约5分钟,持续时间极短(约45秒和50秒),呈现间歇性误触发的特征,符合PIR运动传感器常见的误报模式(如阳光直射、温度变化、昆虫经过等)。\",\n \"推理步骤5: 次卧温度传感器全天数据正常,与其他房间温度趋势一致(夜间约23°C,午间升至约25.8°C,傍晚回落),无异常读数,工作正常。次卧窗户传感器全天无状态变化事件,说明窗户保持关闭,也属正常。\"\n ],\n \"key_evidence\": [\n \"09:01:00 次卧运动传感器触发(occupancy=1),09:01:45 恢复(occupancy=0),持续仅45秒\",\n \"09:06:20 次卧运动传感器再次触发(occupancy=1),09:07:10 恢复(occupancy=0),持续仅50秒\",\n \"该时段住户已于 07:17 外出且门锁已自动上锁,家中应无人\",\n \"同时段入户门、次卧窗户等传感器均无触发,排除真实人员进入\",\n \"次卧温度传感器全天读数正常,与其他房间趋势一致\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否受阳光直射或热源影响,必要时调整角度或加装遮光罩\",\n \"观察未来几天该传感器是否继续出现无人时段的短暂误触发,若频繁发生建议更换传感器或调整灵敏度\",\n \"可考虑在自动化规则中增加去抖逻辑,对持续时间低于2分钟的单次触发不作为有人判定\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在住户外出期间出现短暂异常触发,疑似传感器故障或误报。", "reasoning": ["推理步骤1: 住户于 07:17 手动开锁出门,门锁自动上锁,此后家中应无人,直到 18:05 住户回家开门。", "推理步骤2: 在住户外出期间(09:01 和 09:06),次卧运动传感器两次短暂触发(occupancy=1),每次持续不到1分钟即恢复为0,且未伴随任何灯光开启、门窗状态变化或其他房间的运动检测。", "推理步骤3: 如果是真实入侵,通常会伴随入户门或窗户传感器的触发,但次卧窗户传感器和入户门传感器在该时段均无变化,排除入侵可能性。", "推理步骤4: 两次触发间隔约5分钟,持续时间极短(约45秒和50秒),呈现间歇性误触发的特征,符合PIR运动传感器常见的误报模式(如阳光直射、温度变化、昆虫经过等)。", "推理步骤5: 次卧温度传感器全天数据正常,与其他房间温度趋势一致(夜间约23°C,午间升至约25.8°C,傍晚回落),无异常读数,工作正常。次卧窗户传感器全天无状态变化事件,说明窗户保持关闭,也属正常。"], "key_evidence": ["09:01:00 次卧运动传感器触发(occupancy=1),09:01:45 恢复(occupancy=0),持续仅45秒", "09:06:20 次卧运动传感器再次触发(occupancy=1),09:07:10 恢复(occupancy=0),持续仅50秒", "该时段住户已于 07:17 外出且门锁已自动上锁,家中应无人", "同时段入户门、次卧窗户等传感器均无触发,排除真实人员进入", "次卧温度传感器全天读数正常,与其他房间趋势一致"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否受阳光直射或热源影响,必要时调整角度或加装遮光罩", "观察未来几天该传感器是否继续出现无人时段的短暂误触发,若频繁发生建议更换传感器或调整灵敏度", "可考虑在自动化规则中增加去抖逻辑,对持续时间低于2分钟的单次触发不作为有人判定"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.48523783683777, "api_error": null} {"episode_id": "SQ1_FP_B_0099", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0099.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260728, "scenario_id": "DF-03", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "master_bedroom", "injection_time": "2026-06-09T21:28:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在21:28-21:34期间出现异常的短暂反复触发,且家中无人时段(白天)未见任何主卧活动,但该传感器在晚间表现出不稳定的占用检测模式。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器工作正常——全天温度读数与其他房间传感器高度一致,呈现合理的昼夜温度曲线(夜间约23°C,午间峰值约25.8°C,晚间回落),无异常跳变或缺失值。\",\n \"推理步骤2: 主卧运动传感器在06:04检测到占用(住户起床),与随后09秒开灯行为吻合,属正常行为。\",\n \"推理步骤3: 但在21:28-21:34期间,运动传感器出现两次短暂的占用-清除循环(21:28触发→21:28:45清除,仅45秒;21:33:20触发→21:34:10清除,仅50秒),而此时住户仍在客厅活动(客厅灯和空调直到22:32才关闭),主卧灯未开启,没有任何与人类活动一致的关联事件。\",\n \"推理步骤4: 正常的人进入房间会伴随开灯、开空调等操作,但这两次触发完全孤立,且持续时间极短(45-50秒),更像是传感器误触发或灵敏度问题,而非真实的人体存在。\",\n \"推理步骤5: 22:32住户进入主卧就寝时,传感器正常触发了占用检测,并伴随关窗帘、关灯等一系列合理操作,说明传感器并非完全失效,而是存在间歇性误报。\"\n ],\n \"key_evidence\": [\n \"21:28:00 occupancy=1 → 21:28:45 occupancy=0(仅45秒),无任何关联设备操作(灯、空调、窗帘均无变化)\",\n \"21:33:20 occupancy=1 → 21:34:10 occupancy=0(仅50秒),同样无关联操作,且住户此时仍在客厅(客厅灯和空调在线)\",\n \"22:32:11 occupancy=1 伴随关窗帘、关灯、锁门等一系列就寝操作,说明传感器基本功能正常\",\n \"主卧温度传感器全天数据完整且合理,无异常\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装位置,确认是否有窗帘飘动、宠物活动或热源干扰导致误触发\",\n \"适当降低运动传感器灵敏度,或调整检测区域以减少误报\",\n \"持续观察几天,如果类似的短暂孤立触发反复出现,考虑更换传感器或进行固件更新\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在21:28-21:34期间出现异常的短暂反复触发,且家中无人时段(白天)未见任何主卧活动,但该传感器在晚间表现出不稳定的占用检测模式。", "reasoning": ["推理步骤1: 主卧温度传感器工作正常——全天温度读数与其他房间传感器高度一致,呈现合理的昼夜温度曲线(夜间约23°C,午间峰值约25.8°C,晚间回落),无异常跳变或缺失值。", "推理步骤2: 主卧运动传感器在06:04检测到占用(住户起床),与随后09秒开灯行为吻合,属正常行为。", "推理步骤3: 但在21:28-21:34期间,运动传感器出现两次短暂的占用-清除循环(21:28触发→21:28:45清除,仅45秒;21:33:20触发→21:34:10清除,仅50秒),而此时住户仍在客厅活动(客厅灯和空调直到22:32才关闭),主卧灯未开启,没有任何与人类活动一致的关联事件。", "推理步骤4: 正常的人进入房间会伴随开灯、开空调等操作,但这两次触发完全孤立,且持续时间极短(45-50秒),更像是传感器误触发或灵敏度问题,而非真实的人体存在。", "推理步骤5: 22:32住户进入主卧就寝时,传感器正常触发了占用检测,并伴随关窗帘、关灯等一系列合理操作,说明传感器并非完全失效,而是存在间歇性误报。"], "key_evidence": ["21:28:00 occupancy=1 → 21:28:45 occupancy=0(仅45秒),无任何关联设备操作(灯、空调、窗帘均无变化)", "21:33:20 occupancy=1 → 21:34:10 occupancy=0(仅50秒),同样无关联操作,且住户此时仍在客厅(客厅灯和空调在线)", "22:32:11 occupancy=1 伴随关窗帘、关灯、锁门等一系列就寝操作,说明传感器基本功能正常", "主卧温度传感器全天数据完整且合理,无异常"], "recommended_actions": ["检查主卧运动传感器的安装位置,确认是否有窗帘飘动、宠物活动或热源干扰导致误触发", "适当降低运动传感器灵敏度,或调整检测区域以减少误报", "持续观察几天,如果类似的短暂孤立触发反复出现,考虑更换传感器或进行固件更新"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.463202714920044, "api_error": null} {"episode_id": "SQ1_FP_B_0103", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0103.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260732, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-25T21:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在间歇性读数异常,在非烹饪时段出现周期性温度跳变,且烹饪期间报告 None 值,指向传感器硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度突然从约 2431 跳升至 2826(约 28.26°C),而同一时刻其他房间温度均在 2431 左右,此时灶具尚未开启(19:13 才开启),说明该跳变并非烹饪导致。\",\n \"推理步骤2: 19:14 和 19:43 灶具使用期间,传感器报告 MeasuredValue = None,表明传感器无法正常采集数据,出现了读数丢失。\",\n \"推理步骤3: 21:31 起,厨房温度传感器在每个整点和半点的正常读数(2375→2355→2351→2326→2331,与其他房间趋势一致)之后约1分钟,额外报告一次约 2500 的异常读数(21:31=2500, 22:01=2502, 22:31=2498, 23:01=2501),形成规律性的周期跳变。此时灶具已关闭、住户已离家,不存在任何热源。\",\n \"推理步骤4: 这种周期性异常跳变(约每30分钟一次、幅度约+150)加上烹饪时的 None 值,高度符合传感器硬件故障特征——可能是内部ADC采样异常、接线松动或传感器元件老化导致的间歇性错误读数。\"\n ],\n \"key_evidence\": [\n \"19:00 灶具未开启时厨房温度异常跳升至 2826,偏离其他房间约 400 单位\",\n \"19:14 和 19:43 传感器报告 MeasuredValue = None(读数丢失)\",\n \"21:31、22:01、22:31、23:01 在正常读数后约1分钟出现周期性异常值(约2500),此时无任何热源且住户已离家\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的物理连接和安装位置,确认是否有松动或受潮\",\n \"对传感器进行固件重置或重新校准,观察异常是否消除\",\n \"若问题持续,更换厨房温度传感器硬件\",\n \"在传感器修复前,可临时依赖厨房烟雾报警器作为安全兜底,避免因温度传感器失效而遗漏火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在间歇性读数异常,在非烹饪时段出现周期性温度跳变,且烹饪期间报告 None 值,指向传感器硬件故障。", "reasoning": ["推理步骤1: 19:00 厨房温度突然从约 2431 跳升至 2826(约 28.26°C),而同一时刻其他房间温度均在 2431 左右,此时灶具尚未开启(19:13 才开启),说明该跳变并非烹饪导致。", "推理步骤2: 19:14 和 19:43 灶具使用期间,传感器报告 MeasuredValue = None,表明传感器无法正常采集数据,出现了读数丢失。", "推理步骤3: 21:31 起,厨房温度传感器在每个整点和半点的正常读数(2375→2355→2351→2326→2331,与其他房间趋势一致)之后约1分钟,额外报告一次约 2500 的异常读数(21:31=2500, 22:01=2502, 22:31=2498, 23:01=2501),形成规律性的周期跳变。此时灶具已关闭、住户已离家,不存在任何热源。", "推理步骤4: 这种周期性异常跳变(约每30分钟一次、幅度约+150)加上烹饪时的 None 值,高度符合传感器硬件故障特征——可能是内部ADC采样异常、接线松动或传感器元件老化导致的间歇性错误读数。"], "key_evidence": ["19:00 灶具未开启时厨房温度异常跳升至 2826,偏离其他房间约 400 单位", "19:14 和 19:43 传感器报告 MeasuredValue = None(读数丢失)", "21:31、22:01、22:31、23:01 在正常读数后约1分钟出现周期性异常值(约2500),此时无任何热源且住户已离家"], "recommended_actions": ["检查厨房温度传感器的物理连接和安装位置,确认是否有松动或受潮", "对传感器进行固件重置或重新校准,观察异常是否消除", "若问题持续,更换厨房温度传感器硬件", "在传感器修复前,可临时依赖厨房烟雾报警器作为安全兜底,避免因温度传感器失效而遗漏火灾风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.967111825942993, "api_error": null} {"episode_id": "SQ1_FP_B_0110", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0110.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260739, "scenario_id": "DF-03", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "master_bedroom", "injection_time": "2026-06-08T10:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在住户外出期间(10:56-11:02)出现短暂异常触发,疑似传感器故障或误报。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:27 通过入户门锁手动开锁出门,门锁随后自动上锁,此后家中应处于无人状态。\",\n \"推理步骤2: 在无人期间,master_bedroom_occupancy 于 10:56:00 触发占用(Occupancy=1),45秒后清除;随后 11:01:20 再次触发,50秒后再次清除。两次触发间隔约5分钟,持续时间极短。\",\n \"推理步骤3: 同时段内没有任何入户门开锁/开门记录,没有其他房间运动传感器触发,也没有灯光或其他设备被操作,排除有人实际进入家中的可能性。\",\n \"推理步骤4: 两次触发持续时间都不到1分钟,且无后续连续活动,不符合真实人体活动的模式(真实入侵通常会触发多个区域传感器并持续更长时间)。\",\n \"推理步骤5: 主卧温度传感器和窗户传感器在整个时段内工作正常,温度读数与其他房间一致且变化平稳,无异常。主卧灯光、空调、窗帘等设备响应正常。因此故障范围仅限于运动传感器。\"\n ],\n \"key_evidence\": [\n \"10:56:00 master_bedroom_occupancy Occupancy=1,10:56:45 清除(持续45秒),家中无人期间触发\",\n \"11:01:20 master_bedroom_occupancy Occupancy=1,11:02:10 清除(持续50秒),5分钟内第二次短暂触发\",\n \"07:27:27 入户门锁自动上锁后至 16:34:00 之间无任何开门/开锁记录,确认家中无人\",\n \"同时段内 entrance_occupancy、living_room_occupancy 均无触发,排除真实入侵\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装位置,确认是否有窗帘飘动、宠物、阳光直射等可能导致 PIR 传感器误触发的干扰源\",\n \"观察未来几天该传感器在无人时段是否继续出现类似短暂触发,若反复出现则考虑更换传感器或调整灵敏度\",\n \"如果担心安全问题,可设置联动规则:无人模式下主卧运动传感器触发时,联动摄像头抓拍或推送告警,以便区分误报与真实入侵\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在住户外出期间(10:56-11:02)出现短暂异常触发,疑似传感器故障或误报。", "reasoning": ["推理步骤1: 住户于 07:27 通过入户门锁手动开锁出门,门锁随后自动上锁,此后家中应处于无人状态。", "推理步骤2: 在无人期间,master_bedroom_occupancy 于 10:56:00 触发占用(Occupancy=1),45秒后清除;随后 11:01:20 再次触发,50秒后再次清除。两次触发间隔约5分钟,持续时间极短。", "推理步骤3: 同时段内没有任何入户门开锁/开门记录,没有其他房间运动传感器触发,也没有灯光或其他设备被操作,排除有人实际进入家中的可能性。", "推理步骤4: 两次触发持续时间都不到1分钟,且无后续连续活动,不符合真实人体活动的模式(真实入侵通常会触发多个区域传感器并持续更长时间)。", "推理步骤5: 主卧温度传感器和窗户传感器在整个时段内工作正常,温度读数与其他房间一致且变化平稳,无异常。主卧灯光、空调、窗帘等设备响应正常。因此故障范围仅限于运动传感器。"], "key_evidence": ["10:56:00 master_bedroom_occupancy Occupancy=1,10:56:45 清除(持续45秒),家中无人期间触发", "11:01:20 master_bedroom_occupancy Occupancy=1,11:02:10 清除(持续50秒),5分钟内第二次短暂触发", "07:27:27 入户门锁自动上锁后至 16:34:00 之间无任何开门/开锁记录,确认家中无人", "同时段内 entrance_occupancy、living_room_occupancy 均无触发,排除真实入侵"], "recommended_actions": ["检查主卧运动传感器的安装位置,确认是否有窗帘飘动、宠物、阳光直射等可能导致 PIR 传感器误触发的干扰源", "观察未来几天该传感器在无人时段是否继续出现类似短暂触发,若反复出现则考虑更换传感器或调整灵敏度", "如果担心安全问题,可设置联动规则:无人模式下主卧运动传感器触发时,联动摄像头抓拍或推送告警,以便区分误报与真实入侵"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.64370846748352, "api_error": null} {"episode_id": "SQ1_FP_B_0112", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0112.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20260741, "scenario_id": "DF-01", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-13T18:45:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在18:45后出现异常的高频波动,温度读数每15分钟在约24°C和25°C之间大幅跳变,与其他房间传感器的平稳下降趋势严重不符。\",\n \"reasoning\": [\n \"推理步骤1: 18:45之前,客厅温度传感器与其他房间传感器保持一致的变化趋势(夜间约23°C,午后峰值约25.5°C,傍晚逐步回落),读数间差异在合理范围内。\",\n \"推理步骤2: 18:45空调再次开启后,客厅温度传感器开始出现异常模式——在整点和半点的常规采样中读数正常下降(19:00=24.41, 19:30=24.44, 20:00=24.11, 20:30=24.09),但在15分钟间隔的额外采样点上突然跳升至约25°C(19:15=25.02, 19:45=24.98, 20:15=25.01)。\",\n \"推理步骤3: 这种每15分钟出现一次、幅度约0.6-0.9°C的锯齿形波动极不自然。同时段主卧、次卧、厨房传感器均呈现平滑单调下降,没有类似跳变,排除了环境因素导致的可能。\",\n \"推理步骤4: 正常空调制冷不会导致温度在15分钟内反复跳升1°C再回落,且跳变值高度一致(均在2498-2502范围),呈现出周期性固定值回报的特征,更像是传感器硬件故障或数据采集异常。\"\n ],\n \"key_evidence\": [\n \"19:00读数2441 → 19:15跳升至2502 → 19:30回落至2444,15分钟内波动约0.6°C,此模式重复出现三次\",\n \"异常跳变值高度集中在2498-2502区间,疑似传感器间歇性回报固定错误值\",\n \"同时段master_bedroom、second_bedroom、kitchen传感器均平滑下降,无类似波动,排除环境因素\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的硬件连接和供电状态,可能存在接触不良或传感器元件老化\",\n \"查看传感器固件版本,考虑重置或升级固件以排除软件层面的采样异常\",\n \"临时以主卧或次卧传感器作为空调控制的参考温度源,避免异常读数影响空调调温逻辑\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在18:45后出现异常的高频波动,温度读数每15分钟在约24°C和25°C之间大幅跳变,与其他房间传感器的平稳下降趋势严重不符。", "reasoning": ["推理步骤1: 18:45之前,客厅温度传感器与其他房间传感器保持一致的变化趋势(夜间约23°C,午后峰值约25.5°C,傍晚逐步回落),读数间差异在合理范围内。", "推理步骤2: 18:45空调再次开启后,客厅温度传感器开始出现异常模式——在整点和半点的常规采样中读数正常下降(19:00=24.41, 19:30=24.44, 20:00=24.11, 20:30=24.09),但在15分钟间隔的额外采样点上突然跳升至约25°C(19:15=25.02, 19:45=24.98, 20:15=25.01)。", "推理步骤3: 这种每15分钟出现一次、幅度约0.6-0.9°C的锯齿形波动极不自然。同时段主卧、次卧、厨房传感器均呈现平滑单调下降,没有类似跳变,排除了环境因素导致的可能。", "推理步骤4: 正常空调制冷不会导致温度在15分钟内反复跳升1°C再回落,且跳变值高度一致(均在2498-2502范围),呈现出周期性固定值回报的特征,更像是传感器硬件故障或数据采集异常。"], "key_evidence": ["19:00读数2441 → 19:15跳升至2502 → 19:30回落至2444,15分钟内波动约0.6°C,此模式重复出现三次", "异常跳变值高度集中在2498-2502区间,疑似传感器间歇性回报固定错误值", "同时段master_bedroom、second_bedroom、kitchen传感器均平滑下降,无类似波动,排除环境因素"], "recommended_actions": ["检查客厅温度传感器的硬件连接和供电状态,可能存在接触不良或传感器元件老化", "查看传感器固件版本,考虑重置或升级固件以排除软件层面的采样异常", "临时以主卧或次卧传感器作为空调控制的参考温度源,避免异常读数影响空调调温逻辑"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.943908214569092, "api_error": null} {"episode_id": "SQ1_FP_B_0114", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0114.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20260743, "scenario_id": "DF-03", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-13T18:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在无人居住迹象的时段出现短暂触发,疑似传感器误报或故障。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,均呈现正常的昼夜温度曲线(夜间约22.9-23.1°C,午间峰值约25.8°C),温度传感器工作正常。\",\n \"推理步骤2: 次卧运动传感器在18:01和18:06出现两次短暂触发(分别持续约45秒和50秒),但整个24小时日志中没有任何其他人类活动的关联证据——没有灯光开关、门锁操作、空调使用、窗帘动作等事件。\",\n \"推理步骤3: 如果是真实的人员进入,通常会伴随入户门锁/门传感器事件、玄关运动传感器触发、灯光操作等关联事件,但日志中完全没有这些。\",\n \"推理步骤4: 两次触发间隔仅约5分钟,且持续时间极短,更符合传感器误触发的特征(如宠物、窗帘飘动、温度变化导致的热释电传感器误报),而非真实人员活动模式。\",\n \"推理步骤5: 综合来看,温度传感器正常,但运动传感器存在可疑的孤立短暂触发,判定为轻度设备异常(误报),而非入侵威胁。\"\n ],\n \"key_evidence\": [\n \"18:01:00 运动传感器触发,18:01:45 恢复,持续仅45秒\",\n \"18:06:20 运动传感器再次触发,18:07:10 恢复,持续仅50秒\",\n \"全天无任何关联的人类活动事件(无门锁、灯光、窗帘等操作)\",\n \"温度传感器数据与其他房间一致,无异常偏差\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否对准窗帘、空调出风口等可能引起误触发的区域\",\n \"确认家中是否有宠物可能触发运动传感器\",\n \"持续观察该传感器是否反复出现类似孤立短暂触发,若频繁发生建议校准或更换传感器\",\n \"可适当调低运动传感器灵敏度以减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在无人居住迹象的时段出现短暂触发,疑似传感器误报或故障。", "reasoning": ["推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,均呈现正常的昼夜温度曲线(夜间约22.9-23.1°C,午间峰值约25.8°C),温度传感器工作正常。", "推理步骤2: 次卧运动传感器在18:01和18:06出现两次短暂触发(分别持续约45秒和50秒),但整个24小时日志中没有任何其他人类活动的关联证据——没有灯光开关、门锁操作、空调使用、窗帘动作等事件。", "推理步骤3: 如果是真实的人员进入,通常会伴随入户门锁/门传感器事件、玄关运动传感器触发、灯光操作等关联事件,但日志中完全没有这些。", "推理步骤4: 两次触发间隔仅约5分钟,且持续时间极短,更符合传感器误触发的特征(如宠物、窗帘飘动、温度变化导致的热释电传感器误报),而非真实人员活动模式。", "推理步骤5: 综合来看,温度传感器正常,但运动传感器存在可疑的孤立短暂触发,判定为轻度设备异常(误报),而非入侵威胁。"], "key_evidence": ["18:01:00 运动传感器触发,18:01:45 恢复,持续仅45秒", "18:06:20 运动传感器再次触发,18:07:10 恢复,持续仅50秒", "全天无任何关联的人类活动事件(无门锁、灯光、窗帘等操作)", "温度传感器数据与其他房间一致,无异常偏差"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否对准窗帘、空调出风口等可能引起误触发的区域", "确认家中是否有宠物可能触发运动传感器", "持续观察该传感器是否反复出现类似孤立短暂触发,若频繁发生建议校准或更换传感器", "可适当调低运动传感器灵敏度以减少误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.69711184501648, "api_error": null} {"episode_id": "SQ1_FP_B_0115", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0115.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260744, "scenario_id": "DF-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-15T21:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在晚间周期性出现异常高温尖峰读数,与同一时刻其他房间传感器数据严重偏离,疑似传感器硬件故障或数据采集异常。\",\n \"reasoning\": [\n \"推理步骤1: 从21:59开始,living_room_temp_sensor在整点/半点的常规采样之前约1分钟,反复报告约2500(25.00°C)的读数,而紧接着的整点/半点读数则为2358-2364(约23.4-23.6°C),两者相差约1.4°C,时间间隔仅1分钟。\",\n \"推理步骤2: 具体异常时间点为 21:59(2500)→22:00(2358)、22:29(2502)→22:30(2364)、22:59(2498)→23:00(2338)、23:29(2501)→23:30(2337)。这些尖峰值高度一致(2498-2502),呈现精确的约30分钟周期性重复模式。\",\n \"推理步骤3: 同一时段内,master_bedroom、second_bedroom、kitchen三个温度传感器的读数平稳下降且彼此一致(从约23.6°C逐步降至约23.3°C),没有出现类似的尖峰现象,排除了环境温度真实波动的可能性。\",\n \"推理步骤4: 22:44时客厅空调已关闭、客厅灯已关闭,客厅处于无人无设备运行状态,不存在能在1分钟内引起1.4°C温度骤升又骤降的合理热源。\",\n \"推理步骤5: 尖峰值高度稳定在2498-2502范围内,周期精确为30分钟,这种规律性更符合传感器固件bug、ADC采样错误或数据上报时序冲突等硬件/软件故障特征,而非真实物理温度变化。\"\n ],\n \"key_evidence\": [\n \"21:59 报告2500,22:00 报告2358,1分钟内温差约1.4°C\",\n \"22:29 报告2502,22:30 报告2364,同样模式重复\",\n \"22:59 报告2498,23:00 报告2338,模式第三次重复\",\n \"23:29 报告2501,23:30 报告2337,模式第四次重复\",\n \"尖峰值稳定在2498-2502区间,周期精确30分钟,具有明显的系统性特征\",\n \"同时段其他三个房间温度传感器读数平稳一致,无类似异常\"\n ],\n \"recommended_actions\": [\n \"检查 living_room_temp_sensor 的固件版本,确认是否存在已知的采样或上报bug,必要时升级固件\",\n \"检查该传感器的数据上报配置,排查是否存在定时任务与常规采样的时序冲突导致缓存旧值被重复上报\",\n \"对传感器进行硬件自检或与已知准确温度计对比校准,排除ADC硬件漂移\",\n \"如确认为硬件故障,建议更换该温度传感器\",\n \"在修复前,自动化规则中应降低对该传感器数据的信任权重,避免基于错误温度数据触发空调等设备的误操作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在晚间周期性出现异常高温尖峰读数,与同一时刻其他房间传感器数据严重偏离,疑似传感器硬件故障或数据采集异常。", "reasoning": ["推理步骤1: 从21:59开始,living_room_temp_sensor在整点/半点的常规采样之前约1分钟,反复报告约2500(25.00°C)的读数,而紧接着的整点/半点读数则为2358-2364(约23.4-23.6°C),两者相差约1.4°C,时间间隔仅1分钟。", "推理步骤2: 具体异常时间点为 21:59(2500)→22:00(2358)、22:29(2502)→22:30(2364)、22:59(2498)→23:00(2338)、23:29(2501)→23:30(2337)。这些尖峰值高度一致(2498-2502),呈现精确的约30分钟周期性重复模式。", "推理步骤3: 同一时段内,master_bedroom、second_bedroom、kitchen三个温度传感器的读数平稳下降且彼此一致(从约23.6°C逐步降至约23.3°C),没有出现类似的尖峰现象,排除了环境温度真实波动的可能性。", "推理步骤4: 22:44时客厅空调已关闭、客厅灯已关闭,客厅处于无人无设备运行状态,不存在能在1分钟内引起1.4°C温度骤升又骤降的合理热源。", "推理步骤5: 尖峰值高度稳定在2498-2502范围内,周期精确为30分钟,这种规律性更符合传感器固件bug、ADC采样错误或数据上报时序冲突等硬件/软件故障特征,而非真实物理温度变化。"], "key_evidence": ["21:59 报告2500,22:00 报告2358,1分钟内温差约1.4°C", "22:29 报告2502,22:30 报告2364,同样模式重复", "22:59 报告2498,23:00 报告2338,模式第三次重复", "23:29 报告2501,23:30 报告2337,模式第四次重复", "尖峰值稳定在2498-2502区间,周期精确30分钟,具有明显的系统性特征", "同时段其他三个房间温度传感器读数平稳一致,无类似异常"], "recommended_actions": ["检查 living_room_temp_sensor 的固件版本,确认是否存在已知的采样或上报bug,必要时升级固件", "检查该传感器的数据上报配置,排查是否存在定时任务与常规采样的时序冲突导致缓存旧值被重复上报", "对传感器进行硬件自检或与已知准确温度计对比校准,排除ADC硬件漂移", "如确认为硬件故障,建议更换该温度传感器", "在修复前,自动化规则中应降低对该传感器数据的信任权重,避免基于错误温度数据触发空调等设备的误操作"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.43536639213562, "api_error": null} {"episode_id": "SQ1_FP_B_0126", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0126.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20260755, "scenario_id": "DF-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-22T22:45:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在夜间出现周期性异常高温跳变,疑似传感器硬件故障或数据采集异常。\",\n \"reasoning\": [\n \"推理步骤1: 22:45 客厅空调被开启,同一时刻客厅温度传感器报告 2500(25.00°C),而 22:30 时仅为 2351(23.51°C),15分钟内跳升约 1.5°C,与其他房间温度趋势(持续下降)明显不一致。\",\n \"推理步骤2: 23:00 客厅温度回落至 2333,但 23:15 又突然跳至 2502,23:30 再回落至 2326,23:45 再次跳至 2498,00:15 又报 2501。呈现出约每 30 分钟在 ~2330 和 ~2500 之间剧烈交替跳变的规律性异常模式。\",\n \"推理步骤3: 同时段其他三个房间(主卧、次卧、厨房)的温度传感器均呈平稳缓慢下降趋势(约 2325-2343),没有出现类似跳变,排除了环境因素(如突然升温)导致的可能性。\",\n \"推理步骤4: 即使客厅空调在 22:45 开启(制冷模式 SystemMode=3),空调制冷只会使温度下降而非升高到 25°C,且不可能在 15 分钟周期内反复升降 1.7°C。这种锯齿状波动不符合任何正常物理场景。\",\n \"推理步骤5: 该异常模式高度规律(约每 30 分钟一次尖峰),指向传感器硬件故障(如热敏电阻接触不良、ADC 采样异常)或数据通信链路间歇性错误,而非真实温度变化。\"\n ],\n \"key_evidence\": [\n \"22:45 客厅温度突跳至 2500,而 22:30 为 2351,其他房间同期无类似变化\",\n \"23:15 报 2502、23:45 报 2498、00:15 报 2501,呈现约每 30 分钟一次的周期性尖峰跳变\",\n \"23:00 报 2333、23:30 报 2326,尖峰之间温度正常回落,形成锯齿状异常波形\",\n \"同时段主卧(2341)、次卧(2332-2343)、厨房(2325-2340)温度均平稳下降,排除环境因素\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的硬件连接状态,重点排查探头接触不良或线缆松动\",\n \"尝试重启/重置客厅温度传感器,观察异常跳变是否消失\",\n \"对比客厅空调自带温度读数与传感器读数,交叉验证真实室温\",\n \"如重启后问题持续,建议更换客厅温度传感器\",\n \"在传感器修复前,避免将客厅空调的自动温控逻辑绑定到该传感器,防止空调因错误读数频繁启停\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在夜间出现周期性异常高温跳变,疑似传感器硬件故障或数据采集异常。", "reasoning": ["推理步骤1: 22:45 客厅空调被开启,同一时刻客厅温度传感器报告 2500(25.00°C),而 22:30 时仅为 2351(23.51°C),15分钟内跳升约 1.5°C,与其他房间温度趋势(持续下降)明显不一致。", "推理步骤2: 23:00 客厅温度回落至 2333,但 23:15 又突然跳至 2502,23:30 再回落至 2326,23:45 再次跳至 2498,00:15 又报 2501。呈现出约每 30 分钟在 ~2330 和 ~2500 之间剧烈交替跳变的规律性异常模式。", "推理步骤3: 同时段其他三个房间(主卧、次卧、厨房)的温度传感器均呈平稳缓慢下降趋势(约 2325-2343),没有出现类似跳变,排除了环境因素(如突然升温)导致的可能性。", "推理步骤4: 即使客厅空调在 22:45 开启(制冷模式 SystemMode=3),空调制冷只会使温度下降而非升高到 25°C,且不可能在 15 分钟周期内反复升降 1.7°C。这种锯齿状波动不符合任何正常物理场景。", "推理步骤5: 该异常模式高度规律(约每 30 分钟一次尖峰),指向传感器硬件故障(如热敏电阻接触不良、ADC 采样异常)或数据通信链路间歇性错误,而非真实温度变化。"], "key_evidence": ["22:45 客厅温度突跳至 2500,而 22:30 为 2351,其他房间同期无类似变化", "23:15 报 2502、23:45 报 2498、00:15 报 2501,呈现约每 30 分钟一次的周期性尖峰跳变", "23:00 报 2333、23:30 报 2326,尖峰之间温度正常回落,形成锯齿状异常波形", "同时段主卧(2341)、次卧(2332-2343)、厨房(2325-2340)温度均平稳下降,排除环境因素"], "recommended_actions": ["检查客厅温度传感器的硬件连接状态,重点排查探头接触不良或线缆松动", "尝试重启/重置客厅温度传感器,观察异常跳变是否消失", "对比客厅空调自带温度读数与传感器读数,交叉验证真实室温", "如重启后问题持续,建议更换客厅温度传感器", "在传感器修复前,避免将客厅空调的自动温控逻辑绑定到该传感器,防止空调因错误读数频繁启停"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.61844491958618, "api_error": null} {"episode_id": "SQ1_FP_B_0127", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_B_0127.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20260756, "scenario_id": "DF-03", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "master_bedroom", "injection_time": "2026-06-27T19:38:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天每30分钟稳定上报数据,无任何 None 值或数据缺失,共计48个采样点全部正常返回。\",\n \"推理步骤2: 温度变化趋势与其他房间(客厅、次卧、厨房)高度一致——凌晨约22.9~23.1°C,白天升至约25.7°C峰值,傍晚回落至约23.3°C,呈现合理的自然昼夜温度曲线,无异常突变。\",\n \"推理步骤3: 主卧运动传感器在19:38和19:43记录了两次短暂的占用事件(分别持续约45秒和50秒),这符合住户短暂进出卧室(如取物品)的正常行为模式,不构成异常。\",\n \"推理步骤4: 相邻时间点之间的温度波动幅度在合理范围内(通常±10~20,即±0.1~0.2°C),未出现像厨房传感器在12:00突然跳至2973(29.73°C)那样的异常尖峰。\",\n \"推理步骤5: 主卧空调和窗帘全天无操作记录,与该区域白天无人长时间停留的状态吻合,传感器未因设备联动产生不合理的状态变化。\"\n ],\n \"key_evidence\": [\n \"主卧温度传感器全天48个采样点均正常上报,无 None 值,数值范围 2290~2577(22.9°C~25.77°C),与其他房间趋势一致\",\n \"主卧运动传感器仅在19:38~19:44有两次短暂触发(各约45~50秒),符合正常人员短暂进出模式\",\n \"主卧窗户传感器、空调、窗帘等关联设备全天无异常状态变化\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\",\n \"可关注厨房温度传感器在12:00的异常读数(2973),该问题不在本次分析范围但值得排查\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器均表现符合预期。", "reasoning": ["推理步骤1: 主卧温度传感器全天每30分钟稳定上报数据,无任何 None 值或数据缺失,共计48个采样点全部正常返回。", "推理步骤2: 温度变化趋势与其他房间(客厅、次卧、厨房)高度一致——凌晨约22.9~23.1°C,白天升至约25.7°C峰值,傍晚回落至约23.3°C,呈现合理的自然昼夜温度曲线,无异常突变。", "推理步骤3: 主卧运动传感器在19:38和19:43记录了两次短暂的占用事件(分别持续约45秒和50秒),这符合住户短暂进出卧室(如取物品)的正常行为模式,不构成异常。", "推理步骤4: 相邻时间点之间的温度波动幅度在合理范围内(通常±10~20,即±0.1~0.2°C),未出现像厨房传感器在12:00突然跳至2973(29.73°C)那样的异常尖峰。", "推理步骤5: 主卧空调和窗帘全天无操作记录,与该区域白天无人长时间停留的状态吻合,传感器未因设备联动产生不合理的状态变化。"], "key_evidence": ["主卧温度传感器全天48个采样点均正常上报,无 None 值,数值范围 2290~2577(22.9°C~25.77°C),与其他房间趋势一致", "主卧运动传感器仅在19:38~19:44有两次短暂触发(各约45~50秒),符合正常人员短暂进出模式", "主卧窗户传感器、空调、窗帘等关联设备全天无异常状态变化"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好", "可关注厨房温度传感器在12:00的异常读数(2973),该问题不在本次分析范围但值得排查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.852927923202515, "api_error": null} {"episode_id": "SQ1_FP_C_0081", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0081.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260710, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-19T15:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行,无故障迹象。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报数据,从凌晨的约23.1°C到正午峰值约25.8°C再回落到夜间约23.4°C,符合夏季自然温度变化曲线,无异常跳变或缺失。\",\n \"推理步骤2: 15:24 主卧空调开启后,温度传感器在15:54、16:00、16:24等时间点额外上报了数据(间隔约30分钟),温度从25.30°C逐步降至约25.0°C附近并趋于稳定,说明传感器对空调制冷的响应正常且灵敏。\",\n \"推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在06:04检测到有人活动(起床),22:46再次检测到有人活动(就寝),与主卧灯的开关时间高度吻合(06:04开灯、22:46关灯),触发逻辑正确。\",\n \"推理步骤4: 对比其他房间的温度传感器,主卧温度读数与客厅、儿童房、厨房的趋势一致,各传感器之间温差始终在合理范围内(±2°C),不存在主卧传感器偏移或漂移的迹象。\",\n \"推理步骤5: 主卧所有传感器全天无 None 值上报(厨房温度传感器出现了3次 None,但主卧没有),数据完整性良好,无通信中断或设备离线的表现。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天上报了完整的温度数据(从00:00到23:30共48个半小时读数+空调开启后3个额外读数),无缺失、无None值\",\n \"温度变化曲线合理:夜间约23.0°C → 正午峰值约25.8°C → 空调开启后降至约25.0°C → 夜间回落至约23.4°C\",\n \"master_bedroom_occupancy 在06:04和22:46两次触发,与灯光开关事件时间匹配,符合起床和就寝的生活规律\",\n \"主卧温度与其他房间传感器读数趋势一致,无异常偏差\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\",\n \"可考虑定期校准温度传感器以保持长期精度(建议每6-12个月一次)\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行,无故障迹象。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报数据,从凌晨的约23.1°C到正午峰值约25.8°C再回落到夜间约23.4°C,符合夏季自然温度变化曲线,无异常跳变或缺失。", "推理步骤2: 15:24 主卧空调开启后,温度传感器在15:54、16:00、16:24等时间点额外上报了数据(间隔约30分钟),温度从25.30°C逐步降至约25.0°C附近并趋于稳定,说明传感器对空调制冷的响应正常且灵敏。", "推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在06:04检测到有人活动(起床),22:46再次检测到有人活动(就寝),与主卧灯的开关时间高度吻合(06:04开灯、22:46关灯),触发逻辑正确。", "推理步骤4: 对比其他房间的温度传感器,主卧温度读数与客厅、儿童房、厨房的趋势一致,各传感器之间温差始终在合理范围内(±2°C),不存在主卧传感器偏移或漂移的迹象。", "推理步骤5: 主卧所有传感器全天无 None 值上报(厨房温度传感器出现了3次 None,但主卧没有),数据完整性良好,无通信中断或设备离线的表现。"], "key_evidence": ["master_bedroom_temp_sensor 全天上报了完整的温度数据(从00:00到23:30共48个半小时读数+空调开启后3个额外读数),无缺失、无None值", "温度变化曲线合理:夜间约23.0°C → 正午峰值约25.8°C → 空调开启后降至约25.0°C → 夜间回落至约23.4°C", "master_bedroom_occupancy 在06:04和22:46两次触发,与灯光开关事件时间匹配,符合起床和就寝的生活规律", "主卧温度与其他房间传感器读数趋势一致,无异常偏差"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好", "可考虑定期校准温度传感器以保持长期精度(建议每6-12个月一次)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.662715911865234, "api_error": null} {"episode_id": "SQ1_FP_C_0085", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0085.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20260714, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-03T08:18:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 1.1533102989196777, "api_error": "400 Client Error: Bad Request for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ1_FP_C_0083", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0083.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260712, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "dining_room", "injection_time": "2026-06-02T14:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"餐厅运动传感器在无人居家时段出现异常触发,且全天未见餐厅灯光联动的自动化响应一致性问题,指向传感器可能存在误触发故障。\",\n \"reasoning\": [\n \"推理步骤1: 梳理 dining_room 区域传感器(dining_room_occupancy)的全部事件。共出现5次状态变化:07:18 触发→用餐后熄灭;14:24 触发→14:24:45 清除→14:29:20 再次触发→14:30:10 清除;19:19 触发→晚餐后正常。\",\n \"推理步骤2: 07:19:27 全家出门(前门上锁、自动锁定),直到 16:14 才有人通过前门回家。因此 07:19 至 16:14 期间家中应无人。\",\n \"推理步骤3: 然而在 14:24:00 和 14:29:20,dining_room_occupancy 两次报告检测到占用(Occupancy=1),且每次持续时间极短(分别约45秒和约50秒),呈现间歇性短暂触发的模式。\",\n \"推理步骤4: 同一时段内,没有任何其他传感器(entrance_occupancy、living_room_occupancy、front_door_contact、front_door_lock)显示有人进入家中,排除了真实有人在场的可能性。\",\n \"推理步骤5: 这两次短暂触发没有伴随餐厅灯开启或任何其他区域的联动活动,进一步印证并非真实人体活动。\",\n \"推理步骤6: 短时间内反复触发又快速清除,是 PIR 运动传感器典型的误触发特征,常见原因包括:宠物活动、热气流扰动(午后室温较高约25.3-25.4°C)、传感器灵敏度漂移、或昆虫经过传感器镜头前方。\"\n ],\n \"key_evidence\": [\n \"14:24:00 dining_room_occupancy 触发 Occupancy=1,14:24:45 清除(持续仅45秒),14:29:20 再次触发,14:30:10 清除(持续约50秒)\",\n \"07:19:27~07:19:32 全家出门并锁门,16:14:00 才有人回家,14:24-14:30 时段家中应无人\",\n \"同时段无任何入户门、玄关传感器活动,排除真实入侵\",\n \"两次触发均未伴随餐厅灯或其他设备联动\"\n ],\n \"recommended_actions\": [\n \"检查餐厅运动传感器的安装位置,确认是否对准窗户、空调出风口或其他热源,避免热气流导致的误触发\",\n \"如家中有宠物,考虑将传感器更换为具备宠物免疫功能的型号或调低灵敏度\",\n \"清洁传感器镜头表面,排除灰尘或昆虫干扰\",\n \"持续监测该传感器在无人时段的触发频率,若误报持续出现则建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "餐厅运动传感器在无人居家时段出现异常触发,且全天未见餐厅灯光联动的自动化响应一致性问题,指向传感器可能存在误触发故障。", "reasoning": ["推理步骤1: 梳理 dining_room 区域传感器(dining_room_occupancy)的全部事件。共出现5次状态变化:07:18 触发→用餐后熄灭;14:24 触发→14:24:45 清除→14:29:20 再次触发→14:30:10 清除;19:19 触发→晚餐后正常。", "推理步骤2: 07:19:27 全家出门(前门上锁、自动锁定),直到 16:14 才有人通过前门回家。因此 07:19 至 16:14 期间家中应无人。", "推理步骤3: 然而在 14:24:00 和 14:29:20,dining_room_occupancy 两次报告检测到占用(Occupancy=1),且每次持续时间极短(分别约45秒和约50秒),呈现间歇性短暂触发的模式。", "推理步骤4: 同一时段内,没有任何其他传感器(entrance_occupancy、living_room_occupancy、front_door_contact、front_door_lock)显示有人进入家中,排除了真实有人在场的可能性。", "推理步骤5: 这两次短暂触发没有伴随餐厅灯开启或任何其他区域的联动活动,进一步印证并非真实人体活动。", "推理步骤6: 短时间内反复触发又快速清除,是 PIR 运动传感器典型的误触发特征,常见原因包括:宠物活动、热气流扰动(午后室温较高约25.3-25.4°C)、传感器灵敏度漂移、或昆虫经过传感器镜头前方。"], "key_evidence": ["14:24:00 dining_room_occupancy 触发 Occupancy=1,14:24:45 清除(持续仅45秒),14:29:20 再次触发,14:30:10 清除(持续约50秒)", "07:19:27~07:19:32 全家出门并锁门,16:14:00 才有人回家,14:24-14:30 时段家中应无人", "同时段无任何入户门、玄关传感器活动,排除真实入侵", "两次触发均未伴随餐厅灯或其他设备联动"], "recommended_actions": ["检查餐厅运动传感器的安装位置,确认是否对准窗户、空调出风口或其他热源,避免热气流导致的误触发", "如家中有宠物,考虑将传感器更换为具备宠物免疫功能的型号或调低灵敏度", "清洁传感器镜头表面,排除灰尘或昆虫干扰", "持续监测该传感器在无人时段的触发频率,若误报持续出现则建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.448814630508423, "api_error": null} {"episode_id": "SQ1_FP_C_0086", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0086.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260715, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-08T13:04:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器和运动传感器均按预期运行。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无None值。温度从夜间约23.0°C逐步升至午间约25.8°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化规律。\",\n \"推理步骤2: 13:04空调开启后,客厅温度在常规30分钟采样点(如13:30的2551)与空调专属采样点(如13:04的2500、13:34的2502、14:04的2498、14:34的2501)之间出现差异,这是因为空调将局部温度压低至约25.0°C,而30分钟整点采样时温度有所回升。这种'锯齿'模式是空调间歇制冷的正常表现,不是传感器故障。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)仅在18:17有人进门时触发Occupancy=1,与入户门锁解锁、门传感器开合事件时间吻合,无深夜或无人时段的误触发。\",\n \"推理步骤4: 客厅烟雾报警器(living_room_smoke_alarm)全天无任何告警事件,状态正常。\",\n \"推理步骤5: 对比厨房温度传感器在06:39和07:04、18:37和18:54多次报告None值(疑似厨房传感器受灶具高温干扰),客厅传感器全天无None值,数据完整性良好。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点数据完整,无None值,温度范围2293~2584(约22.9°C~25.8°C),符合夏季室内正常波动\",\n \"空调开启期间(13:04起)出现的额外采样点温度约2498~2502,与整点采样的2531~2551形成合理的制冷波动模式\",\n \"living_room_occupancy 仅在18:17触发,与front_door_lock解锁事件完全吻合,无异常触发\",\n \"living_room_smoke_alarm 全天无告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,客厅区域所有传感器运行状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器和运动传感器均按预期运行。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无None值。温度从夜间约23.0°C逐步升至午间约25.8°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化规律。", "推理步骤2: 13:04空调开启后,客厅温度在常规30分钟采样点(如13:30的2551)与空调专属采样点(如13:04的2500、13:34的2502、14:04的2498、14:34的2501)之间出现差异,这是因为空调将局部温度压低至约25.0°C,而30分钟整点采样时温度有所回升。这种'锯齿'模式是空调间歇制冷的正常表现,不是传感器故障。", "推理步骤3: 客厅运动传感器(living_room_occupancy)仅在18:17有人进门时触发Occupancy=1,与入户门锁解锁、门传感器开合事件时间吻合,无深夜或无人时段的误触发。", "推理步骤4: 客厅烟雾报警器(living_room_smoke_alarm)全天无任何告警事件,状态正常。", "推理步骤5: 对比厨房温度传感器在06:39和07:04、18:37和18:54多次报告None值(疑似厨房传感器受灶具高温干扰),客厅传感器全天无None值,数据完整性良好。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点数据完整,无None值,温度范围2293~2584(约22.9°C~25.8°C),符合夏季室内正常波动", "空调开启期间(13:04起)出现的额外采样点温度约2498~2502,与整点采样的2531~2551形成合理的制冷波动模式", "living_room_occupancy 仅在18:17触发,与front_door_lock解锁事件完全吻合,无异常触发", "living_room_smoke_alarm 全天无告警事件"], "recommended_actions": ["无需采取措施,客厅区域所有传感器运行状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.630898475646973, "api_error": null} {"episode_id": "SQ1_FP_C_0089", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0089.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260718, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "master_bedroom", "injection_time": "2026-06-02T07:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器的数据均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天48个采样点(每30分钟一次)均正常上报数值,无一次出现 None 或缺失,数值范围为 2290~2584(即 22.90°C~25.84°C),与同期其他房间温度走势一致,呈现夜间低、午间高的合理日变化曲线。\",\n \"推理步骤2: 主卧运动传感器(master_bedroom_occupancy)在全天共触发5次状态变化:06:15 起床检测到占用(与随后开灯一致)、07:57-07:57:45 短暂检测到运动(家人出门前可能回房取物)、08:02-08:03 再次短暂检测(同理)、22:44 晚间回卧室就寝检测到占用。这些触发时间和持续时长均与正常生活作息吻合。\",\n \"推理步骤3: 对比厨房温度传感器(kitchen_temp_sensor)在 07:04、07:31、18:37、19:23 四次上报 None 值的情况,主卧温度传感器从未出现 None 值,说明其通信链路和硬件状态稳定可靠。\",\n \"推理步骤4: 主卧其他关联设备(灯、窗帘、窗户传感器)的状态变化也与运动传感器数据相互印证——06:15 检测到人后灯亮,07:34 出门前灯灭,22:44 回卧室后窗帘关闭、灯灭就寝,逻辑链完整无矛盾。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48次采样均正常上报,数值范围 22.90°C~25.84°C,无 None 值,温度曲线与其他房间同步\",\n \"master_bedroom_occupancy 触发时间(06:15、07:57、08:02、22:44)与灯光/窗帘操作时间高度吻合,传感器响应正常\",\n \"与存在 None 值异常的 kitchen_temp_sensor 形成对比,主卧传感器数据完整无缺失\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\",\n \"建议关注厨房温度传感器(kitchen_temp_sensor)多次上报 None 的问题,可能存在设备故障或通信干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器的数据均符合预期。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天48个采样点(每30分钟一次)均正常上报数值,无一次出现 None 或缺失,数值范围为 2290~2584(即 22.90°C~25.84°C),与同期其他房间温度走势一致,呈现夜间低、午间高的合理日变化曲线。", "推理步骤2: 主卧运动传感器(master_bedroom_occupancy)在全天共触发5次状态变化:06:15 起床检测到占用(与随后开灯一致)、07:57-07:57:45 短暂检测到运动(家人出门前可能回房取物)、08:02-08:03 再次短暂检测(同理)、22:44 晚间回卧室就寝检测到占用。这些触发时间和持续时长均与正常生活作息吻合。", "推理步骤3: 对比厨房温度传感器(kitchen_temp_sensor)在 07:04、07:31、18:37、19:23 四次上报 None 值的情况,主卧温度传感器从未出现 None 值,说明其通信链路和硬件状态稳定可靠。", "推理步骤4: 主卧其他关联设备(灯、窗帘、窗户传感器)的状态变化也与运动传感器数据相互印证——06:15 检测到人后灯亮,07:34 出门前灯灭,22:44 回卧室后窗帘关闭、灯灭就寝,逻辑链完整无矛盾。"], "key_evidence": ["master_bedroom_temp_sensor 全天48次采样均正常上报,数值范围 22.90°C~25.84°C,无 None 值,温度曲线与其他房间同步", "master_bedroom_occupancy 触发时间(06:15、07:57、08:02、22:44)与灯光/窗帘操作时间高度吻合,传感器响应正常", "与存在 None 值异常的 kitchen_temp_sensor 形成对比,主卧传感器数据完整无缺失"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好", "建议关注厨房温度传感器(kitchen_temp_sensor)多次上报 None 的问题,可能存在设备故障或通信干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.653756618499756, "api_error": null} {"episode_id": "SQ1_FP_C_0095", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0095.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20260724, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-26T06:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器疑似故障:全天仅有两次极短暂的触发且无后续人员活动关联,与该房间其他设备缺乏联动,行为模式异常。\",\n \"reasoning\": [\n \"推理步骤1: 次卧区域共有运动传感器(second_bedroom_occupancy)、灯(second_bedroom_light)、空调(second_bedroom_ac)、窗帘(second_bedroom_window)、窗户传感器(second_bedroom_window_contact)等设备。整日日志中,仅运动传感器有事件记录,其余设备全天无任何状态变化。\",\n \"推理步骤2: 运动传感器在06:42:00触发Occupancy=1,仅45秒后(06:42:45)就变回Occupancy=0;随后在06:47:20再次触发Occupancy=1,50秒后(06:48:10)又变回Occupancy=0。两次触发间隔约5分钟,每次持续时间都不到1分钟,极为短暂。\",\n \"推理步骤3: 这两次触发发生在早晨06:42-06:48期间,此时家中其他区域有明确的人员活动(主卧、儿童房、厨房、卫生间均有传感器和灯光联动)。但次卧的两次运动检测没有触发任何关联设备——灯未开、空调未动、窗帘未动,说明并非真正有人进入次卧活动。\",\n \"推理步骤4: 正常的人员进入房间会伴随开灯、停留一段时间等行为。两次不到1分钟的孤立触发更像是传感器误触发(如灵敏度过高导致的误报、传感器硬件间歇性故障、或受到走廊/相邻房间活动的干扰)。\",\n \"推理步骤5: 16:27有人回家后,次卧运动传感器全天再无任何触发,进一步说明该房间当天无人实际使用,早晨的两次触发属于异常信号。\",\n \"推理步骤6: 次卧没有温度传感器,无法通过温度数据交叉验证。但窗户传感器(second_bedroom_window_contact)全天无事件,说明窗户状态未变,排除了外部入侵的可能性。综合判断为传感器自身故障或误报。\"\n ],\n \"key_evidence\": [\n \"second_bedroom_occupancy 全天仅在06:42-06:48出现两次极短暂触发(分别持续45秒和50秒),之后再无任何事件\",\n \"两次运动检测均未触发次卧任何关联设备(灯、空调、窗帘均无状态变化),不符合正常人员活动模式\",\n \"次卧其他所有设备(灯、空调、窗帘、窗户传感器)全天零事件记录,表明该房间当天无人实际使用\",\n \"同一时段家中其他房间的运动传感器触发均伴随灯光等设备联动,形成鲜明对比\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置和朝向,确认是否受到走廊或相邻房间活动的干扰\",\n \"检查传感器电池电量或供电状态,低电量可能导致间歇性误触发\",\n \"适当降低运动传感器灵敏度,或调整检测区域以减少误报\",\n \"持续观察数天,如果类似的短暂孤立触发反复出现,建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧运动传感器疑似故障:全天仅有两次极短暂的触发且无后续人员活动关联,与该房间其他设备缺乏联动,行为模式异常。", "reasoning": ["推理步骤1: 次卧区域共有运动传感器(second_bedroom_occupancy)、灯(second_bedroom_light)、空调(second_bedroom_ac)、窗帘(second_bedroom_window)、窗户传感器(second_bedroom_window_contact)等设备。整日日志中,仅运动传感器有事件记录,其余设备全天无任何状态变化。", "推理步骤2: 运动传感器在06:42:00触发Occupancy=1,仅45秒后(06:42:45)就变回Occupancy=0;随后在06:47:20再次触发Occupancy=1,50秒后(06:48:10)又变回Occupancy=0。两次触发间隔约5分钟,每次持续时间都不到1分钟,极为短暂。", "推理步骤3: 这两次触发发生在早晨06:42-06:48期间,此时家中其他区域有明确的人员活动(主卧、儿童房、厨房、卫生间均有传感器和灯光联动)。但次卧的两次运动检测没有触发任何关联设备——灯未开、空调未动、窗帘未动,说明并非真正有人进入次卧活动。", "推理步骤4: 正常的人员进入房间会伴随开灯、停留一段时间等行为。两次不到1分钟的孤立触发更像是传感器误触发(如灵敏度过高导致的误报、传感器硬件间歇性故障、或受到走廊/相邻房间活动的干扰)。", "推理步骤5: 16:27有人回家后,次卧运动传感器全天再无任何触发,进一步说明该房间当天无人实际使用,早晨的两次触发属于异常信号。", "推理步骤6: 次卧没有温度传感器,无法通过温度数据交叉验证。但窗户传感器(second_bedroom_window_contact)全天无事件,说明窗户状态未变,排除了外部入侵的可能性。综合判断为传感器自身故障或误报。"], "key_evidence": ["second_bedroom_occupancy 全天仅在06:42-06:48出现两次极短暂触发(分别持续45秒和50秒),之后再无任何事件", "两次运动检测均未触发次卧任何关联设备(灯、空调、窗帘均无状态变化),不符合正常人员活动模式", "次卧其他所有设备(灯、空调、窗帘、窗户传感器)全天零事件记录,表明该房间当天无人实际使用", "同一时段家中其他房间的运动传感器触发均伴随灯光等设备联动,形成鲜明对比"], "recommended_actions": ["检查次卧运动传感器的安装位置和朝向,确认是否受到走廊或相邻房间活动的干扰", "检查传感器电池电量或供电状态,低电量可能导致间歇性误触发", "适当降低运动传感器灵敏度,或调整检测区域以减少误报", "持续观察数天,如果类似的短暂孤立触发反复出现,建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.880735158920288, "api_error": null} {"episode_id": "SQ1_FP_C_0097", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0097.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20260726, "scenario_id": "DF-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-14T19:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调开启后出现周期性异常尖峰读数,疑似传感器故障或受空调气流干扰。\",\n \"reasoning\": [\n \"推理步骤1: 00:00-19:30期间,客厅温度传感器与其他三个房间(主卧、儿童房、厨房)的温度走势高度一致,均呈现夜间低温(~22.9°C)→午间高温(~25.8°C)→傍晚回落(~24.3°C)的正常日变化曲线。\",\n \"推理步骤2: 19:44客厅空调开启(OnOff=True),同一时刻客厅温度传感器突然从约24.4°C跳升至25.0°C,这与开空调后温度应逐渐下降的预期相矛盾。\",\n \"推理步骤3: 空调开启后,客厅温度传感器在每个整点/半点的常规读数中显示温度正常下降(20:00→24.1°C, 20:30→24.0°C, 21:00→23.8°C),与其他房间的自然降温趋势一致甚至略快,说明空调确实在制冷。\",\n \"推理步骤4: 但在整点之间(19:44, 20:14, 20:44, 21:14),客厅温度传感器反复出现约25.0°C的异常尖峰读数(2500, 2502, 2498, 2501),与前后正常读数相差约1°C,且数值高度集中在2500附近,呈现不自然的周期性模式。\",\n \"推理步骤5: 这些异常尖峰仅出现在客厅温度传感器上,其他三个房间的传感器在同一时段无任何类似跳变,排除了环境因素(如全屋突然升温)的可能性。\",\n \"推理步骤6: 尖峰间隔约30分钟且数值几乎恒定在~2500,这种规律性更像是传感器硬件故障(如ADC采样错误、固件bug导致周期性回报默认值)或受空调运行振动/气流干扰,而非真实温度变化。\"\n ],\n \"key_evidence\": [\n \"19:44空调开启瞬间,客厅温度从~2440突跳至2500,与制冷预期矛盾\",\n \"20:14读数2502、20:44读数2498、21:14读数2501——空调运行期间每隔约30分钟出现一次~2500的异常尖峰\",\n \"异常尖峰值高度集中在2498-2502范围,数值稳定性不自然\",\n \"同时段主卧、儿童房、厨房传感器均无类似异常跳变\",\n \"整点/半点的常规采样读数(如20:00的2411、21:00的2376)走势正常且持续下降\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的安装位置,确认是否处于空调出风口直吹范围内,如是则重新选址安装\",\n \"检查传感器固件版本,查看是否有已知的周期性采样异常bug,必要时升级固件\",\n \"对传感器进行硬件诊断或更换,排除ADC模块间歇性故障的可能\",\n \"临时在客厅增设一个备用温度传感器进行交叉验证,确认异常读数是否为传感器自身问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调开启后出现周期性异常尖峰读数,疑似传感器故障或受空调气流干扰。", "reasoning": ["推理步骤1: 00:00-19:30期间,客厅温度传感器与其他三个房间(主卧、儿童房、厨房)的温度走势高度一致,均呈现夜间低温(~22.9°C)→午间高温(~25.8°C)→傍晚回落(~24.3°C)的正常日变化曲线。", "推理步骤2: 19:44客厅空调开启(OnOff=True),同一时刻客厅温度传感器突然从约24.4°C跳升至25.0°C,这与开空调后温度应逐渐下降的预期相矛盾。", "推理步骤3: 空调开启后,客厅温度传感器在每个整点/半点的常规读数中显示温度正常下降(20:00→24.1°C, 20:30→24.0°C, 21:00→23.8°C),与其他房间的自然降温趋势一致甚至略快,说明空调确实在制冷。", "推理步骤4: 但在整点之间(19:44, 20:14, 20:44, 21:14),客厅温度传感器反复出现约25.0°C的异常尖峰读数(2500, 2502, 2498, 2501),与前后正常读数相差约1°C,且数值高度集中在2500附近,呈现不自然的周期性模式。", "推理步骤5: 这些异常尖峰仅出现在客厅温度传感器上,其他三个房间的传感器在同一时段无任何类似跳变,排除了环境因素(如全屋突然升温)的可能性。", "推理步骤6: 尖峰间隔约30分钟且数值几乎恒定在~2500,这种规律性更像是传感器硬件故障(如ADC采样错误、固件bug导致周期性回报默认值)或受空调运行振动/气流干扰,而非真实温度变化。"], "key_evidence": ["19:44空调开启瞬间,客厅温度从~2440突跳至2500,与制冷预期矛盾", "20:14读数2502、20:44读数2498、21:14读数2501——空调运行期间每隔约30分钟出现一次~2500的异常尖峰", "异常尖峰值高度集中在2498-2502范围,数值稳定性不自然", "同时段主卧、儿童房、厨房传感器均无类似异常跳变", "整点/半点的常规采样读数(如20:00的2411、21:00的2376)走势正常且持续下降"], "recommended_actions": ["检查客厅温度传感器的安装位置,确认是否处于空调出风口直吹范围内,如是则重新选址安装", "检查传感器固件版本,查看是否有已知的周期性采样异常bug,必要时升级固件", "对传感器进行硬件诊断或更换,排除ADC模块间歇性故障的可能", "临时在客厅增设一个备用温度传感器进行交叉验证,确认异常读数是否为传感器自身问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.59286379814148, "api_error": null} {"episode_id": "SQ1_FP_C_0101", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0101.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260730, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-17T14:34:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天持续每30分钟上报一次温度数据,从00:00到23:30无缺失周期,未出现 None 值,数据连续性良好。\",\n \"推理步骤2: 温度数值变化趋势合理——凌晨约23.0°C,随日间升温至中午峰值约25.8°C,午后逐步回落,晚间降至约23.4°C,符合夏季(6月)自然昼夜温度曲线。\",\n \"推理步骤3: 14:34主卧空调开启后,主卧温度传感器在15:04和15:34分别报告了额外的中间读数(2502、2498),显示传感器能灵敏响应环境变化,且温度下降趋势与空调制冷一致(Thermostat.SystemMode=3 为制冷模式在客厅,主卧空调同样开启),说明传感器精度和响应性正常。\",\n \"推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:33检测到有人活动(起床),22:17再次检测到有人(就寝),与全屋生活动线吻合——起床后去卫生间、厨房做早餐、出门;晚间回家后最终回卧室休息。触发时间和频率合理,无深夜异常触发。\",\n \"推理步骤5: 主卧温度与其他房间(客厅、儿童房、厨房)的温度走势高度一致,各房间之间温差始终在合理范围内(±1°C左右),排除了主卧温度传感器漂移或故障的可能。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48个半小时周期均有有效数值上报,无 None 或异常跳变\",\n \"温度范围 22.93°C ~ 25.86°C,与同期其他房间传感器数据一致,符合夏季室内温度特征\",\n \"空调开启后出现额外温度上报(15:04、15:34、16:04),传感器响应灵敏且数值变化方向正确\",\n \"master_bedroom_occupancy 仅在06:33和22:17触发,与住户作息(早起、就寝)完全吻合\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域所有传感器运行状态正常\",\n \"可持续监控,若后续出现温度突变或运动传感器深夜频繁触发再做排查\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天持续每30分钟上报一次温度数据,从00:00到23:30无缺失周期,未出现 None 值,数据连续性良好。", "推理步骤2: 温度数值变化趋势合理——凌晨约23.0°C,随日间升温至中午峰值约25.8°C,午后逐步回落,晚间降至约23.4°C,符合夏季(6月)自然昼夜温度曲线。", "推理步骤3: 14:34主卧空调开启后,主卧温度传感器在15:04和15:34分别报告了额外的中间读数(2502、2498),显示传感器能灵敏响应环境变化,且温度下降趋势与空调制冷一致(Thermostat.SystemMode=3 为制冷模式在客厅,主卧空调同样开启),说明传感器精度和响应性正常。", "推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:33检测到有人活动(起床),22:17再次检测到有人(就寝),与全屋生活动线吻合——起床后去卫生间、厨房做早餐、出门;晚间回家后最终回卧室休息。触发时间和频率合理,无深夜异常触发。", "推理步骤5: 主卧温度与其他房间(客厅、儿童房、厨房)的温度走势高度一致,各房间之间温差始终在合理范围内(±1°C左右),排除了主卧温度传感器漂移或故障的可能。"], "key_evidence": ["master_bedroom_temp_sensor 全天48个半小时周期均有有效数值上报,无 None 或异常跳变", "温度范围 22.93°C ~ 25.86°C,与同期其他房间传感器数据一致,符合夏季室内温度特征", "空调开启后出现额外温度上报(15:04、15:34、16:04),传感器响应灵敏且数值变化方向正确", "master_bedroom_occupancy 仅在06:33和22:17触发,与住户作息(早起、就寝)完全吻合"], "recommended_actions": ["无需采取措施,主卧区域所有传感器运行状态正常", "可持续监控,若后续出现温度突变或运动传感器深夜频繁触发再做排查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.637084484100342, "api_error": null} {"episode_id": "SQ1_FP_C_0105", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0105.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260734, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-02T15:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器在下午15:03-15:09期间检测到活动,但入户门未开锁、未开门,且无后续入室行为,疑似传感器误触发或存在故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域有两个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)和玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 在15:03:00和15:08:20,entrance_occupancy两次检测到有人(Occupancy=1),随后分别在15:03:45和15:09:10恢复为无人(Occupancy=0)。\",\n \"推理步骤3: 但在这两次触发期间,front_door_lock没有任何开锁事件,front_door_contact也没有开门记录(门保持关闭状态)。这意味着没有人通过入户门进出。\",\n \"推理步骤4: 对比正常的进出事件(07:13和16:30、17:51),每次都伴随门锁解锁+门传感器开门+运动传感器触发的完整序列。而15:03的事件缺少门锁和门传感器的配合。\",\n \"推理步骤5: 两次触发间隔约5分钟,持续时间短(45秒和50秒),没有触发任何灯光或其他室内活动,不像是有人在玄关区域正常活动。可能是传感器受到干扰(如宠物、光线变化、设备灵敏度问题)导致的误触发。\"\n ],\n \"key_evidence\": [\n \"15:03:00和15:08:20 entrance_occupancy两次触发,但同期无任何door_lock或door_contact事件\",\n \"正常进出模式(07:13、16:30、17:51)均有完整的 门锁→门传感器→运动传感器 事件链,而15:03的触发缺失前两环\",\n \"两次触发持续时间极短(45秒、50秒),无后续室内活动痕迹\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器的安装位置和灵敏度设置,确认是否存在误触发源(如宠物、窗外光线等)\",\n \"查看是否有其他时段出现类似的孤立触发记录,评估是否为偶发还是频繁故障\",\n \"如果家中无宠物且排除环境干扰,建议适当降低传感器灵敏度或更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器在下午15:03-15:09期间检测到活动,但入户门未开锁、未开门,且无后续入室行为,疑似传感器误触发或存在故障。", "reasoning": ["推理步骤1: entrance 区域有两个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)和玄关运动传感器(entrance_occupancy)。", "推理步骤2: 在15:03:00和15:08:20,entrance_occupancy两次检测到有人(Occupancy=1),随后分别在15:03:45和15:09:10恢复为无人(Occupancy=0)。", "推理步骤3: 但在这两次触发期间,front_door_lock没有任何开锁事件,front_door_contact也没有开门记录(门保持关闭状态)。这意味着没有人通过入户门进出。", "推理步骤4: 对比正常的进出事件(07:13和16:30、17:51),每次都伴随门锁解锁+门传感器开门+运动传感器触发的完整序列。而15:03的事件缺少门锁和门传感器的配合。", "推理步骤5: 两次触发间隔约5分钟,持续时间短(45秒和50秒),没有触发任何灯光或其他室内活动,不像是有人在玄关区域正常活动。可能是传感器受到干扰(如宠物、光线变化、设备灵敏度问题)导致的误触发。"], "key_evidence": ["15:03:00和15:08:20 entrance_occupancy两次触发,但同期无任何door_lock或door_contact事件", "正常进出模式(07:13、16:30、17:51)均有完整的 门锁→门传感器→运动传感器 事件链,而15:03的触发缺失前两环", "两次触发持续时间极短(45秒、50秒),无后续室内活动痕迹"], "recommended_actions": ["检查玄关运动传感器的安装位置和灵敏度设置,确认是否存在误触发源(如宠物、窗外光线等)", "查看是否有其他时段出现类似的孤立触发记录,评估是否为偶发还是频繁故障", "如果家中无宠物且排除环境干扰,建议适当降低传感器灵敏度或更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.850895404815674, "api_error": null} {"episode_id": "SQ1_FP_C_0104", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0104.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260733, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-05T14:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器在无人在家期间出现两次短暂触发,且入户门锁和门磁均无对应事件,疑似传感器误触发或故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 全天日志中,entrance_occupancy 共触发 4 次有人状态。其中 07:41:32 和 16:29:03 和 18:15:03 三次均伴随门锁解锁和门磁开合事件,属于正常出入行为。\",\n \"推理步骤3: 但在 14:08:00 和 14:13:20 出现了两次短暂的运动检测(14:08:00→14:08:45 持续约45秒,14:13:20→14:14:10 持续约50秒),这两次触发期间没有任何门锁操作、门磁状态变化,也没有灯被打开。\",\n \"推理步骤4: 根据时间线,住户在 07:41 出门(门锁上锁、全屋灯关闭),直到 16:29 才有人通过门锁开门回家。因此 14:08~14:14 期间家中应无人。\",\n \"推理步骤5: 在无人在家且门锁未被操作的情况下,玄关运动传感器两次短暂触发,间隔约5分钟,每次持续不到1分钟即恢复,更符合传感器误触发的特征(如热源干扰、昆虫经过、传感器灵敏度漂移等),而非真实入侵。若为入侵,通常会伴随门锁或门磁的异常事件。\",\n \"推理步骤6: 玄关灯(entrance_light)全天无任何开关记录,说明即使运动传感器触发也未联动灯光,可能灯光联动未配置,也可能进一步佐证这是传感器层面的异常。\"\n ],\n \"key_evidence\": [\n \"14:08:00 entrance_occupancy 触发有人,14:08:45 恢复无人(持续45秒),期间无门锁/门磁事件\",\n \"14:13:20 entrance_occupancy 再次触发有人,14:14:10 恢复无人(持续50秒),期间同样无门锁/门磁事件\",\n \"07:41 住户出门后门锁自动上锁,直到 16:29 才有下一次门锁解锁记录,14:08~14:14 期间家中应无人\",\n \"两次触发持续时间极短且间隔仅约5分钟,不符合正常人员活动模式\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器的安装位置,确认是否存在热源干扰(如阳光直射、暖气管道)或宠物活动\",\n \"查看传感器的灵敏度设置,适当降低灵敏度以减少误触发\",\n \"如果问题持续出现,建议更换传感器电池或传感器本体,排除硬件老化故障\",\n \"建议配置联动规则:无人在家模式下玄关运动传感器触发时推送告警通知,以便及时排查是误报还是真实入侵\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器在无人在家期间出现两次短暂触发,且入户门锁和门磁均无对应事件,疑似传感器误触发或故障。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 全天日志中,entrance_occupancy 共触发 4 次有人状态。其中 07:41:32 和 16:29:03 和 18:15:03 三次均伴随门锁解锁和门磁开合事件,属于正常出入行为。", "推理步骤3: 但在 14:08:00 和 14:13:20 出现了两次短暂的运动检测(14:08:00→14:08:45 持续约45秒,14:13:20→14:14:10 持续约50秒),这两次触发期间没有任何门锁操作、门磁状态变化,也没有灯被打开。", "推理步骤4: 根据时间线,住户在 07:41 出门(门锁上锁、全屋灯关闭),直到 16:29 才有人通过门锁开门回家。因此 14:08~14:14 期间家中应无人。", "推理步骤5: 在无人在家且门锁未被操作的情况下,玄关运动传感器两次短暂触发,间隔约5分钟,每次持续不到1分钟即恢复,更符合传感器误触发的特征(如热源干扰、昆虫经过、传感器灵敏度漂移等),而非真实入侵。若为入侵,通常会伴随门锁或门磁的异常事件。", "推理步骤6: 玄关灯(entrance_light)全天无任何开关记录,说明即使运动传感器触发也未联动灯光,可能灯光联动未配置,也可能进一步佐证这是传感器层面的异常。"], "key_evidence": ["14:08:00 entrance_occupancy 触发有人,14:08:45 恢复无人(持续45秒),期间无门锁/门磁事件", "14:13:20 entrance_occupancy 再次触发有人,14:14:10 恢复无人(持续50秒),期间同样无门锁/门磁事件", "07:41 住户出门后门锁自动上锁,直到 16:29 才有下一次门锁解锁记录,14:08~14:14 期间家中应无人", "两次触发持续时间极短且间隔仅约5分钟,不符合正常人员活动模式"], "recommended_actions": ["检查玄关运动传感器的安装位置,确认是否存在热源干扰(如阳光直射、暖气管道)或宠物活动", "查看传感器的灵敏度设置,适当降低灵敏度以减少误触发", "如果问题持续出现,建议更换传感器电池或传感器本体,排除硬件老化故障", "建议配置联动规则:无人在家模式下玄关运动传感器触发时推送告警通知,以便及时排查是误报还是真实入侵"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.379880666732788, "api_error": null} {"episode_id": "SQ1_FP_C_0107", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0107.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260736, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kids_room", "injection_time": "2026-06-11T08:29:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房温度传感器在白天无人时段出现多次异常偏高读数,疑似传感器间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 儿童房温度传感器在凌晨至清晨(00:00-05:30)的读数与其他房间基本一致,均在 22.9°C-23.1°C 范围内波动,表现正常。\",\n \"推理步骤2: 从 06:00 起全屋温度因日间升温同步上升,儿童房传感器读数与客厅、主卧、厨房保持一致趋势,这部分正常。\",\n \"推理步骤3: 但在 08:29 时,儿童房温度传感器单独报告了 2500(25.00°C),而同一时刻(08:30)的整点读数回落到 2461(24.61°C),客厅 2453、主卧 2467、厨房 2452。这意味着在约1分钟内出现了一个比周围房间高出约 0.4°C 的尖峰,随后立即回落。\",\n \"推理步骤4: 类似的尖峰在 08:59(2502)、09:29(2498)、09:59(2501)反复出现,每次都在整点半小时读数之间插入一个偏高值,而整点读数本身与其他房间保持一致。这种'整点正常、半点前1分钟偏高'的规律性模式不符合真实物理温度变化。\",\n \"推理步骤5: 此时段(07:24 出门后至 16:22 回家前)家中无人,儿童房无运动传感器触发、无设备开启,不存在局部热源。其他三个温度传感器在同时段无此现象。\",\n \"推理步骤6: 该异常仅出现在上午时段(约 08:29-09:59),之后自行消失,属于间歇性故障特征,可能是传感器采样电路在特定温度区间(约 24.5-25°C)出现漂移或ADC转换偶发错误。\"\n ],\n \"key_evidence\": [\n \"08:29 儿童房温度 2500,而 08:30 整点读数为 2461(其他房间 2452-2467),1分钟内落差约 0.4°C\",\n \"08:59 读数 2502、09:29 读数 2498、09:59 读数 2501,均为整点前约1分钟出现的异常偏高值\",\n \"该时段家中无人(07:24 出门、16:22 回家),儿童房无任何活动或热源\",\n \"其他三个温度传感器(客厅、主卧、厨房)在同时段无类似尖峰现象\"\n ],\n \"recommended_actions\": [\n \"持续监测儿童房温度传感器,观察该间歇性尖峰是否在后续几天重复出现\",\n \"检查传感器固件版本,确认是否有已知的采样精度问题,必要时更新固件\",\n \"如果异常持续,建议更换儿童房温度传感器或重新校准\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "儿童房温度传感器在白天无人时段出现多次异常偏高读数,疑似传感器间歇性故障。", "reasoning": ["推理步骤1: 儿童房温度传感器在凌晨至清晨(00:00-05:30)的读数与其他房间基本一致,均在 22.9°C-23.1°C 范围内波动,表现正常。", "推理步骤2: 从 06:00 起全屋温度因日间升温同步上升,儿童房传感器读数与客厅、主卧、厨房保持一致趋势,这部分正常。", "推理步骤3: 但在 08:29 时,儿童房温度传感器单独报告了 2500(25.00°C),而同一时刻(08:30)的整点读数回落到 2461(24.61°C),客厅 2453、主卧 2467、厨房 2452。这意味着在约1分钟内出现了一个比周围房间高出约 0.4°C 的尖峰,随后立即回落。", "推理步骤4: 类似的尖峰在 08:59(2502)、09:29(2498)、09:59(2501)反复出现,每次都在整点半小时读数之间插入一个偏高值,而整点读数本身与其他房间保持一致。这种'整点正常、半点前1分钟偏高'的规律性模式不符合真实物理温度变化。", "推理步骤5: 此时段(07:24 出门后至 16:22 回家前)家中无人,儿童房无运动传感器触发、无设备开启,不存在局部热源。其他三个温度传感器在同时段无此现象。", "推理步骤6: 该异常仅出现在上午时段(约 08:29-09:59),之后自行消失,属于间歇性故障特征,可能是传感器采样电路在特定温度区间(约 24.5-25°C)出现漂移或ADC转换偶发错误。"], "key_evidence": ["08:29 儿童房温度 2500,而 08:30 整点读数为 2461(其他房间 2452-2467),1分钟内落差约 0.4°C", "08:59 读数 2502、09:29 读数 2498、09:59 读数 2501,均为整点前约1分钟出现的异常偏高值", "该时段家中无人(07:24 出门、16:22 回家),儿童房无任何活动或热源", "其他三个温度传感器(客厅、主卧、厨房)在同时段无类似尖峰现象"], "recommended_actions": ["持续监测儿童房温度传感器,观察该间歇性尖峰是否在后续几天重复出现", "检查传感器固件版本,确认是否有已知的采样精度问题,必要时更新固件", "如果异常持续,建议更换儿童房温度传感器或重新校准"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.944566011428833, "api_error": null} {"episode_id": "SQ1_FP_C_0117", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0117.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260746, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-18T08:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器疑似故障:全天仅在无人时段出现两次极短暂的占用信号,且无任何关联设备响应,高度疑似传感器误触发或硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 次卧区域共有运动传感器(second_bedroom_occupancy)、灯(second_bedroom_light)、空调(second_bedroom_ac)、窗帘(second_bedroom_window)、窗户传感器(second_bedroom_window_contact)五个设备。整个24小时日志中,仅运动传感器产生了事件,其余四个设备全天无任何状态变化记录。\",\n \"推理步骤2: 运动传感器在08:32:00触发占用(=1),仅45秒后(08:32:45)就恢复为无人(=0);随后08:37:20再次触发,50秒后(08:38:10)又恢复。两次触发间隔约5分钟,每次持续不到1分钟,模式高度一致且异常短暂。\",\n \"推理步骤3: 此时段(08:30左右)家中应无人——早上07:10全家已出门(关灯、锁门、自动上锁),下一次入户门开启是16:23。在确认无人的时段内出现运动检测,排除正常人员活动的可能。\",\n \"推理步骤4: 如果是真实入侵,入侵者需要通过入户门或窗户进入,但入户门传感器和门锁在07:10~16:23之间无任何开启记录,次卧窗户传感器也全天无变化。没有任何入侵路径的证据。\",\n \"推理步骤5: 两次触发均未伴随灯光开启、空调启动或窗帘移动等人为操作,进一步排除有人实际进入次卧的可能。这种无关联设备响应的孤立短暂触发,是PIR运动传感器常见的误报模式(可能由温度变化、昆虫、气流等引起)。\",\n \"推理步骤6: 对比同一时段(08:00-08:30)的温度数据,各房间温度正处于快速上升阶段(从约24.6°C升至约24.9°C),室内温度梯度变化可能导致PIR传感器误触发。\"\n ],\n \"key_evidence\": [\n \"次卧运动传感器在确认无人在家时段(08:32-08:38)出现两次短暂触发,每次持续不到1分钟\",\n \"入户门锁和门传感器在07:10:31上锁后直到16:23:00才再次开启,期间无人进出\",\n \"次卧窗户传感器全天无开合记录,排除窗户入侵路径\",\n \"次卧灯、空调、窗帘全天零事件,无任何人为操作痕迹\",\n \"两次触发模式高度一致(短暂触发后快速恢复),符合传感器误报特征\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否对准窗户、空调出风口或阳光直射区域,这些都可能导致PIR误触发\",\n \"清洁传感器镜头,检查是否有灰尘、蜘蛛网等干扰物\",\n \"观察未来几天是否在无人时段持续出现类似短暂触发,如果频繁复现建议更换传感器\",\n \"考虑调低传感器灵敏度或增加触发确认时间窗口,减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧运动传感器疑似故障:全天仅在无人时段出现两次极短暂的占用信号,且无任何关联设备响应,高度疑似传感器误触发或硬件故障。", "reasoning": ["推理步骤1: 次卧区域共有运动传感器(second_bedroom_occupancy)、灯(second_bedroom_light)、空调(second_bedroom_ac)、窗帘(second_bedroom_window)、窗户传感器(second_bedroom_window_contact)五个设备。整个24小时日志中,仅运动传感器产生了事件,其余四个设备全天无任何状态变化记录。", "推理步骤2: 运动传感器在08:32:00触发占用(=1),仅45秒后(08:32:45)就恢复为无人(=0);随后08:37:20再次触发,50秒后(08:38:10)又恢复。两次触发间隔约5分钟,每次持续不到1分钟,模式高度一致且异常短暂。", "推理步骤3: 此时段(08:30左右)家中应无人——早上07:10全家已出门(关灯、锁门、自动上锁),下一次入户门开启是16:23。在确认无人的时段内出现运动检测,排除正常人员活动的可能。", "推理步骤4: 如果是真实入侵,入侵者需要通过入户门或窗户进入,但入户门传感器和门锁在07:10~16:23之间无任何开启记录,次卧窗户传感器也全天无变化。没有任何入侵路径的证据。", "推理步骤5: 两次触发均未伴随灯光开启、空调启动或窗帘移动等人为操作,进一步排除有人实际进入次卧的可能。这种无关联设备响应的孤立短暂触发,是PIR运动传感器常见的误报模式(可能由温度变化、昆虫、气流等引起)。", "推理步骤6: 对比同一时段(08:00-08:30)的温度数据,各房间温度正处于快速上升阶段(从约24.6°C升至约24.9°C),室内温度梯度变化可能导致PIR传感器误触发。"], "key_evidence": ["次卧运动传感器在确认无人在家时段(08:32-08:38)出现两次短暂触发,每次持续不到1分钟", "入户门锁和门传感器在07:10:31上锁后直到16:23:00才再次开启,期间无人进出", "次卧窗户传感器全天无开合记录,排除窗户入侵路径", "次卧灯、空调、窗帘全天零事件,无任何人为操作痕迹", "两次触发模式高度一致(短暂触发后快速恢复),符合传感器误报特征"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否对准窗户、空调出风口或阳光直射区域,这些都可能导致PIR误触发", "清洁传感器镜头,检查是否有灰尘、蜘蛛网等干扰物", "观察未来几天是否在无人时段持续出现类似短暂触发,如果频繁复现建议更换传感器", "考虑调低传感器灵敏度或增加触发确认时间窗口,减少误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.45054578781128, "api_error": null} {"episode_id": "SQ1_FP_C_0121", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0121.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260750, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-01T14:00:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器在无人在家期间出现两次短暂触发,且入户门锁和门磁均无对应事件,疑似传感器误触发或故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含四个设备——入户门锁(front_door_lock)、入户门磁(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查其日志表现。\",\n \"推理步骤2: 入户门锁在全天有三次正常操作:07:49 手动开锁→自动上锁(早晨出门)、16:33 手动开锁(下午回家)、17:52 手动开锁(另一人回家),22:45 自动上锁(睡前锁门)。开锁/上锁配对完整,操作源合理,无异常。\",\n \"推理步骤3: 入户门磁(front_door_contact)在 07:49 开→关、16:33 开(有人进门)、22:45 关并上锁,与门锁事件完全吻合,工作正常。\",\n \"推理步骤4: 玄关灯(entrance_light)全天无任何开关事件记录。考虑到白天出门/回家时段光线充足,可能不需要开灯,这本身不构成异常。\",\n \"推理步骤5: 重点异常——玄关运动传感器(entrance_occupancy)在 14:00 和 14:05 出现了两次短暂触发(14:00→14:00:45 占用约45秒,14:05:20→14:06:10 占用约50秒)。然而此时段全家已于 07:49 出门,门锁处于锁定状态,门磁无开门记录,没有任何人通过入户门进入。\",\n \"推理步骤6: 如果是真实的人员活动,应当伴随门锁解锁或门磁打开事件,但两者均未发生。同时也没有其他房间的运动传感器被触发,排除了有人从室内走到玄关的可能(07:49后到16:33前无任何房间有occupancy事件)。\",\n \"推理步骤7: 两次触发间隔约5分钟,持续时间短且相近,更符合传感器误触发的模式(如热源干扰、宠物活动、传感器灵敏度过高或硬件间歇性故障),而非真实入侵。若为入侵,通常会有更持续的活动和其他设备联动。\"\n ],\n \"key_evidence\": [\n \"14:00:00 entrance_occupancy 触发(Occupancy=1),14:00:45 恢复(Occupancy=0),期间门锁未解锁、门磁未打开\",\n \"14:05:20 entrance_occupancy 再次触发(Occupancy=1),14:06:10 恢复(Occupancy=0),同样无门锁/门磁事件\",\n \"07:49 全家出门后门锁自动上锁,直到 16:33 才有下一次开锁记录,期间家中应无人\",\n \"两次触发持续时间极短(45秒和50秒),且无其他房间传感器联动\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器的安装位置和灵敏度设置,确认是否对准了窗户、暖气片等可能产生热源变化的区域\",\n \"排查是否有宠物在家中活动,若有宠物建议调整传感器灵敏度或更换支持宠物免疫的型号\",\n \"持续监控该传感器,若类似无关联的短暂触发反复出现,建议更换传感器硬件\",\n \"可考虑增加玄关摄像头作为交叉验证手段,以便在运动传感器触发时确认是否有真实活动\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器在无人在家期间出现两次短暂触发,且入户门锁和门磁均无对应事件,疑似传感器误触发或故障。", "reasoning": ["推理步骤1: entrance 区域包含四个设备——入户门锁(front_door_lock)、入户门磁(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查其日志表现。", "推理步骤2: 入户门锁在全天有三次正常操作:07:49 手动开锁→自动上锁(早晨出门)、16:33 手动开锁(下午回家)、17:52 手动开锁(另一人回家),22:45 自动上锁(睡前锁门)。开锁/上锁配对完整,操作源合理,无异常。", "推理步骤3: 入户门磁(front_door_contact)在 07:49 开→关、16:33 开(有人进门)、22:45 关并上锁,与门锁事件完全吻合,工作正常。", "推理步骤4: 玄关灯(entrance_light)全天无任何开关事件记录。考虑到白天出门/回家时段光线充足,可能不需要开灯,这本身不构成异常。", "推理步骤5: 重点异常——玄关运动传感器(entrance_occupancy)在 14:00 和 14:05 出现了两次短暂触发(14:00→14:00:45 占用约45秒,14:05:20→14:06:10 占用约50秒)。然而此时段全家已于 07:49 出门,门锁处于锁定状态,门磁无开门记录,没有任何人通过入户门进入。", "推理步骤6: 如果是真实的人员活动,应当伴随门锁解锁或门磁打开事件,但两者均未发生。同时也没有其他房间的运动传感器被触发,排除了有人从室内走到玄关的可能(07:49后到16:33前无任何房间有occupancy事件)。", "推理步骤7: 两次触发间隔约5分钟,持续时间短且相近,更符合传感器误触发的模式(如热源干扰、宠物活动、传感器灵敏度过高或硬件间歇性故障),而非真实入侵。若为入侵,通常会有更持续的活动和其他设备联动。"], "key_evidence": ["14:00:00 entrance_occupancy 触发(Occupancy=1),14:00:45 恢复(Occupancy=0),期间门锁未解锁、门磁未打开", "14:05:20 entrance_occupancy 再次触发(Occupancy=1),14:06:10 恢复(Occupancy=0),同样无门锁/门磁事件", "07:49 全家出门后门锁自动上锁,直到 16:33 才有下一次开锁记录,期间家中应无人", "两次触发持续时间极短(45秒和50秒),且无其他房间传感器联动"], "recommended_actions": ["检查玄关运动传感器的安装位置和灵敏度设置,确认是否对准了窗户、暖气片等可能产生热源变化的区域", "排查是否有宠物在家中活动,若有宠物建议调整传感器灵敏度或更换支持宠物免疫的型号", "持续监控该传感器,若类似无关联的短暂触发反复出现,建议更换传感器硬件", "可考虑增加玄关摄像头作为交叉验证手段,以便在运动传感器触发时确认是否有真实活动"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.29470658302307, "api_error": null} {"episode_id": "SQ1_FP_C_0122", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0122.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260751, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kids_room", "injection_time": "2026-06-15T15:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"儿童房区域所有传感器工作正常,数据采集连续且数值合理。\",\n \"reasoning\": [\n \"推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)在全天24小时内每30分钟稳定上报一次数据,无任何缺失或 None 值。温度从夜间约22.9°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季(6月15日)自然昼夜温度变化曲线。\",\n \"推理步骤2: 儿童房温度传感器的读数与同一时刻客厅、主卧、厨房的温度传感器高度一致(偏差通常在0.1-0.3°C以内),说明传感器校准正常,没有出现漂移或异常偏高/偏低。作为对比,厨房温度传感器在灶具开启期间多次报告 None 值,而儿童房传感器始终正常。\",\n \"推理步骤3: 儿童房运动传感器(kids_room_occupancy)在06:46检测到有人活动(与开灯、开窗帘动作吻合,符合早晨起床场景),15:18和15:23短暂检测到活动后恢复无人,15:58再次检测到有人(与入户门开锁时间吻合,符合放学回家场景)。触发时机和持续时间均合理,无误报或漏报迹象。\",\n \"推理步骤4: 儿童房窗帘(kids_room_window)在06:46:15从全关(0%)打开,21:09:05恢复全关(10000 = 100%),符合早起开窗帘、睡前关窗帘的正常生活习惯。\",\n \"推理步骤5: 儿童房窗户传感器(kids_room_window_contact)在整个日志期间未报告任何状态变化事件,说明窗户始终保持关闭状态,这在无人期间是安全的。虽然没有主动上报,但这属于无变化不上报的正常行为,不代表传感器离线。\",\n \"推理步骤6: 儿童房灯(kids_room_light)在06:46:08开启、07:11:14关闭(出门时统一关灯)、15:58:12再次开启、21:09:00关闭(睡前),开关时间与运动传感器和门锁事件完全吻合,设备联动正常。\"\n ],\n \"key_evidence\": [\n \"kids_room_temp_sensor 全天48个采样点无一缺失或异常,数值范围22.90°C~25.85°C,与其他房间传感器高度一致\",\n \"kids_room_occupancy 触发时间与入户门锁操作、灯光开关严格对应(06:46起床、15:58回家),无无故触发\",\n \"kids_room_window 窗帘早开晚关(06:46开 → 21:09关),符合正常作息\",\n \"kids_room_window_contact 全天无变化事件,窗户保持关闭,属于正常静默状态\",\n \"对比厨房温度传感器出现3次 None 值,儿童房传感器从未出现此类问题\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,儿童房所有传感器运行状态良好\",\n \"可考虑定期(如每月)对比各房间温度传感器读数,持续监控校准一致性\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "儿童房区域所有传感器工作正常,数据采集连续且数值合理。", "reasoning": ["推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)在全天24小时内每30分钟稳定上报一次数据,无任何缺失或 None 值。温度从夜间约22.9°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季(6月15日)自然昼夜温度变化曲线。", "推理步骤2: 儿童房温度传感器的读数与同一时刻客厅、主卧、厨房的温度传感器高度一致(偏差通常在0.1-0.3°C以内),说明传感器校准正常,没有出现漂移或异常偏高/偏低。作为对比,厨房温度传感器在灶具开启期间多次报告 None 值,而儿童房传感器始终正常。", "推理步骤3: 儿童房运动传感器(kids_room_occupancy)在06:46检测到有人活动(与开灯、开窗帘动作吻合,符合早晨起床场景),15:18和15:23短暂检测到活动后恢复无人,15:58再次检测到有人(与入户门开锁时间吻合,符合放学回家场景)。触发时机和持续时间均合理,无误报或漏报迹象。", "推理步骤4: 儿童房窗帘(kids_room_window)在06:46:15从全关(0%)打开,21:09:05恢复全关(10000 = 100%),符合早起开窗帘、睡前关窗帘的正常生活习惯。", "推理步骤5: 儿童房窗户传感器(kids_room_window_contact)在整个日志期间未报告任何状态变化事件,说明窗户始终保持关闭状态,这在无人期间是安全的。虽然没有主动上报,但这属于无变化不上报的正常行为,不代表传感器离线。", "推理步骤6: 儿童房灯(kids_room_light)在06:46:08开启、07:11:14关闭(出门时统一关灯)、15:58:12再次开启、21:09:00关闭(睡前),开关时间与运动传感器和门锁事件完全吻合,设备联动正常。"], "key_evidence": ["kids_room_temp_sensor 全天48个采样点无一缺失或异常,数值范围22.90°C~25.85°C,与其他房间传感器高度一致", "kids_room_occupancy 触发时间与入户门锁操作、灯光开关严格对应(06:46起床、15:58回家),无无故触发", "kids_room_window 窗帘早开晚关(06:46开 → 21:09关),符合正常作息", "kids_room_window_contact 全天无变化事件,窗户保持关闭,属于正常静默状态", "对比厨房温度传感器出现3次 None 值,儿童房传感器从未出现此类问题"], "recommended_actions": ["无需采取任何措施,儿童房所有传感器运行状态良好", "可考虑定期(如每月)对比各房间温度传感器读数,持续监控校准一致性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.54590892791748, "api_error": null} {"episode_id": "SQ1_FP_C_0128", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0128.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260757, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-17T17:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器出现短时间内反复触发/清除的异常模式,疑似传感器故障或安装松动。\",\n \"reasoning\": [\n \"推理步骤1: 次卧运动传感器在17:06:00触发占用(1),仅45秒后(17:06:45)就清除为0,间隔极短。\",\n \"推理步骤2: 随后在17:11:20再次触发占用(1),50秒后(17:12:10)又清除为0,同样是极短暂的触发。\",\n \"推理步骤3: 正常人体活动(如进入房间取物)通常会持续更长时间,且两次触发之间间隔约5分钟,模式更像传感器灵敏度异常或间歇性误触发。\",\n \"推理步骤4: 对比同一时段,家中其他区域(如16:14进门后孩子在儿童房持续活动)的运动传感器表现稳定,没有类似的快速闪烁模式。\",\n \"推理步骤5: 次卧在整天日志中没有灯光、窗帘、空调等任何其他设备操作,说明该房间当天无人实际使用,进一步支持这些短暂触发为异常信号。\"\n ],\n \"key_evidence\": [\n \"17:06:00 占用触发 → 17:06:45 清除(仅45秒)\",\n \"17:11:20 占用触发 → 17:12:10 清除(仅50秒)\",\n \"次卧全天无其他设备(灯/空调/窗帘)被操作,表明无人实际使用该房间\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置是否松动或朝向是否对准窗帘/窗户等可能被风吹动的物体\",\n \"检查传感器灵敏度设置,适当降低灵敏度以减少误触发\",\n \"观察未来几天是否持续出现类似短时间反复触发模式,若持续则考虑更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器出现短时间内反复触发/清除的异常模式,疑似传感器故障或安装松动。", "reasoning": ["推理步骤1: 次卧运动传感器在17:06:00触发占用(1),仅45秒后(17:06:45)就清除为0,间隔极短。", "推理步骤2: 随后在17:11:20再次触发占用(1),50秒后(17:12:10)又清除为0,同样是极短暂的触发。", "推理步骤3: 正常人体活动(如进入房间取物)通常会持续更长时间,且两次触发之间间隔约5分钟,模式更像传感器灵敏度异常或间歇性误触发。", "推理步骤4: 对比同一时段,家中其他区域(如16:14进门后孩子在儿童房持续活动)的运动传感器表现稳定,没有类似的快速闪烁模式。", "推理步骤5: 次卧在整天日志中没有灯光、窗帘、空调等任何其他设备操作,说明该房间当天无人实际使用,进一步支持这些短暂触发为异常信号。"], "key_evidence": ["17:06:00 占用触发 → 17:06:45 清除(仅45秒)", "17:11:20 占用触发 → 17:12:10 清除(仅50秒)", "次卧全天无其他设备(灯/空调/窗帘)被操作,表明无人实际使用该房间"], "recommended_actions": ["检查次卧运动传感器的安装位置是否松动或朝向是否对准窗帘/窗户等可能被风吹动的物体", "检查传感器灵敏度设置,适当降低灵敏度以减少误触发", "观察未来几天是否持续出现类似短时间反复触发模式,若持续则考虑更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 15.521550178527832, "api_error": null} {"episode_id": "SQ1_FP_C_0124", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0124.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260753, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-05T17:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧温度传感器存在间歇性异常读数,在空调运行期间出现与整体趋势相悖的温度回升,疑似传感器故障或安装位置受干扰。\",\n \"reasoning\": [\n \"推理步骤1: 17:55 主卧空调开启,此时主卧温度传感器报告 2500(25.00°C),而同一时刻其他房间温度均在 24.70°C 左右,主卧温度偏高约 0.3°C,尚属合理。\",\n \"推理步骤2: 18:00 整点读数主卧降至 2470(24.70°C),说明空调开始制冷生效。但 18:25 主卧温度传感器突然回升至 2502(25.02°C),在空调持续运行仅 30 分钟的情况下出现了一次逆趋势的温度跳升。\",\n \"推理步骤3: 18:30 整点读数主卧又降回 2455(24.55°C),说明空调制冷确实在工作。但 18:55 再次出现异常回升至 2498(24.98°C),随后 19:00 整点又降至 2429(24.29°C)。19:25 再次跳升至 2501(25.01°C),19:30 整点又回落至 2438(24.38°C)。\",\n \"推理步骤4: 这种模式非常明显——在每两个整点读数之间,主卧温度传感器会插入一个异常偏高的读数(约 25.00°C 左右),与空调制冷的整体下降趋势严重矛盾。其他三个房间的温度传感器在同一时段均呈现平滑、一致的下降曲线,没有类似的锯齿波动。\",\n \"推理步骤5: 这些异常读数集中在 25.00°C 附近(2498-2502),像是传感器在某些采样周期返回了一个接近固定的'默认值'或受到了局部热源干扰(如空调出风口热交换、传感器自身发热等),而非真实的环境温度。\",\n \"推理步骤6: 对比厨房温度传感器也出现了多次 None 值(06:34、07:06、18:35、19:24),说明该家庭的传感器网络可能存在通信不稳定的问题。主卧传感器虽未报告 None,但其间歇性异常读数可能是类似通信问题的另一种表现形式——返回了缓存值或错误值而非 null。\"\n ],\n \"key_evidence\": [\n \"18:25 主卧温度 2502,而 18:00 为 2470、18:30 为 2455,空调运行中出现逆趋势跳升\",\n \"18:55 主卧温度 2498,而 19:00 为 2429,5 分钟内不合理地骤降 0.69°C\",\n \"19:25 主卧温度 2501,而 19:30 为 2438,再次出现同样的跳升-骤降模式\",\n \"三次异常读数均集中在 2498-2502 范围(约 25.00°C),高度接近一个固定值\",\n \"同时段其他房间(客厅、儿童房、厨房)温度曲线平滑下降,无类似波动\"\n ],\n \"recommended_actions\": [\n \"检查主卧温度传感器的安装位置,确认是否靠近空调出风口或其他局部热源,必要时重新定位\",\n \"检查传感器固件版本并更新,排除固件缺陷导致的间歇性错误读数\",\n \"检查传感器与网关之间的通信质量(信号强度、丢包率),结合厨房传感器的 None 值问题一并排查网络稳定性\",\n \"如问题持续,建议更换主卧温度传感器硬件以排除元器件老化故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "主卧温度传感器存在间歇性异常读数,在空调运行期间出现与整体趋势相悖的温度回升,疑似传感器故障或安装位置受干扰。", "reasoning": ["推理步骤1: 17:55 主卧空调开启,此时主卧温度传感器报告 2500(25.00°C),而同一时刻其他房间温度均在 24.70°C 左右,主卧温度偏高约 0.3°C,尚属合理。", "推理步骤2: 18:00 整点读数主卧降至 2470(24.70°C),说明空调开始制冷生效。但 18:25 主卧温度传感器突然回升至 2502(25.02°C),在空调持续运行仅 30 分钟的情况下出现了一次逆趋势的温度跳升。", "推理步骤3: 18:30 整点读数主卧又降回 2455(24.55°C),说明空调制冷确实在工作。但 18:55 再次出现异常回升至 2498(24.98°C),随后 19:00 整点又降至 2429(24.29°C)。19:25 再次跳升至 2501(25.01°C),19:30 整点又回落至 2438(24.38°C)。", "推理步骤4: 这种模式非常明显——在每两个整点读数之间,主卧温度传感器会插入一个异常偏高的读数(约 25.00°C 左右),与空调制冷的整体下降趋势严重矛盾。其他三个房间的温度传感器在同一时段均呈现平滑、一致的下降曲线,没有类似的锯齿波动。", "推理步骤5: 这些异常读数集中在 25.00°C 附近(2498-2502),像是传感器在某些采样周期返回了一个接近固定的'默认值'或受到了局部热源干扰(如空调出风口热交换、传感器自身发热等),而非真实的环境温度。", "推理步骤6: 对比厨房温度传感器也出现了多次 None 值(06:34、07:06、18:35、19:24),说明该家庭的传感器网络可能存在通信不稳定的问题。主卧传感器虽未报告 None,但其间歇性异常读数可能是类似通信问题的另一种表现形式——返回了缓存值或错误值而非 null。"], "key_evidence": ["18:25 主卧温度 2502,而 18:00 为 2470、18:30 为 2455,空调运行中出现逆趋势跳升", "18:55 主卧温度 2498,而 19:00 为 2429,5 分钟内不合理地骤降 0.69°C", "19:25 主卧温度 2501,而 19:30 为 2438,再次出现同样的跳升-骤降模式", "三次异常读数均集中在 2498-2502 范围(约 25.00°C),高度接近一个固定值", "同时段其他房间(客厅、儿童房、厨房)温度曲线平滑下降,无类似波动"], "recommended_actions": ["检查主卧温度传感器的安装位置,确认是否靠近空调出风口或其他局部热源,必要时重新定位", "检查传感器固件版本并更新,排除固件缺陷导致的间歇性错误读数", "检查传感器与网关之间的通信质量(信号强度、丢包率),结合厨房传感器的 None 值问题一并排查网络稳定性", "如问题持续,建议更换主卧温度传感器硬件以排除元器件老化故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.515628576278687, "api_error": null} {"episode_id": "SQ1_FP_C_0129", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0129.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260758, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-17T07:05:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在间歇性故障,多次报告 None 值,且在灶具使用期间出现与其他房间不一致的异常温度跳变。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:38:07、07:28:00、18:46:00、19:04:00 共4次报告 MeasuredValue = None,表明传感器读数丢失。这些 None 值均出现在灶具开启或刚关闭后不久,说明传感器可能受热源干扰导致读数异常。\",\n \"推理步骤2: 在 07:00 时各房间温度约为 2423-2437,但厨房在 07:05 突然跳至 2500(+77),07:35 报告 2502,08:05 报告 2498,08:35 报告 2501,而同时段其他房间温度在 2450-2465 范围内平稳变化。厨房温度比其他房间高出约 30-50 个单位,且呈现锯齿状波动(正常读数与异常高值交替出现),这不符合正常的热传导规律。\",\n \"推理步骤3: 对比两次灶具使用场景——早晨 06:37-07:27 和傍晚 18:45-19:03,两次灶具开启后传感器都出现了 None 值,说明问题可重复触发,属于系统性故障而非偶发。\",\n \"推理步骤4: 其他厨房传感器(烟雾报警器、漏水传感器)在全天未触发报警,厨房窗户传感器正常工作,排除了真实火灾或水灾风险,进一步指向温度传感器自身的硬件或通信故障。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:38:07、07:28:00、18:46:00、19:04:00 四次报告 MeasuredValue = None\",\n \"灶具使用后厨房温度出现异常跳变:07:05 从 2423 跳至 2500,而同时段其他房间仅为 2426-2437\",\n \"早晨灶具关闭后(07:27),07:30 恢复正常值 2437,但 07:35 又跳至 2502,呈锯齿状异常波动\",\n \"两次灶具使用均触发 None 值,故障可重复出现\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰\",\n \"检查传感器的供电和通信连接是否稳定,None 值可能由通信中断或传感器过热保护引起\",\n \"考虑将温度传感器迁移到远离热源的位置,或加装隔热防护\",\n \"如传感器硬件老化,建议更换新的温度传感器并重新校准\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在间歇性故障,多次报告 None 值,且在灶具使用期间出现与其他房间不一致的异常温度跳变。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:38:07、07:28:00、18:46:00、19:04:00 共4次报告 MeasuredValue = None,表明传感器读数丢失。这些 None 值均出现在灶具开启或刚关闭后不久,说明传感器可能受热源干扰导致读数异常。", "推理步骤2: 在 07:00 时各房间温度约为 2423-2437,但厨房在 07:05 突然跳至 2500(+77),07:35 报告 2502,08:05 报告 2498,08:35 报告 2501,而同时段其他房间温度在 2450-2465 范围内平稳变化。厨房温度比其他房间高出约 30-50 个单位,且呈现锯齿状波动(正常读数与异常高值交替出现),这不符合正常的热传导规律。", "推理步骤3: 对比两次灶具使用场景——早晨 06:37-07:27 和傍晚 18:45-19:03,两次灶具开启后传感器都出现了 None 值,说明问题可重复触发,属于系统性故障而非偶发。", "推理步骤4: 其他厨房传感器(烟雾报警器、漏水传感器)在全天未触发报警,厨房窗户传感器正常工作,排除了真实火灾或水灾风险,进一步指向温度传感器自身的硬件或通信故障。"], "key_evidence": ["厨房温度传感器在 06:38:07、07:28:00、18:46:00、19:04:00 四次报告 MeasuredValue = None", "灶具使用后厨房温度出现异常跳变:07:05 从 2423 跳至 2500,而同时段其他房间仅为 2426-2437", "早晨灶具关闭后(07:27),07:30 恢复正常值 2437,但 07:35 又跳至 2502,呈锯齿状异常波动", "两次灶具使用均触发 None 值,故障可重复出现"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰", "检查传感器的供电和通信连接是否稳定,None 值可能由通信中断或传感器过热保护引起", "考虑将温度传感器迁移到远离热源的位置,或加装隔热防护", "如传感器硬件老化,建议更换新的温度传感器并重新校准"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.675764322280884, "api_error": null} {"episode_id": "SQ1_FP_C_0131", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0131.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260760, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-25T07:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧温度传感器存在周期性异常尖峰读数,疑似传感器硬件故障或接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器在大部分时段的读数与其他房间(客厅、儿童房、厨房)保持一致的变化趋势和相近的数值,属于正常的环境温度波动。\",\n \"推理步骤2: 但在 07:22 时,主卧温度传感器突然报告 2500(25.00°C),而同一时段(07:00)其他房间温度均在 2421-2424 范围内,主卧自身在 07:00 也仅为 2439。短短 22 分钟内跳升约 0.6°C,且明显偏离其他房间。\",\n \"推理步骤3: 更关键的是,该传感器在 07:22 报告 2500 后,07:30 回落至 2440,07:52 又跳回 2502,08:22 再次跳至 2498,08:30 又回落至 2453,08:52 再次跳至 2501。呈现出约每 30 分钟一次的、在正常值与 ~2500 之间反复跳变的锯齿形模式。\",\n \"推理步骤4: 这些 ~2500 的尖峰读数仅出现在主卧温度传感器上,同时段其他三个温度传感器均无类似跳变,排除了真实环境温度突变的可能性。\",\n \"推理步骤5: 07:22 主卧空调开启(制冷模式 SystemMode=3),如果是空调导致温度变化,应该是温度下降而非上升到 2500;且空调影响应是持续渐变的,不会出现反复跳回又恢复的锯齿波形。\",\n \"推理步骤6: 反复出现的固定值 ~2500 的尖峰,结合正常读数之间的快速跳变,高度符合传感器硬件故障的特征——可能是接触不良、ADC 采样异常、或传感器内部校准漂移导致的间歇性错误读数。\"\n ],\n \"key_evidence\": [\n \"07:22 主卧温度突跳至 2500,而 07:00 时为 2439,同时段其他房间均在 2421-2424\",\n \"07:52 读数 2502、08:22 读数 2498、08:52 读数 2501——反复出现 ~2500 的异常尖峰\",\n \"尖峰之间(07:30 为 2440、08:00 为 2454、08:30 为 2453)读数恢复正常并与其他房间一致,形成锯齿形跳变模式\",\n \"异常仅出现在 master_bedroom_temp_sensor,其他三个温度传感器全天无类似现象\"\n ],\n \"recommended_actions\": [\n \"检查主卧温度传感器的物理安装状态,确认是否存在接线松动或接触不良\",\n \"查看传感器固件版本,尝试重置或升级固件以排除软件层面的采样异常\",\n \"在传感器旁放置独立温度计进行交叉验证,确认 ~25.00°C 的读数是否为真实温度\",\n \"如确认为硬件故障,建议更换该温度传感器\",\n \"在传感器修复前,基于主卧空调的自动控温逻辑应暂时切换为手动模式,避免错误温度读数导致空调异常运行\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "主卧温度传感器存在周期性异常尖峰读数,疑似传感器硬件故障或接触不良。", "reasoning": ["推理步骤1: 主卧温度传感器在大部分时段的读数与其他房间(客厅、儿童房、厨房)保持一致的变化趋势和相近的数值,属于正常的环境温度波动。", "推理步骤2: 但在 07:22 时,主卧温度传感器突然报告 2500(25.00°C),而同一时段(07:00)其他房间温度均在 2421-2424 范围内,主卧自身在 07:00 也仅为 2439。短短 22 分钟内跳升约 0.6°C,且明显偏离其他房间。", "推理步骤3: 更关键的是,该传感器在 07:22 报告 2500 后,07:30 回落至 2440,07:52 又跳回 2502,08:22 再次跳至 2498,08:30 又回落至 2453,08:52 再次跳至 2501。呈现出约每 30 分钟一次的、在正常值与 ~2500 之间反复跳变的锯齿形模式。", "推理步骤4: 这些 ~2500 的尖峰读数仅出现在主卧温度传感器上,同时段其他三个温度传感器均无类似跳变,排除了真实环境温度突变的可能性。", "推理步骤5: 07:22 主卧空调开启(制冷模式 SystemMode=3),如果是空调导致温度变化,应该是温度下降而非上升到 2500;且空调影响应是持续渐变的,不会出现反复跳回又恢复的锯齿波形。", "推理步骤6: 反复出现的固定值 ~2500 的尖峰,结合正常读数之间的快速跳变,高度符合传感器硬件故障的特征——可能是接触不良、ADC 采样异常、或传感器内部校准漂移导致的间歇性错误读数。"], "key_evidence": ["07:22 主卧温度突跳至 2500,而 07:00 时为 2439,同时段其他房间均在 2421-2424", "07:52 读数 2502、08:22 读数 2498、08:52 读数 2501——反复出现 ~2500 的异常尖峰", "尖峰之间(07:30 为 2440、08:00 为 2454、08:30 为 2453)读数恢复正常并与其他房间一致,形成锯齿形跳变模式", "异常仅出现在 master_bedroom_temp_sensor,其他三个温度传感器全天无类似现象"], "recommended_actions": ["检查主卧温度传感器的物理安装状态,确认是否存在接线松动或接触不良", "查看传感器固件版本,尝试重置或升级固件以排除软件层面的采样异常", "在传感器旁放置独立温度计进行交叉验证,确认 ~25.00°C 的读数是否为真实温度", "如确认为硬件故障,建议更换该温度传感器", "在传感器修复前,基于主卧空调的自动控温逻辑应暂时切换为手动模式,避免错误温度读数导致空调异常运行"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.196354389190674, "api_error": null} {"episode_id": "SQ1_FP_C_0132", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0132.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20260761, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-23T13:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度和运动传感器数据均符合预期模式\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无缺失或None值。温度从夜间约23°C逐步升至中午约25.7°C,再随傍晚降温回落至约23.3°C,符合夏季自然温度变化曲线。\",\n \"推理步骤2: 13:53空调开启后,客厅温度出现周期性下降(约每30分钟降至25°C左右再回升),这是空调制冷循环的正常表现。17:45再次开启空调后温度持续下降,22:17关闭空调后温度趋于稳定,逻辑自洽。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)在17:45检测到有人进入,与入户门解锁、开门事件时间吻合,属于正常回家场景。全天无异常触发。\",\n \"推理步骤4: 对比其他房间温度传感器,客厅温度变化趋势一致(除空调制冷期间略低外),无异常偏离,说明传感器读数准确可靠。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor全天48个采样点均正常上报,无None值或异常跳变\",\n \"温度变化曲线与自然昼夜温差及空调制冷效果一致(夜间~23°C,午间峰值~25.8°C,空调开启后降至~25°C)\",\n \"living_room_occupancy仅在17:45有人回家时触发,与门锁事件时间匹配\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,客厅区域传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度和运动传感器数据均符合预期模式", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无缺失或None值。温度从夜间约23°C逐步升至中午约25.7°C,再随傍晚降温回落至约23.3°C,符合夏季自然温度变化曲线。", "推理步骤2: 13:53空调开启后,客厅温度出现周期性下降(约每30分钟降至25°C左右再回升),这是空调制冷循环的正常表现。17:45再次开启空调后温度持续下降,22:17关闭空调后温度趋于稳定,逻辑自洽。", "推理步骤3: 客厅运动传感器(living_room_occupancy)在17:45检测到有人进入,与入户门解锁、开门事件时间吻合,属于正常回家场景。全天无异常触发。", "推理步骤4: 对比其他房间温度传感器,客厅温度变化趋势一致(除空调制冷期间略低外),无异常偏离,说明传感器读数准确可靠。"], "key_evidence": ["living_room_temp_sensor全天48个采样点均正常上报,无None值或异常跳变", "温度变化曲线与自然昼夜温差及空调制冷效果一致(夜间~23°C,午间峰值~25.8°C,空调开启后降至~25°C)", "living_room_occupancy仅在17:45有人回家时触发,与门锁事件时间匹配"], "recommended_actions": ["无需采取措施,客厅区域传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.357128858566284, "api_error": null} {"episode_id": "SQ1_FP_C_0133", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_C_0133.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20260762, "scenario_id": "DF-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-06T10:28:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在周期性异常骤降,疑似传感器故障或受到局部热源干扰。\",\n \"reasoning\": [\n \"推理步骤1: 整体趋势分析——全屋四个温度传感器在当天呈现一致的温度曲线:凌晨约23.0°C,上午逐步升温,中午12:30左右达到峰值约25.8°C,下午至夜间逐步回落至约23.3°C,这是典型的夏季昼夜温度变化。\",\n \"推理步骤2: 厨房传感器在常规半小时采样点(整点和半点)上的读数与其他三个房间高度一致,走势完全吻合,说明传感器在正常采样周期内工作基本正常。\",\n \"推理步骤3: 异常发现——厨房传感器在10:28、10:58、11:28、11:58四个时间点额外上报了数据,且这些读数显著偏离同时段的正常值。例如10:28报2500(25.00°C),而10:00和10:30的正常读数分别为2520和2528;10:58报2502,而11:00正常读数为2546;11:28报2498,而11:30正常读数为2556;11:58报2501,而12:00正常读数为2576。\",\n \"推理步骤4: 这四次异常读数呈现明显规律:间隔均为30分钟(10:28→10:58→11:28→11:58),读数都在2498~2502范围内(约25.0°C),与当时实际环境温度偏差达20~76个单位(0.2~0.76°C),且始终低于正常值。\",\n \"推理步骤5: 这种以固定周期出现、数值高度集中在25.0°C附近的异常读数,不符合自然温度波动特征。可能原因包括:(a) 传感器硬件间歇性故障,周期性回报一个接近校准基准值的错误读数;(b) 传感器固件bug导致在非标准采样时刻触发了一次带有错误值的上报;(c) 附近存在周期性局部冷源(如冰箱压缩机启停)对传感器造成瞬时干扰,但考虑到数值高度一致,硬件/固件故障的可能性更大。\"\n ],\n \"key_evidence\": [\n \"厨房传感器在10:28、10:58、11:28、11:58出现4次非标准采样时刻的额外上报,间隔精确为30分钟\",\n \"这4次异常读数集中在2498~2502(约25.00°C),而同时段其他房间和厨房自身的正常读数在2520~2576之间,偏低约20~76个单位\",\n \"异常读数高度一致地锁定在25.0°C附近,疑似传感器回报了校准基准值或默认值\",\n \"其他三个房间的传感器在同一时段无任何异常,排除全局性环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的固件版本,确认是否有已知的间歇性上报bug,如有则升级固件\",\n \"观察未来几天该传感器是否继续在非标准时刻上报约25.0°C的读数,确认故障是否持续\",\n \"检查传感器的物理安装位置,确保远离冰箱、烤箱等可能造成局部温度干扰的设备\",\n \"如故障持续,考虑更换厨房温度传感器或重新校准\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在周期性异常骤降,疑似传感器故障或受到局部热源干扰。", "reasoning": ["推理步骤1: 整体趋势分析——全屋四个温度传感器在当天呈现一致的温度曲线:凌晨约23.0°C,上午逐步升温,中午12:30左右达到峰值约25.8°C,下午至夜间逐步回落至约23.3°C,这是典型的夏季昼夜温度变化。", "推理步骤2: 厨房传感器在常规半小时采样点(整点和半点)上的读数与其他三个房间高度一致,走势完全吻合,说明传感器在正常采样周期内工作基本正常。", "推理步骤3: 异常发现——厨房传感器在10:28、10:58、11:28、11:58四个时间点额外上报了数据,且这些读数显著偏离同时段的正常值。例如10:28报2500(25.00°C),而10:00和10:30的正常读数分别为2520和2528;10:58报2502,而11:00正常读数为2546;11:28报2498,而11:30正常读数为2556;11:58报2501,而12:00正常读数为2576。", "推理步骤4: 这四次异常读数呈现明显规律:间隔均为30分钟(10:28→10:58→11:28→11:58),读数都在2498~2502范围内(约25.0°C),与当时实际环境温度偏差达20~76个单位(0.2~0.76°C),且始终低于正常值。", "推理步骤5: 这种以固定周期出现、数值高度集中在25.0°C附近的异常读数,不符合自然温度波动特征。可能原因包括:(a) 传感器硬件间歇性故障,周期性回报一个接近校准基准值的错误读数;(b) 传感器固件bug导致在非标准采样时刻触发了一次带有错误值的上报;(c) 附近存在周期性局部冷源(如冰箱压缩机启停)对传感器造成瞬时干扰,但考虑到数值高度一致,硬件/固件故障的可能性更大。"], "key_evidence": ["厨房传感器在10:28、10:58、11:28、11:58出现4次非标准采样时刻的额外上报,间隔精确为30分钟", "这4次异常读数集中在2498~2502(约25.00°C),而同时段其他房间和厨房自身的正常读数在2520~2576之间,偏低约20~76个单位", "异常读数高度一致地锁定在25.0°C附近,疑似传感器回报了校准基准值或默认值", "其他三个房间的传感器在同一时段无任何异常,排除全局性环境因素"], "recommended_actions": ["检查厨房温度传感器的固件版本,确认是否有已知的间歇性上报bug,如有则升级固件", "观察未来几天该传感器是否继续在非标准时刻上报约25.0°C的读数,确认故障是否持续", "检查传感器的物理安装位置,确保远离冰箱、烤箱等可能造成局部温度干扰的设备", "如故障持续,考虑更换厨房温度传感器或重新校准"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.228967666625977, "api_error": null} {"episode_id": "SQ1_FP_D_0087", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0087.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20260716, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kitchen", "injection_time": "2026-06-05T10:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间持续报告 None(空值),表明传感器存在故障,无法在高温环境下正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在非烹饪时段(00:00-06:03、06:31-10:57、11:32-16:52、17:36-23:30)均能正常上报温度数据,数值在 2290-2586 范围内波动,与客厅/卧室温度趋势一致,说明传感器基础功能存在。\",\n \"推理步骤2: 但每次灶具开启后,厨房温度传感器都会在约30秒内报告 MeasuredValue = None。具体出现了4次:06:04:04(灶具06:03:34开)、10:58:00(灶具10:57:30开)、16:53:00(灶具16:52:30开),以及灶具关闭后的06:32:00、11:33:00、17:37:00也报告了None。\",\n \"推理步骤3: 灶具关闭后,传感器并未立即恢复正常读数,而是报告了一次额外的 None 值。直到下一个整点或半点的定时上报周期,传感器才恢复正常数值。这说明传感器在受热或受灶具电磁干扰后需要较长时间才能恢复。\",\n \"推理步骤4: 正常的温度传感器在灶具工作时应该能测量到升高的温度值,而非返回空值。返回 None 通常意味着传感器测量失败(超量程、硬件故障或通信异常)。这种在特定条件下可复现的故障模式,高度指向传感器在高温或电磁干扰环境下的工作异常。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器恰好在灶具使用(即最需要温度监控的时段)失效,将导致安全监控出现盲区,存在严重的安全隐患。\"\n ],\n \"key_evidence\": [\n \"灶具开启期间厨房温度传感器共6次报告 MeasuredValue = None(06:04:04、06:32:00、10:58:00、11:33:00、16:53:00、17:37:00),覆盖全天3次烹饪的开启和关闭时刻\",\n \"非烹饪时段传感器始终正常上报温度值(如 2290-2586),故障仅在灶具使用前后出现,具有明确的触发条件关联性\",\n \"灶具关闭后传感器仍报告一次 None,说明恢复存在延迟,不是简单的瞬时干扰\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或受热损伤\",\n \"排查灶具工作时是否产生电磁干扰影响传感器通信或测量电路\",\n \"考虑更换为耐高温型温度传感器,或将传感器重新安装到远离灶具但仍能有效监测厨房环境温度的位置\",\n \"在传感器修复前,建议加强烟雾报警器的功能验证,确保厨房至少有一道有效的安全监测防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间持续报告 None(空值),表明传感器存在故障,无法在高温环境下正常工作。", "reasoning": ["推理步骤1: 厨房温度传感器在非烹饪时段(00:00-06:03、06:31-10:57、11:32-16:52、17:36-23:30)均能正常上报温度数据,数值在 2290-2586 范围内波动,与客厅/卧室温度趋势一致,说明传感器基础功能存在。", "推理步骤2: 但每次灶具开启后,厨房温度传感器都会在约30秒内报告 MeasuredValue = None。具体出现了4次:06:04:04(灶具06:03:34开)、10:58:00(灶具10:57:30开)、16:53:00(灶具16:52:30开),以及灶具关闭后的06:32:00、11:33:00、17:37:00也报告了None。", "推理步骤3: 灶具关闭后,传感器并未立即恢复正常读数,而是报告了一次额外的 None 值。直到下一个整点或半点的定时上报周期,传感器才恢复正常数值。这说明传感器在受热或受灶具电磁干扰后需要较长时间才能恢复。", "推理步骤4: 正常的温度传感器在灶具工作时应该能测量到升高的温度值,而非返回空值。返回 None 通常意味着传感器测量失败(超量程、硬件故障或通信异常)。这种在特定条件下可复现的故障模式,高度指向传感器在高温或电磁干扰环境下的工作异常。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器恰好在灶具使用(即最需要温度监控的时段)失效,将导致安全监控出现盲区,存在严重的安全隐患。"], "key_evidence": ["灶具开启期间厨房温度传感器共6次报告 MeasuredValue = None(06:04:04、06:32:00、10:58:00、11:33:00、16:53:00、17:37:00),覆盖全天3次烹饪的开启和关闭时刻", "非烹饪时段传感器始终正常上报温度值(如 2290-2586),故障仅在灶具使用前后出现,具有明确的触发条件关联性", "灶具关闭后传感器仍报告一次 None,说明恢复存在延迟,不是简单的瞬时干扰"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或受热损伤", "排查灶具工作时是否产生电磁干扰影响传感器通信或测量电路", "考虑更换为耐高温型温度传感器,或将传感器重新安装到远离灶具但仍能有效监测厨房环境温度的位置", "在传感器修复前,建议加强烟雾报警器的功能验证,确保厨房至少有一道有效的安全监测防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.489285707473755, "api_error": null} {"episode_id": "SQ1_FP_D_0091", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0091.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20260720, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-24T17:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调运行期间出现异常的周期性温度波动,疑似传感器读数不稳定或空调温控异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅空调于17:22开启,之后客厅温度传感器出现明显的锯齿形波动模式,而非平稳下降。\",\n \"推理步骤2: 具体表现为:17:22(2500)→17:30(2476)→17:52(2502)→18:00(2457)→18:22(2498)→18:30(2468)→18:52(2501)→19:00(2427),每隔约20-30分钟出现一次回升至约2500的异常读数。\",\n \"推理步骤3: 对比同时段卧室和厨房温度传感器,两者均呈现平稳持续下降趋势,没有类似的周期性波动,说明这不是环境温度的真实变化。\",\n \"推理步骤4: 这种周期性跳变模式可能是传感器接触不良、采样干扰,或者空调出风口气流直吹传感器导致的读数不稳定。\",\n \"推理步骤5: 除温度传感器外,客厅的运动传感器和灯光设备工作正常,状态变化符合独居老人的日常活动规律。\"\n ],\n \"key_evidence\": [\n \"空调开启后(17:22起)客厅温度传感器出现约每20-30分钟一次的周期性回升(回升至~2500),与整体降温趋势矛盾\",\n \"同时段卧室温度从2388→2325→2317→2305持续平稳下降,厨房温度从2477→2436→2409→2408也持续下降,唯独客厅出现锯齿波动\",\n \"异常读数(17:52的2502、18:22的2498、18:52的2501)数值高度接近,呈现规律性特征,不像自然温度变化\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器是否安装在空调出风口附近,如是则建议移至远离直吹气流的位置\",\n \"观察后续几天是否持续出现相同的周期性波动模式,确认是否为稳定复现的故障\",\n \"检查传感器电池电量或供电状态,排除供电不稳导致的间歇性读数异常\",\n \"如确认传感器故障,建议更换或重新校准客厅温度传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调运行期间出现异常的周期性温度波动,疑似传感器读数不稳定或空调温控异常。", "reasoning": ["推理步骤1: 客厅空调于17:22开启,之后客厅温度传感器出现明显的锯齿形波动模式,而非平稳下降。", "推理步骤2: 具体表现为:17:22(2500)→17:30(2476)→17:52(2502)→18:00(2457)→18:22(2498)→18:30(2468)→18:52(2501)→19:00(2427),每隔约20-30分钟出现一次回升至约2500的异常读数。", "推理步骤3: 对比同时段卧室和厨房温度传感器,两者均呈现平稳持续下降趋势,没有类似的周期性波动,说明这不是环境温度的真实变化。", "推理步骤4: 这种周期性跳变模式可能是传感器接触不良、采样干扰,或者空调出风口气流直吹传感器导致的读数不稳定。", "推理步骤5: 除温度传感器外,客厅的运动传感器和灯光设备工作正常,状态变化符合独居老人的日常活动规律。"], "key_evidence": ["空调开启后(17:22起)客厅温度传感器出现约每20-30分钟一次的周期性回升(回升至~2500),与整体降温趋势矛盾", "同时段卧室温度从2388→2325→2317→2305持续平稳下降,厨房温度从2477→2436→2409→2408也持续下降,唯独客厅出现锯齿波动", "异常读数(17:52的2502、18:22的2498、18:52的2501)数值高度接近,呈现规律性特征,不像自然温度变化"], "recommended_actions": ["检查客厅温度传感器是否安装在空调出风口附近,如是则建议移至远离直吹气流的位置", "观察后续几天是否持续出现相同的周期性波动模式,确认是否为稳定复现的故障", "检查传感器电池电量或供电状态,排除供电不稳导致的间歇性读数异常", "如确认传感器故障,建议更换或重新校准客厅温度传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.537975072860718, "api_error": null} {"episode_id": "SQ1_FP_D_0093", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0093.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20260722, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-08T18:04:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在间歇性故障:灶具使用期间反复报告 None 值,且灶具关闭后出现与整体趋势不符的异常温度跳变。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:58、06:39、10:52、11:25、17:08、17:28),说明传感器在高温或灶具工作环境下无法正常采集数据。\",\n \"推理步骤2: 对比客厅和卧室温度传感器,它们在整个24小时内从未出现 None 值,始终稳定上报,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 18:04 起,灶具已于 17:27 关闭,厨房温度传感器在常规半小时周期之外额外上报了多次异常读数(18:04 报 2500、18:34 报 2502、19:04 报 2498、19:34 报 2501),这些值约 25.00°C,与同时刻半小时周期的正常读数(如 18:30 报 2451、19:00 报 2433)存在明显偏差,呈现出两套互相矛盾的读数交替出现的模式。\",\n \"推理步骤4: 这种 '正常周期读数 + 额外异常定时读数' 并存的现象,高度疑似传感器内部校准漂移或硬件间歇性故障,可能在受热后触发了异常的补偿上报机制,输出了固定在约 25.00°C 附近的错误值。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。传感器在灶具工作时失效(None)且事后读数不可靠,意味着如果发生灶具忘关或厨房起火,温度异常升高可能无法被及时检测到,存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"灶具开启期间温度传感器6次报告 None:05:58、06:39、10:52、11:25、17:08、17:28\",\n \"18:04-19:34 期间出现4次非周期性额外上报(间隔约30分钟),读数固定在 2498-2502 范围,与同时段周期性读数(2412-2460)偏差约 40-90 个单位(0.4-0.9°C)\",\n \"客厅和卧室温度传感器全天无 None 值且无异常额外上报,排除系统性问题\"\n ],\n \"recommended_actions\": [\n \"对厨房温度传感器进行硬件检查,重点排查是否因长期受灶具热辐射导致元器件老化或损坏\",\n \"考虑将温度传感器安装位置远离灶具热源,减少高温对传感器的直接影响\",\n \"在传感器维修或更换前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其工作正常作为火灾检测的主要手段\",\n \"设置告警规则:当厨房温度传感器报告 None 值时立即通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在间歇性故障:灶具使用期间反复报告 None 值,且灶具关闭后出现与整体趋势不符的异常温度跳变。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:58、06:39、10:52、11:25、17:08、17:28),说明传感器在高温或灶具工作环境下无法正常采集数据。", "推理步骤2: 对比客厅和卧室温度传感器,它们在整个24小时内从未出现 None 值,始终稳定上报,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 18:04 起,灶具已于 17:27 关闭,厨房温度传感器在常规半小时周期之外额外上报了多次异常读数(18:04 报 2500、18:34 报 2502、19:04 报 2498、19:34 报 2501),这些值约 25.00°C,与同时刻半小时周期的正常读数(如 18:30 报 2451、19:00 报 2433)存在明显偏差,呈现出两套互相矛盾的读数交替出现的模式。", "推理步骤4: 这种 '正常周期读数 + 额外异常定时读数' 并存的现象,高度疑似传感器内部校准漂移或硬件间歇性故障,可能在受热后触发了异常的补偿上报机制,输出了固定在约 25.00°C 附近的错误值。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。传感器在灶具工作时失效(None)且事后读数不可靠,意味着如果发生灶具忘关或厨房起火,温度异常升高可能无法被及时检测到,存在安全隐患。"], "key_evidence": ["灶具开启期间温度传感器6次报告 None:05:58、06:39、10:52、11:25、17:08、17:28", "18:04-19:34 期间出现4次非周期性额外上报(间隔约30分钟),读数固定在 2498-2502 范围,与同时段周期性读数(2412-2460)偏差约 40-90 个单位(0.4-0.9°C)", "客厅和卧室温度传感器全天无 None 值且无异常额外上报,排除系统性问题"], "recommended_actions": ["对厨房温度传感器进行硬件检查,重点排查是否因长期受灶具热辐射导致元器件老化或损坏", "考虑将温度传感器安装位置远离灶具热源,减少高温对传感器的直接影响", "在传感器维修或更换前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其工作正常作为火灾检测的主要手段", "设置告警规则:当厨房温度传感器报告 None 值时立即通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.191854238510132, "api_error": null} {"episode_id": "SQ1_FP_D_0108", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0108.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20260737, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-08T17:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调运行期间出现异常跳变读数,疑似传感器故障或受空调气流干扰。\",\n \"reasoning\": [\n \"推理步骤1: 客厅空调于17:33开启,此后客厅温度传感器出现周期性异常跳变模式——每隔约3分钟报告一次约2500的读数(18:03=2502, 18:33=2498, 19:03=2501),而正常半小时周期读数则持续下降(18:00=2465, 18:30=2470, 19:00=2429, 19:30=2430)。\",\n \"推理步骤2: 这些额外的非整点/半点读数(xx:03, xx:33)与正常的30分钟采样周期不一致,且数值始终稳定在2498-2502范围内,与同时段正常读数存在30-70单位的偏差,表现出'双轨'读数特征。\",\n \"推理步骤3: 厨房和卧室传感器在同一时段无此现象,排除环境因素。该异常与空调开启时间高度吻合,可能是空调气流直吹传感器导致读数不稳定,或传感器在空调运行时触发了异常的额外上报机制。\",\n \"推理步骤4: 除温度传感器外,客厅的运动传感器和灯光控制均工作正常——运动检测与住户活动时间吻合,灯光开关响应正常。\"\n ],\n \"key_evidence\": [\n \"空调17:33开启后,客厅温度传感器在非标准采样时间点(18:03, 18:33, 19:03)额外上报了约2500的读数,与正常半小时读数形成矛盾\",\n \"这些异常读数数值高度一致(2498-2502),而同时段正常周期读数持续下降(2465→2429),两组数据存在明显偏差\",\n \"厨房和卧室传感器在同一时段无类似异常,排除系统性问题\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的安装位置,确认是否受空调出风口直吹影响,必要时调整位置\",\n \"检查传感器固件是否存在在空调运行时触发额外上报的bug,考虑固件更新\",\n \"持续监测该传感器在空调关闭后是否恢复正常采样模式,确认故障是否为间歇性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调运行期间出现异常跳变读数,疑似传感器故障或受空调气流干扰。", "reasoning": ["推理步骤1: 客厅空调于17:33开启,此后客厅温度传感器出现周期性异常跳变模式——每隔约3分钟报告一次约2500的读数(18:03=2502, 18:33=2498, 19:03=2501),而正常半小时周期读数则持续下降(18:00=2465, 18:30=2470, 19:00=2429, 19:30=2430)。", "推理步骤2: 这些额外的非整点/半点读数(xx:03, xx:33)与正常的30分钟采样周期不一致,且数值始终稳定在2498-2502范围内,与同时段正常读数存在30-70单位的偏差,表现出'双轨'读数特征。", "推理步骤3: 厨房和卧室传感器在同一时段无此现象,排除环境因素。该异常与空调开启时间高度吻合,可能是空调气流直吹传感器导致读数不稳定,或传感器在空调运行时触发了异常的额外上报机制。", "推理步骤4: 除温度传感器外,客厅的运动传感器和灯光控制均工作正常——运动检测与住户活动时间吻合,灯光开关响应正常。"], "key_evidence": ["空调17:33开启后,客厅温度传感器在非标准采样时间点(18:03, 18:33, 19:03)额外上报了约2500的读数,与正常半小时读数形成矛盾", "这些异常读数数值高度一致(2498-2502),而同时段正常周期读数持续下降(2465→2429),两组数据存在明显偏差", "厨房和卧室传感器在同一时段无类似异常,排除系统性问题"], "recommended_actions": ["检查客厅温度传感器的安装位置,确认是否受空调出风口直吹影响,必要时调整位置", "检查传感器固件是否存在在空调运行时触发额外上报的bug,考虑固件更新", "持续监测该传感器在空调关闭后是否恢复正常采样模式,确认故障是否为间歇性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.678826093673706, "api_error": null} {"episode_id": "SQ1_FP_D_0106", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0106.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-02T00:00:00", "seed": 20260735, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-02T19:26:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门区域存在多项传感器异常:门锁在08:34开锁后未关门/未上锁长达12小时,玄关运动传感器在19:26出现无对应开门事件的异常触发,整体联动逻辑不一致。\",\n \"reasoning\": [\n \"推理步骤1: 梳理 entrance 区域所有事件。涉及设备:front_door_lock、front_door_contact、entrance_occupancy、entrance_light。\",\n \"推理步骤2: 07:07 老人出门——门锁手动开锁(LockOperationType=1)、门打开(StateValue=False)、门关上(StateValue=True)、自动上锁(LockOperationType=0, LockState=1)。这一组事件完整且合理。\",\n \"推理步骤3: 08:34 有人进门——门锁手动开锁(LockState=2)、门打开(StateValue=False)、玄关运动传感器触发。但此后直到 20:36:14 才出现门关闭(StateValue=True)和自动上锁事件。这意味着入户门在开启状态持续了约12小时,对于独居老人来说极不正常。\",\n \"推理步骤4: 然而 08:34 之后老人在室内活动轨迹正常(客厅、厨房做饭、卧室午休等),说明老人确实在家。一扇门开着12小时而无任何关门记录,更可能是 front_door_contact(门磁传感器)漏报了关门事件,即传感器故障。\",\n \"推理步骤5: 19:26 和 19:31 玄关运动传感器两次短暂触发(各持续约45秒和50秒),但没有对应的开门/门锁事件。如果是老人从室内经过玄关,应有其他房间的运动轨迹衔接;如果是门外有人,门锁和门磁均无反应。这种孤立触发模式异常——可能是 entrance_occupancy 传感器误触发(灵敏度过高或故障),也不排除门外有人徘徊但未进入。\",\n \"推理步骤6: 玄关灯(entrance_light)全天无任何开关记录。如果玄关灯与运动传感器有联动,则联动可能已失效;如果无联动设置,则这一点本身不构成异常,但值得关注。\",\n \"推理步骤7: 综合来看,entrance 区域至少存在两个传感器问题:(1) 门磁传感器可能漏报关门事件(08:34开门后长时间无关门记录);(2) 玄关运动传感器出现无上下文关联的孤立触发。\"\n ],\n \"key_evidence\": [\n \"08:34:02 front_door_contact 报告开门(StateValue=False),直到 20:36:14 才报告关门(StateValue=True),间隔约12小时,期间无任何关门记录\",\n \"19:26:00 和 19:31:20 entrance_occupancy 两次短暂触发,但无对应的门锁操作或门磁状态变化,属于孤立异常事件\",\n \"08:34 开锁进门后无上锁记录,直到 20:36:15 才出现自动上锁,门锁状态与门磁状态的恢复时间点一致,说明系统认为门一直处于开启状态\",\n \"entrance_light 全天零记录,若存在与运动传感器的联动规则则联动可能失效\"\n ],\n \"recommended_actions\": [\n \"检查 front_door_contact(门磁传感器)的安装位置和电池电量,确认是否存在信号丢失或粘连导致的漏报问题\",\n \"检查 entrance_occupancy(玄关运动传感器)的灵敏度设置,排查19:26/19:31两次孤立触发是否为误报(如宠物、气流、传感器老化)\",\n \"确认入户门在 08:34 至 20:36 期间是否确实处于未关状态——如果实际已关门,则门磁传感器需要维修或更换\",\n \"建议为独居老人场景增加规则:入户门开启超过10分钟未关闭时发送告警通知,防止安全隐患\",\n \"检查玄关灯与运动传感器的联动规则是否正常配置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门区域存在多项传感器异常:门锁在08:34开锁后未关门/未上锁长达12小时,玄关运动传感器在19:26出现无对应开门事件的异常触发,整体联动逻辑不一致。", "reasoning": ["推理步骤1: 梳理 entrance 区域所有事件。涉及设备:front_door_lock、front_door_contact、entrance_occupancy、entrance_light。", "推理步骤2: 07:07 老人出门——门锁手动开锁(LockOperationType=1)、门打开(StateValue=False)、门关上(StateValue=True)、自动上锁(LockOperationType=0, LockState=1)。这一组事件完整且合理。", "推理步骤3: 08:34 有人进门——门锁手动开锁(LockState=2)、门打开(StateValue=False)、玄关运动传感器触发。但此后直到 20:36:14 才出现门关闭(StateValue=True)和自动上锁事件。这意味着入户门在开启状态持续了约12小时,对于独居老人来说极不正常。", "推理步骤4: 然而 08:34 之后老人在室内活动轨迹正常(客厅、厨房做饭、卧室午休等),说明老人确实在家。一扇门开着12小时而无任何关门记录,更可能是 front_door_contact(门磁传感器)漏报了关门事件,即传感器故障。", "推理步骤5: 19:26 和 19:31 玄关运动传感器两次短暂触发(各持续约45秒和50秒),但没有对应的开门/门锁事件。如果是老人从室内经过玄关,应有其他房间的运动轨迹衔接;如果是门外有人,门锁和门磁均无反应。这种孤立触发模式异常——可能是 entrance_occupancy 传感器误触发(灵敏度过高或故障),也不排除门外有人徘徊但未进入。", "推理步骤6: 玄关灯(entrance_light)全天无任何开关记录。如果玄关灯与运动传感器有联动,则联动可能已失效;如果无联动设置,则这一点本身不构成异常,但值得关注。", "推理步骤7: 综合来看,entrance 区域至少存在两个传感器问题:(1) 门磁传感器可能漏报关门事件(08:34开门后长时间无关门记录);(2) 玄关运动传感器出现无上下文关联的孤立触发。"], "key_evidence": ["08:34:02 front_door_contact 报告开门(StateValue=False),直到 20:36:14 才报告关门(StateValue=True),间隔约12小时,期间无任何关门记录", "19:26:00 和 19:31:20 entrance_occupancy 两次短暂触发,但无对应的门锁操作或门磁状态变化,属于孤立异常事件", "08:34 开锁进门后无上锁记录,直到 20:36:15 才出现自动上锁,门锁状态与门磁状态的恢复时间点一致,说明系统认为门一直处于开启状态", "entrance_light 全天零记录,若存在与运动传感器的联动规则则联动可能失效"], "recommended_actions": ["检查 front_door_contact(门磁传感器)的安装位置和电池电量,确认是否存在信号丢失或粘连导致的漏报问题", "检查 entrance_occupancy(玄关运动传感器)的灵敏度设置,排查19:26/19:31两次孤立触发是否为误报(如宠物、气流、传感器老化)", "确认入户门在 08:34 至 20:36 期间是否确实处于未关状态——如果实际已关门,则门磁传感器需要维修或更换", "建议为独居老人场景增加规则:入户门开启超过10分钟未关闭时发送告警通知,防止安全隐患", "检查玄关灯与运动传感器的联动规则是否正常配置"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.694997310638428, "api_error": null} {"episode_id": "SQ1_FP_D_0111", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0111.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20260740, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-12T11:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在空调运行期间出现与整体趋势矛盾的锯齿状异常读数,疑似传感器故障或受空调气流干扰。\",\n \"reasoning\": [\n \"推理步骤1: 客厅空调于 11:40 开启,此后客厅温度传感器出现明显的锯齿波动模式——在半小时周期读数(跟随室外大趋势)与中间时刻读数之间反复跳变,例如 12:00 报 2589 → 12:10 报 2502 → 12:30 报 2589,13:00 报 2567 → 13:10 报 2501 → 13:30 报 2565。\",\n \"推理步骤2: 这种约 60-90 点(约 0.6-0.9°C)的快速来回跳变在 10-20 分钟内反复出现,不符合正常空调制冷的平滑降温曲线,也不符合自然温度变化规律。正常空调制冷应呈现持续下降或在设定温度附近小幅波动,而非与环境温度交替出现。\",\n \"推理步骤3: 对比卧室和厨房温度传感器,同一时段它们的读数平滑且单调变化,没有出现类似的锯齿波动,说明这不是全屋温度的真实变化,而是客厅传感器自身的问题。\",\n \"推理步骤4: 可能原因包括:传感器安装位置正好处于空调出风口直吹区域,导致交替测量到冷风温度和回温后的环境温度;或传感器本身存在接触不良、热敏元件老化等硬件故障,在温度变化时响应异常。\",\n \"推理步骤5: 除温度传感器外,客厅的运动传感器(occupancy)和窗户传感器在日志中表现正常,触发时机与住户活动一致,因此异常仅限于温度传感器。\"\n ],\n \"key_evidence\": [\n \"空调开启后客厅温度出现锯齿波动:12:00=2589 → 12:10=2502 → 12:30=2589 → 12:40=2498 → 13:00=2567 → 13:10=2501 → 13:30=2565,波动幅度约 60-90 点(0.6-0.9°C),周期约 10-20 分钟\",\n \"同时段卧室和厨房传感器读数平滑无异常跳变,排除全屋温度真实波动的可能\",\n \"空调开启前(11:40 之前)客厅温度传感器读数平稳上升,无锯齿现象,说明异常与空调运行状态相关\",\n \"11:40 空调开启时报告 MeasuredValue=2500,而同一时刻半小时周期读数趋势应在 2557 附近,出现突降\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器的安装位置,确认是否处于空调出风口直吹范围内,如是则移至远离出风口的位置\",\n \"对传感器进行校准测试,用独立温度计对比读数,确认传感器精度是否在规格范围内\",\n \"如确认为传感器硬件故障(热敏元件老化或接触不良),建议更换传感器\",\n \"考虑为独居老人场景增加温度读数平滑滤波逻辑,避免异常跳变触发错误的环境控制决策\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在空调运行期间出现与整体趋势矛盾的锯齿状异常读数,疑似传感器故障或受空调气流干扰。", "reasoning": ["推理步骤1: 客厅空调于 11:40 开启,此后客厅温度传感器出现明显的锯齿波动模式——在半小时周期读数(跟随室外大趋势)与中间时刻读数之间反复跳变,例如 12:00 报 2589 → 12:10 报 2502 → 12:30 报 2589,13:00 报 2567 → 13:10 报 2501 → 13:30 报 2565。", "推理步骤2: 这种约 60-90 点(约 0.6-0.9°C)的快速来回跳变在 10-20 分钟内反复出现,不符合正常空调制冷的平滑降温曲线,也不符合自然温度变化规律。正常空调制冷应呈现持续下降或在设定温度附近小幅波动,而非与环境温度交替出现。", "推理步骤3: 对比卧室和厨房温度传感器,同一时段它们的读数平滑且单调变化,没有出现类似的锯齿波动,说明这不是全屋温度的真实变化,而是客厅传感器自身的问题。", "推理步骤4: 可能原因包括:传感器安装位置正好处于空调出风口直吹区域,导致交替测量到冷风温度和回温后的环境温度;或传感器本身存在接触不良、热敏元件老化等硬件故障,在温度变化时响应异常。", "推理步骤5: 除温度传感器外,客厅的运动传感器(occupancy)和窗户传感器在日志中表现正常,触发时机与住户活动一致,因此异常仅限于温度传感器。"], "key_evidence": ["空调开启后客厅温度出现锯齿波动:12:00=2589 → 12:10=2502 → 12:30=2589 → 12:40=2498 → 13:00=2567 → 13:10=2501 → 13:30=2565,波动幅度约 60-90 点(0.6-0.9°C),周期约 10-20 分钟", "同时段卧室和厨房传感器读数平滑无异常跳变,排除全屋温度真实波动的可能", "空调开启前(11:40 之前)客厅温度传感器读数平稳上升,无锯齿现象,说明异常与空调运行状态相关", "11:40 空调开启时报告 MeasuredValue=2500,而同一时刻半小时周期读数趋势应在 2557 附近,出现突降"], "recommended_actions": ["检查客厅温度传感器的安装位置,确认是否处于空调出风口直吹范围内,如是则移至远离出风口的位置", "对传感器进行校准测试,用独立温度计对比读数,确认传感器精度是否在规格范围内", "如确认为传感器硬件故障(热敏元件老化或接触不良),建议更换传感器", "考虑为独居老人场景增加温度读数平滑滤波逻辑,避免异常跳变触发错误的环境控制决策"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.162222385406494, "api_error": null} {"episode_id": "SQ1_FP_D_0116", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0116.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20260745, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-30T06:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器存在间歇性异常跳变,在正常半小时采样周期之间出现不规律的高温尖峰读数,疑似传感器硬件故障或接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器正常每30分钟上报一次数据,与客厅和厨房传感器同步。但在06:42、07:12、07:42、08:12这几个时间点,卧室温度传感器额外上报了非周期性数据,而同一时刻客厅和厨房传感器并无上报,说明这些是卧室传感器独有的异常上报。\",\n \"推理步骤2: 这些额外上报的读数均为约2500(25.00°C),明显偏离前后正常周期读数的趋势。例如06:30正常读数为2295(22.95°C),06:42突然跳至2500,07:00又回落至2320;07:12再次跳至2502,07:30回落至2334;07:42跳至2498,08:00回落至2364;08:12跳至2501,08:30回落至2352。\",\n \"推理步骤3: 这些尖峰值高度一致(2498-2502),几乎锁定在2500附近,与自然温度变化的渐进特征不符。自然温度不会在12分钟内上升近2°C又在18分钟内回落近2°C,且反复出现相同的峰值。这种'锁定在特定值'的行为更像是传感器在某种故障模式下输出默认值或饱和值。\",\n \"推理步骤4: 同时段客厅和厨房温度传感器的读数变化平滑且符合自然趋势,排除了环境因素(如空调开启)导致卧室真实温度剧烈波动的可能性。虽然06:42空调开启,但空调在客厅,不会导致卧室温度瞬间跳升至25°C再回落。\",\n \"推理步骤5: 异常上报集中在06:42-08:12约1.5小时的窗口内,之后传感器恢复正常的30分钟周期上报且读数趋势平滑,说明这是一个间歇性故障,可能与特定时段的环境条件(如晨间湿度、温度变化)触发了传感器的不稳定状态有关。\",\n \"推理步骤6: 厨房温度传感器在灶具使用期间上报None值,这是已知的正常行为(可能是灶具高温干扰或设计上的屏蔽机制),与卧室传感器的异常模式完全不同,不应混淆。\"\n ],\n \"key_evidence\": [\n \"06:42上报2500、07:12上报2502、07:42上报2498、08:12上报2501——四次非周期性异常读数均锁定在约25.00°C\",\n \"这些异常读数出现在正常30分钟周期之间(如06:30和07:00之间的06:42),且仅卧室传感器有此行为\",\n \"异常读数与前后正常读数存在约1.5-2°C的突变落差,不符合自然温度变化规律\",\n \"同时段客厅和厨房传感器读数平滑正常,排除环境因素\"\n ],\n \"recommended_actions\": [\n \"检查卧室温度传感器的硬件连接状态,清洁探头并确认安装是否牢固\",\n \"查看传感器固件版本,如有可用更新则升级固件以修复可能的采样逻辑缺陷\",\n \"在传感器旁放置一个已校准的独立温度计,对比验证读数准确性\",\n \"如故障持续出现,建议更换卧室温度传感器,对于独居老人家庭,准确的环境监测数据对健康安全至关重要\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卧室温度传感器存在间歇性异常跳变,在正常半小时采样周期之间出现不规律的高温尖峰读数,疑似传感器硬件故障或接触不良。", "reasoning": ["推理步骤1: 卧室温度传感器正常每30分钟上报一次数据,与客厅和厨房传感器同步。但在06:42、07:12、07:42、08:12这几个时间点,卧室温度传感器额外上报了非周期性数据,而同一时刻客厅和厨房传感器并无上报,说明这些是卧室传感器独有的异常上报。", "推理步骤2: 这些额外上报的读数均为约2500(25.00°C),明显偏离前后正常周期读数的趋势。例如06:30正常读数为2295(22.95°C),06:42突然跳至2500,07:00又回落至2320;07:12再次跳至2502,07:30回落至2334;07:42跳至2498,08:00回落至2364;08:12跳至2501,08:30回落至2352。", "推理步骤3: 这些尖峰值高度一致(2498-2502),几乎锁定在2500附近,与自然温度变化的渐进特征不符。自然温度不会在12分钟内上升近2°C又在18分钟内回落近2°C,且反复出现相同的峰值。这种'锁定在特定值'的行为更像是传感器在某种故障模式下输出默认值或饱和值。", "推理步骤4: 同时段客厅和厨房温度传感器的读数变化平滑且符合自然趋势,排除了环境因素(如空调开启)导致卧室真实温度剧烈波动的可能性。虽然06:42空调开启,但空调在客厅,不会导致卧室温度瞬间跳升至25°C再回落。", "推理步骤5: 异常上报集中在06:42-08:12约1.5小时的窗口内,之后传感器恢复正常的30分钟周期上报且读数趋势平滑,说明这是一个间歇性故障,可能与特定时段的环境条件(如晨间湿度、温度变化)触发了传感器的不稳定状态有关。", "推理步骤6: 厨房温度传感器在灶具使用期间上报None值,这是已知的正常行为(可能是灶具高温干扰或设计上的屏蔽机制),与卧室传感器的异常模式完全不同,不应混淆。"], "key_evidence": ["06:42上报2500、07:12上报2502、07:42上报2498、08:12上报2501——四次非周期性异常读数均锁定在约25.00°C", "这些异常读数出现在正常30分钟周期之间(如06:30和07:00之间的06:42),且仅卧室传感器有此行为", "异常读数与前后正常读数存在约1.5-2°C的突变落差,不符合自然温度变化规律", "同时段客厅和厨房传感器读数平滑正常,排除环境因素"], "recommended_actions": ["检查卧室温度传感器的硬件连接状态,清洁探头并确认安装是否牢固", "查看传感器固件版本,如有可用更新则升级固件以修复可能的采样逻辑缺陷", "在传感器旁放置一个已校准的独立温度计,对比验证读数准确性", "如故障持续出现,建议更换卧室温度传感器,对于独居老人家庭,准确的环境监测数据对健康安全至关重要"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.760781049728394, "api_error": null} {"episode_id": "SQ1_FP_D_0123", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0123.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20260752, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kitchen", "injection_time": "2026-06-16T06:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间反复报告 None(空值),存在间歇性故障,可能导致无法及时检测厨房高温异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在非烹饪时段(00:00-05:30、06:30-10:55、11:30-16:56、17:30-23:30)均能正常上报温度数据,数值在 2291-2586 范围内波动,与客厅/卧室温度趋势一致,说明传感器基础功能存在。\",\n \"推理步骤2: 但在三次灶具开启期间,传感器均出现 MeasuredValue = None 的异常读数:第一次 06:00:36 灶具开启 → 06:01:06 报 None,06:40:00 灶具关闭 → 06:41:00 再次报 None;第二次 10:55:30 灶具开启 → 10:56:00 报 None,11:25:00 灶具关闭 → 11:26:00 报 None;第三次 16:56:30 灶具开启 → 16:57:00 报 None,17:31:00 灶具关闭 → 17:32:00 报 None。\",\n \"推理步骤3: 三次灶具使用均在开启后约 30 秒和关闭后约 1 分钟各触发一次 None 值,模式高度一致,说明这不是随机通信丢包,而是与灶具状态切换强相关的系统性故障。\",\n \"推理步骤4: 可能的故障原因包括:(a) 灶具开关产生的电磁干扰导致传感器瞬时读数异常;(b) 灶具附近温度骤变超出传感器量程,传感器返回 null 表示读数无效;(c) 传感器固件缺陷,在温度快速变化时无法正确采样。\",\n \"推理步骤5: 对于独居老人场景,厨房温度传感器在烹饪期间失效尤其危险——这恰恰是最需要温度监测来预防火灾的时段。如果灶具忘关或油温过高,传感器可能无法提供有效告警数据。\"\n ],\n \"key_evidence\": [\n \"灶具三次使用期间(06:00-06:40、10:55-11:25、16:56-17:31),厨房温度传感器共 6 次报告 MeasuredValue = None\",\n \"None 值出现时机高度规律:每次灶具开启后约 30 秒一次,关闭后约 1 分钟一次\",\n \"非烹饪时段传感器工作完全正常,全天其余时间无任何 None 值出现\",\n \"同一网络下的客厅和卧室温度传感器全天无任何 None 值,排除网络层面的普遍问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰\",\n \"检查传感器固件版本,如有更新应及时升级以修复可能的采样缺陷\",\n \"在传感器报告 None 期间,系统应自动启用备用安全策略(如依赖烟雾报警器加强监测,或对灶具设置最大使用时长自动断电)\",\n \"考虑增加一个冗余温度传感器或将现有传感器迁移到不受灶具直接影响的位置\",\n \"针对独居老人场景,建议为灶具配置无人看管超时自动关闭功能(如 30 分钟无厨房运动则关闭灶具)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间反复报告 None(空值),存在间歇性故障,可能导致无法及时检测厨房高温异常。", "reasoning": ["推理步骤1: 厨房温度传感器在非烹饪时段(00:00-05:30、06:30-10:55、11:30-16:56、17:30-23:30)均能正常上报温度数据,数值在 2291-2586 范围内波动,与客厅/卧室温度趋势一致,说明传感器基础功能存在。", "推理步骤2: 但在三次灶具开启期间,传感器均出现 MeasuredValue = None 的异常读数:第一次 06:00:36 灶具开启 → 06:01:06 报 None,06:40:00 灶具关闭 → 06:41:00 再次报 None;第二次 10:55:30 灶具开启 → 10:56:00 报 None,11:25:00 灶具关闭 → 11:26:00 报 None;第三次 16:56:30 灶具开启 → 16:57:00 报 None,17:31:00 灶具关闭 → 17:32:00 报 None。", "推理步骤3: 三次灶具使用均在开启后约 30 秒和关闭后约 1 分钟各触发一次 None 值,模式高度一致,说明这不是随机通信丢包,而是与灶具状态切换强相关的系统性故障。", "推理步骤4: 可能的故障原因包括:(a) 灶具开关产生的电磁干扰导致传感器瞬时读数异常;(b) 灶具附近温度骤变超出传感器量程,传感器返回 null 表示读数无效;(c) 传感器固件缺陷,在温度快速变化时无法正确采样。", "推理步骤5: 对于独居老人场景,厨房温度传感器在烹饪期间失效尤其危险——这恰恰是最需要温度监测来预防火灾的时段。如果灶具忘关或油温过高,传感器可能无法提供有效告警数据。"], "key_evidence": ["灶具三次使用期间(06:00-06:40、10:55-11:25、16:56-17:31),厨房温度传感器共 6 次报告 MeasuredValue = None", "None 值出现时机高度规律:每次灶具开启后约 30 秒一次,关闭后约 1 分钟一次", "非烹饪时段传感器工作完全正常,全天其余时间无任何 None 值出现", "同一网络下的客厅和卧室温度传感器全天无任何 None 值,排除网络层面的普遍问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰", "检查传感器固件版本,如有更新应及时升级以修复可能的采样缺陷", "在传感器报告 None 期间,系统应自动启用备用安全策略(如依赖烟雾报警器加强监测,或对灶具设置最大使用时长自动断电)", "考虑增加一个冗余温度传感器或将现有传感器迁移到不受灶具直接影响的位置", "针对独居老人场景,建议为灶具配置无人看管超时自动关闭功能(如 30 分钟无厨房运动则关闭灶具)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.994370698928833, "api_error": null} {"episode_id": "SQ1_FP_D_0130", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0130.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20260759, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-07T16:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卫生间运动传感器存在异常短暂触发现象,且漏水传感器全天无任何数据上报,可能存在设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间运动传感器(bathroom_occupancy)在16:58:00触发占用(=1),仅45秒后(16:58:45)就报告无人(=0),随后17:03:20再次触发,50秒后(17:04:10)又报告无人。两次触发时间极短且间隔很近,不符合正常如厕或洗漱的行为模式。\",\n \"推理步骤2: 对比早晨(05:37-05:51,约14分钟)和晚间(20:39-20:47,约7-8分钟)的正常卫生间使用时长,16:58和17:03的两次触发(分别45秒和50秒)异常短暂,可能是传感器灵敏度问题或老人经过门口被误触发。\",\n \"推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有任何数据上报——既没有正常的心跳/状态汇报,也没有检测值。对于一个应定期上报状态的传感器来说,完全静默可能意味着设备离线或通信故障。\",\n \"推理步骤4: 卫生间灯(bathroom_light)与运动传感器的联动在早晨和晚间表现正常,但16:58的两次短暂触发期间灯未被开启,进一步说明这两次触发可能是误报而非真实进入。\"\n ],\n \"key_evidence\": [\n \"bathroom_occupancy 在16:58:00-16:58:45仅持续45秒,17:03:20-17:04:10仅持续50秒,远短于正常使用时长\",\n \"bathroom_water_leak 全天24小时无任何状态上报记录\",\n \"16:58和17:03的两次短暂触发期间bathroom_light未被开启,与早晚正常使用时灯光联动的模式不一致\"\n ],\n \"recommended_actions\": [\n \"检查卫生间漏水传感器(bathroom_water_leak)的电池电量和网络连接状态,确认设备是否在线\",\n \"检查卫生间运动传感器的安装位置和灵敏度设置,排除门口过路误触发的可能\",\n \"对漏水传感器进行手动测试(如滴水测试),验证其检测功能是否正常\",\n \"考虑为漏水传感器设置离线告警规则,当设备超过一定时间未上报时自动通知家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卫生间运动传感器存在异常短暂触发现象,且漏水传感器全天无任何数据上报,可能存在设备故障。", "reasoning": ["推理步骤1: 卫生间运动传感器(bathroom_occupancy)在16:58:00触发占用(=1),仅45秒后(16:58:45)就报告无人(=0),随后17:03:20再次触发,50秒后(17:04:10)又报告无人。两次触发时间极短且间隔很近,不符合正常如厕或洗漱的行为模式。", "推理步骤2: 对比早晨(05:37-05:51,约14分钟)和晚间(20:39-20:47,约7-8分钟)的正常卫生间使用时长,16:58和17:03的两次触发(分别45秒和50秒)异常短暂,可能是传感器灵敏度问题或老人经过门口被误触发。", "推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有任何数据上报——既没有正常的心跳/状态汇报,也没有检测值。对于一个应定期上报状态的传感器来说,完全静默可能意味着设备离线或通信故障。", "推理步骤4: 卫生间灯(bathroom_light)与运动传感器的联动在早晨和晚间表现正常,但16:58的两次短暂触发期间灯未被开启,进一步说明这两次触发可能是误报而非真实进入。"], "key_evidence": ["bathroom_occupancy 在16:58:00-16:58:45仅持续45秒,17:03:20-17:04:10仅持续50秒,远短于正常使用时长", "bathroom_water_leak 全天24小时无任何状态上报记录", "16:58和17:03的两次短暂触发期间bathroom_light未被开启,与早晚正常使用时灯光联动的模式不一致"], "recommended_actions": ["检查卫生间漏水传感器(bathroom_water_leak)的电池电量和网络连接状态,确认设备是否在线", "检查卫生间运动传感器的安装位置和灵敏度设置,排除门口过路误触发的可能", "对漏水传感器进行手动测试(如滴水测试),验证其检测功能是否正常", "考虑为漏水传感器设置离线告警规则,当设备超过一定时间未上报时自动通知家属"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.251049280166626, "api_error": null} {"episode_id": "SQ1_FP_D_0134", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_FP_D_0134.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20260763, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kitchen", "injection_time": "2026-06-08T13:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间反复报告 None 值,存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内多次报告 MeasuredValue = None(05:57、06:34、10:55、11:26、16:51、17:39),共出现6次空值。\",\n \"推理步骤2: 每次 None 值都紧跟在 kitchen_cook_surface 开启或关闭事件之后约30秒到1分钟内出现,说明传感器在灶具状态变化时失效。\",\n \"推理步骤3: 对比客厅和卧室温度传感器,它们在整个24小时内从未报告 None 值,始终正常输出数值,排除系统级通信故障的可能。\",\n \"推理步骤4: 在灶具未使用的时段(如凌晨0:00-5:30、下午时段),厨房温度传感器能正常报告数值,说明传感器并非完全损坏,而是在高温或电磁干扰环境下出现间歇性失效。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节,传感器在灶具使用时恰好失效意味着在最需要监测的时刻反而无法提供数据,存在安全盲区。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:57、06:34、10:55、11:26、16:51、17:39)\",\n \"同一时段客厅和卧室温度传感器均正常工作,排除网络或系统级故障\",\n \"None 值与 kitchen_cook_surface 的 OnOff 状态变化高度相关,非灶具使用时段传感器正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数\",\n \"检查传感器的测量范围上限,灶具使用时局部温度可能超出传感器量程导致返回空值\",\n \"考虑更换为耐高温型温度传感器或调整安装位置,确保灶具使用期间仍能有效监测\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常作为备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间反复报告 None 值,存在间歇性故障。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内多次报告 MeasuredValue = None(05:57、06:34、10:55、11:26、16:51、17:39),共出现6次空值。", "推理步骤2: 每次 None 值都紧跟在 kitchen_cook_surface 开启或关闭事件之后约30秒到1分钟内出现,说明传感器在灶具状态变化时失效。", "推理步骤3: 对比客厅和卧室温度传感器,它们在整个24小时内从未报告 None 值,始终正常输出数值,排除系统级通信故障的可能。", "推理步骤4: 在灶具未使用的时段(如凌晨0:00-5:30、下午时段),厨房温度传感器能正常报告数值,说明传感器并非完全损坏,而是在高温或电磁干扰环境下出现间歇性失效。", "推理步骤5: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节,传感器在灶具使用时恰好失效意味着在最需要监测的时刻反而无法提供数据,存在安全盲区。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:57、06:34、10:55、11:26、16:51、17:39)", "同一时段客厅和卧室温度传感器均正常工作,排除网络或系统级故障", "None 值与 kitchen_cook_surface 的 OnOff 状态变化高度相关,非灶具使用时段传感器正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数", "检查传感器的测量范围上限,灶具使用时局部温度可能超出传感器量程导致返回空值", "考虑更换为耐高温型温度传感器或调整安装位置,确保灶具使用期间仍能有效监测", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常作为备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.38065528869629, "api_error": null} {"episode_id": "SQ1_TN_A_0135", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_A_0135.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20260764, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)全天仅在23:07上报一次事件,且玄关灯(entrance_light)全天无任何事件记录,存在传感器故障或离线的可能。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有3个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。\",\n \"推理步骤2: 全天日志中,front_door_contact 仅在 23:07:20 上报了一次 StateValue=True(门关闭),而住户早上 08:43 起床、09:18 进厨房做饭、10:00 到客厅等活动表明人在家中活动,但没有任何出入门的开关记录,这本身不一定异常(住户可能整天未出门)。\",\n \"推理步骤3: 但 entrance_light(玄关灯)在整整24小时内没有产生任何事件(无开/关记录),这非常不寻常。即使住户整天在家,晚间 23:07 明确有一次'关客厅灯→进卧室→门锁自动上锁'的就寝流程,期间也没有玄关灯的任何状态变化。对比其他区域的灯(bathroom_light、kitchen_light、bedroom_light、living_room_light)都有正常的开关记录。\",\n \"推理步骤4: front_door_contact 在 23:07:20 报告 StateValue=True(门已关闭),紧接着 23:07:21 门锁自动上锁。但全天没有对应的 StateValue=False(门打开)记录。如果住户整天未出门,门传感器确实可能不触发,但结合玄关灯完全无响应来看,更可能是玄关区域设备通信存在问题。\",\n \"推理步骤5: 综合判断:entrance_light 全天零事件高度疑似离线或故障;front_door_contact 功能可能部分正常(23:07有一次上报),但缺少配对的开门事件也可能意味着该传感器存在漏报。整体来看 entrance 区域传感器工作状态不正常。\"\n ],\n \"key_evidence\": [\n \"entrance_light 全天24小时无任何状态变化事件,其他区域灯具均有正常开关记录\",\n \"front_door_contact 全天仅在 23:07:20 上报一次 StateValue=True,无对应的开门(StateValue=False)事件\",\n \"其他区域传感器(bathroom_occupancy、bedroom_occupancy、living_room_occupancy、kitchen_window_contact 等)均有多次正常上报\"\n ],\n \"recommended_actions\": [\n \"检查玄关灯(entrance_light)的网络连接状态和供电情况,确认设备是否离线或硬件故障\",\n \"手动触发入户门开关,验证 front_door_contact 是否能正常上报开/关两个状态\",\n \"检查 entrance 区域的 Matter 网络信号覆盖情况,排除因信号弱导致的设备间歇性离线\",\n \"如确认设备故障,及时更换或重新配对,避免安防盲区(入户门是最关键的安全防线)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)全天仅在23:07上报一次事件,且玄关灯(entrance_light)全天无任何事件记录,存在传感器故障或离线的可能。", "reasoning": ["推理步骤1: entrance 区域共有3个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。", "推理步骤2: 全天日志中,front_door_contact 仅在 23:07:20 上报了一次 StateValue=True(门关闭),而住户早上 08:43 起床、09:18 进厨房做饭、10:00 到客厅等活动表明人在家中活动,但没有任何出入门的开关记录,这本身不一定异常(住户可能整天未出门)。", "推理步骤3: 但 entrance_light(玄关灯)在整整24小时内没有产生任何事件(无开/关记录),这非常不寻常。即使住户整天在家,晚间 23:07 明确有一次'关客厅灯→进卧室→门锁自动上锁'的就寝流程,期间也没有玄关灯的任何状态变化。对比其他区域的灯(bathroom_light、kitchen_light、bedroom_light、living_room_light)都有正常的开关记录。", "推理步骤4: front_door_contact 在 23:07:20 报告 StateValue=True(门已关闭),紧接着 23:07:21 门锁自动上锁。但全天没有对应的 StateValue=False(门打开)记录。如果住户整天未出门,门传感器确实可能不触发,但结合玄关灯完全无响应来看,更可能是玄关区域设备通信存在问题。", "推理步骤5: 综合判断:entrance_light 全天零事件高度疑似离线或故障;front_door_contact 功能可能部分正常(23:07有一次上报),但缺少配对的开门事件也可能意味着该传感器存在漏报。整体来看 entrance 区域传感器工作状态不正常。"], "key_evidence": ["entrance_light 全天24小时无任何状态变化事件,其他区域灯具均有正常开关记录", "front_door_contact 全天仅在 23:07:20 上报一次 StateValue=True,无对应的开门(StateValue=False)事件", "其他区域传感器(bathroom_occupancy、bedroom_occupancy、living_room_occupancy、kitchen_window_contact 等)均有多次正常上报"], "recommended_actions": ["检查玄关灯(entrance_light)的网络连接状态和供电情况,确认设备是否离线或硬件故障", "手动触发入户门开关,验证 front_door_contact 是否能正常上报开/关两个状态", "检查 entrance 区域的 Matter 网络信号覆盖情况,排除因信号弱导致的设备间歇性离线", "如确认设备故障,及时更换或重新配对,避免安防盲区(入户门是最关键的安全防线)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.243996381759644, "api_error": null} {"episode_id": "SQ1_TN_A_0137", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_A_0137.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260766, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卫生间漏水传感器全天无任何数据上报,可能处于离线或故障状态。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间区域共有3个设备——卫生间灯(bathroom_light)、卫生间运动传感器(bathroom_occupancy)、卫生间漏水传感器(bathroom_water_leak)。\",\n \"推理步骤2: 卫生间灯和运动传感器在当天有正常的事件记录:06:26 运动传感器检测到占用、灯自动开启,07:06 灯关闭、07:07 运动传感器恢复无人状态,行为模式符合早晨使用卫生间的正常习惯。\",\n \"推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有任何一条记录——既没有正常的状态心跳上报,也没有告警事件。\",\n \"推理步骤4: 对比其他传感器(如温度传感器每30分钟上报一次、运动传感器在有人时即时上报),漏水传感器作为安全类设备,通常也应有周期性心跳或状态上报以证明在线。全天零记录提示该设备可能离线、电池耗尽或通信故障。\",\n \"推理步骤5: 虽然漏水传感器在无漏水时不会触发告警是正常的,但完全没有任何心跳或属性上报(如 BooleanState.StateValue = False 的周期性确认)在一整天的日志中缺失,属于值得关注的异常。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何事件或状态上报记录\",\n \"同区域的 bathroom_occupancy 和 bathroom_light 均有正常事件记录,排除区域网络整体故障的可能\"\n ],\n \"recommended_actions\": [\n \"检查卫生间漏水传感器的电池电量或供电状态,确认设备是否在线\",\n \"通过 Matter 协议手动查询 bathroom_water_leak 的 BooleanState.StateValue 属性,验证设备是否响应\",\n \"如设备无响应,尝试重新配网或更换电池;如仍无法恢复,考虑更换传感器\",\n \"漏水传感器属于安全关键设备,建议在系统中配置离线告警规则,当设备超过一定时间无心跳时主动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卫生间漏水传感器全天无任何数据上报,可能处于离线或故障状态。", "reasoning": ["推理步骤1: 卫生间区域共有3个设备——卫生间灯(bathroom_light)、卫生间运动传感器(bathroom_occupancy)、卫生间漏水传感器(bathroom_water_leak)。", "推理步骤2: 卫生间灯和运动传感器在当天有正常的事件记录:06:26 运动传感器检测到占用、灯自动开启,07:06 灯关闭、07:07 运动传感器恢复无人状态,行为模式符合早晨使用卫生间的正常习惯。", "推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有任何一条记录——既没有正常的状态心跳上报,也没有告警事件。", "推理步骤4: 对比其他传感器(如温度传感器每30分钟上报一次、运动传感器在有人时即时上报),漏水传感器作为安全类设备,通常也应有周期性心跳或状态上报以证明在线。全天零记录提示该设备可能离线、电池耗尽或通信故障。", "推理步骤5: 虽然漏水传感器在无漏水时不会触发告警是正常的,但完全没有任何心跳或属性上报(如 BooleanState.StateValue = False 的周期性确认)在一整天的日志中缺失,属于值得关注的异常。"], "key_evidence": ["bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何事件或状态上报记录", "同区域的 bathroom_occupancy 和 bathroom_light 均有正常事件记录,排除区域网络整体故障的可能"], "recommended_actions": ["检查卫生间漏水传感器的电池电量或供电状态,确认设备是否在线", "通过 Matter 协议手动查询 bathroom_water_leak 的 BooleanState.StateValue 属性,验证设备是否响应", "如设备无响应,尝试重新配网或更换电池;如仍无法恢复,考虑更换传感器", "漏水传感器属于安全关键设备,建议在系统中配置离线告警规则,当设备超过一定时间无心跳时主动通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.6764919757843, "api_error": null} {"episode_id": "SQ1_TN_A_0138", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_A_0138.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20260767, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的温度传感器和运动传感器工作正常,数据符合预期规律。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。\",\n \"推理步骤2: 温度变化曲线符合自然昼夜规律——凌晨最低约22.9°C,午间最高约25.8°C,傍晚逐步回落。整体波动范围约22.9°C~25.8°C,属于夏季室内正常温度区间,无突变或异常跳变。\",\n \"推理步骤3: 18:12住户回家后开启空调(制冷模式 SystemMode=3),此后客厅温度从约24.6°C逐步下降至22:00的23.6°C,降温速率合理,说明温度传感器准确反映了空调的制冷效果。\",\n \"推理步骤4: 客厅运动传感器(living_room_occupancy)在18:12住户进门后触发 Occupancy=1,20:01再次确认有人在客厅活动,与开灯、开空调等操作时间吻合,行为逻辑一致。\",\n \"推理步骤5: 对比同期厨房温度传感器在18:00出现异常跳变(28.62°C)和两次 None 值,客厅传感器无此类问题,进一步佐证客厅传感器数据质量良好。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点均正常上报,无缺失或 None 值,温度范围 2290~2582(22.9°C~25.8°C)符合夏季昼夜变化\",\n \"living_room_occupancy 在18:12和20:01两次触发,与入户门开锁、开灯、开空调等事件时间高度吻合\",\n \"空调开启后温度持续平稳下降(24.6°C → 23.6°C),传感器准确反映了环境变化\"\n ],\n \"recommended_actions\": [\n \"客厅传感器无需处理,建议保持当前状态继续监测\",\n \"注意:同期厨房温度传感器存在异常(18:00突然跳至28.62°C、两次报告None),建议优先排查厨房温度传感器是否故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的温度传感器和运动传感器工作正常,数据符合预期规律。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。", "推理步骤2: 温度变化曲线符合自然昼夜规律——凌晨最低约22.9°C,午间最高约25.8°C,傍晚逐步回落。整体波动范围约22.9°C~25.8°C,属于夏季室内正常温度区间,无突变或异常跳变。", "推理步骤3: 18:12住户回家后开启空调(制冷模式 SystemMode=3),此后客厅温度从约24.6°C逐步下降至22:00的23.6°C,降温速率合理,说明温度传感器准确反映了空调的制冷效果。", "推理步骤4: 客厅运动传感器(living_room_occupancy)在18:12住户进门后触发 Occupancy=1,20:01再次确认有人在客厅活动,与开灯、开空调等操作时间吻合,行为逻辑一致。", "推理步骤5: 对比同期厨房温度传感器在18:00出现异常跳变(28.62°C)和两次 None 值,客厅传感器无此类问题,进一步佐证客厅传感器数据质量良好。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点均正常上报,无缺失或 None 值,温度范围 2290~2582(22.9°C~25.8°C)符合夏季昼夜变化", "living_room_occupancy 在18:12和20:01两次触发,与入户门开锁、开灯、开空调等事件时间高度吻合", "空调开启后温度持续平稳下降(24.6°C → 23.6°C),传感器准确反映了环境变化"], "recommended_actions": ["客厅传感器无需处理,建议保持当前状态继续监测", "注意:同期厨房温度传感器存在异常(18:00突然跳至28.62°C、两次报告None),建议优先排查厨房温度传感器是否故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.485177993774414, "api_error": null} {"episode_id": "SQ1_TN_A_0142", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_A_0142.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20260771, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在两项异常:多次报告 None 值(疑似灶具干扰导致读数丢失),以及 12:00 出现不合理的温度跳变(29.85°C),指向传感器故障或数据异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:17、09:26、12:11、12:34、18:13、18:56),共计 6 次。而客厅和卧室传感器在整个日志周期内从未出现 None 值,说明这不是系统级通信问题,而是厨房传感器自身的问题。\",\n \"推理步骤2: 每次 None 值的出现都紧跟在 kitchen_cook_surface 开启或关闭之后(间隔约 30 秒到 1 分钟),高度关联灶具操作。可能原因:灶具产生的高温或电磁干扰导致传感器读数超量程或采样失败,传感器返回 None 而非有效数值。\",\n \"推理步骤3: 12:00 时厨房温度突然从 25.43°C(11:30)跳升至 29.85°C,而同一时刻客厅仅为 25.85°C、卧室为 24.88°C。此时灶具并未开启(灶具在 12:10 才开启),厨房不应比其他房间高出约 4°C。12:30 仍报告 29.70°C,直到 13:00 才回落至 25.64°C。这一异常跳变无合理热源解释,疑似传感器偶发性读数漂移或数据错误。\",\n \"推理步骤4: 除上述两个异常外,厨房温度传感器在其余时段的读数趋势与客厅基本一致(通常高 1-2°C 属正常),整体温度曲线符合夏季昼夜变化规律,说明传感器并非完全失效,而是在特定条件下出现间歇性故障。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具操作前后共 6 次报告 MeasuredValue = None(09:17、09:26、12:11、12:34、18:13、18:56),客厅和卧室传感器全天无 None 值\",\n \"12:00 厨房温度异常跳变至 29.85°C(较 11:30 的 25.43°C 骤升 4.42°C),此时灶具未开启,客厅同时刻仅 25.85°C,温差不合理\",\n \"每次 None 值均与 kitchen_cook_surface 的 OnOff 状态变化在时间上强相关(间隔 < 1 分钟)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到高温辐射或电磁干扰影响,必要时重新选址安装\",\n \"对传感器进行校准测试,使用已知温度源验证其读数准确性,排查 12:00 异常跳变是否为硬件漂移\",\n \"检查传感器固件版本,确认是否存在已知的超量程处理缺陷,必要时升级固件或更换传感器\",\n \"作为临时措施,可在灶具使用期间对厨房温度传感器的 None 值做容错处理(如沿用最近有效值),避免依赖该传感器的自动化规则误触发\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在两项异常:多次报告 None 值(疑似灶具干扰导致读数丢失),以及 12:00 出现不合理的温度跳变(29.85°C),指向传感器故障或数据异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:17、09:26、12:11、12:34、18:13、18:56),共计 6 次。而客厅和卧室传感器在整个日志周期内从未出现 None 值,说明这不是系统级通信问题,而是厨房传感器自身的问题。", "推理步骤2: 每次 None 值的出现都紧跟在 kitchen_cook_surface 开启或关闭之后(间隔约 30 秒到 1 分钟),高度关联灶具操作。可能原因:灶具产生的高温或电磁干扰导致传感器读数超量程或采样失败,传感器返回 None 而非有效数值。", "推理步骤3: 12:00 时厨房温度突然从 25.43°C(11:30)跳升至 29.85°C,而同一时刻客厅仅为 25.85°C、卧室为 24.88°C。此时灶具并未开启(灶具在 12:10 才开启),厨房不应比其他房间高出约 4°C。12:30 仍报告 29.70°C,直到 13:00 才回落至 25.64°C。这一异常跳变无合理热源解释,疑似传感器偶发性读数漂移或数据错误。", "推理步骤4: 除上述两个异常外,厨房温度传感器在其余时段的读数趋势与客厅基本一致(通常高 1-2°C 属正常),整体温度曲线符合夏季昼夜变化规律,说明传感器并非完全失效,而是在特定条件下出现间歇性故障。"], "key_evidence": ["厨房温度传感器在灶具操作前后共 6 次报告 MeasuredValue = None(09:17、09:26、12:11、12:34、18:13、18:56),客厅和卧室传感器全天无 None 值", "12:00 厨房温度异常跳变至 29.85°C(较 11:30 的 25.43°C 骤升 4.42°C),此时灶具未开启,客厅同时刻仅 25.85°C,温差不合理", "每次 None 值均与 kitchen_cook_surface 的 OnOff 状态变化在时间上强相关(间隔 < 1 分钟)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到高温辐射或电磁干扰影响,必要时重新选址安装", "对传感器进行校准测试,使用已知温度源验证其读数准确性,排查 12:00 异常跳变是否为硬件漂移", "检查传感器固件版本,确认是否存在已知的超量程处理缺陷,必要时升级固件或更换传感器", "作为临时措施,可在灶具使用期间对厨房温度传感器的 None 值做容错处理(如沿用最近有效值),避免依赖该传感器的自动化规则误触发"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.19442629814148, "api_error": null} {"episode_id": "SQ1_TN_A_0169", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_A_0169.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20260798, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅空调在持续运行约13小时期间未能有效降温,且客厅运动传感器全天仅触发一次,疑似空调制冷故障或传感器灵敏度异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,数值从凌晨约22.9°C逐步升至中午约25.9°C再回落至夜间约23.3°C,温度曲线平滑连续,传感器本身工作正常。\",\n \"推理步骤2: 客厅空调于10:10开启(SystemMode=3,即制冷模式),直到22:58关闭,持续运行近13小时。但在此期间,客厅温度从10:00的25.2°C继续上升至12:00的25.7°C,午后才缓慢下降,且下降趋势与室外自然降温一致(卧室和厨房同步下降),说明空调的制冷效果不明显。\",\n \"推理步骤3: 对比卧室温度(无空调)和客厅温度(有空调),两者午后的降温曲线几乎平行,客厅并未表现出空调制冷应有的更快降温速率,进一步佐证空调可能存在制冷能力不足的问题。\",\n \"推理步骤4: 客厅运动传感器全天仅在10:10触发一次占用状态(Occupancy=1),之后再无状态变化。住户从08:26起床后在各房间活动(卧室→卫生间→厨房→客厅),但客厅传感器在住户离开客厅去厨房做午饭(12:06)和晚饭(18:00)期间均无Occupancy=0的回落事件,也没有后续重新检测到占用的事件,这可能是传感器灵敏度偏低或存在'粘滞'状态的迹象。\",\n \"推理步骤5: 客厅窗户传感器全天无任何事件上报,窗帘在10:10被关闭(位置0%),这些行为本身正常,无异常。\"\n ],\n \"key_evidence\": [\n \"空调10:10开启制冷模式,运行至22:58,但10:00-13:00期间客厅温度反而从25.2°C升至25.6°C,制冷效果缺失\",\n \"客厅与卧室(无空调)的午后降温曲线几乎平行,说明客厅降温主要靠自然散热而非空调\",\n \"客厅运动传感器10:10触发Occupancy=1后全天无后续状态变化,缺少离开/重新进入事件\"\n ],\n \"recommended_actions\": [\n \"检查客厅空调的制冷剂是否充足、滤网是否堵塞、出风口是否正常工作,必要时安排维修\",\n \"检查客厅空调的温控设定值(Thermostat.OccupiedCoolingSetpoint),确认目标温度是否设置合理\",\n \"测试客厅运动传感器的灵敏度,确认其能正常检测人员离开事件(Occupancy=0),排除固件或硬件故障\",\n \"可考虑在下次空调运行时对比开启前后的温度变化率,量化评估制冷性能是否达标\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅空调在持续运行约13小时期间未能有效降温,且客厅运动传感器全天仅触发一次,疑似空调制冷故障或传感器灵敏度异常。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,数值从凌晨约22.9°C逐步升至中午约25.9°C再回落至夜间约23.3°C,温度曲线平滑连续,传感器本身工作正常。", "推理步骤2: 客厅空调于10:10开启(SystemMode=3,即制冷模式),直到22:58关闭,持续运行近13小时。但在此期间,客厅温度从10:00的25.2°C继续上升至12:00的25.7°C,午后才缓慢下降,且下降趋势与室外自然降温一致(卧室和厨房同步下降),说明空调的制冷效果不明显。", "推理步骤3: 对比卧室温度(无空调)和客厅温度(有空调),两者午后的降温曲线几乎平行,客厅并未表现出空调制冷应有的更快降温速率,进一步佐证空调可能存在制冷能力不足的问题。", "推理步骤4: 客厅运动传感器全天仅在10:10触发一次占用状态(Occupancy=1),之后再无状态变化。住户从08:26起床后在各房间活动(卧室→卫生间→厨房→客厅),但客厅传感器在住户离开客厅去厨房做午饭(12:06)和晚饭(18:00)期间均无Occupancy=0的回落事件,也没有后续重新检测到占用的事件,这可能是传感器灵敏度偏低或存在'粘滞'状态的迹象。", "推理步骤5: 客厅窗户传感器全天无任何事件上报,窗帘在10:10被关闭(位置0%),这些行为本身正常,无异常。"], "key_evidence": ["空调10:10开启制冷模式,运行至22:58,但10:00-13:00期间客厅温度反而从25.2°C升至25.6°C,制冷效果缺失", "客厅与卧室(无空调)的午后降温曲线几乎平行,说明客厅降温主要靠自然散热而非空调", "客厅运动传感器10:10触发Occupancy=1后全天无后续状态变化,缺少离开/重新进入事件"], "recommended_actions": ["检查客厅空调的制冷剂是否充足、滤网是否堵塞、出风口是否正常工作,必要时安排维修", "检查客厅空调的温控设定值(Thermostat.OccupiedCoolingSetpoint),确认目标温度是否设置合理", "测试客厅运动传感器的灵敏度,确认其能正常检测人员离开事件(Occupancy=0),排除固件或硬件故障", "可考虑在下次空调运行时对比开启前后的温度变化率,量化评估制冷性能是否达标"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.970632076263428, "api_error": null} {"episode_id": "SQ1_TN_B_0143", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0143.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20260772, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度数据和运动传感器表现均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 分析主卧温度传感器(master_bedroom_temp_sensor)全天数据,凌晨00:00-05:30期间温度在22.91°C-23.08°C之间小幅波动,属于夜间正常范围。\",\n \"推理步骤2: 06:00起温度开始上升(23.99°C),随日照升温至中午12:00-12:30达到峰值约25.70°C-25.71°C,下午逐步回落,至23:30降回23.45°C。这一日变化曲线完全符合夏季自然气温的昼夜节律。\",\n \"推理步骤3: 主卧温度与其他房间(客厅、次卧、厨房)的温度趋势高度一致,各传感器之间的读数差异始终在合理范围内(通常<1°C),不存在某个时间点主卧温度异常偏离其他房间的情况。\",\n \"推理步骤4: 主卧温度传感器全天48个采样点均返回有效数值,未出现 None 值(对比厨房传感器在18:50和19:53出现了两次 None),说明传感器通信链路稳定。\",\n \"推理步骤5: 主卧运动传感器(master_bedroom_occupancy)全天无触发记录,结合住户07:16出门、18:20回家后主要活动在客厅和厨房的行为轨迹,主卧无人活动是合理的,不属于传感器失灵。\"\n ],\n \"key_evidence\": [\n \"主卧温度全天范围22.91°C-25.71°C,变化平滑且与其他房间趋势一致,无突变或异常偏离\",\n \"温度传感器48个采样点全部返回有效数值,无 None 或数据缺失\",\n \"主卧运动传感器无触发记录,与住户白天外出、晚间活动在客厅/厨房的行为模式吻合\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度数据和运动传感器表现均符合预期。", "reasoning": ["推理步骤1: 分析主卧温度传感器(master_bedroom_temp_sensor)全天数据,凌晨00:00-05:30期间温度在22.91°C-23.08°C之间小幅波动,属于夜间正常范围。", "推理步骤2: 06:00起温度开始上升(23.99°C),随日照升温至中午12:00-12:30达到峰值约25.70°C-25.71°C,下午逐步回落,至23:30降回23.45°C。这一日变化曲线完全符合夏季自然气温的昼夜节律。", "推理步骤3: 主卧温度与其他房间(客厅、次卧、厨房)的温度趋势高度一致,各传感器之间的读数差异始终在合理范围内(通常<1°C),不存在某个时间点主卧温度异常偏离其他房间的情况。", "推理步骤4: 主卧温度传感器全天48个采样点均返回有效数值,未出现 None 值(对比厨房传感器在18:50和19:53出现了两次 None),说明传感器通信链路稳定。", "推理步骤5: 主卧运动传感器(master_bedroom_occupancy)全天无触发记录,结合住户07:16出门、18:20回家后主要活动在客厅和厨房的行为轨迹,主卧无人活动是合理的,不属于传感器失灵。"], "key_evidence": ["主卧温度全天范围22.91°C-25.71°C,变化平滑且与其他房间趋势一致,无突变或异常偏离", "温度传感器48个采样点全部返回有效数值,无 None 或数据缺失", "主卧运动传感器无触发记录,与住户白天外出、晚间活动在客厅/厨房的行为模式吻合"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.40451741218567, "api_error": null} {"episode_id": "SQ1_TN_B_0148", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0148.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20260777, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度、运动和窗帘等设备状态均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天持续每30分钟上报一次数据,无缺失、无 None 值。凌晨约 22.9–23.1°C,白天随室外升温逐步升至约 25.7°C(12:30 前后峰值),傍晚后逐步回落至约 23.3°C,变化曲线平滑且与其他房间(客厅、次卧、厨房)高度一致,属于正常的昼夜温度波动。\",\n \"推理步骤2: 主卧运动传感器在 06:20 检测到有人(Occupancy=1),随后 06:20:04 主卧灯被打开,符合住户早晨起床的行为模式。晚间 22:25:08 再次检测到有人,随后关窗帘、关灯,符合睡前准备的行为模式。两次触发时间和关联动作均合理。\",\n \"推理步骤3: 主卧窗帘在 22:25:18 被拉至 100%(全关),与睡前场景一致。主卧窗户传感器全天无异常开关事件。主卧灯在 06:20 开、07:46 关(出门前)、22:25 关(睡前),使用时段合理。\",\n \"推理步骤4: 将主卧温度与其他三个房间温度交叉对比,各时间点偏差均在 ±2°C 以内,不存在单一传感器漂移或异常读数的情况,排除传感器故障的可能。\"\n ],\n \"key_evidence\": [\n \"主卧温度传感器全天48个采样点均正常上报,数值范围 2290–2572(22.9°C–25.7°C),与其他房间温度走势一致\",\n \"主卧运动传感器仅在 06:20 和 22:25 触发,与起床和睡前行为吻合,无深夜异常触发\",\n \"主卧灯、窗帘操作时间与住户作息(早起、出门、睡前)完全匹配\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,所有主卧传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度、运动和窗帘等设备状态均符合预期。", "reasoning": ["推理步骤1: 主卧温度传感器全天持续每30分钟上报一次数据,无缺失、无 None 值。凌晨约 22.9–23.1°C,白天随室外升温逐步升至约 25.7°C(12:30 前后峰值),傍晚后逐步回落至约 23.3°C,变化曲线平滑且与其他房间(客厅、次卧、厨房)高度一致,属于正常的昼夜温度波动。", "推理步骤2: 主卧运动传感器在 06:20 检测到有人(Occupancy=1),随后 06:20:04 主卧灯被打开,符合住户早晨起床的行为模式。晚间 22:25:08 再次检测到有人,随后关窗帘、关灯,符合睡前准备的行为模式。两次触发时间和关联动作均合理。", "推理步骤3: 主卧窗帘在 22:25:18 被拉至 100%(全关),与睡前场景一致。主卧窗户传感器全天无异常开关事件。主卧灯在 06:20 开、07:46 关(出门前)、22:25 关(睡前),使用时段合理。", "推理步骤4: 将主卧温度与其他三个房间温度交叉对比,各时间点偏差均在 ±2°C 以内,不存在单一传感器漂移或异常读数的情况,排除传感器故障的可能。"], "key_evidence": ["主卧温度传感器全天48个采样点均正常上报,数值范围 2290–2572(22.9°C–25.7°C),与其他房间温度走势一致", "主卧运动传感器仅在 06:20 和 22:25 触发,与起床和睡前行为吻合,无深夜异常触发", "主卧灯、窗帘操作时间与住户作息(早起、出门、睡前)完全匹配"], "recommended_actions": ["无需采取措施,所有主卧传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.36347484588623, "api_error": null} {"episode_id": "SQ1_TN_B_0149", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0149.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260778, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卫生间漏水传感器全天无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: bathroom 区域共有 3 个传感器/设备——卫生间灯(bathroom_light)、卫生间运动传感器(bathroom_occupancy)、卫生间漏水传感器(bathroom_water_leak)。\",\n \"推理步骤2: 在整个 24 小时日志中,bathroom_light 有 2 条记录(06:47:10 开灯、07:03:00 关灯),bathroom_occupancy 有 2 条记录(06:47:10 检测到有人、07:04:05 无人),这两个设备工作正常且事件逻辑一致——早晨有人使用卫生间,灯随动作开关。\",\n \"推理步骤3: 然而 bathroom_water_leak(漏水传感器)在全天 00:00 至 23:30 的日志中没有任何一条上报记录,既没有正常的'无漏水'状态心跳,也没有任何状态变化事件。\",\n \"推理步骤4: 对比其他传感器(温度传感器每 30 分钟上报一次、运动传感器在有事件时上报),漏水传感器作为安全类设备,通常应定期上报心跳或状态以证明在线。全天零上报强烈暗示设备离线、电池耗尽或通信故障。\",\n \"推理步骤5: 漏水传感器是卫生间的关键安全设备,一旦失效将无法及时发现漏水事故,存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何事件上报\",\n \"同区域的 bathroom_light 和 bathroom_occupancy 在 06:47~07:04 期间正常上报,说明网络通信本身没有问题\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水传感器的电池电量或供电状态\",\n \"确认该设备是否仍在 Matter 网络中在线(检查设备可达性/心跳)\",\n \"如设备离线,尝试重新配网或更换电池;若仍无法恢复,考虑更换传感器\",\n \"在传感器恢复前,建议人工定期检查卫生间是否有漏水迹象\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卫生间漏水传感器全天无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: bathroom 区域共有 3 个传感器/设备——卫生间灯(bathroom_light)、卫生间运动传感器(bathroom_occupancy)、卫生间漏水传感器(bathroom_water_leak)。", "推理步骤2: 在整个 24 小时日志中,bathroom_light 有 2 条记录(06:47:10 开灯、07:03:00 关灯),bathroom_occupancy 有 2 条记录(06:47:10 检测到有人、07:04:05 无人),这两个设备工作正常且事件逻辑一致——早晨有人使用卫生间,灯随动作开关。", "推理步骤3: 然而 bathroom_water_leak(漏水传感器)在全天 00:00 至 23:30 的日志中没有任何一条上报记录,既没有正常的'无漏水'状态心跳,也没有任何状态变化事件。", "推理步骤4: 对比其他传感器(温度传感器每 30 分钟上报一次、运动传感器在有事件时上报),漏水传感器作为安全类设备,通常应定期上报心跳或状态以证明在线。全天零上报强烈暗示设备离线、电池耗尽或通信故障。", "推理步骤5: 漏水传感器是卫生间的关键安全设备,一旦失效将无法及时发现漏水事故,存在安全隐患。"], "key_evidence": ["bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何事件上报", "同区域的 bathroom_light 和 bathroom_occupancy 在 06:47~07:04 期间正常上报,说明网络通信本身没有问题"], "recommended_actions": ["立即检查卫生间漏水传感器的电池电量或供电状态", "确认该设备是否仍在 Matter 网络中在线(检查设备可达性/心跳)", "如设备离线,尝试重新配网或更换电池;若仍无法恢复,考虑更换传感器", "在传感器恢复前,建议人工定期检查卫生间是否有漏水迹象"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.55791163444519, "api_error": null} {"episode_id": "SQ1_TN_B_0159", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0159.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260788, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"entrance 区域的所有传感器(入户门锁、入户门传感器、玄关灯、玄关运动传感器)在整个24小时周期内无任何事件上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 日志覆盖了 2026-06-20 全天 00:00 至 23:30 的数据,共48个时间点,每30分钟一次采样。\",\n \"推理步骤2: 在全部日志中搜索 entrance 区域的四个设备(front_door_lock、front_door_contact、entrance_light、entrance_occupancy),没有找到任何一条事件记录。\",\n \"推理步骤3: 作为入户区域,玄关运动传感器和入户门传感器在正常居住情况下应有频繁触发——住户每天进出家门、经过玄关都会产生运动检测和门开关事件。24小时零事件极不正常。\",\n \"推理步骤4: 同期其他区域的温度传感器均在持续正常上报数据,说明系统采集链路本身是通畅的,问题定位在 entrance 区域设备侧。\",\n \"推理步骤5: 可能的故障原因包括:设备电池耗尽、Zigbee/Thread 等无线网络连接中断、Matter 节点掉线、或设备硬件故障。\"\n ],\n \"key_evidence\": [\n \"整个24小时日志中 front_door_lock、front_door_contact、entrance_light、entrance_occupancy 四个设备的事件数量为零\",\n \"其他区域传感器(客厅、主卧、次卧、厨房温度传感器)在同一时段内持续正常上报,排除系统级采集故障\"\n ],\n \"recommended_actions\": [\n \"立即检查 entrance 区域四个设备的在线状态和网络连接,确认是否处于离线状态\",\n \"检查电池供电设备(入户门传感器、玄关运动传感器)的电量,必要时更换电池\",\n \"尝试对设备进行重启或重新入网操作,恢复 Matter 节点通信\",\n \"在设备恢复前,entrance 区域处于安防盲区,建议住户加强人工关注入户门的锁闭状态\",\n \"排查是否存在局部无线信号干扰或 Matter 网络分区问题,必要时增加中继节点\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "entrance 区域的所有传感器(入户门锁、入户门传感器、玄关灯、玄关运动传感器)在整个24小时周期内无任何事件上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 日志覆盖了 2026-06-20 全天 00:00 至 23:30 的数据,共48个时间点,每30分钟一次采样。", "推理步骤2: 在全部日志中搜索 entrance 区域的四个设备(front_door_lock、front_door_contact、entrance_light、entrance_occupancy),没有找到任何一条事件记录。", "推理步骤3: 作为入户区域,玄关运动传感器和入户门传感器在正常居住情况下应有频繁触发——住户每天进出家门、经过玄关都会产生运动检测和门开关事件。24小时零事件极不正常。", "推理步骤4: 同期其他区域的温度传感器均在持续正常上报数据,说明系统采集链路本身是通畅的,问题定位在 entrance 区域设备侧。", "推理步骤5: 可能的故障原因包括:设备电池耗尽、Zigbee/Thread 等无线网络连接中断、Matter 节点掉线、或设备硬件故障。"], "key_evidence": ["整个24小时日志中 front_door_lock、front_door_contact、entrance_light、entrance_occupancy 四个设备的事件数量为零", "其他区域传感器(客厅、主卧、次卧、厨房温度传感器)在同一时段内持续正常上报,排除系统级采集故障"], "recommended_actions": ["立即检查 entrance 区域四个设备的在线状态和网络连接,确认是否处于离线状态", "检查电池供电设备(入户门传感器、玄关运动传感器)的电量,必要时更换电池", "尝试对设备进行重启或重新入网操作,恢复 Matter 节点通信", "在设备恢复前,entrance 区域处于安防盲区,建议住户加强人工关注入户门的锁闭状态", "排查是否存在局部无线信号干扰或 Matter 网络分区问题,必要时增加中继节点"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.316730976104736, "api_error": null} {"episode_id": "SQ1_TN_B_0166", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0166.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20260795, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在开门离家时未经手动操作即自动上锁,且玄关运动传感器在住户离家后全天无活动记录却未触发离家检测异常。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域有三个传感器/设备:front_door_lock、front_door_contact、entrance_occupancy。分析它们全天的工作记录。\",\n \"推理步骤2: 早晨 07:19 离家序列中,entrance_occupancy 在 07:19:12 检测到运动,门锁手动解锁(LockOperationType=1),门传感器显示开/关(False→True),然后门锁自动上锁(Auto)。这个序列合理。\",\n \"推理步骤3: 傍晚 18:14 回家序列中,门锁手动解锁,门传感器显示开门(StateValue=False),entrance_occupancy 检测到运动,但门传感器没有记录关门事件(没有 StateValue=True)。直到 22:15:31 才出现 front_door_contact StateValue=True(关门)。\",\n \"推理步骤4: 这意味着入户门从 18:14:02 到 22:15:31 长达约4小时处于'开启'状态(contact sensor 报告 False=开),这期间门锁也未上锁。这在正常居家场景中极不寻常——住户不会将入户门敞开4小时。\",\n \"推理步骤5: 更可能的解释是 front_door_contact(门磁传感器)存在故障,未能正确检测到关门动作,或者存在安装松动导致状态报告不准确。\"\n ],\n \"key_evidence\": [\n \"18:14:02 front_door_contact 报告 StateValue=False(开门),直到 22:15:31 才报告 StateValue=True(关门),间隔超过4小时\",\n \"18:14 回家后门锁未上锁,直到 22:15:32 才自动上锁,期间住户一直在家活动(客厅有人、做饭、开洗碗机等)\",\n \"entrance_occupancy 在 07:19 之后到 18:14 之间全天无任何触发记录,符合无人在家预期,传感器本身工作正常\"\n ],\n \"recommended_actions\": [\n \"检查入户门磁传感器(front_door_contact)的安装位置和电池电量,确认是否存在松动或信号丢失\",\n \"检查门锁自动上锁策略配置——建议设置关门后自动上锁,而非仅依赖手动或离家触发\",\n \"如门磁传感器确认正常,则需排查住户是否确实长时间未关门,存在安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在开门离家时未经手动操作即自动上锁,且玄关运动传感器在住户离家后全天无活动记录却未触发离家检测异常。", "reasoning": ["推理步骤1: entrance 区域有三个传感器/设备:front_door_lock、front_door_contact、entrance_occupancy。分析它们全天的工作记录。", "推理步骤2: 早晨 07:19 离家序列中,entrance_occupancy 在 07:19:12 检测到运动,门锁手动解锁(LockOperationType=1),门传感器显示开/关(False→True),然后门锁自动上锁(Auto)。这个序列合理。", "推理步骤3: 傍晚 18:14 回家序列中,门锁手动解锁,门传感器显示开门(StateValue=False),entrance_occupancy 检测到运动,但门传感器没有记录关门事件(没有 StateValue=True)。直到 22:15:31 才出现 front_door_contact StateValue=True(关门)。", "推理步骤4: 这意味着入户门从 18:14:02 到 22:15:31 长达约4小时处于'开启'状态(contact sensor 报告 False=开),这期间门锁也未上锁。这在正常居家场景中极不寻常——住户不会将入户门敞开4小时。", "推理步骤5: 更可能的解释是 front_door_contact(门磁传感器)存在故障,未能正确检测到关门动作,或者存在安装松动导致状态报告不准确。"], "key_evidence": ["18:14:02 front_door_contact 报告 StateValue=False(开门),直到 22:15:31 才报告 StateValue=True(关门),间隔超过4小时", "18:14 回家后门锁未上锁,直到 22:15:32 才自动上锁,期间住户一直在家活动(客厅有人、做饭、开洗碗机等)", "entrance_occupancy 在 07:19 之后到 18:14 之间全天无任何触发记录,符合无人在家预期,传感器本身工作正常"], "recommended_actions": ["检查入户门磁传感器(front_door_contact)的安装位置和电池电量,确认是否存在松动或信号丢失", "检查门锁自动上锁策略配置——建议设置关门后自动上锁,而非仅依赖手动或离家触发", "如门磁传感器确认正常,则需排查住户是否确实长时间未关门,存在安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.034799098968506, "api_error": null} {"episode_id": "SQ1_TN_B_0167", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0167.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260796, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的阳台门传感器(balcony_door_contact)在整个24小时日志周期内无任何数据上报,设备疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共部署了3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。\",\n \"推理步骤2: 检索整个2026-06-25全天日志(00:00~23:30),未发现任何以 balcony_light、balcony_door_contact 或 balcony_laundry_washer 为来源的事件记录。\",\n \"推理步骤3: 对于阳台灯和洗衣机,它们属于主动操作型设备,住户当天未使用属于正常情况,不上报状态变化是合理的。\",\n \"推理步骤4: 但阳台门传感器(contact_sensor)是被动监测型传感器,即使门未被开关,正常工作的传感器通常也会有心跳上报或周期性状态确认。与之对比,同类型的入户门传感器(front_door_contact)、厨房窗户传感器(kitchen_window_contact)、客厅窗户传感器(living_room_window_contact)在日志中均有事件记录。\",\n \"推理步骤5: 阳台门传感器24小时零上报,结合其他同类传感器有正常活动记录,高度怀疑该传感器存在离线、电池耗尽或通信故障的问题。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在2026-06-25全天(00:00~23:30)无任何事件记录\",\n \"同类型 contact_sensor 设备(front_door_contact、kitchen_window_contact)在同一时间段内均有正常的状态上报\",\n \"阳台区域全部3个设备(balcony_light、balcony_door_contact、balcony_laundry_washer)均无任何日志输出\"\n ],\n \"recommended_actions\": [\n \"立即检查 balcony_door_contact 传感器的在线状态和电池电量\",\n \"尝试对该传感器进行手动触发测试(开关阳台门),确认其是否能正常上报状态\",\n \"检查传感器与 Matter 网络网关之间的通信链路,排除信号遮挡或网络配对丢失的可能\",\n \"如确认设备故障,及时更换或重新配对,避免阳台门的开关状态处于监控盲区,产生入侵风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的阳台门传感器(balcony_door_contact)在整个24小时日志周期内无任何数据上报,设备疑似离线或故障。", "reasoning": ["推理步骤1: 阳台区域共部署了3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。", "推理步骤2: 检索整个2026-06-25全天日志(00:00~23:30),未发现任何以 balcony_light、balcony_door_contact 或 balcony_laundry_washer 为来源的事件记录。", "推理步骤3: 对于阳台灯和洗衣机,它们属于主动操作型设备,住户当天未使用属于正常情况,不上报状态变化是合理的。", "推理步骤4: 但阳台门传感器(contact_sensor)是被动监测型传感器,即使门未被开关,正常工作的传感器通常也会有心跳上报或周期性状态确认。与之对比,同类型的入户门传感器(front_door_contact)、厨房窗户传感器(kitchen_window_contact)、客厅窗户传感器(living_room_window_contact)在日志中均有事件记录。", "推理步骤5: 阳台门传感器24小时零上报,结合其他同类传感器有正常活动记录,高度怀疑该传感器存在离线、电池耗尽或通信故障的问题。"], "key_evidence": ["balcony_door_contact 在2026-06-25全天(00:00~23:30)无任何事件记录", "同类型 contact_sensor 设备(front_door_contact、kitchen_window_contact)在同一时间段内均有正常的状态上报", "阳台区域全部3个设备(balcony_light、balcony_door_contact、balcony_laundry_washer)均无任何日志输出"], "recommended_actions": ["立即检查 balcony_door_contact 传感器的在线状态和电池电量", "尝试对该传感器进行手动触发测试(开关阳台门),确认其是否能正常上报状态", "检查传感器与 Matter 网络网关之间的通信链路,排除信号遮挡或网络配对丢失的可能", "如确认设备故障,及时更换或重新配对,避免阳台门的开关状态处于监控盲区,产生入侵风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.338316202163696, "api_error": null} {"episode_id": "SQ1_TN_B_0173", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0173.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260802, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卫生间所有传感器(运动传感器、漏水传感器、灯)在整个24小时日志中无任何数据上报,疑似设备离线或通信故障。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间区域共部署了3个设备——卫生间灯(bathroom_light)、运动传感器(bathroom_occupancy)、漏水传感器(bathroom_water_leak)。\",\n \"推理步骤2: 遍历从 2026-06-09T00:00:00 到 2026-06-09T23:30:00 的全部日志,未找到任何以 bathroom_light、bathroom_occupancy 或 bathroom_water_leak 为来源的事件记录。\",\n \"推理步骤3: 作为对比,其他区域的同类传感器均有正常上报——例如 master_bedroom_occupancy、entrance_occupancy、living_room_occupancy 都在当天产生了占用检测事件;各房间温度传感器每30分钟定时上报一次。\",\n \"推理步骤4: 住户当天有明确的在家活动(早晨起床、做饭、晚间回家做饭等),正常生活中卫生间的使用频率很高,运动传感器理应至少触发多次,但实际为零。\",\n \"推理步骤5: 漏水传感器属于安全关键设备,即使未检测到漏水,通常也应有周期性心跳或状态上报来表明设备在线,但日志中完全没有该设备的任何记录。\",\n \"推理步骤6: 三个设备同时静默,最可能的原因是卫生间区域的网络网关/中继节点故障、供电中断,或者这些设备的 Matter 通信模块集体离线。\"\n ],\n \"key_evidence\": [\n \"整个24小时日志中 bathroom_light、bathroom_occupancy、bathroom_water_leak 三个设备的事件记录数量为 0\",\n \"同一时间段内其他区域的运动传感器(master_bedroom_occupancy、entrance_occupancy、living_room_occupancy)均有正常触发记录\",\n \"住户当天有明确的居家活动(06:09起床、07:21出门、17:48回家、22:49就寝),卫生间使用概率极高却无任何运动检测\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间区域的供电情况,确认设备是否断电\",\n \"检查卫生间传感器的 Matter 网络连接状态,确认是否在线\",\n \"如果设备使用电池供电,检查电池电量是否耗尽\",\n \"优先恢复漏水传感器(bathroom_water_leak)的工作,该设备承担安全监测职责,长时间离线存在漏水无法及时发现的风险\",\n \"恢复后观察设备是否正常上报数据,若仍无响应则考虑更换设备或检查 Matter 网络中继节点\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卫生间所有传感器(运动传感器、漏水传感器、灯)在整个24小时日志中无任何数据上报,疑似设备离线或通信故障。", "reasoning": ["推理步骤1: 卫生间区域共部署了3个设备——卫生间灯(bathroom_light)、运动传感器(bathroom_occupancy)、漏水传感器(bathroom_water_leak)。", "推理步骤2: 遍历从 2026-06-09T00:00:00 到 2026-06-09T23:30:00 的全部日志,未找到任何以 bathroom_light、bathroom_occupancy 或 bathroom_water_leak 为来源的事件记录。", "推理步骤3: 作为对比,其他区域的同类传感器均有正常上报——例如 master_bedroom_occupancy、entrance_occupancy、living_room_occupancy 都在当天产生了占用检测事件;各房间温度传感器每30分钟定时上报一次。", "推理步骤4: 住户当天有明确的在家活动(早晨起床、做饭、晚间回家做饭等),正常生活中卫生间的使用频率很高,运动传感器理应至少触发多次,但实际为零。", "推理步骤5: 漏水传感器属于安全关键设备,即使未检测到漏水,通常也应有周期性心跳或状态上报来表明设备在线,但日志中完全没有该设备的任何记录。", "推理步骤6: 三个设备同时静默,最可能的原因是卫生间区域的网络网关/中继节点故障、供电中断,或者这些设备的 Matter 通信模块集体离线。"], "key_evidence": ["整个24小时日志中 bathroom_light、bathroom_occupancy、bathroom_water_leak 三个设备的事件记录数量为 0", "同一时间段内其他区域的运动传感器(master_bedroom_occupancy、entrance_occupancy、living_room_occupancy)均有正常触发记录", "住户当天有明确的居家活动(06:09起床、07:21出门、17:48回家、22:49就寝),卫生间使用概率极高却无任何运动检测"], "recommended_actions": ["立即检查卫生间区域的供电情况,确认设备是否断电", "检查卫生间传感器的 Matter 网络连接状态,确认是否在线", "如果设备使用电池供电,检查电池电量是否耗尽", "优先恢复漏水传感器(bathroom_water_leak)的工作,该设备承担安全监测职责,长时间离线存在漏水无法及时发现的风险", "恢复后观察设备是否正常上报数据,若仍无响应则考虑更换设备或检查 Matter 网络中继节点"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.035488843917847, "api_error": null} {"episode_id": "SQ1_TN_B_0174", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0174.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20260803, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"次卧传感器工作正常,温度数据与其他房间一致,无异常偏差。\",\n \"reasoning\": [\n \"推理步骤1: 次卧仅部署了温度传感器(second_bedroom_temp_sensor)、运动传感器(second_bedroom_occupancy)、窗帘(second_bedroom_window)和窗户传感器(second_bedroom_window_contact)。日志中只有温度传感器有周期性上报,其余设备无事件触发。\",\n \"推理步骤2: 温度传感器每30分钟上报一次,从00:00到23:30共48个数据点,无任何缺失,说明设备通信链路稳定、上报周期正常。\",\n \"推理步骤3: 温度值从夜间约22.92°C逐步升至中午约25.87°C,再回落至夜间约23.42°C,呈现典型的昼夜温度曲线。各时间点的读数与客厅、主卧、厨房的温度高度一致(偏差通常在±0.2°C以内),不存在异常尖峰或骤降。\",\n \"推理步骤4: 对比厨房温度传感器在12:00出现的异常值2983(29.83°C,因灶具使用导致局部高温)以及多次出现的None值,次卧温度传感器从未出现过None或异常跳变,数据质量良好。\",\n \"推理步骤5: 次卧运动传感器全天未触发(Occupancy始终为0),窗帘和窗户传感器也无状态变化,这与住户白天主要活动在客厅/厨房、次卧无人使用的生活模式一致,属于正常静默状态而非设备故障。\"\n ],\n \"key_evidence\": [\n \"温度传感器全天48个数据点无缺失,上报间隔稳定为30分钟\",\n \"温度范围22.92°C~25.87°C,与同时段其他房间偏差在±0.2°C以内,昼夜曲线合理\",\n \"未出现任何None值或异常跳变,数据质量优于厨房传感器\",\n \"运动传感器、窗帘、窗户传感器全天无事件,符合次卧无人活动的预期\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,次卧所有传感器运行状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "次卧传感器工作正常,温度数据与其他房间一致,无异常偏差。", "reasoning": ["推理步骤1: 次卧仅部署了温度传感器(second_bedroom_temp_sensor)、运动传感器(second_bedroom_occupancy)、窗帘(second_bedroom_window)和窗户传感器(second_bedroom_window_contact)。日志中只有温度传感器有周期性上报,其余设备无事件触发。", "推理步骤2: 温度传感器每30分钟上报一次,从00:00到23:30共48个数据点,无任何缺失,说明设备通信链路稳定、上报周期正常。", "推理步骤3: 温度值从夜间约22.92°C逐步升至中午约25.87°C,再回落至夜间约23.42°C,呈现典型的昼夜温度曲线。各时间点的读数与客厅、主卧、厨房的温度高度一致(偏差通常在±0.2°C以内),不存在异常尖峰或骤降。", "推理步骤4: 对比厨房温度传感器在12:00出现的异常值2983(29.83°C,因灶具使用导致局部高温)以及多次出现的None值,次卧温度传感器从未出现过None或异常跳变,数据质量良好。", "推理步骤5: 次卧运动传感器全天未触发(Occupancy始终为0),窗帘和窗户传感器也无状态变化,这与住户白天主要活动在客厅/厨房、次卧无人使用的生活模式一致,属于正常静默状态而非设备故障。"], "key_evidence": ["温度传感器全天48个数据点无缺失,上报间隔稳定为30分钟", "温度范围22.92°C~25.87°C,与同时段其他房间偏差在±0.2°C以内,昼夜曲线合理", "未出现任何None值或异常跳变,数据质量优于厨房传感器", "运动传感器、窗帘、窗户传感器全天无事件,符合次卧无人活动的预期"], "recommended_actions": ["无需采取任何措施,次卧所有传感器运行状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.261019706726074, "api_error": null} {"episode_id": "SQ1_TN_B_0175", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0175.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260804, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"entrance 区域的两个传感器(入户门传感器 front_door_contact、玄关运动传感器 entrance_occupancy)在整个 24 小时日志周期内无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 日志覆盖 2026-06-20 全天(00:00 ~ 23:30),共 48 个采样周期,所有温度传感器均每 30 分钟稳定上报一次数据,说明日志采集系统本身运行正常。\",\n \"推理步骤2: entrance 区域共有 4 个设备:入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。在整份日志中,这 4 个设备没有产生任何一条事件记录。\",\n \"推理步骤3: 重点关注两个传感器——front_door_contact 和 entrance_occupancy。运动传感器在正常居住场景下,住户每天进出玄关、经过走廊,一天之内必然会多次触发 occupancy 事件;入户门传感器在开关门时也应上报 contact 状态变化。24 小时内零事件极不正常。\",\n \"推理步骤4: 对比其他区域的传感器(如 4 个温度传感器),它们全天持续上报,说明 Matter 网络和日志管道畅通。entrance 传感器的完全静默不能用'无人经过'解释——即使住户整天外出,至少出门和回家时也会触发一次。\",\n \"推理步骤5: 综合判断,entrance 区域传感器最可能的故障类型为:设备离线(电池耗尽、Zigbee/Thread 网络断连)或设备硬件故障导致无法上报事件。这属于 device_fault 类别,同时也带来安全隐患——入侵检测在玄关区域处于盲区。\"\n ],\n \"key_evidence\": [\n \"整份 24 小时日志(48 个采样点)中,entrance_occupancy 和 front_door_contact 没有产生任何一条事件记录\",\n \"同一时间段内,其他区域的传感器(4 个温度传感器)均正常、持续地每 30 分钟上报数据,排除日志系统故障的可能\",\n \"正常居住条件下,玄关运动传感器和入户门传感器一天内应有多次触发,零事件不符合预期\"\n ],\n \"recommended_actions\": [\n \"立即检查 entrance_occupancy 和 front_door_contact 的设备在线状态及电池电量,确认是否离线\",\n \"尝试对两个传感器进行手动触发测试(开关门、在玄关走动),观察是否能产生事件上报\",\n \"如确认离线,检查设备电池并更换,或重新将设备加入 Matter 网络\",\n \"在传感器恢复前,提高对入户门锁(front_door_lock)日志的关注度,作为玄关区域的替代安防手段\",\n \"建议为关键安防传感器配置离线告警规则,当设备超过一定时间未上报时自动通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "entrance 区域的两个传感器(入户门传感器 front_door_contact、玄关运动传感器 entrance_occupancy)在整个 24 小时日志周期内无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 日志覆盖 2026-06-20 全天(00:00 ~ 23:30),共 48 个采样周期,所有温度传感器均每 30 分钟稳定上报一次数据,说明日志采集系统本身运行正常。", "推理步骤2: entrance 区域共有 4 个设备:入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。在整份日志中,这 4 个设备没有产生任何一条事件记录。", "推理步骤3: 重点关注两个传感器——front_door_contact 和 entrance_occupancy。运动传感器在正常居住场景下,住户每天进出玄关、经过走廊,一天之内必然会多次触发 occupancy 事件;入户门传感器在开关门时也应上报 contact 状态变化。24 小时内零事件极不正常。", "推理步骤4: 对比其他区域的传感器(如 4 个温度传感器),它们全天持续上报,说明 Matter 网络和日志管道畅通。entrance 传感器的完全静默不能用'无人经过'解释——即使住户整天外出,至少出门和回家时也会触发一次。", "推理步骤5: 综合判断,entrance 区域传感器最可能的故障类型为:设备离线(电池耗尽、Zigbee/Thread 网络断连)或设备硬件故障导致无法上报事件。这属于 device_fault 类别,同时也带来安全隐患——入侵检测在玄关区域处于盲区。"], "key_evidence": ["整份 24 小时日志(48 个采样点)中,entrance_occupancy 和 front_door_contact 没有产生任何一条事件记录", "同一时间段内,其他区域的传感器(4 个温度传感器)均正常、持续地每 30 分钟上报数据,排除日志系统故障的可能", "正常居住条件下,玄关运动传感器和入户门传感器一天内应有多次触发,零事件不符合预期"], "recommended_actions": ["立即检查 entrance_occupancy 和 front_door_contact 的设备在线状态及电池电量,确认是否离线", "尝试对两个传感器进行手动触发测试(开关门、在玄关走动),观察是否能产生事件上报", "如确认离线,检查设备电池并更换,或重新将设备加入 Matter 网络", "在传感器恢复前,提高对入户门锁(front_door_lock)日志的关注度,作为玄关区域的替代安防手段", "建议为关键安防传感器配置离线告警规则,当设备超过一定时间未上报时自动通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.4025399684906, "api_error": null} {"episode_id": "SQ1_TN_B_0179", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0179.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260808, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和洗衣机 balcony_laundry_washer)在整整24小时内没有任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。\",\n \"推理步骤2: 遍历从 2026-06-17T00:00:00 到 2026-06-17T23:30:00 的全部日志,未发现任何来自 balcony_door_contact 或 balcony_laundry_washer 的事件记录。\",\n \"推理步骤3: 阳台灯 balcony_light 同样没有任何事件,但灯具作为被动执行器,在无人操作时不上报状态变化是正常的。\",\n \"推理步骤4: 阳台门传感器属于 contact_sensor 类型。对比同类型设备——front_door_contact、kitchen_window_contact、living_room_window_contact 等在日志中均有状态上报。阳台门传感器24小时零上报不合理,即使门始终关闭,传感器通常也会有心跳或周期性状态确认。\",\n \"推理步骤5: 洗衣机虽然不一定每天使用,但作为联网设备,长时间无任何状态上报(包括待机状态)也值得关注,可能处于断电或离线状态。\",\n \"推理步骤6: 综合来看,阳台区域传感器集体静默,最可能的原因是该区域设备离线、通信中断或供电异常。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在24小时完整日志中无任何事件上报\",\n \"balcony_laundry_washer 在24小时完整日志中无任何事件上报\",\n \"同类型的 contact_sensor(如 front_door_contact、kitchen_window_contact)在同一时段内均有正常的状态变化记录\",\n \"阳台区域全部3个设备均无任何日志输出,提示可能是区域性通信或供电问题\"\n ],\n \"recommended_actions\": [\n \"检查阳台区域的网络网关或 Matter 边界路由器是否正常工作,确认设备与中枢的通信链路\",\n \"检查阳台门传感器的电池电量或供电状态,必要时更换电池\",\n \"检查洗衣机的电源插座是否通电,确认设备是否处于待机联网状态\",\n \"在智能家居管理平台中查看这些设备的在线/离线状态,尝试手动 ping 或唤醒设备\",\n \"如确认设备离线,尽快恢复,因为阳台门传感器失效会导致入侵检测出现盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和洗衣机 balcony_laundry_washer)在整整24小时内没有任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。", "推理步骤2: 遍历从 2026-06-17T00:00:00 到 2026-06-17T23:30:00 的全部日志,未发现任何来自 balcony_door_contact 或 balcony_laundry_washer 的事件记录。", "推理步骤3: 阳台灯 balcony_light 同样没有任何事件,但灯具作为被动执行器,在无人操作时不上报状态变化是正常的。", "推理步骤4: 阳台门传感器属于 contact_sensor 类型。对比同类型设备——front_door_contact、kitchen_window_contact、living_room_window_contact 等在日志中均有状态上报。阳台门传感器24小时零上报不合理,即使门始终关闭,传感器通常也会有心跳或周期性状态确认。", "推理步骤5: 洗衣机虽然不一定每天使用,但作为联网设备,长时间无任何状态上报(包括待机状态)也值得关注,可能处于断电或离线状态。", "推理步骤6: 综合来看,阳台区域传感器集体静默,最可能的原因是该区域设备离线、通信中断或供电异常。"], "key_evidence": ["balcony_door_contact 在24小时完整日志中无任何事件上报", "balcony_laundry_washer 在24小时完整日志中无任何事件上报", "同类型的 contact_sensor(如 front_door_contact、kitchen_window_contact)在同一时段内均有正常的状态变化记录", "阳台区域全部3个设备均无任何日志输出,提示可能是区域性通信或供电问题"], "recommended_actions": ["检查阳台区域的网络网关或 Matter 边界路由器是否正常工作,确认设备与中枢的通信链路", "检查阳台门传感器的电池电量或供电状态,必要时更换电池", "检查洗衣机的电源插座是否通电,确认设备是否处于待机联网状态", "在智能家居管理平台中查看这些设备的在线/离线状态,尝试手动 ping 或唤醒设备", "如确认设备离线,尽快恢复,因为阳台门传感器失效会导致入侵检测出现盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.70158290863037, "api_error": null} {"episode_id": "SQ1_TN_B_0186", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0186.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20260815, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度读数、运动传感器及灯光设备均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无缺失或 None 值。温度从凌晨约 23.0°C 逐步升至中午约 25.8°C,再回落至夜间约 23.3°C,符合夏季自然昼夜温度变化曲线。\",\n \"推理步骤2: 客厅温度与其他房间(主卧、次卧、厨房)的温度走势高度一致,各时间点偏差通常在 0.1-0.2°C 以内,说明传感器之间没有系统性偏移,living_room_temp_sensor 读数可信。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)在 18:16:21 住户回家后触发 Occupancy=1,20:13:10 再次检测到活动,与住户回家后在客厅活动的场景吻合,无深夜或无人时段的异常触发。\",\n \"推理步骤4: 客厅主灯(living_room_light_1)在 18:16:25 开启、21:53:00 关闭,与住户 18:16 回家、21:53 就寝/离开的时间线一致。客厅空调在 18:16:33 开启制冷(SystemMode=3),21:53:07 关闭,之后温度自然回升,行为合理。\",\n \"推理步骤5: 对比厨房温度传感器在 18:00 和 18:30 出现异常高温(2853/2859)以及 18:47 和 19:50 出现 None 值,客厅传感器全天无任何此类异常,数据完整且连续。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点数据完整,无 None 或异常跳变,温度范围 2291-2580(约 22.9°C-25.8°C),符合夏季室内自然波动\",\n \"living_room_occupancy 仅在住户回家后(18:16、20:13)触发,无深夜或空房异常触发\",\n \"客厅温度与主卧、次卧温度走势高度同步,无单一传感器偏移迹象\",\n \"客厅空调开启制冷后温度从约 24.6°C 降至约 23.9°C,关闭后温度继续自然下降,传感器响应符合物理预期\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,客厅区域所有传感器运行正常\",\n \"建议关注厨房温度传感器在 18:00-18:30 的异常高温读数及 18:47/19:50 的 None 值,可能存在传感器故障或受灶具高温影响\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度读数、运动传感器及灯光设备均表现符合预期。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无缺失或 None 值。温度从凌晨约 23.0°C 逐步升至中午约 25.8°C,再回落至夜间约 23.3°C,符合夏季自然昼夜温度变化曲线。", "推理步骤2: 客厅温度与其他房间(主卧、次卧、厨房)的温度走势高度一致,各时间点偏差通常在 0.1-0.2°C 以内,说明传感器之间没有系统性偏移,living_room_temp_sensor 读数可信。", "推理步骤3: 客厅运动传感器(living_room_occupancy)在 18:16:21 住户回家后触发 Occupancy=1,20:13:10 再次检测到活动,与住户回家后在客厅活动的场景吻合,无深夜或无人时段的异常触发。", "推理步骤4: 客厅主灯(living_room_light_1)在 18:16:25 开启、21:53:00 关闭,与住户 18:16 回家、21:53 就寝/离开的时间线一致。客厅空调在 18:16:33 开启制冷(SystemMode=3),21:53:07 关闭,之后温度自然回升,行为合理。", "推理步骤5: 对比厨房温度传感器在 18:00 和 18:30 出现异常高温(2853/2859)以及 18:47 和 19:50 出现 None 值,客厅传感器全天无任何此类异常,数据完整且连续。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点数据完整,无 None 或异常跳变,温度范围 2291-2580(约 22.9°C-25.8°C),符合夏季室内自然波动", "living_room_occupancy 仅在住户回家后(18:16、20:13)触发,无深夜或空房异常触发", "客厅温度与主卧、次卧温度走势高度同步,无单一传感器偏移迹象", "客厅空调开启制冷后温度从约 24.6°C 降至约 23.9°C,关闭后温度继续自然下降,传感器响应符合物理预期"], "recommended_actions": ["无需采取措施,客厅区域所有传感器运行正常", "建议关注厨房温度传感器在 18:00-18:30 的异常高温读数及 18:47/19:50 的 None 值,可能存在传感器故障或受灶具高温影响"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.754846811294556, "api_error": null} {"episode_id": "SQ1_TN_B_0189", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_B_0189.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20260818, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入口区域的运动传感器(entrance_occupancy)在全天有明确人员进出活动的情况下,未产生任何占用检测事件,判断为设备故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 在整个24小时日志中,entrance_occupancy 没有产生任何一条 OccupancySensing.Occupancy 事件记录,既无检测到有人(=1)也无检测到无人(=0)的状态变化。\",\n \"推理步骤3: 然而日志明确显示 23:07:31 入户门传感器检测到门被打开(StateValue=True),23:07:32 门锁执行了自动上锁操作,说明确实有人经过玄关区域。\",\n \"推理步骤4: 同样,住户白天在厨房、客厅、卫生间之间活动(bathroom_occupancy 和 living_room_occupancy 均有触发记录),进出这些区域大概率会经过玄关,但 entrance_occupancy 始终沉默。\",\n \"推理步骤5: 对比 bathroom_occupancy(08:36 触发占用、09:17 触发空闲)和 living_room_occupancy(10:02 触发占用)均正常工作,唯独 entrance_occupancy 全天零事件,排除'无人经过'的可能性,判定为传感器故障或离线。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy 在完整24小时日志中无任何事件输出\",\n \"23:07:31 front_door_contact 检测到开门、23:07:32 front_door_lock 自动上锁,证明有人经过玄关但运动传感器未响应\",\n \"同类传感器 bathroom_occupancy 和 living_room_occupancy 在同一时间段内均正常触发,排除系统级通信故障\"\n ],\n \"recommended_actions\": [\n \"检查 entrance_occupancy 传感器的电池电量或供电状态,确认设备是否离线\",\n \"在智能家居管理平台中查看该设备的在线状态和最后通信时间\",\n \"尝试对传感器进行重启或重新配对,恢复后在玄关走动验证是否能正常触发\",\n \"在传感器修复前,可依赖 front_door_contact 和 front_door_lock 事件作为玄关区域的临时入侵检测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入口区域的运动传感器(entrance_occupancy)在全天有明确人员进出活动的情况下,未产生任何占用检测事件,判断为设备故障。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 在整个24小时日志中,entrance_occupancy 没有产生任何一条 OccupancySensing.Occupancy 事件记录,既无检测到有人(=1)也无检测到无人(=0)的状态变化。", "推理步骤3: 然而日志明确显示 23:07:31 入户门传感器检测到门被打开(StateValue=True),23:07:32 门锁执行了自动上锁操作,说明确实有人经过玄关区域。", "推理步骤4: 同样,住户白天在厨房、客厅、卫生间之间活动(bathroom_occupancy 和 living_room_occupancy 均有触发记录),进出这些区域大概率会经过玄关,但 entrance_occupancy 始终沉默。", "推理步骤5: 对比 bathroom_occupancy(08:36 触发占用、09:17 触发空闲)和 living_room_occupancy(10:02 触发占用)均正常工作,唯独 entrance_occupancy 全天零事件,排除'无人经过'的可能性,判定为传感器故障或离线。"], "key_evidence": ["entrance_occupancy 在完整24小时日志中无任何事件输出", "23:07:31 front_door_contact 检测到开门、23:07:32 front_door_lock 自动上锁,证明有人经过玄关但运动传感器未响应", "同类传感器 bathroom_occupancy 和 living_room_occupancy 在同一时间段内均正常触发,排除系统级通信故障"], "recommended_actions": ["检查 entrance_occupancy 传感器的电池电量或供电状态,确认设备是否离线", "在智能家居管理平台中查看该设备的在线状态和最后通信时间", "尝试对传感器进行重启或重新配对,恢复后在玄关走动验证是否能正常触发", "在传感器修复前,可依赖 front_door_contact 和 front_door_lock 事件作为玄关区域的临时入侵检测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.164313554763794, "api_error": null} {"episode_id": "SQ1_TN_C_0136", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0136.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260765, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"entrance 区域的所有传感器(玄关运动传感器、入户门传感器、入户门锁)在整个24小时日志周期内无任何数据上报,疑似设备离线或通信故障。\",\n \"reasoning\": [\n \"推理步骤1: 日志覆盖了 2026-06-21 全天 00:00 至 23:30 的数据,共48个时间点,所有温度传感器均每30分钟规律上报一次。\",\n \"推理步骤2: 在整份日志中搜索 entrance 区域的四个设备(front_door_lock、front_door_contact、entrance_light、entrance_occupancy),没有找到任何一条事件记录。\",\n \"推理步骤3: 其他区域的传感器(如 living_room、master_bedroom、kids_room、kitchen 的温度传感器)均持续正常上报,说明系统的日志采集管道本身是正常工作的。\",\n \"推理步骤4: entrance 区域的运动传感器(entrance_occupancy)和门磁传感器(front_door_contact)属于被动触发型设备,理论上一天内完全无触发是可能的,但结合入户门锁(front_door_lock)也无任何状态上报来看,更合理的解释是这些设备整体离线。\",\n \"推理步骤5: 入户门区域是家庭安防的第一道防线,该区域所有设备同时静默24小时,极大概率是网络连接中断、Matter 网络节点失联或供电故障,而非住户一整天未经过玄关。\"\n ],\n \"key_evidence\": [\n \"整个24小时日志中 entrance_occupancy、front_door_contact、front_door_lock、entrance_light 四个设备无任何事件上报\",\n \"同一时间段内其他区域传感器(4个温度传感器)均正常上报了48组数据,排除日志系统本身故障\"\n ],\n \"recommended_actions\": [\n \"立即检查 entrance 区域设备的供电状态,确认是否断电或电池耗尽\",\n \"检查 entrance 区域设备与 Matter 网络的连接状态,尝试重新配网或重启边界路由器\",\n \"在设备恢复前,通过其他方式(如摄像头或人工巡查)加强入户门区域的安全监控\",\n \"恢复后验证各传感器功能:手动触发门磁、运动传感器和门锁,确认事件能正常上报\",\n \"建议为关键安防设备(门锁、门磁)配置离线告警规则,避免长时间静默而无人察觉\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "entrance 区域的所有传感器(玄关运动传感器、入户门传感器、入户门锁)在整个24小时日志周期内无任何数据上报,疑似设备离线或通信故障。", "reasoning": ["推理步骤1: 日志覆盖了 2026-06-21 全天 00:00 至 23:30 的数据,共48个时间点,所有温度传感器均每30分钟规律上报一次。", "推理步骤2: 在整份日志中搜索 entrance 区域的四个设备(front_door_lock、front_door_contact、entrance_light、entrance_occupancy),没有找到任何一条事件记录。", "推理步骤3: 其他区域的传感器(如 living_room、master_bedroom、kids_room、kitchen 的温度传感器)均持续正常上报,说明系统的日志采集管道本身是正常工作的。", "推理步骤4: entrance 区域的运动传感器(entrance_occupancy)和门磁传感器(front_door_contact)属于被动触发型设备,理论上一天内完全无触发是可能的,但结合入户门锁(front_door_lock)也无任何状态上报来看,更合理的解释是这些设备整体离线。", "推理步骤5: 入户门区域是家庭安防的第一道防线,该区域所有设备同时静默24小时,极大概率是网络连接中断、Matter 网络节点失联或供电故障,而非住户一整天未经过玄关。"], "key_evidence": ["整个24小时日志中 entrance_occupancy、front_door_contact、front_door_lock、entrance_light 四个设备无任何事件上报", "同一时间段内其他区域传感器(4个温度传感器)均正常上报了48组数据,排除日志系统本身故障"], "recommended_actions": ["立即检查 entrance 区域设备的供电状态,确认是否断电或电池耗尽", "检查 entrance 区域设备与 Matter 网络的连接状态,尝试重新配网或重启边界路由器", "在设备恢复前,通过其他方式(如摄像头或人工巡查)加强入户门区域的安全监控", "恢复后验证各传感器功能:手动触发门磁、运动传感器和门锁,确认事件能正常上报", "建议为关键安防设备(门锁、门磁)配置离线告警规则,避免长时间静默而无人察觉"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.521342039108276, "api_error": null} {"episode_id": "SQ1_TN_C_0145", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0145.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260774, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整个24小时日志周期内无任何事件上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。在整整24小时(2026-06-18 00:00 ~ 23:30)的日志中,这三个设备均无任何事件记录。\",\n \"推理步骤2: 阳台门传感器(contact_sensor)属于被动式传感器,即使门未被开关,也应有周期性心跳或状态上报。与之对比,其他同类型传感器(如 front_door_contact、kitchen_window_contact、kids_room_window_contact 等)在日志中均有状态变化记录。\",\n \"推理步骤3: 从住户行为来看,当天有人在阳台附近活动的合理场景(如早晨、傍晚),但阳台门传感器始终没有任何开关记录,阳台灯也从未被开关过,这不符合正常的居住使用模式。\",\n \"推理步骤4: 洗衣机一天未使用尚属正常,但门传感器作为安全类设备,24小时零上报更可能是设备通信中断或电量耗尽,而非单纯的'无人使用'。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在24小时内无任何 BooleanState.StateValue 事件上报\",\n \"balcony_light 在24小时内无任何 OnOff.OnOff 事件上报\",\n \"同类型的 contact_sensor(如 front_door_contact、kitchen_window_contact)在同一时段内均有正常的状态变化记录\",\n \"阳台区域全部3个设备均无任何日志输出,指向区域性通信故障的可能性\"\n ],\n \"recommended_actions\": [\n \"立即检查 balcony_door_contact 传感器的电池电量和在线状态,确认是否离线\",\n \"检查阳台区域的 Matter 网络覆盖情况,排查是否存在无线信号盲区导致设备无法上报\",\n \"手动触发阳台门传感器和阳台灯,观察是否能产生事件日志,以区分是设备硬件故障还是通信故障\",\n \"如确认设备离线,尽快恢复,因为阳台门传感器是入侵检测的重要环节,长时间失效会形成安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整个24小时日志周期内无任何事件上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。在整整24小时(2026-06-18 00:00 ~ 23:30)的日志中,这三个设备均无任何事件记录。", "推理步骤2: 阳台门传感器(contact_sensor)属于被动式传感器,即使门未被开关,也应有周期性心跳或状态上报。与之对比,其他同类型传感器(如 front_door_contact、kitchen_window_contact、kids_room_window_contact 等)在日志中均有状态变化记录。", "推理步骤3: 从住户行为来看,当天有人在阳台附近活动的合理场景(如早晨、傍晚),但阳台门传感器始终没有任何开关记录,阳台灯也从未被开关过,这不符合正常的居住使用模式。", "推理步骤4: 洗衣机一天未使用尚属正常,但门传感器作为安全类设备,24小时零上报更可能是设备通信中断或电量耗尽,而非单纯的'无人使用'。"], "key_evidence": ["balcony_door_contact 在24小时内无任何 BooleanState.StateValue 事件上报", "balcony_light 在24小时内无任何 OnOff.OnOff 事件上报", "同类型的 contact_sensor(如 front_door_contact、kitchen_window_contact)在同一时段内均有正常的状态变化记录", "阳台区域全部3个设备均无任何日志输出,指向区域性通信故障的可能性"], "recommended_actions": ["立即检查 balcony_door_contact 传感器的电池电量和在线状态,确认是否离线", "检查阳台区域的 Matter 网络覆盖情况,排查是否存在无线信号盲区导致设备无法上报", "手动触发阳台门传感器和阳台灯,观察是否能产生事件日志,以区分是设备硬件故障还是通信故障", "如确认设备离线,尽快恢复,因为阳台门传感器是入侵检测的重要环节,长时间失效会形成安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.423869371414185, "api_error": null} {"episode_id": "SQ1_TN_C_0150", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0150.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260779, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度和运动传感器数据均符合预期模式\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天持续每30分钟上报数据,无缺失。夜间(00:00-05:30)温度稳定在22.9-23.1°C,白天随室外升温逐步上升至峰值25.9°C(12:00),傍晚后逐步回落至23.4°C,符合夏季自然温度变化曲线。\",\n \"推理步骤2: 主卧运动传感器在06:04检测到有人活动(起床),22:29再次检测到活动(就寝),与灯光开关时间吻合(06:04开灯、22:29关灯),符合正常作息规律。\",\n \"推理步骤3: 主卧温度传感器未出现类似厨房传感器的 None 值异常,数据连续且变化平滑,相邻时间点温差均在合理范围内(≤3°C/30min),无突变或漂移迹象。\",\n \"推理步骤4: 主卧窗帘在22:29关闭(10000=全关),与就寝时间一致,设备响应正常。\"\n ],\n \"key_evidence\": [\n \"温度传感器全天48个采样点数据完整,无None值,范围22.9°C-25.9°C,变化平滑\",\n \"运动传感器06:04和22:29两次触发,与灯光操作时间高度吻合,符合起床/就寝模式\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度和运动传感器数据均符合预期模式", "reasoning": ["推理步骤1: 主卧温度传感器全天持续每30分钟上报数据,无缺失。夜间(00:00-05:30)温度稳定在22.9-23.1°C,白天随室外升温逐步上升至峰值25.9°C(12:00),傍晚后逐步回落至23.4°C,符合夏季自然温度变化曲线。", "推理步骤2: 主卧运动传感器在06:04检测到有人活动(起床),22:29再次检测到活动(就寝),与灯光开关时间吻合(06:04开灯、22:29关灯),符合正常作息规律。", "推理步骤3: 主卧温度传感器未出现类似厨房传感器的 None 值异常,数据连续且变化平滑,相邻时间点温差均在合理范围内(≤3°C/30min),无突变或漂移迹象。", "推理步骤4: 主卧窗帘在22:29关闭(10000=全关),与就寝时间一致,设备响应正常。"], "key_evidence": ["温度传感器全天48个采样点数据完整,无None值,范围22.9°C-25.9°C,变化平滑", "运动传感器06:04和22:29两次触发,与灯光操作时间高度吻合,符合起床/就寝模式"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.797482252120972, "api_error": null} {"episode_id": "SQ1_TN_C_0147", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0147.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260776, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器、运动传感器和窗户传感器均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或None值。凌晨约23.0°C,随日间升温至中午峰值约25.9°C,傍晚后逐步回落至夜间约23.4°C,符合夏季(6月)自然昼夜温度变化曲线。\",\n \"推理步骤2: 18:09开启空调(制冷模式SystemMode=3)后,客厅温度从约24.6°C持续下降至22:00的约23.7°C,22:26关闭空调后温度继续缓降,说明温度传感器能正确反映空调制冷效果,响应合理。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)在18:09检测到有人进入,与同一时刻入户门解锁、开门事件吻合,白天家中无人期间未产生误触发,行为正常。\",\n \"推理步骤4: 客厅窗户传感器(living_room_window_contact_1/2)全天无状态变化事件,说明窗户始终保持关闭状态,这与家中白天无人、夜间休息的场景一致,属正常。\",\n \"推理步骤5: 对比其他房间传感器,厨房温度传感器多次上报None值,而客厅温度传感器从未出现此问题,进一步佐证客厅传感器工作稳定。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点均正常上报,无None或异常跳变,温度范围2293~2589(约22.9°C~25.9°C),符合夏季昼夜规律\",\n \"living_room_occupancy 仅在18:09(与入户门开锁同步)触发一次,白天无人时段无误报\",\n \"living_room_window_contact_1/2 全天无变化事件,窗户持续关闭,状态稳定\",\n \"空调开启(18:09)至关闭(22:26)期间温度持续下降,传感器正确反映了环境变化\"\n ],\n \"recommended_actions\": [\n \"客厅传感器状态良好,无需采取措施\",\n \"建议关注厨房温度传感器多次上报None值的问题,可能存在设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器、运动传感器和窗户传感器均表现符合预期。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或None值。凌晨约23.0°C,随日间升温至中午峰值约25.9°C,傍晚后逐步回落至夜间约23.4°C,符合夏季(6月)自然昼夜温度变化曲线。", "推理步骤2: 18:09开启空调(制冷模式SystemMode=3)后,客厅温度从约24.6°C持续下降至22:00的约23.7°C,22:26关闭空调后温度继续缓降,说明温度传感器能正确反映空调制冷效果,响应合理。", "推理步骤3: 客厅运动传感器(living_room_occupancy)在18:09检测到有人进入,与同一时刻入户门解锁、开门事件吻合,白天家中无人期间未产生误触发,行为正常。", "推理步骤4: 客厅窗户传感器(living_room_window_contact_1/2)全天无状态变化事件,说明窗户始终保持关闭状态,这与家中白天无人、夜间休息的场景一致,属正常。", "推理步骤5: 对比其他房间传感器,厨房温度传感器多次上报None值,而客厅温度传感器从未出现此问题,进一步佐证客厅传感器工作稳定。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点均正常上报,无None或异常跳变,温度范围2293~2589(约22.9°C~25.9°C),符合夏季昼夜规律", "living_room_occupancy 仅在18:09(与入户门开锁同步)触发一次,白天无人时段无误报", "living_room_window_contact_1/2 全天无变化事件,窗户持续关闭,状态稳定", "空调开启(18:09)至关闭(22:26)期间温度持续下降,传感器正确反映了环境变化"], "recommended_actions": ["客厅传感器状态良好,无需采取措施", "建议关注厨房温度传感器多次上报None值的问题,可能存在设备故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.4844012260437, "api_error": null} {"episode_id": "SQ1_TN_C_0157", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0157.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20260786, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整整24小时的日志中没有任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。\",\n \"推理步骤2: 在2026-06-23全天(00:00~23:30)的完整日志中,搜索所有以 'balcony_' 开头的设备ID,结果为零条记录,没有任何阳台设备产生过事件上报。\",\n \"推理步骤3: 阳台门传感器(contact_sensor)属于安防类被动传感器,即使一天内无人开关阳台门,传感器本身也应有周期性心跳或状态上报。对比同类型的 front_door_contact、kitchen_window_contact 等传感器,它们在当天均有状态变化记录。\",\n \"推理步骤4: 其他区域的同类传感器(如厨房窗户传感器、入户门传感器、各房间运动传感器)均在日志中正常出现,排除了'日志采集系统整体故障'的可能性。\",\n \"推理步骤5: 洗衣机作为用户主动操作的设备,当天未使用属于正常情况,但阳台门传感器作为安防设备完全静默则不正常,可能存在设备掉线、电池耗尽、通信模块故障或与 Matter 网络断开连接等问题。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在24小时日志中无任何 BooleanState.StateValue 上报记录\",\n \"balcony_light 在24小时日志中无任何 OnOff.OnOff 上报记录\",\n \"同类型传感器(front_door_contact、kitchen_window_contact 等)在同一时间段内均有正常上报,排除系统性采集故障\"\n ],\n \"recommended_actions\": [\n \"立即检查阳台门传感器(balcony_door_contact)的在线状态、电池电量及 Matter 网络连接情况\",\n \"检查阳台灯(balcony_light)的供电和网络连接状态\",\n \"如设备显示离线,尝试重新配网或更换电池后观察是否恢复上报\",\n \"在设备恢复前,人工关注阳台门的开关安全,避免安防盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整整24小时的日志中没有任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。", "推理步骤2: 在2026-06-23全天(00:00~23:30)的完整日志中,搜索所有以 'balcony_' 开头的设备ID,结果为零条记录,没有任何阳台设备产生过事件上报。", "推理步骤3: 阳台门传感器(contact_sensor)属于安防类被动传感器,即使一天内无人开关阳台门,传感器本身也应有周期性心跳或状态上报。对比同类型的 front_door_contact、kitchen_window_contact 等传感器,它们在当天均有状态变化记录。", "推理步骤4: 其他区域的同类传感器(如厨房窗户传感器、入户门传感器、各房间运动传感器)均在日志中正常出现,排除了'日志采集系统整体故障'的可能性。", "推理步骤5: 洗衣机作为用户主动操作的设备,当天未使用属于正常情况,但阳台门传感器作为安防设备完全静默则不正常,可能存在设备掉线、电池耗尽、通信模块故障或与 Matter 网络断开连接等问题。"], "key_evidence": ["balcony_door_contact 在24小时日志中无任何 BooleanState.StateValue 上报记录", "balcony_light 在24小时日志中无任何 OnOff.OnOff 上报记录", "同类型传感器(front_door_contact、kitchen_window_contact 等)在同一时间段内均有正常上报,排除系统性采集故障"], "recommended_actions": ["立即检查阳台门传感器(balcony_door_contact)的在线状态、电池电量及 Matter 网络连接情况", "检查阳台灯(balcony_light)的供电和网络连接状态", "如设备显示离线,尝试重新配网或更换电池后观察是否恢复上报", "在设备恢复前,人工关注阳台门的开关安全,避免安防盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.501449584960938, "api_error": null} {"episode_id": "SQ1_TN_C_0156", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0156.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20260785, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在16:23的开锁事件后未记录到关门和上锁动作,且玄关运动传感器全天仅触发两次且无自动回零记录,存在传感器工作异常。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 早晨07:35出门时,门锁解锁(LockState=2)→门传感器开(False)→关(True)→自动上锁(LockState=1),这是一个完整的出门序列,行为正常。\",\n \"推理步骤3: 下午16:23有人进门,门锁解锁(LockState=2)→门传感器开(False)→玄关运动传感器触发(Occupancy=1),但之后没有记录到 front_door_contact 恢复为 True(关门)的事件,也没有门锁重新上锁(LockState=1)的事件。直到17:59第二次进门时才再次出现门锁解锁事件。\",\n \"推理步骤4: 16:23进门后门传感器(front_door_contact)未报告关门状态变化,这意味着要么门一直开着(安全隐患),要么门传感器未能正确上报关门事件(设备故障)。结合后续17:59正常的开门事件来看,更可能是16:23那次的关门/上锁事件丢失。\",\n \"推理步骤5: 玄关运动传感器(entrance_occupancy)全天仅在07:35和16:23各触发一次Occupancy=1,但从未记录到Occupancy=0的回零事件。正常的占用传感器在人员离开后应回报Occupancy=0,全天无回零记录说明该传感器可能存在状态上报异常。\",\n \"推理步骤6: 玄关灯(entrance_light)全天没有任何开关记录。考虑到早晨07:35和下午16:23、17:59都有人经过玄关且运动传感器有触发,玄关灯却始终未被点亮,可能是灯的联动自动化未配置,也可能是灯本身离线或故障。这一点可疑但不能确定为故障。\",\n \"推理步骤7: 综合来看,入户门传感器在16:23事件中丢失了关门状态上报,玄关运动传感器缺少所有回零事件,这两个传感器的上报行为存在明显异常,判定为设备故障。\"\n ],\n \"key_evidence\": [\n \"16:23:02 front_door_contact 报告开门(False)后,无对应的关门(True)事件,直到22:29:30才出现下一次True状态\",\n \"16:23:00 front_door_lock 解锁后无对应的自动上锁事件(对比07:35的完整出门序列有自动上锁)\",\n \"entrance_occupancy 全天触发两次Occupancy=1(07:35和16:23),但从未上报Occupancy=0回零事件\",\n \"entrance_light 全天零事件记录,尽管有多次人员通过玄关\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁对齐是否正常,必要时重新配对\",\n \"检查玄关运动传感器(entrance_occupancy)是否固件需要更新,确认其占用超时和回零逻辑是否正常工作\",\n \"确认入户门锁的自动上锁功能是否启用且工作正常,检查16:23至17:59期间门锁是否实际处于未锁状态\",\n \"检查玄关灯(entrance_light)是否在线,确认其与运动传感器的联动自动化规则是否正确配置\",\n \"建议对 entrance 区域所有设备进行一次连通性测试和状态同步\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门锁在16:23的开锁事件后未记录到关门和上锁动作,且玄关运动传感器全天仅触发两次且无自动回零记录,存在传感器工作异常。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 早晨07:35出门时,门锁解锁(LockState=2)→门传感器开(False)→关(True)→自动上锁(LockState=1),这是一个完整的出门序列,行为正常。", "推理步骤3: 下午16:23有人进门,门锁解锁(LockState=2)→门传感器开(False)→玄关运动传感器触发(Occupancy=1),但之后没有记录到 front_door_contact 恢复为 True(关门)的事件,也没有门锁重新上锁(LockState=1)的事件。直到17:59第二次进门时才再次出现门锁解锁事件。", "推理步骤4: 16:23进门后门传感器(front_door_contact)未报告关门状态变化,这意味着要么门一直开着(安全隐患),要么门传感器未能正确上报关门事件(设备故障)。结合后续17:59正常的开门事件来看,更可能是16:23那次的关门/上锁事件丢失。", "推理步骤5: 玄关运动传感器(entrance_occupancy)全天仅在07:35和16:23各触发一次Occupancy=1,但从未记录到Occupancy=0的回零事件。正常的占用传感器在人员离开后应回报Occupancy=0,全天无回零记录说明该传感器可能存在状态上报异常。", "推理步骤6: 玄关灯(entrance_light)全天没有任何开关记录。考虑到早晨07:35和下午16:23、17:59都有人经过玄关且运动传感器有触发,玄关灯却始终未被点亮,可能是灯的联动自动化未配置,也可能是灯本身离线或故障。这一点可疑但不能确定为故障。", "推理步骤7: 综合来看,入户门传感器在16:23事件中丢失了关门状态上报,玄关运动传感器缺少所有回零事件,这两个传感器的上报行为存在明显异常,判定为设备故障。"], "key_evidence": ["16:23:02 front_door_contact 报告开门(False)后,无对应的关门(True)事件,直到22:29:30才出现下一次True状态", "16:23:00 front_door_lock 解锁后无对应的自动上锁事件(对比07:35的完整出门序列有自动上锁)", "entrance_occupancy 全天触发两次Occupancy=1(07:35和16:23),但从未上报Occupancy=0回零事件", "entrance_light 全天零事件记录,尽管有多次人员通过玄关"], "recommended_actions": ["检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁对齐是否正常,必要时重新配对", "检查玄关运动传感器(entrance_occupancy)是否固件需要更新,确认其占用超时和回零逻辑是否正常工作", "确认入户门锁的自动上锁功能是否启用且工作正常,检查16:23至17:59期间门锁是否实际处于未锁状态", "检查玄关灯(entrance_light)是否在线,确认其与运动传感器的联动自动化规则是否正确配置", "建议对 entrance 区域所有设备进行一次连通性测试和状态同步"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.051387548446655, "api_error": null} {"episode_id": "SQ1_TN_C_0158", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0158.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260787, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门在16:15开锁进入后未关闭/上锁,持续约1.5小时处于未锁定且门开启状态;玄关灯全天未触发,可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 早晨07:36出门序列正常:门锁解锁(LockOperationType=1)→门开(StateValue=False)→门关(StateValue=True)→自动上锁(LockOperationType=0, LockState=1),整个流程在5秒内完成,合理。\",\n \"推理步骤3: 16:15有人回家:门锁解锁→门开(StateValue=False)→玄关运动传感器触发(Occupancy=1)→人进入儿童房。但此后直到22:15:20才出现 front_door_contact StateValue=True(门关闭)和22:15:21自动上锁。这意味着入户门在开启/未锁状态下持续了约6小时,这极不正常。\",\n \"推理步骤4: 17:40第二次回家事件中,门锁再次解锁、门开、运动传感器触发,但同样没有随后的关门记录,说明门可能一直处于开启状态,或者门传感器在16:15之后出现了漏报。\",\n \"推理步骤5: 玄关灯(entrance_light)在全天24小时日志中没有任何状态变化记录。考虑到玄关运动传感器在07:36、16:15、17:40三次检测到有人经过,玄关灯却从未被触发(无论手动还是自动),这表明玄关灯可能存在故障或已离线。\",\n \"推理步骤6: 玄关运动传感器(entrance_occupancy)仅记录了 Occupancy=1 的事件,全天没有任何 Occupancy=0(无人)的恢复事件。正常的占用传感器在人离开后应回报无人状态,缺失恢复事件可能表明传感器状态上报不完整或存在固件问题。\"\n ],\n \"key_evidence\": [\n \"16:15:02 front_door_contact StateValue=False(门开),直到22:15:20才恢复为True(门关),间隔约6小时\",\n \"17:40:02 front_door_contact 再次报告StateValue=False,但16:15之后从未报告过门关闭,说明门传感器可能漏报或门确实未关\",\n \"entrance_light 全天零事件记录,尽管有3次人员通过玄关\",\n \"entrance_occupancy 仅有 Occupancy=1 记录,无 Occupancy=0 恢复事件\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和电池电量,确认是否存在漏报问题\",\n \"检查玄关灯(entrance_light)是否离线或损坏,确认其与智能家居网关的连接状态\",\n \"检查玄关运动传感器(entrance_occupancy)的固件版本,确认占用恢复事件是否正常上报\",\n \"建议设置入户门长时间未关闭的告警规则(如超过5分钟未关门则推送通知),防止安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门在16:15开锁进入后未关闭/上锁,持续约1.5小时处于未锁定且门开启状态;玄关灯全天未触发,可能存在故障。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 早晨07:36出门序列正常:门锁解锁(LockOperationType=1)→门开(StateValue=False)→门关(StateValue=True)→自动上锁(LockOperationType=0, LockState=1),整个流程在5秒内完成,合理。", "推理步骤3: 16:15有人回家:门锁解锁→门开(StateValue=False)→玄关运动传感器触发(Occupancy=1)→人进入儿童房。但此后直到22:15:20才出现 front_door_contact StateValue=True(门关闭)和22:15:21自动上锁。这意味着入户门在开启/未锁状态下持续了约6小时,这极不正常。", "推理步骤4: 17:40第二次回家事件中,门锁再次解锁、门开、运动传感器触发,但同样没有随后的关门记录,说明门可能一直处于开启状态,或者门传感器在16:15之后出现了漏报。", "推理步骤5: 玄关灯(entrance_light)在全天24小时日志中没有任何状态变化记录。考虑到玄关运动传感器在07:36、16:15、17:40三次检测到有人经过,玄关灯却从未被触发(无论手动还是自动),这表明玄关灯可能存在故障或已离线。", "推理步骤6: 玄关运动传感器(entrance_occupancy)仅记录了 Occupancy=1 的事件,全天没有任何 Occupancy=0(无人)的恢复事件。正常的占用传感器在人离开后应回报无人状态,缺失恢复事件可能表明传感器状态上报不完整或存在固件问题。"], "key_evidence": ["16:15:02 front_door_contact StateValue=False(门开),直到22:15:20才恢复为True(门关),间隔约6小时", "17:40:02 front_door_contact 再次报告StateValue=False,但16:15之后从未报告过门关闭,说明门传感器可能漏报或门确实未关", "entrance_light 全天零事件记录,尽管有3次人员通过玄关", "entrance_occupancy 仅有 Occupancy=1 记录,无 Occupancy=0 恢复事件"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和电池电量,确认是否存在漏报问题", "检查玄关灯(entrance_light)是否离线或损坏,确认其与智能家居网关的连接状态", "检查玄关运动传感器(entrance_occupancy)的固件版本,确认占用恢复事件是否正常上报", "建议设置入户门长时间未关闭的告警规则(如超过5分钟未关门则推送通知),防止安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.957857847213745, "api_error": null} {"episode_id": "SQ1_TN_C_0160", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0160.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20260789, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。\",\n \"reasoning\": [\n \"推理步骤1: 分析客厅温度传感器全天数据,MeasuredValue 从凌晨约 2300(23.00°C)逐步上升至中午峰值约 2576(25.76°C),再回落至夜间约 2325(23.25°C),呈现典型的昼夜温度曲线。\",\n \"推理步骤2: 将客厅传感器与主卧、儿童房、厨房三个传感器逐时段对比,四个传感器在同一时刻的读数差异始终在 20 个单位(0.2°C)以内,说明客厅传感器没有出现偏移或漂移。\",\n \"推理步骤3: 全天温度变化幅度约 2.8°C(23.0°C → 25.8°C),变化平滑,相邻时段最大跳变不超过约 1°C(如 05:30 的 2293 到 06:00 的 2407,约 1.1°C),这与清晨日照升温一致,未出现突变、卡死、丢数据等异常模式。\",\n \"推理步骤4: 数据采集间隔稳定为 30 分钟,全天 48 条记录无缺失,传感器通信正常。\",\n \"推理步骤5: 未发现任何读数为零、负值、极端高温或长时间恒定不变等典型传感器故障特征。\"\n ],\n \"key_evidence\": [\n \"客厅传感器全天 48 个采样点无缺失,采集间隔稳定 30 分钟\",\n \"客厅与其他三个房间传感器同时刻读数偏差始终 < 0.2°C,无系统性偏移\",\n \"温度曲线呈平滑的单峰昼夜变化(夜间 ~23°C,午间 ~25.8°C),无突变或卡顿\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,传感器运行状态良好\",\n \"可继续保持当前 30 分钟的采样频率进行常规监测\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。", "reasoning": ["推理步骤1: 分析客厅温度传感器全天数据,MeasuredValue 从凌晨约 2300(23.00°C)逐步上升至中午峰值约 2576(25.76°C),再回落至夜间约 2325(23.25°C),呈现典型的昼夜温度曲线。", "推理步骤2: 将客厅传感器与主卧、儿童房、厨房三个传感器逐时段对比,四个传感器在同一时刻的读数差异始终在 20 个单位(0.2°C)以内,说明客厅传感器没有出现偏移或漂移。", "推理步骤3: 全天温度变化幅度约 2.8°C(23.0°C → 25.8°C),变化平滑,相邻时段最大跳变不超过约 1°C(如 05:30 的 2293 到 06:00 的 2407,约 1.1°C),这与清晨日照升温一致,未出现突变、卡死、丢数据等异常模式。", "推理步骤4: 数据采集间隔稳定为 30 分钟,全天 48 条记录无缺失,传感器通信正常。", "推理步骤5: 未发现任何读数为零、负值、极端高温或长时间恒定不变等典型传感器故障特征。"], "key_evidence": ["客厅传感器全天 48 个采样点无缺失,采集间隔稳定 30 分钟", "客厅与其他三个房间传感器同时刻读数偏差始终 < 0.2°C,无系统性偏移", "温度曲线呈平滑的单峰昼夜变化(夜间 ~23°C,午间 ~25.8°C),无突变或卡顿"], "recommended_actions": ["无需采取措施,传感器运行状态良好", "可继续保持当前 30 分钟的采样频率进行常规监测"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.360897541046143, "api_error": null} {"episode_id": "SQ1_TN_C_0161", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0161.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260790, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天每30分钟稳定上报一次数据,从00:00到23:30共48个读数,无任何缺失或None值,采样频率完全正常。\",\n \"推理步骤2: 温度变化趋势合理——凌晨约22.9~23.1°C,清晨6:00起随日出升温,中午12:00~12:30达到峰值约25.8°C,午后逐步回落,夜间23:30降至约23.3°C,符合夏季(6月)自然昼夜温度曲线。\",\n \"推理步骤3: 主卧温度与其他房间(客厅、儿童房、厨房)的温度高度一致,各房间同一时刻温差通常在1°C以内,不存在主卧传感器偏移或漂移的迹象。\",\n \"推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:23检测到有人活动(起床),在22:49再次检测到有人(就寝),与灯光开关、窗帘关闭等操作时间吻合,行为模式完全合理。\",\n \"推理步骤5: 对比厨房温度传感器多次出现MeasuredValue=None的情况(06:52、07:05、18:14、19:18),主卧温度传感器全天无任何None值,数据完整性良好。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48次上报均有有效数值,无None或异常跳变,温度范围22.9°C~25.8°C符合季节特征\",\n \"master_bedroom_occupancy 在06:23和22:49两次触发,与主卧灯光开关时间精确匹配(06:23开灯、22:49关灯),符合正常起居规律\",\n \"主卧温度与相邻房间温度走势高度一致,无传感器漂移或故障特征\"\n ],\n \"recommended_actions\": [\n \"主卧传感器无需处理,建议保持当前状态继续监测\",\n \"可关注厨房温度传感器多次上报None值的问题,该传感器可能存在故障或受灶具干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天每30分钟稳定上报一次数据,从00:00到23:30共48个读数,无任何缺失或None值,采样频率完全正常。", "推理步骤2: 温度变化趋势合理——凌晨约22.9~23.1°C,清晨6:00起随日出升温,中午12:00~12:30达到峰值约25.8°C,午后逐步回落,夜间23:30降至约23.3°C,符合夏季(6月)自然昼夜温度曲线。", "推理步骤3: 主卧温度与其他房间(客厅、儿童房、厨房)的温度高度一致,各房间同一时刻温差通常在1°C以内,不存在主卧传感器偏移或漂移的迹象。", "推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:23检测到有人活动(起床),在22:49再次检测到有人(就寝),与灯光开关、窗帘关闭等操作时间吻合,行为模式完全合理。", "推理步骤5: 对比厨房温度传感器多次出现MeasuredValue=None的情况(06:52、07:05、18:14、19:18),主卧温度传感器全天无任何None值,数据完整性良好。"], "key_evidence": ["master_bedroom_temp_sensor 全天48次上报均有有效数值,无None或异常跳变,温度范围22.9°C~25.8°C符合季节特征", "master_bedroom_occupancy 在06:23和22:49两次触发,与主卧灯光开关时间精确匹配(06:23开灯、22:49关灯),符合正常起居规律", "主卧温度与相邻房间温度走势高度一致,无传感器漂移或故障特征"], "recommended_actions": ["主卧传感器无需处理,建议保持当前状态继续监测", "可关注厨房温度传感器多次上报None值的问题,该传感器可能存在故障或受灶具干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.097682237625122, "api_error": null} {"episode_id": "SQ1_TN_C_0162", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0162.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260791, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整整24小时内没有产生任何事件日志,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。在整个2026-06-18全天日志中,这三个设备均无任何事件记录。\",\n \"推理步骤2: 对比其他区域的 contact_sensor,front_door_contact 在 07:42 和 18:04 等时刻有开关记录,kitchen_window_contact 在 07:01 和 18:59 有记录,kids_room_window_contact 等也有窗帘联动。阳台门传感器全天零记录是异常的。\",\n \"推理步骤3: 即使住户全天未使用阳台,contact_sensor 通常也会有周期性的心跳上报或状态确认。24小时内完全静默,更符合设备离线、通信中断或电池耗尽的特征,而非单纯的'无人使用'。\",\n \"推理步骤4: 洗衣机作为手动操作设备,全天不使用属于正常情况,不构成异常。但阳台灯和阳台门传感器同时静默,提示可能是该区域的网络节点(如 Matter 边界路由器覆盖不足)或供电出现了问题。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在 2026-06-18 全天(00:00~23:30)无任何事件上报\",\n \"balcony_light 在 2026-06-18 全天无任何事件上报\",\n \"同类型传感器(front_door_contact、kitchen_window_contact)在同一天内均有正常的状态变化记录\"\n ],\n \"recommended_actions\": [\n \"检查阳台门传感器(balcony_door_contact)的电池电量或供电状态,确认是否电量耗尽\",\n \"检查阳台区域设备的 Matter 网络连接状态,确认是否存在通信中断或信号覆盖盲区\",\n \"手动触发阳台门传感器和阳台灯,验证设备是否能正常响应并上报状态\",\n \"如确认设备离线,及时恢复,因为阳台门传感器失效会导致入侵检测出现盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和阳台灯 balcony_light)在整整24小时内没有产生任何事件日志,疑似设备离线或故障。", "reasoning": ["推理步骤1: 阳台区域共有3个设备——阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。在整个2026-06-18全天日志中,这三个设备均无任何事件记录。", "推理步骤2: 对比其他区域的 contact_sensor,front_door_contact 在 07:42 和 18:04 等时刻有开关记录,kitchen_window_contact 在 07:01 和 18:59 有记录,kids_room_window_contact 等也有窗帘联动。阳台门传感器全天零记录是异常的。", "推理步骤3: 即使住户全天未使用阳台,contact_sensor 通常也会有周期性的心跳上报或状态确认。24小时内完全静默,更符合设备离线、通信中断或电池耗尽的特征,而非单纯的'无人使用'。", "推理步骤4: 洗衣机作为手动操作设备,全天不使用属于正常情况,不构成异常。但阳台灯和阳台门传感器同时静默,提示可能是该区域的网络节点(如 Matter 边界路由器覆盖不足)或供电出现了问题。"], "key_evidence": ["balcony_door_contact 在 2026-06-18 全天(00:00~23:30)无任何事件上报", "balcony_light 在 2026-06-18 全天无任何事件上报", "同类型传感器(front_door_contact、kitchen_window_contact)在同一天内均有正常的状态变化记录"], "recommended_actions": ["检查阳台门传感器(balcony_door_contact)的电池电量或供电状态,确认是否电量耗尽", "检查阳台区域设备的 Matter 网络连接状态,确认是否存在通信中断或信号覆盖盲区", "手动触发阳台门传感器和阳台灯,验证设备是否能正常响应并上报状态", "如确认设备离线,及时恢复,因为阳台门传感器失效会导致入侵检测出现盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.985304355621338, "api_error": null} {"episode_id": "SQ1_TN_C_0164", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0164.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260793, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卫运动传感器在住户离开后长时间未报告占用状态变化,且漏水传感器全天无任何心跳或状态上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 主卫共有3个设备——主卫灯(master_bathroom_light)、主卫运动传感器(master_bathroom_occupancy)、主卫漏水传感器(master_bathroom_water_leak)。\",\n \"推理步骤2: 主卫运动传感器在06:20:00报告Occupancy=1(有人),在06:50:52报告Occupancy=0(无人),之后全天再无任何状态上报。考虑到晚间22:15住户回到主卧,正常生活中睡前使用主卫的概率很高,但传感器完全没有触发,这存在两种可能:住户确实未进入主卫,或传感器已不再正常工作。\",\n \"推理步骤3: 主卫漏水传感器(master_bathroom_water_leak)在整个24小时日志中没有任何一条记录——既没有报告漏水,也没有报告正常状态或心跳。对比厨房漏水传感器和次卫漏水传感器同样全天无记录,这可能是正常的(无事件则不上报),但也可能意味着设备处于离线状态。\",\n \"推理步骤4: 主卫灯在06:20:00开启、06:50:00关闭,行为与运动传感器吻合,灯本身工作正常。\",\n \"推理步骤5: 综合来看,运动传感器早晨工作过一次后全天沉默,虽然不能完全排除'住户确实没再进主卫'的可能,但结合漏水传感器全天零上报的情况,建议对主卫区域传感器进行健康检查,确认设备在线状态和电池电量。\"\n ],\n \"key_evidence\": [\n \"master_bathroom_occupancy 仅在06:20:00和06:50:52有两次状态变化,此后全天无任何上报\",\n \"master_bathroom_water_leak 全天24小时零记录,无法确认设备是否在线\",\n \"晚间22:15住户进入主卧就寝,但主卫传感器未检测到任何活动\"\n ],\n \"recommended_actions\": [\n \"检查主卫运动传感器和漏水传感器的在线状态与电池电量\",\n \"向主卫运动传感器和漏水传感器发送一次主动读取(Read)请求,确认设备是否响应\",\n \"如设备无响应,尝试重新配网或更换电池\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卫运动传感器在住户离开后长时间未报告占用状态变化,且漏水传感器全天无任何心跳或状态上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 主卫共有3个设备——主卫灯(master_bathroom_light)、主卫运动传感器(master_bathroom_occupancy)、主卫漏水传感器(master_bathroom_water_leak)。", "推理步骤2: 主卫运动传感器在06:20:00报告Occupancy=1(有人),在06:50:52报告Occupancy=0(无人),之后全天再无任何状态上报。考虑到晚间22:15住户回到主卧,正常生活中睡前使用主卫的概率很高,但传感器完全没有触发,这存在两种可能:住户确实未进入主卫,或传感器已不再正常工作。", "推理步骤3: 主卫漏水传感器(master_bathroom_water_leak)在整个24小时日志中没有任何一条记录——既没有报告漏水,也没有报告正常状态或心跳。对比厨房漏水传感器和次卫漏水传感器同样全天无记录,这可能是正常的(无事件则不上报),但也可能意味着设备处于离线状态。", "推理步骤4: 主卫灯在06:20:00开启、06:50:00关闭,行为与运动传感器吻合,灯本身工作正常。", "推理步骤5: 综合来看,运动传感器早晨工作过一次后全天沉默,虽然不能完全排除'住户确实没再进主卫'的可能,但结合漏水传感器全天零上报的情况,建议对主卫区域传感器进行健康检查,确认设备在线状态和电池电量。"], "key_evidence": ["master_bathroom_occupancy 仅在06:20:00和06:50:52有两次状态变化,此后全天无任何上报", "master_bathroom_water_leak 全天24小时零记录,无法确认设备是否在线", "晚间22:15住户进入主卧就寝,但主卫传感器未检测到任何活动"], "recommended_actions": ["检查主卫运动传感器和漏水传感器的在线状态与电池电量", "向主卫运动传感器和漏水传感器发送一次主动读取(Read)请求,确认设备是否响应", "如设备无响应,尝试重新配网或更换电池"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.163594961166382, "api_error": null} {"episode_id": "SQ1_TN_C_0165", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0165.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260794, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卫漏水传感器(second_bathroom_water_leak)在全天24小时日志中无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: second_bathroom 区域共有两个设备——次卫灯(second_bathroom_light)和次卫漏水传感器(second_bathroom_water_leak)。\",\n \"推理步骤2: 次卫灯在 06:49 有一次开启记录(OnOff.OnOff = True),说明该区域确实有人使用,灯具工作正常。但全天日志中未见其关闭记录,这可能是灯被遗忘未关,也可能关闭事件未被记录,属于轻微异常。\",\n \"推理步骤3: 次卫漏水传感器(second_bathroom_water_leak)在整整24小时的日志中没有任何一条上报记录。对比同类型设备——主卫漏水传感器(master_bathroom_water_leak)和厨房漏水传感器(kitchen_water_leak)同样全天无上报,但漏水传感器属于事件触发型设备,无漏水时不上报是正常的。\",\n \"推理步骤4: 然而,进一步分析发现问题不在于漏水事件未触发,而在于该传感器全天没有任何心跳、状态确认或周期性上报。对比其他传感器(如温度传感器每30分钟上报一次、运动传感器有明确的占用状态变化),漏水传感器作为安全关键设备,通常应有周期性的在线状态或自检上报。\",\n \"推理步骤5: 综合来看,漏水传感器无上报本身不能100%确认故障(可能只是无事件触发),但考虑到它是安全关键设备且次卫确实有人使用(灯被打开过),建议主动检查该传感器的连接状态和电池电量,以排除离线风险。将其标记为疑似设备故障,置信度为高。\"\n ],\n \"key_evidence\": [\n \"second_bathroom_water_leak 全天(00:00~23:30)无任何状态上报记录\",\n \"second_bathroom_light 在 06:49 被开启,证明该区域有人活动,但全天未见关灯记录\",\n \"同类漏水传感器(master_bathroom_water_leak、kitchen_water_leak)同样无上报,可能是此类设备的正常行为,但也可能是系统性问题\"\n ],\n \"recommended_actions\": [\n \"通过系统后台主动查询 second_bathroom_water_leak 的在线状态(Reachability),确认设备是否在线\",\n \"检查该漏水传感器的电池电量(PowerSource.BatPercentRemaining),低电量可能导致设备静默离线\",\n \"对传感器进行一次手动测试(如滴水测试),验证其检测和上报功能是否正常\",\n \"检查次卫灯是否仍处于开启状态,如是则建议关闭以节能\",\n \"建议对所有漏水传感器统一进行一次健康检查,排除系统性通信故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卫漏水传感器(second_bathroom_water_leak)在全天24小时日志中无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: second_bathroom 区域共有两个设备——次卫灯(second_bathroom_light)和次卫漏水传感器(second_bathroom_water_leak)。", "推理步骤2: 次卫灯在 06:49 有一次开启记录(OnOff.OnOff = True),说明该区域确实有人使用,灯具工作正常。但全天日志中未见其关闭记录,这可能是灯被遗忘未关,也可能关闭事件未被记录,属于轻微异常。", "推理步骤3: 次卫漏水传感器(second_bathroom_water_leak)在整整24小时的日志中没有任何一条上报记录。对比同类型设备——主卫漏水传感器(master_bathroom_water_leak)和厨房漏水传感器(kitchen_water_leak)同样全天无上报,但漏水传感器属于事件触发型设备,无漏水时不上报是正常的。", "推理步骤4: 然而,进一步分析发现问题不在于漏水事件未触发,而在于该传感器全天没有任何心跳、状态确认或周期性上报。对比其他传感器(如温度传感器每30分钟上报一次、运动传感器有明确的占用状态变化),漏水传感器作为安全关键设备,通常应有周期性的在线状态或自检上报。", "推理步骤5: 综合来看,漏水传感器无上报本身不能100%确认故障(可能只是无事件触发),但考虑到它是安全关键设备且次卫确实有人使用(灯被打开过),建议主动检查该传感器的连接状态和电池电量,以排除离线风险。将其标记为疑似设备故障,置信度为高。"], "key_evidence": ["second_bathroom_water_leak 全天(00:00~23:30)无任何状态上报记录", "second_bathroom_light 在 06:49 被开启,证明该区域有人活动,但全天未见关灯记录", "同类漏水传感器(master_bathroom_water_leak、kitchen_water_leak)同样无上报,可能是此类设备的正常行为,但也可能是系统性问题"], "recommended_actions": ["通过系统后台主动查询 second_bathroom_water_leak 的在线状态(Reachability),确认设备是否在线", "检查该漏水传感器的电池电量(PowerSource.BatPercentRemaining),低电量可能导致设备静默离线", "对传感器进行一次手动测试(如滴水测试),验证其检测和上报功能是否正常", "检查次卫灯是否仍处于开启状态,如是则建议关闭以节能", "建议对所有漏水传感器统一进行一次健康检查,排除系统性通信故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.591041088104248, "api_error": null} {"episode_id": "SQ1_TN_C_0168", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0168.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20260797, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"厨房温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器全天读数范围为 2291(约22.91°C,凌晨低点)到 2586(约25.86°C,正午高点),属于夏季室内正常温度范围。\",\n \"推理步骤2: 将厨房传感器与客厅、主卧、儿童房传感器对比,四个传感器在每个时间点的读数差异通常在 10-20 个单位(0.1-0.2°C)以内,偶尔最大差异不超过 30 个单位(0.3°C),各传感器高度一致。\",\n \"推理步骤3: 温度变化趋势完全符合自然昼夜规律——凌晨最低(约23°C),上午逐步升高,中午12:00-13:30达到峰值(约25.5-25.9°C),下午缓慢回落,夜间降至约23.3°C。无突变、无异常跳跃、无滞后。\",\n \"推理步骤4: 未观察到厨房传感器出现读数卡死(stuck value)、突然偏移、与其他传感器趋势背离、或数据缺失等典型故障特征。\"\n ],\n \"key_evidence\": [\n \"厨房传感器全天48个采样点均有数据上报,无缺失\",\n \"厨房与其他三个房间传感器的温度曲线走势一致,同一时刻最大偏差不超过0.3°C\",\n \"温度变化呈平滑的昼夜正弦曲线,无异常阶跃或噪声\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,传感器运行状态良好\",\n \"可继续保持每30分钟的常规采样频率进行监测\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "厨房温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。", "reasoning": ["推理步骤1: 厨房温度传感器全天读数范围为 2291(约22.91°C,凌晨低点)到 2586(约25.86°C,正午高点),属于夏季室内正常温度范围。", "推理步骤2: 将厨房传感器与客厅、主卧、儿童房传感器对比,四个传感器在每个时间点的读数差异通常在 10-20 个单位(0.1-0.2°C)以内,偶尔最大差异不超过 30 个单位(0.3°C),各传感器高度一致。", "推理步骤3: 温度变化趋势完全符合自然昼夜规律——凌晨最低(约23°C),上午逐步升高,中午12:00-13:30达到峰值(约25.5-25.9°C),下午缓慢回落,夜间降至约23.3°C。无突变、无异常跳跃、无滞后。", "推理步骤4: 未观察到厨房传感器出现读数卡死(stuck value)、突然偏移、与其他传感器趋势背离、或数据缺失等典型故障特征。"], "key_evidence": ["厨房传感器全天48个采样点均有数据上报,无缺失", "厨房与其他三个房间传感器的温度曲线走势一致,同一时刻最大偏差不超过0.3°C", "温度变化呈平滑的昼夜正弦曲线,无异常阶跃或噪声"], "recommended_actions": ["无需采取措施,传感器运行状态良好", "可继续保持每30分钟的常规采样频率进行监测"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.104461669921875, "api_error": null} {"episode_id": "SQ1_TN_C_0170", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0170.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260799, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天24小时内持续每30分钟上报一次温度数据,无任何缺失或 None 值,数据连续性完好。\",\n \"推理步骤2: 温度变化趋势合理——凌晨约22.9°C,随日出逐步升高,中午峰值约25.8°C,傍晚回落,深夜降至约23.3°C,符合夏季自然昼夜温差规律,且与其他房间(客厅、儿童房)的温度走势高度一致。\",\n \"推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在06:22检测到有人活动(起床),在22:18再次检测到有人活动(就寝),两次触发时间与日常作息吻合,且与灯光开关事件形成合理因果链。\",\n \"推理步骤4: 主卧窗户传感器(master_bedroom_window_contact)全天无开合事件上报,说明窗户保持关闭状态,属于正常情况。\",\n \"推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况,主卧温度传感器从未出现空值,数据质量明显更好,进一步印证其工作状态正常。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48个采样点(00:00-23:30,每30分钟一次)均有有效数值,无 None 值,温度范围 2290-2584(22.9°C-25.8°C),变化平滑合理\",\n \"master_bedroom_occupancy 在 06:22 和 22:18 两次触发,分别对应起床和就寝,与灯光操作(06:22开灯、22:18关灯)时间一致\",\n \"master_bedroom_window_contact 全天无异常状态变化事件\",\n \"温度曲线与同户其他房间传感器高度同步,排除传感器漂移或故障的可能\"\n ],\n \"recommended_actions\": [\n \"主卧传感器无需处理,建议保持当前状态\",\n \"可关注厨房温度传感器多次报告 None 值的问题,该传感器可能存在故障隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天24小时内持续每30分钟上报一次温度数据,无任何缺失或 None 值,数据连续性完好。", "推理步骤2: 温度变化趋势合理——凌晨约22.9°C,随日出逐步升高,中午峰值约25.8°C,傍晚回落,深夜降至约23.3°C,符合夏季自然昼夜温差规律,且与其他房间(客厅、儿童房)的温度走势高度一致。", "推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在06:22检测到有人活动(起床),在22:18再次检测到有人活动(就寝),两次触发时间与日常作息吻合,且与灯光开关事件形成合理因果链。", "推理步骤4: 主卧窗户传感器(master_bedroom_window_contact)全天无开合事件上报,说明窗户保持关闭状态,属于正常情况。", "推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况,主卧温度传感器从未出现空值,数据质量明显更好,进一步印证其工作状态正常。"], "key_evidence": ["master_bedroom_temp_sensor 全天48个采样点(00:00-23:30,每30分钟一次)均有有效数值,无 None 值,温度范围 2290-2584(22.9°C-25.8°C),变化平滑合理", "master_bedroom_occupancy 在 06:22 和 22:18 两次触发,分别对应起床和就寝,与灯光操作(06:22开灯、22:18关灯)时间一致", "master_bedroom_window_contact 全天无异常状态变化事件", "温度曲线与同户其他房间传感器高度同步,排除传感器漂移或故障的可能"], "recommended_actions": ["主卧传感器无需处理,建议保持当前状态", "可关注厨房温度传感器多次报告 None 值的问题,该传感器可能存在故障隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.109398365020752, "api_error": null} {"episode_id": "SQ1_TN_C_0171", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0171.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260800, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和洗衣机 balcony_laundry_washer)在整个24小时日志中没有任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 阳台区域共有3个设备:阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。\",\n \"推理步骤2: 在整整24小时(2026-06-08 00:00 至 23:30)的日志中,没有任何来自 balcony_door_contact 的状态报告。作为接触传感器,即使门未被打开,也应有周期性心跳或状态确认上报。\",\n \"推理步骤3: 同样,balcony_laundry_washer 也没有任何状态上报。虽然洗衣机不一定每天使用,但完全无通信记录仍值得关注。\",\n \"推理步骤4: 对比其他区域的同类传感器(如 front_door_contact、kitchen_window_contact 等),它们在日志中都有正常的状态变化记录,说明系统本身的日志采集是正常的。\",\n \"推理步骤5: 阳台灯(balcony_light)同样无任何记录,整个阳台区域设备集体静默,更倾向于是通信链路问题(如该区域的网关/路由节点故障)而非单个设备问题。\"\n ],\n \"key_evidence\": [\n \"balcony_door_contact 在24小时内零上报记录\",\n \"balcony_laundry_washer 在24小时内零上报记录\",\n \"balcony_light 在24小时内零上报记录\",\n \"其他区域的同类传感器(contact_sensor、occupancy_sensor等)均有正常上报,排除系统级日志故障\"\n ],\n \"recommended_actions\": [\n \"检查阳台区域设备的网络连接状态,确认是否存在 Matter 网络节点离线\",\n \"物理检查阳台门传感器的电池电量和安装状态\",\n \"检查阳台区域是否有中继节点/边界路由器,确认其工作状态\",\n \"尝试手动触发阳台门传感器(开关门)观察是否有响应\",\n \"在设备恢复前,注意阳台门的物理安全,因为入侵检测在该区域处于盲区状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "阳台区域的两个传感器(阳台门传感器 balcony_door_contact 和洗衣机 balcony_laundry_washer)在整个24小时日志中没有任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: 阳台区域共有3个设备:阳台灯(balcony_light)、阳台门传感器(balcony_door_contact)、洗衣机(balcony_laundry_washer)。", "推理步骤2: 在整整24小时(2026-06-08 00:00 至 23:30)的日志中,没有任何来自 balcony_door_contact 的状态报告。作为接触传感器,即使门未被打开,也应有周期性心跳或状态确认上报。", "推理步骤3: 同样,balcony_laundry_washer 也没有任何状态上报。虽然洗衣机不一定每天使用,但完全无通信记录仍值得关注。", "推理步骤4: 对比其他区域的同类传感器(如 front_door_contact、kitchen_window_contact 等),它们在日志中都有正常的状态变化记录,说明系统本身的日志采集是正常的。", "推理步骤5: 阳台灯(balcony_light)同样无任何记录,整个阳台区域设备集体静默,更倾向于是通信链路问题(如该区域的网关/路由节点故障)而非单个设备问题。"], "key_evidence": ["balcony_door_contact 在24小时内零上报记录", "balcony_laundry_washer 在24小时内零上报记录", "balcony_light 在24小时内零上报记录", "其他区域的同类传感器(contact_sensor、occupancy_sensor等)均有正常上报,排除系统级日志故障"], "recommended_actions": ["检查阳台区域设备的网络连接状态,确认是否存在 Matter 网络节点离线", "物理检查阳台门传感器的电池电量和安装状态", "检查阳台区域是否有中继节点/边界路由器,确认其工作状态", "尝试手动触发阳台门传感器(开关门)观察是否有响应", "在设备恢复前,注意阳台门的物理安全,因为入侵检测在该区域处于盲区状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.840086936950684, "api_error": null} {"episode_id": "SQ1_TN_C_0180", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0180.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260809, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 1.3668019771575928, "api_error": "400 Client Error: Bad Request for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ1_TN_C_0176", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0176.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20260805, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卫漏水传感器(second_bathroom_water_leak)在整个24小时日志中无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: second_bathroom 区域共有两个设备——次卫灯(second_bathroom_light)和次卫漏水传感器(second_bathroom_water_leak)。\",\n \"推理步骤2: 次卫灯在 06:48:00 有一次开启记录(OnOff.OnOff = True),说明该区域确实有人使用,灯具工作正常。但整个日志中未见其关闭记录,存在轻微异常(可能是手动关闭未被记录,或灯一直开着)。\",\n \"推理步骤3: 次卫漏水传感器(second_bathroom_water_leak)在完整的24小时日志中没有任何一条上报记录。对比同类型设备——厨房漏水传感器(kitchen_water_leak)和主卫漏水传感器(master_bathroom_water_leak)同样无上报,但漏水传感器属于事件触发型设备,无水时不上报可视为正常。\",\n \"推理步骤4: 然而,可靠的漏水传感器通常会周期性上报心跳或状态值(如 BooleanState.StateValue = False 表示无漏水),以证明设备在线。整个日志中三个漏水传感器均无任何心跳或状态上报,这在24小时周期内是不正常的,尤其需要关注 second_bathroom_water_leak 的在线状态。\",\n \"推理步骤5: 综合来看,次卫漏水传感器最可能处于离线、电池耗尽或通信故障状态,无法确认其是否正常工作。这构成安全隐患——一旦发生漏水将无法及时报警。\"\n ],\n \"key_evidence\": [\n \"second_bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何状态上报或心跳记录\",\n \"second_bathroom_light 在 06:48 有开启记录但全天无关闭记录,说明区域有使用但传感器侧无响应\",\n \"同类漏水传感器(kitchen_water_leak、master_bathroom_water_leak)也无上报,可能是系统性问题\"\n ],\n \"recommended_actions\": [\n \"立即检查 second_bathroom_water_leak 的设备在线状态、电池电量和网络连接\",\n \"对所有三个漏水传感器(second_bathroom、master_bathroom、kitchen)进行统一排查,确认是否存在系统性通信故障\",\n \"手动向次卫漏水传感器浇少量水进行功能测试,验证其是否能正常触发报警\",\n \"检查次卫灯是否仍处于开启状态,如是则确认是否为遗忘关灯\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卫漏水传感器(second_bathroom_water_leak)在整个24小时日志中无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: second_bathroom 区域共有两个设备——次卫灯(second_bathroom_light)和次卫漏水传感器(second_bathroom_water_leak)。", "推理步骤2: 次卫灯在 06:48:00 有一次开启记录(OnOff.OnOff = True),说明该区域确实有人使用,灯具工作正常。但整个日志中未见其关闭记录,存在轻微异常(可能是手动关闭未被记录,或灯一直开着)。", "推理步骤3: 次卫漏水传感器(second_bathroom_water_leak)在完整的24小时日志中没有任何一条上报记录。对比同类型设备——厨房漏水传感器(kitchen_water_leak)和主卫漏水传感器(master_bathroom_water_leak)同样无上报,但漏水传感器属于事件触发型设备,无水时不上报可视为正常。", "推理步骤4: 然而,可靠的漏水传感器通常会周期性上报心跳或状态值(如 BooleanState.StateValue = False 表示无漏水),以证明设备在线。整个日志中三个漏水传感器均无任何心跳或状态上报,这在24小时周期内是不正常的,尤其需要关注 second_bathroom_water_leak 的在线状态。", "推理步骤5: 综合来看,次卫漏水传感器最可能处于离线、电池耗尽或通信故障状态,无法确认其是否正常工作。这构成安全隐患——一旦发生漏水将无法及时报警。"], "key_evidence": ["second_bathroom_water_leak 在 2026-06-04 全天(00:00~23:30)无任何状态上报或心跳记录", "second_bathroom_light 在 06:48 有开启记录但全天无关闭记录,说明区域有使用但传感器侧无响应", "同类漏水传感器(kitchen_water_leak、master_bathroom_water_leak)也无上报,可能是系统性问题"], "recommended_actions": ["立即检查 second_bathroom_water_leak 的设备在线状态、电池电量和网络连接", "对所有三个漏水传感器(second_bathroom、master_bathroom、kitchen)进行统一排查,确认是否存在系统性通信故障", "手动向次卫漏水传感器浇少量水进行功能测试,验证其是否能正常触发报警", "检查次卫灯是否仍处于开启状态,如是则确认是否为遗忘关灯"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.80122709274292, "api_error": null} {"episode_id": "SQ1_TN_C_0182", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0182.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260811, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卫漏水传感器全天无任何数据上报,可能存在设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: master_bathroom 区域共有3个传感器/设备:主卫灯(master_bathroom_light)、主卫运动传感器(master_bathroom_occupancy)、主卫漏水传感器(master_bathroom_water_leak)。\",\n \"推理步骤2: 主卫运动传感器在 06:43 检测到有人(Occupancy=1),07:07 恢复无人(Occupancy=0),与主卫灯 06:43 开、07:06 关的时间吻合,属于早晨洗漱的正常行为模式,工作正常。\",\n \"推理步骤3: 主卫灯在 06:43 开启、07:06 关闭,与运动传感器联动一致,工作正常。\",\n \"推理步骤4: 主卫漏水传感器(master_bathroom_water_leak)在整个24小时日志中没有任何一条上报记录——既没有正常的'未检测到漏水'状态心跳,也没有任何状态变化事件。\",\n \"推理步骤5: 对比其他同类传感器(如厨房温度传感器即使读数为 None 也会上报),漏水传感器完全静默是不正常的。虽然漏水传感器在无漏水时上报频率可能较低,但全天零上报仍值得关注,可能处于离线、电量耗尽或通信故障状态。\"\n ],\n \"key_evidence\": [\n \"master_bathroom_water_leak 在 2026-06-17 全天(00:00~23:30)无任何事件上报\",\n \"同区域的 master_bathroom_occupancy 和 master_bathroom_light 均有正常事件记录,排除网关区域性故障\",\n \"second_bathroom_water_leak 同样全天无上报,可能是同类设备的共性问题\"\n ],\n \"recommended_actions\": [\n \"检查主卫漏水传感器的电池电量或供电状态,确认设备是否在线\",\n \"通过 Matter 协议查询 master_bathroom_water_leak 的可达性(Reachability)和最后通信时间\",\n \"同时排查 second_bathroom_water_leak 是否也存在相同的离线问题\",\n \"如确认设备离线,尝试重新配网或更换电池;如仍无法恢复,考虑更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卫漏水传感器全天无任何数据上报,可能存在设备离线或故障。", "reasoning": ["推理步骤1: master_bathroom 区域共有3个传感器/设备:主卫灯(master_bathroom_light)、主卫运动传感器(master_bathroom_occupancy)、主卫漏水传感器(master_bathroom_water_leak)。", "推理步骤2: 主卫运动传感器在 06:43 检测到有人(Occupancy=1),07:07 恢复无人(Occupancy=0),与主卫灯 06:43 开、07:06 关的时间吻合,属于早晨洗漱的正常行为模式,工作正常。", "推理步骤3: 主卫灯在 06:43 开启、07:06 关闭,与运动传感器联动一致,工作正常。", "推理步骤4: 主卫漏水传感器(master_bathroom_water_leak)在整个24小时日志中没有任何一条上报记录——既没有正常的'未检测到漏水'状态心跳,也没有任何状态变化事件。", "推理步骤5: 对比其他同类传感器(如厨房温度传感器即使读数为 None 也会上报),漏水传感器完全静默是不正常的。虽然漏水传感器在无漏水时上报频率可能较低,但全天零上报仍值得关注,可能处于离线、电量耗尽或通信故障状态。"], "key_evidence": ["master_bathroom_water_leak 在 2026-06-17 全天(00:00~23:30)无任何事件上报", "同区域的 master_bathroom_occupancy 和 master_bathroom_light 均有正常事件记录,排除网关区域性故障", "second_bathroom_water_leak 同样全天无上报,可能是同类设备的共性问题"], "recommended_actions": ["检查主卫漏水传感器的电池电量或供电状态,确认设备是否在线", "通过 Matter 协议查询 master_bathroom_water_leak 的可达性(Reachability)和最后通信时间", "同时排查 second_bathroom_water_leak 是否也存在相同的离线问题", "如确认设备离线,尝试重新配网或更换电池;如仍无法恢复,考虑更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.593674182891846, "api_error": null} {"episode_id": "SQ1_TN_C_0184", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0184.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260813, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器(kitchen_temp_sensor)在烹饪期间多次报告 None 值,表明设备存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在全天大部分时间正常上报温度数据(每30分钟一次),数值在 2291~2582 范围内波动,与其他房间传感器趋势一致,说明传感器基线功能正常。\",\n \"推理步骤2: 但在 07:11:06 和 07:26:00 两个时间点,传感器上报了 MeasuredValue = None;同样在 18:20:00 和 18:54:00 也上报了 None。这四次 None 值均发生在灶具(kitchen_cook_surface)开启使用期间或刚关闭后。\",\n \"推理步骤3: 对比其他三个温度传感器(客厅、主卧、儿童房),它们在整个24小时内从未出现 None 值,始终正常上报数据,排除了系统级通信故障的可能性。\",\n \"推理步骤4: 两次烹饪场景(早餐 07:10~07:25、晚餐 18:19~18:53)都触发了 None 值,说明故障与厨房局部高温环境高度相关。传感器可能在灶具工作导致的局部温升下超出量程或出现热保护,导致无法返回有效读数。\",\n \"推理步骤5: 每次烹饪结束后,传感器在下一个30分钟周期恢复正常读数(07:30 报 2435、18:30 报 2453),说明这是间歇性故障而非永久损坏,但故障模式可重复触发。\"\n ],\n \"key_evidence\": [\n \"07:11:06 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 07:10:36 开启后约30秒)\",\n \"07:26:00 kitchen_temp_sensor 再次报告 MeasuredValue = None(灶具 07:25 关闭后1分钟)\",\n \"18:20:00 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 18:19:30 开启后约30秒)\",\n \"18:54:00 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 18:53 关闭后1分钟)\",\n \"同时段其他三个房间的温度传感器全部正常上报,无任何 None 值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到烹饪时的直接热辐射影响,建议将传感器迁移至远离灶具的位置\",\n \"查看传感器产品规格中的工作温度范围,确认烹饪时局部温度是否超出其量程上限\",\n \"检查传感器固件版本,确认是否有已知的高温环境下读数异常的 bug,必要时进行固件升级\",\n \"如传感器硬件已老化,考虑更换为耐高温型号,确保厨房火灾预警场景下温度数据不中断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器(kitchen_temp_sensor)在烹饪期间多次报告 None 值,表明设备存在间歇性故障。", "reasoning": ["推理步骤1: 厨房温度传感器在全天大部分时间正常上报温度数据(每30分钟一次),数值在 2291~2582 范围内波动,与其他房间传感器趋势一致,说明传感器基线功能正常。", "推理步骤2: 但在 07:11:06 和 07:26:00 两个时间点,传感器上报了 MeasuredValue = None;同样在 18:20:00 和 18:54:00 也上报了 None。这四次 None 值均发生在灶具(kitchen_cook_surface)开启使用期间或刚关闭后。", "推理步骤3: 对比其他三个温度传感器(客厅、主卧、儿童房),它们在整个24小时内从未出现 None 值,始终正常上报数据,排除了系统级通信故障的可能性。", "推理步骤4: 两次烹饪场景(早餐 07:10~07:25、晚餐 18:19~18:53)都触发了 None 值,说明故障与厨房局部高温环境高度相关。传感器可能在灶具工作导致的局部温升下超出量程或出现热保护,导致无法返回有效读数。", "推理步骤5: 每次烹饪结束后,传感器在下一个30分钟周期恢复正常读数(07:30 报 2435、18:30 报 2453),说明这是间歇性故障而非永久损坏,但故障模式可重复触发。"], "key_evidence": ["07:11:06 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 07:10:36 开启后约30秒)", "07:26:00 kitchen_temp_sensor 再次报告 MeasuredValue = None(灶具 07:25 关闭后1分钟)", "18:20:00 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 18:19:30 开启后约30秒)", "18:54:00 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 18:53 关闭后1分钟)", "同时段其他三个房间的温度传感器全部正常上报,无任何 None 值"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到烹饪时的直接热辐射影响,建议将传感器迁移至远离灶具的位置", "查看传感器产品规格中的工作温度范围,确认烹饪时局部温度是否超出其量程上限", "检查传感器固件版本,确认是否有已知的高温环境下读数异常的 bug,必要时进行固件升级", "如传感器硬件已老化,考虑更换为耐高温型号,确保厨房火灾预警场景下温度数据不中断"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.937390089035034, "api_error": null} {"episode_id": "SQ1_TN_C_0185", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_C_0185.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260814, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器、运动传感器和窗户接触传感器均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无任何一次缺失(None)。温度值从凌晨约22.9°C逐步升至中午峰值约25.8°C,再回落至夜间约23.3°C,符合夏季(6月)自然昼夜温度变化曲线。\",\n \"推理步骤2: 温度变化幅度合理,相邻采样点之间的波动通常在0.1-0.3°C之间,最大单次跳变出现在06:00(从23.0°C升至23.9°C),属于清晨日出升温的正常范围,未出现异常突变。\",\n \"推理步骤3: 对比其他房间传感器,客厅温度与主卧、儿童房、厨房的温度走势高度一致,说明客厅温度传感器没有偏移或漂移问题。而厨房传感器在06:47、18:18、19:26多次报告None值,客厅传感器从未出现此问题。\",\n \"推理步骤4: 客厅运动传感器(living_room_occupancy)在18:07检测到有人,与入户门开锁/开门事件时间吻合(家人下班回家),白天家中无人期间未触发,行为合理。\",\n \"推理步骤5: 客厅窗户接触传感器(living_room_window_contact_1, living_room_window_contact_2)全天无状态变化事件,说明窗户始终保持关闭状态,在家人外出期间属于正常安全状态。\",\n \"推理步骤6: 18:07开启空调(制冷模式SystemMode=3)后,客厅温度从24.56°C(18:00)先微升至24.69°C(18:30)再持续下降至22:00的23.69°C,符合空调制冷的实际效果曲线(开机初期有滞后,随后稳步降温)。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点均正常上报,无None值,温度范围22.9°C~25.8°C,变化平滑连续\",\n \"客厅温度曲线与其他三个房间传感器高度一致,无独立偏移或异常跳变\",\n \"living_room_occupancy 仅在18:07(家人回家时)触发,与入户门事件时序匹配\",\n \"客厅窗户传感器全天无变化,窗户保持关闭\",\n \"空调开启后温度变化趋势符合制冷预期\"\n ],\n \"recommended_actions\": [\n \"客厅传感器状态良好,无需采取任何措施\",\n \"建议关注厨房温度传感器多次报告None值的问题,可能存在设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器、运动传感器和窗户接触传感器均表现符合预期。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报数据,无任何一次缺失(None)。温度值从凌晨约22.9°C逐步升至中午峰值约25.8°C,再回落至夜间约23.3°C,符合夏季(6月)自然昼夜温度变化曲线。", "推理步骤2: 温度变化幅度合理,相邻采样点之间的波动通常在0.1-0.3°C之间,最大单次跳变出现在06:00(从23.0°C升至23.9°C),属于清晨日出升温的正常范围,未出现异常突变。", "推理步骤3: 对比其他房间传感器,客厅温度与主卧、儿童房、厨房的温度走势高度一致,说明客厅温度传感器没有偏移或漂移问题。而厨房传感器在06:47、18:18、19:26多次报告None值,客厅传感器从未出现此问题。", "推理步骤4: 客厅运动传感器(living_room_occupancy)在18:07检测到有人,与入户门开锁/开门事件时间吻合(家人下班回家),白天家中无人期间未触发,行为合理。", "推理步骤5: 客厅窗户接触传感器(living_room_window_contact_1, living_room_window_contact_2)全天无状态变化事件,说明窗户始终保持关闭状态,在家人外出期间属于正常安全状态。", "推理步骤6: 18:07开启空调(制冷模式SystemMode=3)后,客厅温度从24.56°C(18:00)先微升至24.69°C(18:30)再持续下降至22:00的23.69°C,符合空调制冷的实际效果曲线(开机初期有滞后,随后稳步降温)。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点均正常上报,无None值,温度范围22.9°C~25.8°C,变化平滑连续", "客厅温度曲线与其他三个房间传感器高度一致,无独立偏移或异常跳变", "living_room_occupancy 仅在18:07(家人回家时)触发,与入户门事件时序匹配", "客厅窗户传感器全天无变化,窗户保持关闭", "空调开启后温度变化趋势符合制冷预期"], "recommended_actions": ["客厅传感器状态良好,无需采取任何措施", "建议关注厨房温度传感器多次报告None值的问题,可能存在设备故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.001914262771606, "api_error": null} {"episode_id": "SQ1_TN_D_0139", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0139.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20260768, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常,未能完整捕捉出入事件。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在日志中的表现。\",\n \"推理步骤2: 06:59 出门事件中,门锁解锁→门传感器开(False)→关(True)→门锁自动上锁,玄关运动传感器触发(Occupancy=1),这一组事件链完整合理。\",\n \"推理步骤3: 08:29 回家事件中,门锁解锁→门传感器开(False)→玄关运动传感器触发(Occupancy=1),但缺少门传感器关闭(StateValue=True)的事件,也缺少门锁重新上锁的记录。这意味着入户门在08:29开门后,日志中一直没有记录关门和上锁,直到20:40才出现 front_door_contact StateValue=True 和门锁自动上锁。\",\n \"推理步骤4: 从08:29到20:40长达12小时,入户门传感器未报告关门状态。对于独居老人来说,回家后不关门/不锁门持续12小时极不合理。更可能的解释是门传感器漏报了关门事件(StateValue=True 的上报丢失)。\",\n \"推理步骤5: 玄关运动传感器(entrance_occupancy)在06:59和08:29两次触发后,均未上报 Occupancy=0(离开)的事件。对比卫生间运动传感器在05:53和20:41都正常上报了 Occupancy=0,说明玄关运动传感器的'离开'检测可能存在故障或上报遗漏。\",\n \"推理步骤6: 玄关灯(entrance_light)全天无任何事件记录。虽然可能是老人未使用玄关灯,但结合其他传感器的异常,也需要关注其是否正常工作。\",\n \"推理步骤7: 20:40 的门锁上锁和门传感器关闭事件发生时,老人已在卧室(bedroom_occupancy触发),没有玄关运动传感器触发,说明这可能是一次延迟上报或系统自动补偿,而非老人实际去关门。这进一步印证传感器存在通信或状态上报问题。\"\n ],\n \"key_evidence\": [\n \"08:29 入户门开启(front_door_contact StateValue=False)后,直到20:40才记录关闭(StateValue=True),间隔超过12小时\",\n \"08:29 门锁解锁后无对应的上锁记录,直到20:40才自动上锁,与06:59出门时的完整事件链形成对比\",\n \"玄关运动传感器两次触发 Occupancy=1 后均无 Occupancy=0 的恢复事件,而卫生间运动传感器能正常上报离开状态\",\n \"20:40 门锁上锁时老人已在卧室,无玄关运动传感器触发,暗示这不是人为操作而是系统补偿或延迟上报\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁与传感器之间的间距是否在有效范围内\",\n \"检查玄关运动传感器(entrance_occupancy)的固件版本和通信质量,排查 Occupancy=0 事件丢失的原因\",\n \"检查 entrance 区域设备与 Matter 网关之间的无线信号强度,玄关区域可能存在信号盲区导致事件上报丢失\",\n \"对玄关灯(entrance_light)进行一次手动开关测试,确认设备在线且响应正常\",\n \"考虑为独居老人场景增加入户门长时间未关闭的告警规则,即使传感器正常也能提供安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常,未能完整捕捉出入事件。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在日志中的表现。", "推理步骤2: 06:59 出门事件中,门锁解锁→门传感器开(False)→关(True)→门锁自动上锁,玄关运动传感器触发(Occupancy=1),这一组事件链完整合理。", "推理步骤3: 08:29 回家事件中,门锁解锁→门传感器开(False)→玄关运动传感器触发(Occupancy=1),但缺少门传感器关闭(StateValue=True)的事件,也缺少门锁重新上锁的记录。这意味着入户门在08:29开门后,日志中一直没有记录关门和上锁,直到20:40才出现 front_door_contact StateValue=True 和门锁自动上锁。", "推理步骤4: 从08:29到20:40长达12小时,入户门传感器未报告关门状态。对于独居老人来说,回家后不关门/不锁门持续12小时极不合理。更可能的解释是门传感器漏报了关门事件(StateValue=True 的上报丢失)。", "推理步骤5: 玄关运动传感器(entrance_occupancy)在06:59和08:29两次触发后,均未上报 Occupancy=0(离开)的事件。对比卫生间运动传感器在05:53和20:41都正常上报了 Occupancy=0,说明玄关运动传感器的'离开'检测可能存在故障或上报遗漏。", "推理步骤6: 玄关灯(entrance_light)全天无任何事件记录。虽然可能是老人未使用玄关灯,但结合其他传感器的异常,也需要关注其是否正常工作。", "推理步骤7: 20:40 的门锁上锁和门传感器关闭事件发生时,老人已在卧室(bedroom_occupancy触发),没有玄关运动传感器触发,说明这可能是一次延迟上报或系统自动补偿,而非老人实际去关门。这进一步印证传感器存在通信或状态上报问题。"], "key_evidence": ["08:29 入户门开启(front_door_contact StateValue=False)后,直到20:40才记录关闭(StateValue=True),间隔超过12小时", "08:29 门锁解锁后无对应的上锁记录,直到20:40才自动上锁,与06:59出门时的完整事件链形成对比", "玄关运动传感器两次触发 Occupancy=1 后均无 Occupancy=0 的恢复事件,而卫生间运动传感器能正常上报离开状态", "20:40 门锁上锁时老人已在卧室,无玄关运动传感器触发,暗示这不是人为操作而是系统补偿或延迟上报"], "recommended_actions": ["检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁与传感器之间的间距是否在有效范围内", "检查玄关运动传感器(entrance_occupancy)的固件版本和通信质量,排查 Occupancy=0 事件丢失的原因", "检查 entrance 区域设备与 Matter 网关之间的无线信号强度,玄关区域可能存在信号盲区导致事件上报丢失", "对玄关灯(entrance_light)进行一次手动开关测试,确认设备在线且响应正常", "考虑为独居老人场景增加入户门长时间未关闭的告警规则,即使传感器正常也能提供安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.115114212036133, "api_error": null} {"episode_id": "SQ1_TN_D_0141", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0141.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20260770, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器(entrance_occupancy)疑似存在故障,在老人出门和回家时均未能持续正常报告占用状态变化。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域有两个传感器——入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)。分析它们在全天日志中的表现。\",\n \"推理步骤2: 07:06时老人出门,entrance_occupancy报告了Occupancy=1,front_door_contact正常报告了开/关,这次工作正常。\",\n \"推理步骤3: 08:27时老人回家,entrance_occupancy报告了Occupancy=1,front_door_contact正常报告了门打开(StateValue=False),但之后门从未报告关闭(StateValue=True),直到20:36才出现关门事件。\",\n \"推理步骤4: 20:36时front_door_contact报告StateValue=True(门关闭)并自动上锁,但此时entrance_occupancy没有任何触发记录,而老人明显从客厅经过玄关区域进入卧室。\",\n \"推理步骤5: 综合来看,entrance_occupancy在08:27之后整天没有再报告任何状态变化(包括Occupancy=0的恢复),且20:36经过玄关时完全无响应,说明该传感器可能存在间歇性故障或灵敏度下降问题。\",\n \"推理步骤6: front_door_contact在08:27开门后长达12小时未报告关门,可能是门确实一直开着(独居老人白天不关门的习惯),也可能是传感器漏报。结合20:36的关门记录,更倾向于门白天确实未关。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy全天仅在07:06和08:27触发了两次Occupancy=1,从未报告Occupancy=0恢复事件\",\n \"20:36老人从客厅移动到卧室(经过玄关区域),entrance_occupancy未触发任何事件\",\n \"front_door_contact在08:27报告开门后,直到20:36才报告关门,间隔超过12小时\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器(entrance_occupancy)的电池电量和安装位置,确认是否存在感应盲区或电量不足\",\n \"观察entrance_occupancy是否能正常报告Occupancy=0(离开状态),若持续无法恢复,考虑重置或更换传感器\",\n \"确认老人白天是否习惯不关入户门,若非习惯则需检查front_door_contact传感器的磁铁对齐情况\",\n \"对于独居老人场景,玄关传感器是判断出入的关键设备,建议尽快排除故障以确保安全监护有效性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器(entrance_occupancy)疑似存在故障,在老人出门和回家时均未能持续正常报告占用状态变化。", "reasoning": ["推理步骤1: entrance 区域有两个传感器——入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)。分析它们在全天日志中的表现。", "推理步骤2: 07:06时老人出门,entrance_occupancy报告了Occupancy=1,front_door_contact正常报告了开/关,这次工作正常。", "推理步骤3: 08:27时老人回家,entrance_occupancy报告了Occupancy=1,front_door_contact正常报告了门打开(StateValue=False),但之后门从未报告关闭(StateValue=True),直到20:36才出现关门事件。", "推理步骤4: 20:36时front_door_contact报告StateValue=True(门关闭)并自动上锁,但此时entrance_occupancy没有任何触发记录,而老人明显从客厅经过玄关区域进入卧室。", "推理步骤5: 综合来看,entrance_occupancy在08:27之后整天没有再报告任何状态变化(包括Occupancy=0的恢复),且20:36经过玄关时完全无响应,说明该传感器可能存在间歇性故障或灵敏度下降问题。", "推理步骤6: front_door_contact在08:27开门后长达12小时未报告关门,可能是门确实一直开着(独居老人白天不关门的习惯),也可能是传感器漏报。结合20:36的关门记录,更倾向于门白天确实未关。"], "key_evidence": ["entrance_occupancy全天仅在07:06和08:27触发了两次Occupancy=1,从未报告Occupancy=0恢复事件", "20:36老人从客厅移动到卧室(经过玄关区域),entrance_occupancy未触发任何事件", "front_door_contact在08:27报告开门后,直到20:36才报告关门,间隔超过12小时"], "recommended_actions": ["检查玄关运动传感器(entrance_occupancy)的电池电量和安装位置,确认是否存在感应盲区或电量不足", "观察entrance_occupancy是否能正常报告Occupancy=0(离开状态),若持续无法恢复,考虑重置或更换传感器", "确认老人白天是否习惯不关入户门,若非习惯则需检查front_door_contact传感器的磁铁对齐情况", "对于独居老人场景,玄关传感器是判断出入的关键设备,建议尽快排除故障以确保安全监护有效性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.250779628753662, "api_error": null} {"episode_id": "SQ1_TN_D_0140", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0140.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20260769, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器读数持续偏低于其他房间约10°C,且在全天温度波动中始终保持固定偏差,疑似存在测量偏移校准故障。\",\n \"reasoning\": [\n \"推理步骤1: 对比三个温度传感器的读数。Matter协议中 TemperatureMeasurement.MeasuredValue 单位为0.01°C,因此卧室夜间读数约21.9°C,客厅约23.0°C,厨房约23.0°C。卧室始终比其他房间低约1.0-1.1°C。\",\n \"推理步骤2: 这个温差在夜间(门窗关闭、无人活动)尚可解释为房间朝向或隔热差异。但到白天高温时段(12:00左右),客厅达25.8°C、厨房达25.8°C,卧室仅24.9°C,差距仍保持约1°C,说明偏差是系统性的而非环境性的。\",\n \"推理步骤3: 进一步观察,卧室窗帘在12:38被完全关闭(10000=100%),13:59又被打开(0),午睡期间卧室有人且门窗封闭,按理温度应因人体散热而略升或至少与其他房间趋近,但偏差依旧稳定,进一步支持传感器本身存在固定偏移。\",\n \"推理步骤4: 不过,卧室温度传感器的变化趋势与其他传感器一致(白天升高、夜间降低),说明传感器并非完全失灵,而是可能存在校准偏移(calibration offset)问题。\",\n \"推理步骤5: 卧室运动传感器(bedroom_occupancy)工作正常——05:29检测到起床活动、12:38检测到午睡、13:59检测到起身、20:35检测到就寝,与灯光和窗帘操作时序吻合,无异常。\",\n \"推理步骤6: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,这对独居老人来说属于正常情况,传感器本身无异常迹象。\"\n ],\n \"key_evidence\": [\n \"卧室温度传感器全天读数系统性低于客厅和厨房约1.0°C,夜间差值约1.0°C(如00:00时卧室21.95°C vs 客厅23.04°C),白天差值约1.0°C(如12:00时卧室24.85°C vs 客厅25.83°C),偏差高度稳定\",\n \"卧室运动传感器在05:29、12:38、13:59、20:35均正常触发,与对应的灯光开关和窗帘动作时序完全吻合,工作正常\",\n \"卧室窗户接触传感器全天无状态变更,窗户持续关闭,属正常状态\",\n \"卧室温度变化趋势与其他房间一致(凌晨低→正午高→夜间回落),排除传感器完全故障的可能\"\n ],\n \"recommended_actions\": [\n \"使用独立温度计对卧室实际温度进行交叉验证,确认温度传感器是否存在固定偏移\",\n \"如确认偏移,对 bedroom_temp_sensor 进行校准重置或在系统中配置补偿偏移量(offset compensation)\",\n \"若传感器支持 OTA 固件更新,检查是否有新版本修复已知的测量漂移问题\",\n \"定期(如每季度)对比各房间传感器读数,建立基线以便及早发现校准漂移\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室温度传感器读数持续偏低于其他房间约10°C,且在全天温度波动中始终保持固定偏差,疑似存在测量偏移校准故障。", "reasoning": ["推理步骤1: 对比三个温度传感器的读数。Matter协议中 TemperatureMeasurement.MeasuredValue 单位为0.01°C,因此卧室夜间读数约21.9°C,客厅约23.0°C,厨房约23.0°C。卧室始终比其他房间低约1.0-1.1°C。", "推理步骤2: 这个温差在夜间(门窗关闭、无人活动)尚可解释为房间朝向或隔热差异。但到白天高温时段(12:00左右),客厅达25.8°C、厨房达25.8°C,卧室仅24.9°C,差距仍保持约1°C,说明偏差是系统性的而非环境性的。", "推理步骤3: 进一步观察,卧室窗帘在12:38被完全关闭(10000=100%),13:59又被打开(0),午睡期间卧室有人且门窗封闭,按理温度应因人体散热而略升或至少与其他房间趋近,但偏差依旧稳定,进一步支持传感器本身存在固定偏移。", "推理步骤4: 不过,卧室温度传感器的变化趋势与其他传感器一致(白天升高、夜间降低),说明传感器并非完全失灵,而是可能存在校准偏移(calibration offset)问题。", "推理步骤5: 卧室运动传感器(bedroom_occupancy)工作正常——05:29检测到起床活动、12:38检测到午睡、13:59检测到起身、20:35检测到就寝,与灯光和窗帘操作时序吻合,无异常。", "推理步骤6: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,这对独居老人来说属于正常情况,传感器本身无异常迹象。"], "key_evidence": ["卧室温度传感器全天读数系统性低于客厅和厨房约1.0°C,夜间差值约1.0°C(如00:00时卧室21.95°C vs 客厅23.04°C),白天差值约1.0°C(如12:00时卧室24.85°C vs 客厅25.83°C),偏差高度稳定", "卧室运动传感器在05:29、12:38、13:59、20:35均正常触发,与对应的灯光开关和窗帘动作时序完全吻合,工作正常", "卧室窗户接触传感器全天无状态变更,窗户持续关闭,属正常状态", "卧室温度变化趋势与其他房间一致(凌晨低→正午高→夜间回落),排除传感器完全故障的可能"], "recommended_actions": ["使用独立温度计对卧室实际温度进行交叉验证,确认温度传感器是否存在固定偏移", "如确认偏移,对 bedroom_temp_sensor 进行校准重置或在系统中配置补偿偏移量(offset compensation)", "若传感器支持 OTA 固件更新,检查是否有新版本修复已知的测量漂移问题", "定期(如每季度)对比各房间传感器读数,建立基线以便及早发现校准漂移"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.14775061607361, "api_error": null} {"episode_id": "SQ1_TN_D_0144", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0144.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20260773, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常:门传感器状态不配对,运动传感器长时间无活动报告。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。\",\n \"推理步骤2: front_door_contact 在 06:58:07 报告 StateValue=False(门开),06:58:09 报告 StateValue=True(门关),这是一次完整的开关配对,属正常。但在 08:39:02 报告 StateValue=False(门开)后,整天再未报告 StateValue=True(门关)。直到 20:38:10 才出现一次 StateValue=True,中间间隔近 12 小时。这意味着要么门确实开了 12 小时(独居老人外出未关门,安全隐患极大),要么传感器漏报了关门事件。\",\n \"推理步骤3: 进一步分析 08:39 事件——老人 08:39 开锁开门进入,玄关运动传感器检测到人,随后客厅也检测到人并开灯,说明老人已经进屋。正常情况下入户门应在数秒内关闭并上锁,但日志中 front_door_contact 没有报告关门(StateValue=True),front_door_lock 也没有报告上锁事件。这高度异常。\",\n \"推理步骤4: 对比 06:58 的正常出门流程:开锁→开门→关门(2秒后)→自动上锁,整个过程完整。而 08:39 的进门流程缺失了关门和上锁环节,直到 20:38:11 才出现自动上锁记录,说明门传感器或门锁在 08:39 之后可能存在状态上报故障。\",\n \"推理步骤5: entrance_occupancy 全天仅在 06:58:08 和 08:39:03 两次报告 Occupancy=1,且从未报告过 Occupancy=0(人离开)。老人多次经过玄关(出门、回家、去厨房等),运动传感器应有更多触发记录。缺少离开状态(Occupancy=0)的上报,说明该传感器可能存在状态回报不完整的问题。\",\n \"推理步骤6: entrance_light(玄关灯)全天无任何日志记录,既没有开也没有关。虽然可能是老人未使用或无自动化联动,但结合其他传感器的异常,也值得关注。\"\n ],\n \"key_evidence\": [\n \"front_door_contact 在 08:39:02 报告开门(StateValue=False)后,直到 20:38:10(约12小时后)才报告关门(StateValue=True),中间缺失关门事件\",\n \"08:39 进门流程中 front_door_lock 没有上锁记录,与 06:58 出门时完整的开锁-开门-关门-自动上锁流程形成对比\",\n \"entrance_occupancy 全天仅触发 2 次 Occupancy=1,且从未报告 Occupancy=0,状态上报不完整\",\n \"entrance_light 全天零记录,无任何开关状态变化\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁与传感器之间的间距是否正常,排除物理偏移导致的漏报\",\n \"检查入户门锁(front_door_lock)的自动上锁功能是否正常工作,确认 08:39 进门后门锁是否实际上锁但未上报\",\n \"检查玄关运动传感器(entrance_occupancy)的灵敏度设置和电池状态,确认其是否能正常检测到人员经过并上报离开状态\",\n \"在排查期间,建议为独居老人启用入户门长时间未关闭的告警规则(如开门超过5分钟未关闭则推送通知给紧急联系人)\",\n \"检查玄关灯(entrance_light)是否已接入系统并正常通信,确认设备在线状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常:门传感器状态不配对,运动传感器长时间无活动报告。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。", "推理步骤2: front_door_contact 在 06:58:07 报告 StateValue=False(门开),06:58:09 报告 StateValue=True(门关),这是一次完整的开关配对,属正常。但在 08:39:02 报告 StateValue=False(门开)后,整天再未报告 StateValue=True(门关)。直到 20:38:10 才出现一次 StateValue=True,中间间隔近 12 小时。这意味着要么门确实开了 12 小时(独居老人外出未关门,安全隐患极大),要么传感器漏报了关门事件。", "推理步骤3: 进一步分析 08:39 事件——老人 08:39 开锁开门进入,玄关运动传感器检测到人,随后客厅也检测到人并开灯,说明老人已经进屋。正常情况下入户门应在数秒内关闭并上锁,但日志中 front_door_contact 没有报告关门(StateValue=True),front_door_lock 也没有报告上锁事件。这高度异常。", "推理步骤4: 对比 06:58 的正常出门流程:开锁→开门→关门(2秒后)→自动上锁,整个过程完整。而 08:39 的进门流程缺失了关门和上锁环节,直到 20:38:11 才出现自动上锁记录,说明门传感器或门锁在 08:39 之后可能存在状态上报故障。", "推理步骤5: entrance_occupancy 全天仅在 06:58:08 和 08:39:03 两次报告 Occupancy=1,且从未报告过 Occupancy=0(人离开)。老人多次经过玄关(出门、回家、去厨房等),运动传感器应有更多触发记录。缺少离开状态(Occupancy=0)的上报,说明该传感器可能存在状态回报不完整的问题。", "推理步骤6: entrance_light(玄关灯)全天无任何日志记录,既没有开也没有关。虽然可能是老人未使用或无自动化联动,但结合其他传感器的异常,也值得关注。"], "key_evidence": ["front_door_contact 在 08:39:02 报告开门(StateValue=False)后,直到 20:38:10(约12小时后)才报告关门(StateValue=True),中间缺失关门事件", "08:39 进门流程中 front_door_lock 没有上锁记录,与 06:58 出门时完整的开锁-开门-关门-自动上锁流程形成对比", "entrance_occupancy 全天仅触发 2 次 Occupancy=1,且从未报告 Occupancy=0,状态上报不完整", "entrance_light 全天零记录,无任何开关状态变化"], "recommended_actions": ["立即检查入户门传感器(front_door_contact)的电池电量和安装位置,确认磁铁与传感器之间的间距是否正常,排除物理偏移导致的漏报", "检查入户门锁(front_door_lock)的自动上锁功能是否正常工作,确认 08:39 进门后门锁是否实际上锁但未上报", "检查玄关运动传感器(entrance_occupancy)的灵敏度设置和电池状态,确认其是否能正常检测到人员经过并上报离开状态", "在排查期间,建议为独居老人启用入户门长时间未关闭的告警规则(如开门超过5分钟未关闭则推送通知给紧急联系人)", "检查玄关灯(entrance_light)是否已接入系统并正常通信,确认设备在线状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.158751249313354, "api_error": null} {"episode_id": "SQ1_TN_D_0146", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0146.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20260775, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常,多次出入事件中传感器响应不完整或缺失。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。\",\n \"推理步骤2: 06:50 早晨出门事件——门锁解锁(LockOperationType=1)、门传感器触发(False→True,表示开→关)、玄关运动传感器触发(Occupancy=1)、门锁自动上锁(LockOperationType=0)。这一组事件序列完整,各传感器协同正常。\",\n \"推理步骤3: 08:30 回家事件——门锁解锁(LockOperationType=1)、门传感器仅报告了 StateValue=False(门开),但始终没有报告 StateValue=True(门关)。对比 06:50 的完整开关序列,这里缺少了关门事件,说明 front_door_contact 可能漏报了关门状态,或者入户门实际未完全关好。\",\n \"推理步骤4: 20:48 睡前锁门事件——门传感器报告 StateValue=True(门关闭),门锁自动上锁(LockOperationType=0, LockState=1)。但在此之前没有对应的开门(StateValue=False)记录,也没有解锁记录。这意味着要么门从 08:30 起一直处于开启状态长达约 12 小时才被关上,要么 front_door_contact 在中间漏报了状态变化。\",\n \"推理步骤5: 玄关运动传感器(entrance_occupancy)在 06:50 和 08:30 各触发了一次 Occupancy=1,但全天没有任何一次 Occupancy=0 的复位记录。正常的运动传感器在人员离开后应回报占用结束。对比 bathroom_occupancy 在 05:55 和 20:48 都有正常的 Occupancy=0 复位,entrance_occupancy 从未复位,说明该传感器可能存在状态卡死或复位机制故障。\",\n \"推理步骤6: 玄关灯(entrance_light)全天没有任何开关记录。虽然玄关灯可能不常用,但结合两次明确的出入事件(06:50 和 08:30 都有运动检测),如果配置了联动自动开灯却未触发,也可能暗示联动链路异常;若未配置联动则属正常,此项单独不构成故障判断。\",\n \"推理步骤7: 综合来看,front_door_contact 在 08:30 丢失了关门事件,且从 08:30 到 20:48 之间长达 12 小时没有状态变化(独居老人场景下入户门长时间敞开是安全隐患);entrance_occupancy 从未报告 Occupancy=0,存在状态卡死嫌疑。两个传感器均表现异常。\"\n ],\n \"key_evidence\": [\n \"08:30 回家时 front_door_contact 仅报告 StateValue=False(开门),缺少 StateValue=True(关门)事件,与 06:50 的完整开关序列不一致\",\n \"20:48 出现 front_door_contact StateValue=True(关门)和自动上锁,但之前无对应的开门和解锁记录,意味着门可能从 08:30 起敞开了约 12 小时\",\n \"entrance_occupancy 在 06:50 和 08:30 两次触发 Occupancy=1,但全天未出现任何 Occupancy=0 复位事件,而同类型的 bathroom_occupancy 有正常的 0/1 交替\",\n \"entrance_light 全天无任何状态变化记录,尽管有两次明确的人员通过玄关的事件\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和电池电量,确认磁铁对齐是否正常,必要时重新配对或更换设备\",\n \"检查玄关运动传感器(entrance_occupancy)是否存在固件问题或状态卡死,尝试重启设备并观察是否能正常报告 Occupancy=0\",\n \"在传感器修复前,建议为独居老人设置入户门长时间未关闭的告警规则(如超过 10 分钟未检测到关门则推送通知给家属)\",\n \"检查玄关灯(entrance_light)是否在系统中正常在线,确认其联动规则配置是否正确\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常,多次出入事件中传感器响应不完整或缺失。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。", "推理步骤2: 06:50 早晨出门事件——门锁解锁(LockOperationType=1)、门传感器触发(False→True,表示开→关)、玄关运动传感器触发(Occupancy=1)、门锁自动上锁(LockOperationType=0)。这一组事件序列完整,各传感器协同正常。", "推理步骤3: 08:30 回家事件——门锁解锁(LockOperationType=1)、门传感器仅报告了 StateValue=False(门开),但始终没有报告 StateValue=True(门关)。对比 06:50 的完整开关序列,这里缺少了关门事件,说明 front_door_contact 可能漏报了关门状态,或者入户门实际未完全关好。", "推理步骤4: 20:48 睡前锁门事件——门传感器报告 StateValue=True(门关闭),门锁自动上锁(LockOperationType=0, LockState=1)。但在此之前没有对应的开门(StateValue=False)记录,也没有解锁记录。这意味着要么门从 08:30 起一直处于开启状态长达约 12 小时才被关上,要么 front_door_contact 在中间漏报了状态变化。", "推理步骤5: 玄关运动传感器(entrance_occupancy)在 06:50 和 08:30 各触发了一次 Occupancy=1,但全天没有任何一次 Occupancy=0 的复位记录。正常的运动传感器在人员离开后应回报占用结束。对比 bathroom_occupancy 在 05:55 和 20:48 都有正常的 Occupancy=0 复位,entrance_occupancy 从未复位,说明该传感器可能存在状态卡死或复位机制故障。", "推理步骤6: 玄关灯(entrance_light)全天没有任何开关记录。虽然玄关灯可能不常用,但结合两次明确的出入事件(06:50 和 08:30 都有运动检测),如果配置了联动自动开灯却未触发,也可能暗示联动链路异常;若未配置联动则属正常,此项单独不构成故障判断。", "推理步骤7: 综合来看,front_door_contact 在 08:30 丢失了关门事件,且从 08:30 到 20:48 之间长达 12 小时没有状态变化(独居老人场景下入户门长时间敞开是安全隐患);entrance_occupancy 从未报告 Occupancy=0,存在状态卡死嫌疑。两个传感器均表现异常。"], "key_evidence": ["08:30 回家时 front_door_contact 仅报告 StateValue=False(开门),缺少 StateValue=True(关门)事件,与 06:50 的完整开关序列不一致", "20:48 出现 front_door_contact StateValue=True(关门)和自动上锁,但之前无对应的开门和解锁记录,意味着门可能从 08:30 起敞开了约 12 小时", "entrance_occupancy 在 06:50 和 08:30 两次触发 Occupancy=1,但全天未出现任何 Occupancy=0 复位事件,而同类型的 bathroom_occupancy 有正常的 0/1 交替", "entrance_light 全天无任何状态变化记录,尽管有两次明确的人员通过玄关的事件"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和电池电量,确认磁铁对齐是否正常,必要时重新配对或更换设备", "检查玄关运动传感器(entrance_occupancy)是否存在固件问题或状态卡死,尝试重启设备并观察是否能正常报告 Occupancy=0", "在传感器修复前,建议为独居老人设置入户门长时间未关闭的告警规则(如超过 10 分钟未检测到关门则推送通知给家属)", "检查玄关灯(entrance_light)是否在系统中正常在线,确认其联动规则配置是否正确"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.966766595840454, "api_error": null} {"episode_id": "SQ1_TN_D_0151", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0151.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20260780, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卫生间漏水传感器全天无任何数据上报,疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间共有3个传感器——卫生间灯(bathroom_light)、运动传感器(bathroom_occupancy)、漏水传感器(bathroom_water_leak)。\",\n \"推理步骤2: 卫生间灯和运动传感器在全天日志中均有正常事件记录:05:46 运动检测+开灯、06:10 关灯、20:32 运动检测+开灯、20:42 关灯、20:43 运动清除,行为模式与独居老人早晚使用卫生间的习惯完全吻合。\",\n \"推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有出现任何一条记录——既没有正常的心跳/状态上报,也没有漏水告警。\",\n \"推理步骤4: 作为对比,厨房漏水传感器(kitchen_water_leak)同样全天无记录,但漏水传感器属于事件触发型设备,无漏水时不上报是可以理解的。然而,Matter 协议下设备通常会有周期性的心跳或属性订阅报告来确认在线状态,全天完全静默仍值得关注。\",\n \"推理步骤5: 对于独居老人家庭,卫生间是跌倒和漏水高风险区域,漏水传感器的可用性尤为重要。如果该传感器已离线或电池耗尽,一旦发生漏水将无法及时告警,存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 2026-06-03 全天24小时日志中无任何事件或状态上报记录\",\n \"bathroom_light 和 bathroom_occupancy 工作正常,分别在 05:46 和 20:32 两个时段有符合预期的状态变化\",\n \"漏水传感器作为安全类设备,长时间无心跳上报可能意味着设备离线、电池耗尽或通信故障\"\n ],\n \"recommended_actions\": [\n \"检查卫生间漏水传感器(bathroom_water_leak)的在线状态和电池电量,确认设备是否仍在网络中\",\n \"手动触发漏水传感器测试(如在传感器探头处滴少量水),验证其检测和上报功能是否正常\",\n \"如确认故障,及时更换电池或设备,确保卫生间漏水监测不留盲区\",\n \"建议为漏水传感器配置离线告警规则,当设备超过一定时间未上报时自动通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卫生间漏水传感器全天无任何数据上报,疑似离线或故障。", "reasoning": ["推理步骤1: 卫生间共有3个传感器——卫生间灯(bathroom_light)、运动传感器(bathroom_occupancy)、漏水传感器(bathroom_water_leak)。", "推理步骤2: 卫生间灯和运动传感器在全天日志中均有正常事件记录:05:46 运动检测+开灯、06:10 关灯、20:32 运动检测+开灯、20:42 关灯、20:43 运动清除,行为模式与独居老人早晚使用卫生间的习惯完全吻合。", "推理步骤3: 卫生间漏水传感器(bathroom_water_leak)在整个24小时日志中没有出现任何一条记录——既没有正常的心跳/状态上报,也没有漏水告警。", "推理步骤4: 作为对比,厨房漏水传感器(kitchen_water_leak)同样全天无记录,但漏水传感器属于事件触发型设备,无漏水时不上报是可以理解的。然而,Matter 协议下设备通常会有周期性的心跳或属性订阅报告来确认在线状态,全天完全静默仍值得关注。", "推理步骤5: 对于独居老人家庭,卫生间是跌倒和漏水高风险区域,漏水传感器的可用性尤为重要。如果该传感器已离线或电池耗尽,一旦发生漏水将无法及时告警,存在安全隐患。"], "key_evidence": ["bathroom_water_leak 在 2026-06-03 全天24小时日志中无任何事件或状态上报记录", "bathroom_light 和 bathroom_occupancy 工作正常,分别在 05:46 和 20:32 两个时段有符合预期的状态变化", "漏水传感器作为安全类设备,长时间无心跳上报可能意味着设备离线、电池耗尽或通信故障"], "recommended_actions": ["检查卫生间漏水传感器(bathroom_water_leak)的在线状态和电池电量,确认设备是否仍在网络中", "手动触发漏水传感器测试(如在传感器探头处滴少量水),验证其检测和上报功能是否正常", "如确认故障,及时更换电池或设备,确保卫生间漏水监测不留盲区", "建议为漏水传感器配置离线告警规则,当设备超过一定时间未上报时自动通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.935617208480835, "api_error": null} {"episode_id": "SQ1_TN_D_0153", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0153.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260782, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 1.3083860874176025, "api_error": "400 Client Error: Bad Request for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ1_TN_D_0152", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0152.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20260781, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常:门锁有开关门操作但门磁传感器状态不一致,且运动传感器在多次有人通过时未触发或行为不完整。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在日志中的表现。\",\n \"推理步骤2: 07:05 出门事件——门锁手动解锁(LockOperationType=1),门磁先报 False(开门) 再报 True(关门),时间间隔不到1秒(07:05:11两条),这个开关门间隔异常短,正常人通过一扇门至少需要几秒。随后 entrance_occupancy 在 07:05:12 才触发,而门已经关上了,时序上运动传感器反应滞后。\",\n \"推理步骤3: 08:36 回家事件——门锁手动解锁,门磁仅报告了 False(开门),但整个日志中没有对应的 True(关门) 记录,说明门磁传感器未检测到关门动作,或者入户门实际上一直处于未关闭状态。这是一个明显的异常。\",\n \"推理步骤4: 20:38 睡前事件——门磁报告 True(关门状态)、门锁自动上锁,但在此之前没有对应的开门(False)记录。这说明门磁在 08:36 开门后一直没有报告状态变化,直到 20:38 才恢复报告,中间长达约12小时的状态缺失。\",\n \"推理步骤5: 玄关运动传感器(entrance_occupancy)全天仅在 07:05:12 和 08:36:03 触发了两次 Occupancy=1,但从未报告过 Occupancy=0(离开),说明传感器要么无法检测到人员离开,要么存在状态上报故障。\",\n \"推理步骤6: 玄关灯(entrance_light)全天没有任何状态变化记录。考虑到老人早晚进出,玄关灯完全无动作可能是正常的(手动未开),但也可能是联动失效,需结合其他异常综合判断。\",\n \"推理步骤7: 综合来看,front_door_contact 存在漏报(08:36开门后未报关门)和时序异常(07:05开关门间隔<1秒),entrance_occupancy 存在只触发占用而从不清除的问题。这些都指向传感器硬件故障或通信不稳定。\"\n ],\n \"key_evidence\": [\n \"08:36:02 门磁报告开门(False),但之后无对应关门(True)记录,直到20:38:16才出现True,中间间隔约12小时\",\n \"07:05:11 门磁在同一秒内连续报告 False→True,开关门间隔不足1秒,不符合正常通行时间\",\n \"entrance_occupancy 全天仅报告2次 Occupancy=1,且从未报告 Occupancy=0,传感器未正常清除占用状态\",\n \"entrance_light 全天零记录,无法确认玄关区域自动化联动是否正常工作\"\n ],\n \"recommended_actions\": [\n \"检查入户门磁传感器(front_door_contact)的安装位置和电池电量,可能存在磁铁偏移或信号丢失导致漏报\",\n \"检查玄关运动传感器(entrance_occupancy)是否存在固件问题或灵敏度设置异常,重点排查为何无法报告 Occupancy=0\",\n \"对独居老人场景,入户门传感器是判断出入安全的关键设备,建议尽快维修或更换故障传感器\",\n \"临时措施:在传感器修复前,可通过门锁事件日志替代门磁来监控出入状态,但应尽快恢复冗余检测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)存在工作异常:门锁有开关门操作但门磁传感器状态不一致,且运动传感器在多次有人通过时未触发或行为不完整。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在日志中的表现。", "推理步骤2: 07:05 出门事件——门锁手动解锁(LockOperationType=1),门磁先报 False(开门) 再报 True(关门),时间间隔不到1秒(07:05:11两条),这个开关门间隔异常短,正常人通过一扇门至少需要几秒。随后 entrance_occupancy 在 07:05:12 才触发,而门已经关上了,时序上运动传感器反应滞后。", "推理步骤3: 08:36 回家事件——门锁手动解锁,门磁仅报告了 False(开门),但整个日志中没有对应的 True(关门) 记录,说明门磁传感器未检测到关门动作,或者入户门实际上一直处于未关闭状态。这是一个明显的异常。", "推理步骤4: 20:38 睡前事件——门磁报告 True(关门状态)、门锁自动上锁,但在此之前没有对应的开门(False)记录。这说明门磁在 08:36 开门后一直没有报告状态变化,直到 20:38 才恢复报告,中间长达约12小时的状态缺失。", "推理步骤5: 玄关运动传感器(entrance_occupancy)全天仅在 07:05:12 和 08:36:03 触发了两次 Occupancy=1,但从未报告过 Occupancy=0(离开),说明传感器要么无法检测到人员离开,要么存在状态上报故障。", "推理步骤6: 玄关灯(entrance_light)全天没有任何状态变化记录。考虑到老人早晚进出,玄关灯完全无动作可能是正常的(手动未开),但也可能是联动失效,需结合其他异常综合判断。", "推理步骤7: 综合来看,front_door_contact 存在漏报(08:36开门后未报关门)和时序异常(07:05开关门间隔<1秒),entrance_occupancy 存在只触发占用而从不清除的问题。这些都指向传感器硬件故障或通信不稳定。"], "key_evidence": ["08:36:02 门磁报告开门(False),但之后无对应关门(True)记录,直到20:38:16才出现True,中间间隔约12小时", "07:05:11 门磁在同一秒内连续报告 False→True,开关门间隔不足1秒,不符合正常通行时间", "entrance_occupancy 全天仅报告2次 Occupancy=1,且从未报告 Occupancy=0,传感器未正常清除占用状态", "entrance_light 全天零记录,无法确认玄关区域自动化联动是否正常工作"], "recommended_actions": ["检查入户门磁传感器(front_door_contact)的安装位置和电池电量,可能存在磁铁偏移或信号丢失导致漏报", "检查玄关运动传感器(entrance_occupancy)是否存在固件问题或灵敏度设置异常,重点排查为何无法报告 Occupancy=0", "对独居老人场景,入户门传感器是判断出入安全的关键设备,建议尽快维修或更换故障传感器", "临时措施:在传感器修复前,可通过门锁事件日志替代门磁来监控出入状态,但应尽快恢复冗余检测能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.538674116134644, "api_error": null} {"episode_id": "SQ1_TN_D_0154", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0154.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20260783, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器存在故障或被高温干扰导致读数失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在非烹饪时段正常报告温度数据(如凌晨至早晨的半小时间隔读数稳定在 2294-2310 范围)。\",\n \"推理步骤2: 每次灶具开启后约30秒至1分钟,温度传感器即报告 MeasuredValue = None(06:06:06、10:56:00、16:55:00),且在灶具关闭后仍有一次 None 读数(06:28:00、11:39:00、17:25:00)。\",\n \"推理步骤3: 这一模式在当天三次烹饪中完全重复出现(早餐06:05-06:27、午餐10:55-11:38、晚餐16:54-17:24),说明不是偶发通信故障,而是与灶具运行存在系统性关联。\",\n \"推理步骤4: 正常温度传感器不应因环境温度升高而返回 None,应返回一个较高的数值或触发过温告警。返回 None 表明传感器超出量程、通信中断或硬件保护性关机。\",\n \"推理步骤5: 灶具关闭后,下一个半小时整点读数恢复正常(06:30 报 2399、11:00 报 2550、17:30 报 2487),说明传感器本身未永久损坏,但在高温环境下无法正常工作。\"\n ],\n \"key_evidence\": [\n \"三次烹饪期间厨房温度传感器均报告 MeasuredValue = None(共6次:06:06、06:28、10:56、11:39、16:55、17:25)\",\n \"灶具关闭后传感器恢复正常读数,故障与灶具运行高度相关\",\n \"其他房间温度传感器(客厅、卧室)全天无 None 值,排除系统性通信问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出工作温度范围\",\n \"将传感器迁移至远离灶具热源的位置(建议距离灶具至少1米以上)\",\n \"检查传感器规格书确认其最大工作温度,评估是否需要更换为耐高温型号\",\n \"在传感器失效期间,厨房缺乏温度监控能力,存在火灾风险盲区,建议增加独立的高温报警装置作为补充\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器存在故障或被高温干扰导致读数失效。", "reasoning": ["推理步骤1: 厨房温度传感器在非烹饪时段正常报告温度数据(如凌晨至早晨的半小时间隔读数稳定在 2294-2310 范围)。", "推理步骤2: 每次灶具开启后约30秒至1分钟,温度传感器即报告 MeasuredValue = None(06:06:06、10:56:00、16:55:00),且在灶具关闭后仍有一次 None 读数(06:28:00、11:39:00、17:25:00)。", "推理步骤3: 这一模式在当天三次烹饪中完全重复出现(早餐06:05-06:27、午餐10:55-11:38、晚餐16:54-17:24),说明不是偶发通信故障,而是与灶具运行存在系统性关联。", "推理步骤4: 正常温度传感器不应因环境温度升高而返回 None,应返回一个较高的数值或触发过温告警。返回 None 表明传感器超出量程、通信中断或硬件保护性关机。", "推理步骤5: 灶具关闭后,下一个半小时整点读数恢复正常(06:30 报 2399、11:00 报 2550、17:30 报 2487),说明传感器本身未永久损坏,但在高温环境下无法正常工作。"], "key_evidence": ["三次烹饪期间厨房温度传感器均报告 MeasuredValue = None(共6次:06:06、06:28、10:56、11:39、16:55、17:25)", "灶具关闭后传感器恢复正常读数,故障与灶具运行高度相关", "其他房间温度传感器(客厅、卧室)全天无 None 值,排除系统性通信问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出工作温度范围", "将传感器迁移至远离灶具热源的位置(建议距离灶具至少1米以上)", "检查传感器规格书确认其最大工作温度,评估是否需要更换为耐高温型号", "在传感器失效期间,厨房缺乏温度监控能力,存在火灾风险盲区,建议增加独立的高温报警装置作为补充"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.207321405410767, "api_error": null} {"episode_id": "SQ1_TN_D_0163", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0163.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20260792, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开启期间及关闭后短时间内持续报告 None(空值),表明传感器存在间歇性故障,可能因高温导致读数丢失。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具未工作时(00:00-05:51)每30分钟正常上报温度数据,数值在2292-2308范围内波动,属于正常。\",\n \"推理步骤2: 第一次灶具开启(05:51:34),约30秒后(05:52:04)温度传感器上报 MeasuredValue = None;灶具关闭(06:32:00)后1分钟(06:33:00)再次上报 None。但到06:30和07:00的定时上报恢复了正常数值。\",\n \"推理步骤3: 第二次灶具开启(11:10:30),约30秒后(11:11:00)上报 None;灶具关闭(11:40:00)后1分钟(11:41:00)再次上报 None。定时上报在11:30和12:00恢复正常。\",\n \"推理步骤4: 第三次灶具开启(16:51:30),约30秒后(16:52:00)上报 None;灶具关闭(17:39:00)后1分钟(17:40:00)再次上报 None。定时上报在17:00和17:30恢复正常。\",\n \"推理步骤5: 三次灶具使用期间出现完全一致的模式——灶具开启/关闭后传感器短暂报告 None,说明这不是随机通信故障,而是与灶具工作状态高度相关的系统性问题。传感器可能在灶具产生的高温或电磁干扰下暂时失效。\",\n \"推理步骤6: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具工作时恰好无法提供温度读数,意味着在最需要监测的时段反而存在监测盲区,这是一个安全隐患。\"\n ],\n \"key_evidence\": [\n \"灶具开启后约30秒,温度传感器连续三次上报 MeasuredValue = None(05:52:04、11:11:00、16:52:00)\",\n \"灶具关闭后约1分钟,温度传感器也连续三次上报 MeasuredValue = None(06:33:00、11:41:00、17:40:00)\",\n \"三次故障模式完全一致,与灶具 OnOff 状态变化强相关,非灶具工作时段传感器读数正常\",\n \"每次 None 之后的下一个定时上报(30分钟周期)均恢复正常数值,说明传感器并非永久损坏而是间歇性失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温直接影响或热辐射干扰\",\n \"检查传感器与灶具之间是否存在电磁干扰(EMI),灶具启停瞬间的电流变化可能影响传感器通信或采样\",\n \"考虑将温度传感器重新安装到距灶具更远但仍能有效监测厨房整体温度的位置\",\n \"如重新定位后问题依旧,建议更换传感器为耐高温型号或增加一个冗余温度传感器\",\n \"在传感器修复前,提醒老人使用灶具时格外注意安全,确保烟雾报警器(kitchen_smoke_alarm)工作正常作为备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开启期间及关闭后短时间内持续报告 None(空值),表明传感器存在间歇性故障,可能因高温导致读数丢失。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具未工作时(00:00-05:51)每30分钟正常上报温度数据,数值在2292-2308范围内波动,属于正常。", "推理步骤2: 第一次灶具开启(05:51:34),约30秒后(05:52:04)温度传感器上报 MeasuredValue = None;灶具关闭(06:32:00)后1分钟(06:33:00)再次上报 None。但到06:30和07:00的定时上报恢复了正常数值。", "推理步骤3: 第二次灶具开启(11:10:30),约30秒后(11:11:00)上报 None;灶具关闭(11:40:00)后1分钟(11:41:00)再次上报 None。定时上报在11:30和12:00恢复正常。", "推理步骤4: 第三次灶具开启(16:51:30),约30秒后(16:52:00)上报 None;灶具关闭(17:39:00)后1分钟(17:40:00)再次上报 None。定时上报在17:00和17:30恢复正常。", "推理步骤5: 三次灶具使用期间出现完全一致的模式——灶具开启/关闭后传感器短暂报告 None,说明这不是随机通信故障,而是与灶具工作状态高度相关的系统性问题。传感器可能在灶具产生的高温或电磁干扰下暂时失效。", "推理步骤6: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具工作时恰好无法提供温度读数,意味着在最需要监测的时段反而存在监测盲区,这是一个安全隐患。"], "key_evidence": ["灶具开启后约30秒,温度传感器连续三次上报 MeasuredValue = None(05:52:04、11:11:00、16:52:00)", "灶具关闭后约1分钟,温度传感器也连续三次上报 MeasuredValue = None(06:33:00、11:41:00、17:40:00)", "三次故障模式完全一致,与灶具 OnOff 状态变化强相关,非灶具工作时段传感器读数正常", "每次 None 之后的下一个定时上报(30分钟周期)均恢复正常数值,说明传感器并非永久损坏而是间歇性失效"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温直接影响或热辐射干扰", "检查传感器与灶具之间是否存在电磁干扰(EMI),灶具启停瞬间的电流变化可能影响传感器通信或采样", "考虑将温度传感器重新安装到距灶具更远但仍能有效监测厨房整体温度的位置", "如重新定位后问题依旧,建议更换传感器为耐高温型号或增加一个冗余温度传感器", "在传感器修复前,提醒老人使用灶具时格外注意安全,确保烟雾报警器(kitchen_smoke_alarm)工作正常作为备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.8809711933136, "api_error": null} {"episode_id": "SQ1_TN_D_0155", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0155.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260784, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)在老人外出和回家时的状态报告不一致,且玄关运动传感器(entrance_occupancy)存在漏报现象,指向传感器工作异常。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。\",\n \"推理步骤2: 07:10 老人出门事件——门锁手动解锁(LockOperationType=1),门传感器报告开门(StateValue=False)再关门(StateValue=True),玄关运动传感器触发(Occupancy=1),门锁自动上锁。这一组事件逻辑完整,传感器工作正常。\",\n \"推理步骤3: 08:21 老人回家事件——门锁手动解锁,门传感器报告开门(StateValue=False),玄关运动传感器触发(Occupancy=1),客厅检测到人。但此后日志中没有 front_door_contact 恢复为 True(关门)的记录,也没有门锁重新上锁的记录。这意味着要么门一直开着没关(对独居老人来说极不合理,且后续无任何入侵迹象),要么门传感器未能正确报告关门状态。\",\n \"推理步骤4: 直到 20:40:07 才出现 front_door_contact StateValue=True 和门锁自动上锁。这距离 08:21 已过去超过 12 小时。在此期间老人一直在家活动(做午饭、午休、做晚饭等),门却显示为'开启'状态长达 12 小时,这在独居老人场景下极不合理。\",\n \"推理步骤5: 20:40 的关门/上锁事件发生时,老人正从客厅经卫生间走向卧室准备睡觉,并没有出门/进门的动作,玄关也没有运动检测触发。门传感器在无人经过玄关的情况下突然报告关门,进一步说明该传感器状态报告存在延迟或粘滞故障。\",\n \"推理步骤6: 玄关运动传感器(entrance_occupancy)在 07:10 和 08:21 两次触发后,全天再无 Occupancy=0 的复位记录。正常的占用传感器在人离开后应回报 Occupancy=0,缺失复位事件说明该传感器可能存在状态卡死或复位超时的问题。\",\n \"推理步骤7: 玄关灯(entrance_light)全天没有任何开关记录,即使老人两次经过玄关(出门和回家)也未触发。如果玄关灯与运动传感器联动,则可能是联动规则失效;如果是手动控制,则属正常但值得关注。\",\n \"推理步骤8: 门锁本身工作基本正常(解锁、上锁事件均有记录),问题集中在 front_door_contact 和 entrance_occupancy 两个传感器上。\"\n ],\n \"key_evidence\": [\n \"08:21 开门后 front_door_contact 未报告关门(StateValue=True),直到 12 小时后的 20:40:07 才恢复,期间老人一直在家\",\n \"20:40 关门事件发生时玄关无运动检测触发,老人实际在卧室/卫生间区域活动,说明门传感器状态变化与实际物理事件不匹配\",\n \"entrance_occupancy 在 07:10 和 08:21 两次触发 Occupancy=1 后,全天无 Occupancy=0 复位记录\",\n \"玄关灯(entrance_light)全天零记录,老人两次经过玄关均未触发\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和电池电量,磁铁与传感器之间的间距可能过大导致状态粘滞或漏报\",\n \"检查玄关运动传感器(entrance_occupancy)是否存在固件问题或超时配置异常,确认其能正常复位到 Occupancy=0\",\n \"对 front_door_contact 进行多次开关门测试,验证其是否能及时、准确地报告状态变化\",\n \"考虑为入户门区域增加冗余传感器,对独居老人场景来说入户门状态的准确性直接关系到安防可靠性\",\n \"检查玄关灯的联动规则或手动开关是否正常工作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)在老人外出和回家时的状态报告不一致,且玄关运动传感器(entrance_occupancy)存在漏报现象,指向传感器工作异常。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。逐一检查它们在全天日志中的表现。", "推理步骤2: 07:10 老人出门事件——门锁手动解锁(LockOperationType=1),门传感器报告开门(StateValue=False)再关门(StateValue=True),玄关运动传感器触发(Occupancy=1),门锁自动上锁。这一组事件逻辑完整,传感器工作正常。", "推理步骤3: 08:21 老人回家事件——门锁手动解锁,门传感器报告开门(StateValue=False),玄关运动传感器触发(Occupancy=1),客厅检测到人。但此后日志中没有 front_door_contact 恢复为 True(关门)的记录,也没有门锁重新上锁的记录。这意味着要么门一直开着没关(对独居老人来说极不合理,且后续无任何入侵迹象),要么门传感器未能正确报告关门状态。", "推理步骤4: 直到 20:40:07 才出现 front_door_contact StateValue=True 和门锁自动上锁。这距离 08:21 已过去超过 12 小时。在此期间老人一直在家活动(做午饭、午休、做晚饭等),门却显示为'开启'状态长达 12 小时,这在独居老人场景下极不合理。", "推理步骤5: 20:40 的关门/上锁事件发生时,老人正从客厅经卫生间走向卧室准备睡觉,并没有出门/进门的动作,玄关也没有运动检测触发。门传感器在无人经过玄关的情况下突然报告关门,进一步说明该传感器状态报告存在延迟或粘滞故障。", "推理步骤6: 玄关运动传感器(entrance_occupancy)在 07:10 和 08:21 两次触发后,全天再无 Occupancy=0 的复位记录。正常的占用传感器在人离开后应回报 Occupancy=0,缺失复位事件说明该传感器可能存在状态卡死或复位超时的问题。", "推理步骤7: 玄关灯(entrance_light)全天没有任何开关记录,即使老人两次经过玄关(出门和回家)也未触发。如果玄关灯与运动传感器联动,则可能是联动规则失效;如果是手动控制,则属正常但值得关注。", "推理步骤8: 门锁本身工作基本正常(解锁、上锁事件均有记录),问题集中在 front_door_contact 和 entrance_occupancy 两个传感器上。"], "key_evidence": ["08:21 开门后 front_door_contact 未报告关门(StateValue=True),直到 12 小时后的 20:40:07 才恢复,期间老人一直在家", "20:40 关门事件发生时玄关无运动检测触发,老人实际在卧室/卫生间区域活动,说明门传感器状态变化与实际物理事件不匹配", "entrance_occupancy 在 07:10 和 08:21 两次触发 Occupancy=1 后,全天无 Occupancy=0 复位记录", "玄关灯(entrance_light)全天零记录,老人两次经过玄关均未触发"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和电池电量,磁铁与传感器之间的间距可能过大导致状态粘滞或漏报", "检查玄关运动传感器(entrance_occupancy)是否存在固件问题或超时配置异常,确认其能正常复位到 Occupancy=0", "对 front_door_contact 进行多次开关门测试,验证其是否能及时、准确地报告状态变化", "考虑为入户门区域增加冗余传感器,对独居老人场景来说入户门状态的准确性直接关系到安防可靠性", "检查玄关灯的联动规则或手动开关是否正常工作"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.107637882232666, "api_error": null} {"episode_id": "SQ1_TN_D_0177", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0177.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260806, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在间歇性读数丢失(报告None),卫生间漏水传感器全天无任何上报记录,可能存在离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间区域共有3个传感器——运动传感器(bathroom_occupancy)、灯(bathroom_light)、漏水传感器(bathroom_water_leak)。\",\n \"推理步骤2: bathroom_occupancy 在05:30和20:24分别检测到有人,20:41报告无人,工作正常;bathroom_light 在对应时段正常开关,工作正常。\",\n \"推理步骤3: bathroom_water_leak 在整个24小时日志中没有任何一条上报记录。对于漏水传感器,虽然没有漏水时不会触发报警,但通常设备会周期性上报心跳或状态(如StateValue=0表示无漏水)。全天完全无记录,可能表明设备离线、电池耗尽或通信故障。\",\n \"推理步骤4: 对于独居老人场景,卫生间漏水传感器是重要的安全设备,若其处于离线状态而未被发现,一旦发生漏水将无法及时报警,存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 全天24小时无任何状态上报记录\",\n \"同区域的 bathroom_occupancy 和 bathroom_light 均有正常事件记录,排除整个区域通信中断的可能\",\n \"kitchen_temp_sensor 在灶具开启/关闭时多次报告 MeasuredValue = None,也存在传感器异常\"\n ],\n \"recommended_actions\": [\n \"检查卫生间漏水传感器(bathroom_water_leak)的在线状态、电池电量和网络连接\",\n \"对该传感器进行手动测试(如模拟少量水滴)确认其检测功能是否正常\",\n \"检查厨房温度传感器在灶具使用期间报告None的原因,可能是高温超出量程或传感器故障\",\n \"为关键安全传感器设置离线告警规则,确保设备掉线时能及时通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在间歇性读数丢失(报告None),卫生间漏水传感器全天无任何上报记录,可能存在离线或故障。", "reasoning": ["推理步骤1: 卫生间区域共有3个传感器——运动传感器(bathroom_occupancy)、灯(bathroom_light)、漏水传感器(bathroom_water_leak)。", "推理步骤2: bathroom_occupancy 在05:30和20:24分别检测到有人,20:41报告无人,工作正常;bathroom_light 在对应时段正常开关,工作正常。", "推理步骤3: bathroom_water_leak 在整个24小时日志中没有任何一条上报记录。对于漏水传感器,虽然没有漏水时不会触发报警,但通常设备会周期性上报心跳或状态(如StateValue=0表示无漏水)。全天完全无记录,可能表明设备离线、电池耗尽或通信故障。", "推理步骤4: 对于独居老人场景,卫生间漏水传感器是重要的安全设备,若其处于离线状态而未被发现,一旦发生漏水将无法及时报警,存在安全隐患。"], "key_evidence": ["bathroom_water_leak 全天24小时无任何状态上报记录", "同区域的 bathroom_occupancy 和 bathroom_light 均有正常事件记录,排除整个区域通信中断的可能", "kitchen_temp_sensor 在灶具开启/关闭时多次报告 MeasuredValue = None,也存在传感器异常"], "recommended_actions": ["检查卫生间漏水传感器(bathroom_water_leak)的在线状态、电池电量和网络连接", "对该传感器进行手动测试(如模拟少量水滴)确认其检测功能是否正常", "检查厨房温度传感器在灶具使用期间报告None的原因,可能是高温超出量程或传感器故障", "为关键安全传感器设置离线告警规则,确保设备掉线时能及时通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.090516328811646, "api_error": null} {"episode_id": "SQ1_TN_D_0172", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0172.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20260801, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅运动传感器疑似存在故障,老人在家期间长时间未报告占用状态变化,且入户门在老人外出归来后未记录关门/上锁动作。\",\n \"reasoning\": [\n \"推理步骤1: 客厅共有两个传感器——温度传感器(living_room_temp_sensor)和运动传感器(living_room_occupancy)。温度传感器每30分钟稳定上报数据,全天无缺失、无None值,数值随昼夜自然波动(夜间约23°C,午间峰值约25.9°C),表现完全正常。\",\n \"推理步骤2: 客厅运动传感器(living_room_occupancy)全天仅在08:39、13:57、19:28三个时刻报告了Occupancy=1事件,但从未报告过Occupancy=0(离开)事件。对比卫生间和卧室的运动传感器,它们都有明确的Occupancy=0回落记录。客厅传感器缺少离开事件,说明其占用状态清除机制可能存在异常,或者传感器未能正确检测到人员离开。\",\n \"推理步骤3: 更关键的是,老人06:55出门(前门开锁、开门、关门、自动上锁),08:39回来(前门开锁、开门、玄关检测到人),但08:39回来后前门传感器没有记录关门(StateValue=True)和上锁事件。直到20:38才出现front_door_contact=True和LockState=1的记录。这意味着入户门可能从08:39到20:38一直处于未关闭/未上锁状态,长达近12小时。这虽然不是客厅传感器本身的问题,但与客厅区域安全直接相关。\",\n \"推理步骤4: 客厅灯(living_room_light)在08:39开启、12:22关闭、13:57再次开启、20:32关闭,操作逻辑与老人的活动轨迹吻合,灯具工作正常。客厅窗帘和窗户传感器全天无事件记录,属于正常(未操作)。\",\n \"推理步骤5: 综合来看,客厅温度传感器和灯具工作正常,但运动传感器缺少Occupancy=0的回落事件,存在状态上报不完整的嫌疑,可能是传感器超时清除功能故障或通信丢包。\"\n ],\n \"key_evidence\": [\n \"living_room_occupancy 全天3次报告 Occupancy=1(08:39、13:57、19:28),但从未报告 Occupancy=0,与 bathroom_occupancy 有明确的 0/1 切换形成对比\",\n \"living_room_temp_sensor 全天每30分钟稳定上报,数值在2291-2590范围内随昼夜自然波动,无异常\",\n \"08:39 老人回家后,front_door_contact 和 front_door_lock 未记录关门上锁事件,直到20:38才出现关门上锁记录,入户门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"检查 living_room_occupancy 传感器的超时清除(unoccupied-to-occupied delay)配置,确认其是否能正常回报 Occupancy=0 状态\",\n \"检查 living_room_occupancy 传感器的通信质量和电池电量,排除丢包或低电量导致的事件丢失\",\n \"核实入户门锁在08:39回家后是否确实未关闭,如属实应提醒老人养成关门习惯,或配置自动关门/上锁策略\",\n \"考虑为独居老人场景增加客厅运动传感器的健康监测规则:若长时间无活动信号应触发关怀提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅运动传感器疑似存在故障,老人在家期间长时间未报告占用状态变化,且入户门在老人外出归来后未记录关门/上锁动作。", "reasoning": ["推理步骤1: 客厅共有两个传感器——温度传感器(living_room_temp_sensor)和运动传感器(living_room_occupancy)。温度传感器每30分钟稳定上报数据,全天无缺失、无None值,数值随昼夜自然波动(夜间约23°C,午间峰值约25.9°C),表现完全正常。", "推理步骤2: 客厅运动传感器(living_room_occupancy)全天仅在08:39、13:57、19:28三个时刻报告了Occupancy=1事件,但从未报告过Occupancy=0(离开)事件。对比卫生间和卧室的运动传感器,它们都有明确的Occupancy=0回落记录。客厅传感器缺少离开事件,说明其占用状态清除机制可能存在异常,或者传感器未能正确检测到人员离开。", "推理步骤3: 更关键的是,老人06:55出门(前门开锁、开门、关门、自动上锁),08:39回来(前门开锁、开门、玄关检测到人),但08:39回来后前门传感器没有记录关门(StateValue=True)和上锁事件。直到20:38才出现front_door_contact=True和LockState=1的记录。这意味着入户门可能从08:39到20:38一直处于未关闭/未上锁状态,长达近12小时。这虽然不是客厅传感器本身的问题,但与客厅区域安全直接相关。", "推理步骤4: 客厅灯(living_room_light)在08:39开启、12:22关闭、13:57再次开启、20:32关闭,操作逻辑与老人的活动轨迹吻合,灯具工作正常。客厅窗帘和窗户传感器全天无事件记录,属于正常(未操作)。", "推理步骤5: 综合来看,客厅温度传感器和灯具工作正常,但运动传感器缺少Occupancy=0的回落事件,存在状态上报不完整的嫌疑,可能是传感器超时清除功能故障或通信丢包。"], "key_evidence": ["living_room_occupancy 全天3次报告 Occupancy=1(08:39、13:57、19:28),但从未报告 Occupancy=0,与 bathroom_occupancy 有明确的 0/1 切换形成对比", "living_room_temp_sensor 全天每30分钟稳定上报,数值在2291-2590范围内随昼夜自然波动,无异常", "08:39 老人回家后,front_door_contact 和 front_door_lock 未记录关门上锁事件,直到20:38才出现关门上锁记录,入户门可能长时间未锁"], "recommended_actions": ["检查 living_room_occupancy 传感器的超时清除(unoccupied-to-occupied delay)配置,确认其是否能正常回报 Occupancy=0 状态", "检查 living_room_occupancy 传感器的通信质量和电池电量,排除丢包或低电量导致的事件丢失", "核实入户门锁在08:39回家后是否确实未关闭,如属实应提醒老人养成关门习惯,或配置自动关门/上锁策略", "考虑为独居老人场景增加客厅运动传感器的健康监测规则:若长时间无活动信号应触发关怀提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.206866979599, "api_error": null} {"episode_id": "SQ1_TN_D_0178", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0178.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20260807, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在老人外出期间长时间未上锁(08:37至20:42),且玄关运动传感器在老人回家时未触发,存在设备故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 早晨06:52老人出门时,门锁手动解锁(LockOperationType=1)、开门(StateValue=False)、出门后关门(StateValue=True)、门锁自动上锁(LockOperationType=0, LockState=1),玄关运动传感器也正常触发。这一系列流程完全正常。\",\n \"推理步骤3: 08:37老人回家时,门锁手动解锁、开门、玄关运动传感器触发,但之后日志中没有关门(front_door_contact StateValue=True)的记录,也没有门锁重新上锁(LockState=1)的记录。直到20:42才出现门锁上锁和门关闭的记录。\",\n \"推理步骤4: 这意味着从08:37到20:42长达约12小时,入户门处于未锁定状态(LockState=2)。对于独居老人来说,这是严重的安全隐患。可能原因:自动上锁功能在此次未触发(门传感器故障导致未检测到关门,从而未触发自动锁定)。\",\n \"推理步骤5: 20:42老人进入卧室时,日志显示 front_door_contact StateValue=True 和门锁自动上锁,说明此时门才被关好并锁上。但这与老人的位置(从客厅到卧室)不一致,更像是门传感器延迟报告或之前卡在开门状态。\",\n \"推理步骤6: 玄关运动传感器(entrance_occupancy)在全天仅在06:52和08:37触发了两次,但老人08:37回家后进入客厅,之后多次在卧室、厨房、卫生间之间移动,理论上应经过玄关区域,但传感器均未触发。这表明玄关运动传感器可能存在灵敏度不足或故障。\",\n \"推理步骤7: 玄关灯(entrance_light)全天无任何开关记录,结合运动传感器几乎不触发的情况,可能是联动自动化未配置,也可能是传感器故障导致灯未被触发。\"\n ],\n \"key_evidence\": [\n \"08:37门锁解锁、门打开后,缺少关门(front_door_contact StateValue=True)和重新上锁的记录,直到20:42才补上\",\n \"入户门从08:37到20:42处于未锁定状态长达约12小时\",\n \"老人全天在各房间间移动多次,但玄关运动传感器仅在06:52和08:37各触发一次,后续再无触发记录\",\n \"玄关灯全天零记录,未被任何事件触发\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和磁铁对齐情况,确认其能可靠检测到关门动作\",\n \"检查门锁的自动上锁策略,确认是否依赖门传感器状态触发,若是则门传感器故障会导致自动锁定失败\",\n \"为门锁增加超时自动上锁功能(如解锁后5分钟无关门信号则强制上锁),作为安全兜底\",\n \"检查玄关运动传感器(entrance_occupancy)的电池电量、安装角度和探测范围,可能存在灵敏度下降或遮挡问题\",\n \"考虑为独居老人场景增加门锁长时间未上锁的告警规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门锁在老人外出期间长时间未上锁(08:37至20:42),且玄关运动传感器在老人回家时未触发,存在设备故障。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 早晨06:52老人出门时,门锁手动解锁(LockOperationType=1)、开门(StateValue=False)、出门后关门(StateValue=True)、门锁自动上锁(LockOperationType=0, LockState=1),玄关运动传感器也正常触发。这一系列流程完全正常。", "推理步骤3: 08:37老人回家时,门锁手动解锁、开门、玄关运动传感器触发,但之后日志中没有关门(front_door_contact StateValue=True)的记录,也没有门锁重新上锁(LockState=1)的记录。直到20:42才出现门锁上锁和门关闭的记录。", "推理步骤4: 这意味着从08:37到20:42长达约12小时,入户门处于未锁定状态(LockState=2)。对于独居老人来说,这是严重的安全隐患。可能原因:自动上锁功能在此次未触发(门传感器故障导致未检测到关门,从而未触发自动锁定)。", "推理步骤5: 20:42老人进入卧室时,日志显示 front_door_contact StateValue=True 和门锁自动上锁,说明此时门才被关好并锁上。但这与老人的位置(从客厅到卧室)不一致,更像是门传感器延迟报告或之前卡在开门状态。", "推理步骤6: 玄关运动传感器(entrance_occupancy)在全天仅在06:52和08:37触发了两次,但老人08:37回家后进入客厅,之后多次在卧室、厨房、卫生间之间移动,理论上应经过玄关区域,但传感器均未触发。这表明玄关运动传感器可能存在灵敏度不足或故障。", "推理步骤7: 玄关灯(entrance_light)全天无任何开关记录,结合运动传感器几乎不触发的情况,可能是联动自动化未配置,也可能是传感器故障导致灯未被触发。"], "key_evidence": ["08:37门锁解锁、门打开后,缺少关门(front_door_contact StateValue=True)和重新上锁的记录,直到20:42才补上", "入户门从08:37到20:42处于未锁定状态长达约12小时", "老人全天在各房间间移动多次,但玄关运动传感器仅在06:52和08:37各触发一次,后续再无触发记录", "玄关灯全天零记录,未被任何事件触发"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和磁铁对齐情况,确认其能可靠检测到关门动作", "检查门锁的自动上锁策略,确认是否依赖门传感器状态触发,若是则门传感器故障会导致自动锁定失败", "为门锁增加超时自动上锁功能(如解锁后5分钟无关门信号则强制上锁),作为安全兜底", "检查玄关运动传感器(entrance_occupancy)的电池电量、安装角度和探测范围,可能存在灵敏度下降或遮挡问题", "考虑为独居老人场景增加门锁长时间未上锁的告警规则"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.96615219116211, "api_error": null} {"episode_id": "SQ1_TN_D_0181", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0181.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20260810, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间反复报告 None 值,存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在大部分时间(每30分钟一次的定时上报)能正常返回数值,说明设备并非完全离线。\",\n \"推理步骤2: 但在灶具开启期间或关闭后不久,传感器多次报告 MeasuredValue = None。具体出现在 06:09(灶具06:08开)、06:21(灶具06:20关后1分钟)、11:00(灶具10:59开)、11:31(灶具11:30关后1分钟)、16:51(灶具16:50开)、17:34(灶具17:33关后1分钟)。\",\n \"推理步骤3: 共出现6次 None 值,且全部与灶具操作在时间上强相关——要么在灶具刚开启后约1分钟,要么在灶具关闭后约1分钟。这排除了随机通信丢包的可能性。\",\n \"推理步骤4: 可能的故障原因:(1) 灶具工作时产生的高温或热辐射超出传感器量程,导致传感器返回无效值;(2) 灶具开关瞬间的电磁干扰影响传感器通信或采样;(3) 传感器本身在温度快速变化时存在固件缺陷,无法正确采样。\",\n \"推理步骤5: 值得注意的是,在 None 值出现后的下一个30分钟定时上报周期,传感器又能恢复正常数值(如06:30报告2395、11:00同时报告了None和2555、17:00报告2485),说明这是间歇性故障而非永久损坏。\",\n \"推理步骤6: 对于独居老人家庭,厨房温度传感器在灶具使用时失效是一个安全隐患——恰恰在最需要温度监控(防止火灾/过热)的时候,传感器无法提供有效数据。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器共出现6次 MeasuredValue = None,分别在 06:09、06:21、11:00、11:31、16:51、17:34\",\n \"6次 None 值全部与灶具 (kitchen_cook_surface) 的开启或关闭操作在时间上高度关联(间隔约1分钟内)\",\n \"在非灶具使用时段,传感器全天正常上报温度数据,无任何 None 值出现\",\n \"厨房烟雾报警器和漏水传感器全天无异常事件,排除环境因素导致的大范围设备故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到直接热辐射或蒸汽影响\",\n \"查看传感器的量程规格,确认灶具工作时的环境温度是否超出其测量范围\",\n \"检查传感器固件版本,联系厂商确认是否存在已知的温度骤变时采样异常的 bug,必要时升级固件\",\n \"考虑将传感器重新定位到距灶具稍远但仍能有效监测厨房整体温度的位置\",\n \"在传感器问题修复前,建议增加灶具使用时长的软件监控规则(如灶具持续开启超过一定时间自动告警),作为温度监控失效时的补偿措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间反复报告 None 值,存在间歇性故障。", "reasoning": ["推理步骤1: 厨房温度传感器在大部分时间(每30分钟一次的定时上报)能正常返回数值,说明设备并非完全离线。", "推理步骤2: 但在灶具开启期间或关闭后不久,传感器多次报告 MeasuredValue = None。具体出现在 06:09(灶具06:08开)、06:21(灶具06:20关后1分钟)、11:00(灶具10:59开)、11:31(灶具11:30关后1分钟)、16:51(灶具16:50开)、17:34(灶具17:33关后1分钟)。", "推理步骤3: 共出现6次 None 值,且全部与灶具操作在时间上强相关——要么在灶具刚开启后约1分钟,要么在灶具关闭后约1分钟。这排除了随机通信丢包的可能性。", "推理步骤4: 可能的故障原因:(1) 灶具工作时产生的高温或热辐射超出传感器量程,导致传感器返回无效值;(2) 灶具开关瞬间的电磁干扰影响传感器通信或采样;(3) 传感器本身在温度快速变化时存在固件缺陷,无法正确采样。", "推理步骤5: 值得注意的是,在 None 值出现后的下一个30分钟定时上报周期,传感器又能恢复正常数值(如06:30报告2395、11:00同时报告了None和2555、17:00报告2485),说明这是间歇性故障而非永久损坏。", "推理步骤6: 对于独居老人家庭,厨房温度传感器在灶具使用时失效是一个安全隐患——恰恰在最需要温度监控(防止火灾/过热)的时候,传感器无法提供有效数据。"], "key_evidence": ["厨房温度传感器共出现6次 MeasuredValue = None,分别在 06:09、06:21、11:00、11:31、16:51、17:34", "6次 None 值全部与灶具 (kitchen_cook_surface) 的开启或关闭操作在时间上高度关联(间隔约1分钟内)", "在非灶具使用时段,传感器全天正常上报温度数据,无任何 None 值出现", "厨房烟雾报警器和漏水传感器全天无异常事件,排除环境因素导致的大范围设备故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到直接热辐射或蒸汽影响", "查看传感器的量程规格,确认灶具工作时的环境温度是否超出其测量范围", "检查传感器固件版本,联系厂商确认是否存在已知的温度骤变时采样异常的 bug,必要时升级固件", "考虑将传感器重新定位到距灶具稍远但仍能有效监测厨房整体温度的位置", "在传感器问题修复前,建议增加灶具使用时长的软件监控规则(如灶具持续开启超过一定时间自动告警),作为温度监控失效时的补偿措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.071128606796265, "api_error": null} {"episode_id": "SQ1_TN_D_0183", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0183.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260812, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"卧室区域所有传感器工作正常,数据采集和响应均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次温度数据,无缺失、无 None 值。温度范围从夜间约 21.9°C 逐步升至午间约 24.8°C,再回落至夜间约 22.4°C,符合夏季(6月)昼夜温度变化的自然规律。\",\n \"推理步骤2: 卧室运动传感器(bedroom_occupancy)在 05:21(起床)、12:22(午休)、14:04(午休起身)、20:46(晚间就寝)四个时间点触发,与独居老人的典型作息节奏高度吻合,触发频率和时间分布合理。\",\n \"推理步骤3: 卧室窗帘(bedroom_window)在 05:21 打开(0 = 全开,起床拉开窗帘)、12:22 关闭(10000 = 全关,午休遮光)、14:04 再次打开(午休结束)、20:46 关闭(就寝遮光),操作逻辑与运动传感器触发时间一致,联动正常。\",\n \"推理步骤4: 卧室灯(bedroom_light)和床头灯(bedroom_bedside_light)的开关事件与运动传感器触发时间匹配——05:21 开灯、20:46 短暂开灯后关灯就寝,行为合理。\",\n \"推理步骤5: 卧室窗户传感器(bedroom_window_contact)全天无触发事件,说明窗户始终保持关闭状态,对于独居老人住宅属正常情况。\",\n \"推理步骤6: 对比厨房温度传感器在灶具使用期间出现多次 None 值(可能受热源干扰),卧室温度传感器全天无任何异常读数,数据质量良好。\"\n ],\n \"key_evidence\": [\n \"bedroom_temp_sensor 全天48个采样点均正常上报,温度范围 21.9°C–24.8°C,无 None 值或异常跳变\",\n \"bedroom_occupancy 在 05:21、12:22、14:04、20:46 四次触发,与老人起床、午休、午起、就寝的作息完全吻合\",\n \"bedroom_window 窗帘动作(开/关/开/关)与运动传感器触发时间精确联动,响应延迟仅数秒\",\n \"bedroom_light 开关时间与 occupancy 事件一致,无无人触发或有人不触发的异常\"\n ],\n \"recommended_actions\": [\n \"卧室传感器当前状态良好,无需干预,建议保持定期巡检周期\",\n \"可考虑为卧室增加长时间无活动告警规则(如超过12小时无 occupancy 触发),作为独居老人健康监护的额外保障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "卧室区域所有传感器工作正常,数据采集和响应均符合预期。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次温度数据,无缺失、无 None 值。温度范围从夜间约 21.9°C 逐步升至午间约 24.8°C,再回落至夜间约 22.4°C,符合夏季(6月)昼夜温度变化的自然规律。", "推理步骤2: 卧室运动传感器(bedroom_occupancy)在 05:21(起床)、12:22(午休)、14:04(午休起身)、20:46(晚间就寝)四个时间点触发,与独居老人的典型作息节奏高度吻合,触发频率和时间分布合理。", "推理步骤3: 卧室窗帘(bedroom_window)在 05:21 打开(0 = 全开,起床拉开窗帘)、12:22 关闭(10000 = 全关,午休遮光)、14:04 再次打开(午休结束)、20:46 关闭(就寝遮光),操作逻辑与运动传感器触发时间一致,联动正常。", "推理步骤4: 卧室灯(bedroom_light)和床头灯(bedroom_bedside_light)的开关事件与运动传感器触发时间匹配——05:21 开灯、20:46 短暂开灯后关灯就寝,行为合理。", "推理步骤5: 卧室窗户传感器(bedroom_window_contact)全天无触发事件,说明窗户始终保持关闭状态,对于独居老人住宅属正常情况。", "推理步骤6: 对比厨房温度传感器在灶具使用期间出现多次 None 值(可能受热源干扰),卧室温度传感器全天无任何异常读数,数据质量良好。"], "key_evidence": ["bedroom_temp_sensor 全天48个采样点均正常上报,温度范围 21.9°C–24.8°C,无 None 值或异常跳变", "bedroom_occupancy 在 05:21、12:22、14:04、20:46 四次触发,与老人起床、午休、午起、就寝的作息完全吻合", "bedroom_window 窗帘动作(开/关/开/关)与运动传感器触发时间精确联动,响应延迟仅数秒", "bedroom_light 开关时间与 occupancy 事件一致,无无人触发或有人不触发的异常"], "recommended_actions": ["卧室传感器当前状态良好,无需干预,建议保持定期巡检周期", "可考虑为卧室增加长时间无活动告警规则(如超过12小时无 occupancy 触发),作为独居老人健康监护的额外保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.555094003677368, "api_error": null} {"episode_id": "SQ1_TN_D_0187", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0187.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20260816, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器工作基本正常,但客厅窗户传感器(living_room_window_contact)全天无任何数据上报,疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,从凌晨00:00到23:30共48个读数,无缺失、无None值,数据连续性良好。\",\n \"推理步骤2: 温度值范围为22.91°C(凌晨)至25.85°C(正午),呈现合理的日间升温、夜间降温趋势,与卧室和厨房传感器的变化趋势一致,无异常跳变。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)在08:27、13:59、19:38三个时段检测到活动,与老人回家、午休起床、晚间活动的生活节奏吻合,工作正常。\",\n \"推理步骤4: 客厅灯(living_room_light)在08:27开启、12:23关闭、13:59再开、19:38调光至30、20:26关闭,响应与运动传感器和老人作息一致,工作正常。\",\n \"推理步骤5: 客厅烟雾报警器(living_room_smoke_alarm)全天无告警事件,在无火灾风险的情况下属于正常静默状态。\",\n \"推理步骤6: 客厅窗帘(living_room_window)全天无任何位置变化上报,可能是老人未操作窗帘,也可能是设备未上报状态,暂无法判定异常。\",\n \"推理步骤7: 但客厅窗户传感器(living_room_window_contact)作为contact_sensor,整个24小时内没有任何一条状态上报记录。对比同类型的卧室窗户传感器(bedroom_window_contact)同样全天无上报,以及入户门传感器(front_door_contact)有多次正常上报。窗户传感器在窗户未被开关时确实不会产生事件,但作为安全设备,通常应有周期性心跳或状态确认上报。在独居老人场景下,窗户传感器的静默值得关注。\",\n \"推理步骤8: 客厅空调(living_room_ac)全天无任何操作记录,结合室温最高仅25.85°C,老人可能未觉得需要开空调,属于合理情况。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48次上报无缺失,温度范围22.91°C~25.85°C,日变化曲线合理\",\n \"living_room_occupancy 在08:27/13:59/19:38正常检测到人体活动\",\n \"living_room_window_contact 全天24小时零上报,作为安全类传感器存在离线或故障可能\",\n \"其他客厅设备(灯、烟雾报警器)行为均与预期一致\"\n ],\n \"recommended_actions\": [\n \"对客厅窗户传感器(living_room_window_contact)进行连通性检查,确认设备是否在线、电池是否充足\",\n \"手动开关客厅窗户一次,验证传感器是否能正常上报状态变化\",\n \"如确认传感器离线,及时更换电池或重新配对设备,独居老人场景下窗户传感器对入侵检测至关重要\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器工作基本正常,但客厅窗户传感器(living_room_window_contact)全天无任何数据上报,疑似离线或故障。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,从凌晨00:00到23:30共48个读数,无缺失、无None值,数据连续性良好。", "推理步骤2: 温度值范围为22.91°C(凌晨)至25.85°C(正午),呈现合理的日间升温、夜间降温趋势,与卧室和厨房传感器的变化趋势一致,无异常跳变。", "推理步骤3: 客厅运动传感器(living_room_occupancy)在08:27、13:59、19:38三个时段检测到活动,与老人回家、午休起床、晚间活动的生活节奏吻合,工作正常。", "推理步骤4: 客厅灯(living_room_light)在08:27开启、12:23关闭、13:59再开、19:38调光至30、20:26关闭,响应与运动传感器和老人作息一致,工作正常。", "推理步骤5: 客厅烟雾报警器(living_room_smoke_alarm)全天无告警事件,在无火灾风险的情况下属于正常静默状态。", "推理步骤6: 客厅窗帘(living_room_window)全天无任何位置变化上报,可能是老人未操作窗帘,也可能是设备未上报状态,暂无法判定异常。", "推理步骤7: 但客厅窗户传感器(living_room_window_contact)作为contact_sensor,整个24小时内没有任何一条状态上报记录。对比同类型的卧室窗户传感器(bedroom_window_contact)同样全天无上报,以及入户门传感器(front_door_contact)有多次正常上报。窗户传感器在窗户未被开关时确实不会产生事件,但作为安全设备,通常应有周期性心跳或状态确认上报。在独居老人场景下,窗户传感器的静默值得关注。", "推理步骤8: 客厅空调(living_room_ac)全天无任何操作记录,结合室温最高仅25.85°C,老人可能未觉得需要开空调,属于合理情况。"], "key_evidence": ["living_room_temp_sensor 全天48次上报无缺失,温度范围22.91°C~25.85°C,日变化曲线合理", "living_room_occupancy 在08:27/13:59/19:38正常检测到人体活动", "living_room_window_contact 全天24小时零上报,作为安全类传感器存在离线或故障可能", "其他客厅设备(灯、烟雾报警器)行为均与预期一致"], "recommended_actions": ["对客厅窗户传感器(living_room_window_contact)进行连通性检查,确认设备是否在线、电池是否充足", "手动开关客厅窗户一次,验证传感器是否能正常上报状态变化", "如确认传感器离线,及时更换电池或重新配对设备,独居老人场景下窗户传感器对入侵检测至关重要"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.67434024810791, "api_error": null} {"episode_id": "SQ1_TN_D_0188", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TN_D_0188.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260817, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器和运动传感器均表现出符合预期的行为模式。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报一次数据,无任何缺失或 None 值,数据连续性良好。\",\n \"推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约22.94°C,午间峰值约25.86°C,夜间回落至23.3°C左右,波动平缓合理,无突变或异常跳跃。\",\n \"推理步骤3: 客厅运动传感器在08:34(老人外出归来)、13:52(午休后起身)、19:23(晚间活动)触发,与入户门锁操作、灯光开关等事件在时间上高度吻合,说明运动检测准确。\",\n \"推理步骤4: 客厅灯(可调光)在有人活动时开启、离开时关闭,19:23时调光至42级(傍晚调暗灯光),行为逻辑自洽。\",\n \"推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(灶具使用期间),客厅温度传感器全天无一次 None 上报,传感器健康状态良好。\",\n \"推理步骤6: 客厅窗户传感器和烟雾报警器全天无触发事件,属于正常静默状态,不构成异常。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点(00:00-23:30)均正常上报数值,无 None 或缺失,数值范围 2294-2586(约22.9°C-25.9°C),变化平滑连续。\",\n \"客厅运动传感器三次触发(08:34、13:52、19:23)均与老人的门锁操作、灯光控制等活动事件时间一致,无孤立误触发。\",\n \"客厅灯的开关和调光操作与运动传感器触发严格对应,设备联动正常。\"\n ],\n \"recommended_actions\": [\n \"客厅传感器当前无需干预,建议保持现有监测频率。\",\n \"可关注厨房温度传感器在灶具使用期间多次上报 None 的问题,可能存在高温干扰或传感器故障隐患。\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器和运动传感器均表现出符合预期的行为模式。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报一次数据,无任何缺失或 None 值,数据连续性良好。", "推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约22.94°C,午间峰值约25.86°C,夜间回落至23.3°C左右,波动平缓合理,无突变或异常跳跃。", "推理步骤3: 客厅运动传感器在08:34(老人外出归来)、13:52(午休后起身)、19:23(晚间活动)触发,与入户门锁操作、灯光开关等事件在时间上高度吻合,说明运动检测准确。", "推理步骤4: 客厅灯(可调光)在有人活动时开启、离开时关闭,19:23时调光至42级(傍晚调暗灯光),行为逻辑自洽。", "推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(灶具使用期间),客厅温度传感器全天无一次 None 上报,传感器健康状态良好。", "推理步骤6: 客厅窗户传感器和烟雾报警器全天无触发事件,属于正常静默状态,不构成异常。"], "key_evidence": ["客厅温度传感器全天48个采样点(00:00-23:30)均正常上报数值,无 None 或缺失,数值范围 2294-2586(约22.9°C-25.9°C),变化平滑连续。", "客厅运动传感器三次触发(08:34、13:52、19:23)均与老人的门锁操作、灯光控制等活动事件时间一致,无孤立误触发。", "客厅灯的开关和调光操作与运动传感器触发严格对应,设备联动正常。"], "recommended_actions": ["客厅传感器当前无需干预,建议保持现有监测频率。", "可关注厨房温度传感器在灶具使用期间多次上报 None 的问题,可能存在高温干扰或传感器故障隐患。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.83770227432251, "api_error": null} {"episode_id": "SQ1_TP_A_0004", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0004.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20260633, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-19T18:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器在住户明显在卧室内时报告无人(occupancy=0),存在间歇性漏检嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 卧室有三个传感器——运动传感器(bedroom_occupancy)、温度传感器(bedroom_temp_sensor)、窗户传感器(bedroom_window_contact)。温度传感器全天每30分钟稳定上报数据,数值在21.9°C~24.8°C之间随昼夜自然波动,工作完全正常。窗户传感器在日志中无触发记录,说明窗户始终保持关闭状态,属于正常。\",\n \"推理步骤2: 重点分析运动传感器。06:29 检测到占用(occupancy=1),随后住户起床开灯、开窗帘,06:31:42 报告 occupancy=0,此时住户去了卫生间(06:31:09 bathroom_occupancy=1),这段逻辑自洽。\",\n \"推理步骤3: 晚间 21:59:21 卧室运动传感器报告 occupancy=1,住户进入卧室准备睡觉,开灯、关窗帘,22:23 调暗灯光,22:41 关灯。然而 22:42:03 传感器报告 occupancy=0。从行为模式看,住户关灯后是在卧室入睡,并非离开卧室——此后没有任何其他房间的运动传感器触发,也没有门锁/门磁事件,说明住户仍在家且在卧室内。\",\n \"推理步骤4: 运动传感器(PIR类型)的常见局限是:当人静止不动(如躺在床上睡觉)时,传感器会因检测不到运动而超时报告无人。这是PIR传感器的固有特性,但从智能家居安全监控角度看,这种'假阴性'可能导致安全自动化误判(例如误认为家中无人而关闭安防模式)。\",\n \"推理步骤5: 综合来看,温度传感器和窗户传感器工作正常,运动传感器存在睡眠状态下的漏检问题。这不算硬件故障,但属于功能性不足,在安全场景下可能造成隐患,因此标记为低级别的设备功能异常。\"\n ],\n \"key_evidence\": [\n \"22:41 卧室灯关闭后,22:42:03 运动传感器报告 occupancy=0,但此后无任何其他房间传感器触发、无门锁/门磁事件,表明住户仍在卧室睡觉\",\n \"温度传感器全天48个采样点均正常上报,数值在2193~2481范围内随昼夜合理波动,无缺失或异常跳变\",\n \"窗户传感器(bedroom_window_contact)全天无状态变化事件,窗户保持关闭,工作正常\"\n ],\n \"recommended_actions\": [\n \"如果卧室运动传感器用于安防联动(如判断是否有人在家),建议增加超时容忍时间或结合门锁状态综合判断,避免因睡眠静止导致误判无人\",\n \"可考虑将卧室PIR运动传感器升级为毫米波雷达存在传感器,后者能检测静止人体的微弱呼吸运动,更适合卧室睡眠场景\",\n \"定期检查运动传感器的灵敏度设置和安装角度,确保覆盖床铺区域\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器在住户明显在卧室内时报告无人(occupancy=0),存在间歇性漏检嫌疑。", "reasoning": ["推理步骤1: 卧室有三个传感器——运动传感器(bedroom_occupancy)、温度传感器(bedroom_temp_sensor)、窗户传感器(bedroom_window_contact)。温度传感器全天每30分钟稳定上报数据,数值在21.9°C~24.8°C之间随昼夜自然波动,工作完全正常。窗户传感器在日志中无触发记录,说明窗户始终保持关闭状态,属于正常。", "推理步骤2: 重点分析运动传感器。06:29 检测到占用(occupancy=1),随后住户起床开灯、开窗帘,06:31:42 报告 occupancy=0,此时住户去了卫生间(06:31:09 bathroom_occupancy=1),这段逻辑自洽。", "推理步骤3: 晚间 21:59:21 卧室运动传感器报告 occupancy=1,住户进入卧室准备睡觉,开灯、关窗帘,22:23 调暗灯光,22:41 关灯。然而 22:42:03 传感器报告 occupancy=0。从行为模式看,住户关灯后是在卧室入睡,并非离开卧室——此后没有任何其他房间的运动传感器触发,也没有门锁/门磁事件,说明住户仍在家且在卧室内。", "推理步骤4: 运动传感器(PIR类型)的常见局限是:当人静止不动(如躺在床上睡觉)时,传感器会因检测不到运动而超时报告无人。这是PIR传感器的固有特性,但从智能家居安全监控角度看,这种'假阴性'可能导致安全自动化误判(例如误认为家中无人而关闭安防模式)。", "推理步骤5: 综合来看,温度传感器和窗户传感器工作正常,运动传感器存在睡眠状态下的漏检问题。这不算硬件故障,但属于功能性不足,在安全场景下可能造成隐患,因此标记为低级别的设备功能异常。"], "key_evidence": ["22:41 卧室灯关闭后,22:42:03 运动传感器报告 occupancy=0,但此后无任何其他房间传感器触发、无门锁/门磁事件,表明住户仍在卧室睡觉", "温度传感器全天48个采样点均正常上报,数值在2193~2481范围内随昼夜合理波动,无缺失或异常跳变", "窗户传感器(bedroom_window_contact)全天无状态变化事件,窗户保持关闭,工作正常"], "recommended_actions": ["如果卧室运动传感器用于安防联动(如判断是否有人在家),建议增加超时容忍时间或结合门锁状态综合判断,避免因睡眠静止导致误判无人", "可考虑将卧室PIR运动传感器升级为毫米波雷达存在传感器,后者能检测静止人体的微弱呼吸运动,更适合卧室睡眠场景", "定期检查运动传感器的灵敏度设置和安装角度,确保覆盖床铺区域"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.344517946243286, "api_error": null} {"episode_id": "SQ1_TP_A_0006", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0006.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20260635, "scenario_id": "DF-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T00:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的传感器(温度传感器、运动传感器)工作正常,未发现故障或异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天持续每30分钟上报一次数据,无任何缺失或 None 值,数据连续性完好。相比之下,厨房温度传感器在 18:54 和 19:49 出现了两次 None 值,客厅没有此问题。\",\n \"推理步骤2: 客厅温度变化趋势合理——凌晨维持在约 22.9-23.1°C,随日照升温至中午峰值约 25.9°C,下午逐步回落。18:00 住户回家开启空调(SystemMode=3,制冷模式)后,温度从约 24.5°C 稳步下降至夜间约 23.3°C,符合空调制冷的预期效果。\",\n \"推理步骤3: 客厅运动传感器在 18:00:21 检测到住户回家后的活动(Occupancy=1),20:13:03 再次检测到活动,与住户在客厅活动的场景一致。传感器响应时间和触发模式正常。\",\n \"推理步骤4: 客厅温度与卧室、厨房温度的相对关系全天保持一致(客厅略高于卧室,与厨房接近),三个传感器之间无矛盾读数,排除客厅传感器漂移或校准异常的可能。\",\n \"推理步骤5: 客厅所有设备事件(灯光开关、空调启停、窗帘未动作)均与住户行为时间线吻合,无无人时设备异常触发的情况。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点(00:00-23:30)均正常上报数值,无 None 或异常跳变,范围 2291-2586(约 22.9°C-25.9°C)\",\n \"18:00 开启空调制冷后,温度从 2451 逐步降至 2343(约 24.5°C→23.4°C),变化平滑且符合物理规律\",\n \"客厅运动传感器在住户回家后正确触发(18:00:21 和 20:13:03),无深夜误触发或住户在家时无响应的情况\"\n ],\n \"recommended_actions\": [\n \"客厅传感器状态良好,无需采取措施\",\n \"建议关注厨房温度传感器——在 18:54 和 19:49 出现 None 值,且 18:00 和 18:30 出现异常高温读数(2854/2865,约 28.5°C-28.7°C),可能存在传感器故障或需要排查原因\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的传感器(温度传感器、运动传感器)工作正常,未发现故障或异常。", "reasoning": ["推理步骤1: 客厅温度传感器全天持续每30分钟上报一次数据,无任何缺失或 None 值,数据连续性完好。相比之下,厨房温度传感器在 18:54 和 19:49 出现了两次 None 值,客厅没有此问题。", "推理步骤2: 客厅温度变化趋势合理——凌晨维持在约 22.9-23.1°C,随日照升温至中午峰值约 25.9°C,下午逐步回落。18:00 住户回家开启空调(SystemMode=3,制冷模式)后,温度从约 24.5°C 稳步下降至夜间约 23.3°C,符合空调制冷的预期效果。", "推理步骤3: 客厅运动传感器在 18:00:21 检测到住户回家后的活动(Occupancy=1),20:13:03 再次检测到活动,与住户在客厅活动的场景一致。传感器响应时间和触发模式正常。", "推理步骤4: 客厅温度与卧室、厨房温度的相对关系全天保持一致(客厅略高于卧室,与厨房接近),三个传感器之间无矛盾读数,排除客厅传感器漂移或校准异常的可能。", "推理步骤5: 客厅所有设备事件(灯光开关、空调启停、窗帘未动作)均与住户行为时间线吻合,无无人时设备异常触发的情况。"], "key_evidence": ["客厅温度传感器全天48个采样点(00:00-23:30)均正常上报数值,无 None 或异常跳变,范围 2291-2586(约 22.9°C-25.9°C)", "18:00 开启空调制冷后,温度从 2451 逐步降至 2343(约 24.5°C→23.4°C),变化平滑且符合物理规律", "客厅运动传感器在住户回家后正确触发(18:00:21 和 20:13:03),无深夜误触发或住户在家时无响应的情况"], "recommended_actions": ["客厅传感器状态良好,无需采取措施", "建议关注厨房温度传感器——在 18:54 和 19:49 出现 None 值,且 18:00 和 18:30 出现异常高温读数(2854/2865,约 28.5°C-28.7°C),可能存在传感器故障或需要排查原因"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.085557460784912, "api_error": null} {"episode_id": "SQ1_TP_A_0007", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0007.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20260636, "scenario_id": "DF-06", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-07T05:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的传感器(温度传感器和运动传感器)工作正常,未发现故障或异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天持续每30分钟上报一次数据,无任何缺失或 None 值,数据连续性完好。相比之下,厨房温度传感器在灶具使用期间多次报告 None,客厅传感器无此问题。\",\n \"推理步骤2: 温度变化趋势合理——凌晨低温约22.9°C,随日照升温至中午峰值约25.9°C,午后逐步回落至夜间约23.3°C,符合夏季(6月)一室一厅的自然温度曲线,无突变或异常跳变。\",\n \"推理步骤3: 客厅运动传感器在10:07检测到有人活动(Occupancy=1),随后触发了主灯开启和空调开启,设备联动响应正常,说明运动传感器工作正常。\",\n \"推理步骤4: 10:07空调开启(制冷模式 SystemMode=3)后,客厅温度仍缓慢上升至约25.9°C后回落,这与室外持续升温、空调抑制但未完全压制升温的实际情况一致,温度数据可信。\",\n \"推理步骤5: 客厅窗帘在05:26收到关闭指令并持续运动(OperationalStatus=0b000010),10:07又被打开(位置归0),窗帘传感器状态上报正常,无卡滞或矛盾状态。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点(每30分钟一次)均正常上报数值,无 None 或缺失,数值范围 2292~2590(约22.9°C~25.9°C),变化平滑合理\",\n \"客厅运动传感器在10:07正确检测到人员活动,并成功触发灯光和空调联动\",\n \"客厅温度曲线与卧室、厨房趋势一致(卧室始终偏低约1°C,符合有窗帘遮挡的预期),三个传感器交叉验证无矛盾\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,客厅区域传感器运行状态良好\",\n \"可关注厨房温度传感器多次报告 None 值的问题(虽不在本次检查范围内,但值得排查)\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的传感器(温度传感器和运动传感器)工作正常,未发现故障或异常。", "reasoning": ["推理步骤1: 客厅温度传感器全天持续每30分钟上报一次数据,无任何缺失或 None 值,数据连续性完好。相比之下,厨房温度传感器在灶具使用期间多次报告 None,客厅传感器无此问题。", "推理步骤2: 温度变化趋势合理——凌晨低温约22.9°C,随日照升温至中午峰值约25.9°C,午后逐步回落至夜间约23.3°C,符合夏季(6月)一室一厅的自然温度曲线,无突变或异常跳变。", "推理步骤3: 客厅运动传感器在10:07检测到有人活动(Occupancy=1),随后触发了主灯开启和空调开启,设备联动响应正常,说明运动传感器工作正常。", "推理步骤4: 10:07空调开启(制冷模式 SystemMode=3)后,客厅温度仍缓慢上升至约25.9°C后回落,这与室外持续升温、空调抑制但未完全压制升温的实际情况一致,温度数据可信。", "推理步骤5: 客厅窗帘在05:26收到关闭指令并持续运动(OperationalStatus=0b000010),10:07又被打开(位置归0),窗帘传感器状态上报正常,无卡滞或矛盾状态。"], "key_evidence": ["客厅温度传感器全天48个采样点(每30分钟一次)均正常上报数值,无 None 或缺失,数值范围 2292~2590(约22.9°C~25.9°C),变化平滑合理", "客厅运动传感器在10:07正确检测到人员活动,并成功触发灯光和空调联动", "客厅温度曲线与卧室、厨房趋势一致(卧室始终偏低约1°C,符合有窗帘遮挡的预期),三个传感器交叉验证无矛盾"], "recommended_actions": ["无需采取措施,客厅区域传感器运行状态良好", "可关注厨房温度传感器多次报告 None 值的问题(虽不在本次检查范围内,但值得排查)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.122734308242798, "api_error": null} {"episode_id": "SQ1_TP_A_0019", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0019.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20260648, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-26T00:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室窗帘在凌晨00:11执行关闭命令后持续运行未到达目标位置,疑似机械卡阻或电机故障。\",\n \"reasoning\": [\n \"推理步骤1: 卧室区域包含4个传感器/设备——运动传感器(bedroom_occupancy)、温度传感器(bedroom_temp_sensor)、窗户传感器(bedroom_window_contact)、窗帘(bedroom_window)。逐一检查其工作状态。\",\n \"推理步骤2: bedroom_temp_sensor 全天每30分钟稳定上报温度数据,夜间约22.0°C,午间峰值约24.9°C,变化平滑合理,无缺失值或异常跳变,工作正常。\",\n \"推理步骤3: bedroom_occupancy 在06:30-06:40、21:46-22:34期间正常检测到有人/无人状态切换,与灯光开关、起床/睡觉的生活节奏一致,工作正常。\",\n \"推理步骤4: bedroom_window_contact(窗户接触传感器)全天无任何事件上报。结合窗帘操作和日常活动来看,如果窗户始终处于关闭状态则无事件是合理的,但也无法排除传感器离线的可能性——不过缺乏进一步证据,暂判为正常。\",\n \"推理步骤5: bedroom_window(窗帘)在00:11:00收到DownOrClose命令后,OperationalStatus持续报告0b000010(正在向下运动),到00:12:00仍为0b000010,而00:11:30时位置仅到达50%(5000/10000)。此后直到06:40:19才报告位置为0%(全开),中间没有到达目标位置(全关=10000)的记录,也没有运动停止(OperationalStatus=0)的记录。\",\n \"推理步骤6: 正常情况下窗帘从当前位置运行到目标位置应在1-2分钟内完成并报告OperationalStatus=0。持续超过1分钟仍在运动且位置仅到50%,说明窗帘可能遭遇机械阻力、轨道卡阻或电机异常,未能正常完成关闭动作。\",\n \"推理步骤7: 06:40:19窗帘位置突然变为0%(全开),这与住户起床后打开窗帘的行为一致,但凌晨的关闭指令显然未成功执行到位。\"\n ],\n \"key_evidence\": [\n \"00:11:00 窗帘收到DownOrClose命令,00:11:30位置仅到50%且OperationalStatus仍为0b000010(运动中),00:12:00仍未停止,缺少运动完成(OperationalStatus=0)和到达目标位置的记录\",\n \"bedroom_temp_sensor 全天48个采样点数据完整、变化平滑,工作正常\",\n \"bedroom_occupancy 在起床和睡觉时段正常触发,与灯光联动一致,工作正常\"\n ],\n \"recommended_actions\": [\n \"检查卧室窗帘轨道是否有异物阻挡或机械磨损,清洁并润滑导轨\",\n \"测试窗帘电机是否能正常完成全行程关闭,观察是否在中途停滞\",\n \"检查窗帘控制器固件版本,确认是否存在已知的状态上报bug,必要时重新校准行程\",\n \"如bedroom_window_contact长期无事件,可手动开关窗户一次以验证该传感器是否在线响应\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室窗帘在凌晨00:11执行关闭命令后持续运行未到达目标位置,疑似机械卡阻或电机故障。", "reasoning": ["推理步骤1: 卧室区域包含4个传感器/设备——运动传感器(bedroom_occupancy)、温度传感器(bedroom_temp_sensor)、窗户传感器(bedroom_window_contact)、窗帘(bedroom_window)。逐一检查其工作状态。", "推理步骤2: bedroom_temp_sensor 全天每30分钟稳定上报温度数据,夜间约22.0°C,午间峰值约24.9°C,变化平滑合理,无缺失值或异常跳变,工作正常。", "推理步骤3: bedroom_occupancy 在06:30-06:40、21:46-22:34期间正常检测到有人/无人状态切换,与灯光开关、起床/睡觉的生活节奏一致,工作正常。", "推理步骤4: bedroom_window_contact(窗户接触传感器)全天无任何事件上报。结合窗帘操作和日常活动来看,如果窗户始终处于关闭状态则无事件是合理的,但也无法排除传感器离线的可能性——不过缺乏进一步证据,暂判为正常。", "推理步骤5: bedroom_window(窗帘)在00:11:00收到DownOrClose命令后,OperationalStatus持续报告0b000010(正在向下运动),到00:12:00仍为0b000010,而00:11:30时位置仅到达50%(5000/10000)。此后直到06:40:19才报告位置为0%(全开),中间没有到达目标位置(全关=10000)的记录,也没有运动停止(OperationalStatus=0)的记录。", "推理步骤6: 正常情况下窗帘从当前位置运行到目标位置应在1-2分钟内完成并报告OperationalStatus=0。持续超过1分钟仍在运动且位置仅到50%,说明窗帘可能遭遇机械阻力、轨道卡阻或电机异常,未能正常完成关闭动作。", "推理步骤7: 06:40:19窗帘位置突然变为0%(全开),这与住户起床后打开窗帘的行为一致,但凌晨的关闭指令显然未成功执行到位。"], "key_evidence": ["00:11:00 窗帘收到DownOrClose命令,00:11:30位置仅到50%且OperationalStatus仍为0b000010(运动中),00:12:00仍未停止,缺少运动完成(OperationalStatus=0)和到达目标位置的记录", "bedroom_temp_sensor 全天48个采样点数据完整、变化平滑,工作正常", "bedroom_occupancy 在起床和睡觉时段正常触发,与灯光联动一致,工作正常"], "recommended_actions": ["检查卧室窗帘轨道是否有异物阻挡或机械磨损,清洁并润滑导轨", "测试窗帘电机是否能正常完成全行程关闭,观察是否在中途停滞", "检查窗帘控制器固件版本,确认是否存在已知的状态上报bug,必要时重新校准行程", "如bedroom_window_contact长期无事件,可手动开关窗户一次以验证该传感器是否在线响应"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.302475214004517, "api_error": null} {"episode_id": "SQ1_TP_A_0021", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0021.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20260650, "scenario_id": "DF-05", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T02:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房区域存在两个传感器异常:烟雾报警器硬件故障,以及温度传感器间歇性读数异常(突然飙升和返回 None)。\",\n \"reasoning\": [\n \"推理步骤1: 厨房烟雾报警器在 02:55 报告 HardwareFaultAlert=True,ExpressedState=5(对应 HardwareFault 状态),并触发了 HardwareFault 事件。此时全屋处于深夜无人活动状态,没有任何烹饪或烟雾相关事件,说明这是设备自身硬件故障而非环境触发。\",\n \"推理步骤2: 厨房温度传感器在 19:00 突然从 24.62°C 跳升至 28.41°C(+3.79°C),而同一时刻客厅温度仅为 24.26°C。虽然 19:06 灶具开启,但灶具尚未点火时温度就已飙升,时间上不合理。\",\n \"推理步骤3: 厨房温度传感器在 19:07 和 19:36 两次返回 MeasuredValue=None,表示传感器无法提供有效读数。正常工作的温度传感器不应返回 None,这是典型的传感器通信故障或硬件异常表现。\",\n \"推理步骤4: 在 19:30 温度传感器恢复报告后读数为 28.31°C,仍然异常偏高;但到 20:00 突然回落至 24.13°C,与客厅温度基本一致。这种剧烈波动后突然恢复的模式更像是传感器间歇性故障,而非真实环境温度变化。\",\n \"推理步骤5: 综合来看,厨房区域有两个独立的传感器故障——烟雾报警器确认的硬件故障和温度传感器的间歇性异常读数/None值。烟雾报警器故障尤其危险,因为它直接影响火灾预警能力。\"\n ],\n \"key_evidence\": [\n \"02:55 kitchen_smoke_alarm 报告 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件\",\n \"19:00 厨房温度从 24.62°C 异常跳升至 28.41°C(灶具 19:06 才开启,时间矛盾)\",\n \"19:07 和 19:36 厨房温度传感器两次返回 MeasuredValue=None\",\n \"19:30 读数 28.31°C 仍异常偏高,20:00 突然回落至 24.13°C,波动不符合正常热传导规律\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,硬件故障状态下无法提供火灾/CO预警,存在严重安全隐患\",\n \"检查厨房温度传感器的安装位置和硬件状态,确认是否受到灶具热辐射直射或存在接线/供电问题\",\n \"在烟雾报警器修复前,考虑在厨房临时增设独立式烟雾报警器作为备用\",\n \"对温度传感器进行校准测试,如果 None 值问题反复出现则需更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房区域存在两个传感器异常:烟雾报警器硬件故障,以及温度传感器间歇性读数异常(突然飙升和返回 None)。", "reasoning": ["推理步骤1: 厨房烟雾报警器在 02:55 报告 HardwareFaultAlert=True,ExpressedState=5(对应 HardwareFault 状态),并触发了 HardwareFault 事件。此时全屋处于深夜无人活动状态,没有任何烹饪或烟雾相关事件,说明这是设备自身硬件故障而非环境触发。", "推理步骤2: 厨房温度传感器在 19:00 突然从 24.62°C 跳升至 28.41°C(+3.79°C),而同一时刻客厅温度仅为 24.26°C。虽然 19:06 灶具开启,但灶具尚未点火时温度就已飙升,时间上不合理。", "推理步骤3: 厨房温度传感器在 19:07 和 19:36 两次返回 MeasuredValue=None,表示传感器无法提供有效读数。正常工作的温度传感器不应返回 None,这是典型的传感器通信故障或硬件异常表现。", "推理步骤4: 在 19:30 温度传感器恢复报告后读数为 28.31°C,仍然异常偏高;但到 20:00 突然回落至 24.13°C,与客厅温度基本一致。这种剧烈波动后突然恢复的模式更像是传感器间歇性故障,而非真实环境温度变化。", "推理步骤5: 综合来看,厨房区域有两个独立的传感器故障——烟雾报警器确认的硬件故障和温度传感器的间歇性异常读数/None值。烟雾报警器故障尤其危险,因为它直接影响火灾预警能力。"], "key_evidence": ["02:55 kitchen_smoke_alarm 报告 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件", "19:00 厨房温度从 24.62°C 异常跳升至 28.41°C(灶具 19:06 才开启,时间矛盾)", "19:07 和 19:36 厨房温度传感器两次返回 MeasuredValue=None", "19:30 读数 28.31°C 仍异常偏高,20:00 突然回落至 24.13°C,波动不符合正常热传导规律"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,硬件故障状态下无法提供火灾/CO预警,存在严重安全隐患", "检查厨房温度传感器的安装位置和硬件状态,确认是否受到灶具热辐射直射或存在接线/供电问题", "在烟雾报警器修复前,考虑在厨房临时增设独立式烟雾报警器作为备用", "对温度传感器进行校准测试,如果 None 值问题反复出现则需更换设备"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.70630383491516, "api_error": null} {"episode_id": "SQ1_TP_A_0029", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0029.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20260658, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-18T16:58:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"bedroom 区域的所有传感器工作正常,数据采集稳定且符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。夜间温度约 21.9°C,白天随外界升温至约 24.8°C,傍晚后逐步回落至约 22.4°C,变化曲线平滑合理,符合夏季一室一厅的自然温度波动规律。\",\n \"推理步骤2: 卧室运动传感器(bedroom_occupancy)在 06:38 检测到住户起床(Occupancy=1),06:56 住户离开卧室去卫生间(Occupancy=0),22:05 住户回到卧室准备睡觉(Occupancy=1),22:47 入睡后传感器超时归零(Occupancy=0)。触发和清除时间点与其他设备事件(开灯、关灯、卫生间活动)完全吻合,行为逻辑自洽。\",\n \"推理步骤3: 卧室窗户传感器(bedroom_window_contact)全天未报告状态变化,说明窗户始终保持关闭状态,在住户外出期间这是正常且安全的。\",\n \"推理步骤4: 卧室窗帘(bedroom_window)在 06:38 被打开(LiftPercent=0,全开),16:58 收到关闭指令并执行中间位置(50%),22:05 完全关闭(LiftPercent=10000),操作时间和方向与起床、傍晚遮阳、睡前的生活习惯一致。\",\n \"推理步骤5: 卧室灯(bedroom_light)在 06:38 开启、07:17 出门前关闭、22:05 回卧室后开启、22:38 调暗至 level=23(阅读/睡前模式)、22:46 关闭,行为模式完全正常。\",\n \"推理步骤6: 对比厨房温度传感器在 18:00 出现异常飙升(2868,即 28.68°C,偏离趋势约 5°C)以及两次上报 None 值,卧室传感器无任何此类异常,数据质量明显更好,进一步确认卧室传感器健康。\"\n ],\n \"key_evidence\": [\n \"bedroom_temp_sensor 全天48个采样点均正常上报,无 None 值,温度范围 21.9°C~24.8°C,变化平滑无跳变\",\n \"bedroom_occupancy 的触发/清除时间与灯光、门锁等关联设备事件严格一致(06:38起床→06:56离开→22:05回卧室→22:47入睡)\",\n \"bedroom_window_contact 全天无异常状态变化,窗户保持关闭\",\n \"bedroom_window 窗帘三次状态变化(全开→半关→全关)均与住户作息时间匹配\",\n \"bedroom_light 的开关和调光操作与运动传感器检测结果时间吻合\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,bedroom 区域传感器运行状态良好\",\n \"建议关注厨房温度传感器(kitchen_temp_sensor)的健康状况,该传感器在 18:00 出现异常高温读数且两次上报 None 值,可能存在故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "bedroom 区域的所有传感器工作正常,数据采集稳定且符合预期。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。夜间温度约 21.9°C,白天随外界升温至约 24.8°C,傍晚后逐步回落至约 22.4°C,变化曲线平滑合理,符合夏季一室一厅的自然温度波动规律。", "推理步骤2: 卧室运动传感器(bedroom_occupancy)在 06:38 检测到住户起床(Occupancy=1),06:56 住户离开卧室去卫生间(Occupancy=0),22:05 住户回到卧室准备睡觉(Occupancy=1),22:47 入睡后传感器超时归零(Occupancy=0)。触发和清除时间点与其他设备事件(开灯、关灯、卫生间活动)完全吻合,行为逻辑自洽。", "推理步骤3: 卧室窗户传感器(bedroom_window_contact)全天未报告状态变化,说明窗户始终保持关闭状态,在住户外出期间这是正常且安全的。", "推理步骤4: 卧室窗帘(bedroom_window)在 06:38 被打开(LiftPercent=0,全开),16:58 收到关闭指令并执行中间位置(50%),22:05 完全关闭(LiftPercent=10000),操作时间和方向与起床、傍晚遮阳、睡前的生活习惯一致。", "推理步骤5: 卧室灯(bedroom_light)在 06:38 开启、07:17 出门前关闭、22:05 回卧室后开启、22:38 调暗至 level=23(阅读/睡前模式)、22:46 关闭,行为模式完全正常。", "推理步骤6: 对比厨房温度传感器在 18:00 出现异常飙升(2868,即 28.68°C,偏离趋势约 5°C)以及两次上报 None 值,卧室传感器无任何此类异常,数据质量明显更好,进一步确认卧室传感器健康。"], "key_evidence": ["bedroom_temp_sensor 全天48个采样点均正常上报,无 None 值,温度范围 21.9°C~24.8°C,变化平滑无跳变", "bedroom_occupancy 的触发/清除时间与灯光、门锁等关联设备事件严格一致(06:38起床→06:56离开→22:05回卧室→22:47入睡)", "bedroom_window_contact 全天无异常状态变化,窗户保持关闭", "bedroom_window 窗帘三次状态变化(全开→半关→全关)均与住户作息时间匹配", "bedroom_light 的开关和调光操作与运动传感器检测结果时间吻合"], "recommended_actions": ["无需采取任何措施,bedroom 区域传感器运行状态良好", "建议关注厨房温度传感器(kitchen_temp_sensor)的健康状况,该传感器在 18:00 出现异常高温读数且两次上报 None 值,可能存在故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.94248127937317, "api_error": null} {"episode_id": "SQ1_TP_A_0036", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0036.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260665, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-22T21:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)在18:05开门后未记录关门事件,直到22:06才报告门已关闭,期间门锁出现异常告警,表明传感器存在状态上报故障或门确实长时间未关。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含三个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其工作状态。\",\n \"推理步骤2: 早晨07:17出门场景正常——门锁解锁(LockState=2)→门传感器检测到开门(StateValue=False)→1秒后关门(StateValue=True)→自动上锁(LockState=1),整个流程在4秒内完成,逻辑自洽。\",\n \"推理步骤3: 傍晚18:05回家场景异常——门锁解锁(LockState=2)→门传感器检测到开门(StateValue=False),但之后没有任何关门事件(StateValue=True)。按正常行为,进门后应在数秒内关门。\",\n \"推理步骤4: 直到22:06:50才出现 front_door_contact StateValue=True(关门),距开门已过去约4小时。这期间住户明显在室内活动(开灯、开空调、做饭等),大门不可能真的敞开4小时。\",\n \"推理步骤5: 21:36出现门锁异常事件——连续两次收到 LockDoor 命令但锁状态始终为2(未锁定),随后触发 DoorLockAlarm(AlarmCode=0) 告警。AlarmCode=0 通常表示锁定失败告警,这与门传感器显示门未关闭的状态一致——锁无法锁上一扇'未关'的门。\",\n \"推理步骤6: 玄关灯工作正常:18:05开灯、22:06关灯,与住户进出活动吻合。\",\n \"推理步骤7: 综合判断:front_door_contact 传感器在18:05开门后未能及时上报关门状态,导致系统长时间认为门处于打开状态,进而引发21:36的门锁锁定失败告警。最可能的原因是传感器粘滞、磁铁偏移或无线通信丢包,导致关门事件丢失。\"\n ],\n \"key_evidence\": [\n \"18:05:02 front_door_contact 报告开门(StateValue=False),之后长达约4小时无关门事件\",\n \"21:36 门锁连续两次执行 LockDoor 命令均失败(LockState保持为2),并触发 DoorLockAlarm(AlarmCode=0)\",\n \"22:06:50 才出现关门事件(StateValue=True),随后自动上锁成功(LockState=1)\",\n \"对比早晨07:17的正常出门流程,开关门间隔仅1秒,傍晚的4小时间隔明显异常\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置,确认磁铁与传感器之间的间距是否在有效范围内,是否存在物理偏移\",\n \"检查传感器电池电量,低电量可能导致状态上报不及时或丢失\",\n \"检查传感器与智能家居网关之间的无线信号质量,排除通信丢包问题\",\n \"检查门锁(front_door_lock)的机械部件是否正常,确认21:36锁定失败是否由传感器误报引起还是锁本身也有故障\",\n \"建议设置门传感器长时间处于'开'状态的告警规则(如超过5分钟未关门则推送通知),以便及时发现类似问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)在18:05开门后未记录关门事件,直到22:06才报告门已关闭,期间门锁出现异常告警,表明传感器存在状态上报故障或门确实长时间未关。", "reasoning": ["推理步骤1: entrance 区域包含三个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其工作状态。", "推理步骤2: 早晨07:17出门场景正常——门锁解锁(LockState=2)→门传感器检测到开门(StateValue=False)→1秒后关门(StateValue=True)→自动上锁(LockState=1),整个流程在4秒内完成,逻辑自洽。", "推理步骤3: 傍晚18:05回家场景异常——门锁解锁(LockState=2)→门传感器检测到开门(StateValue=False),但之后没有任何关门事件(StateValue=True)。按正常行为,进门后应在数秒内关门。", "推理步骤4: 直到22:06:50才出现 front_door_contact StateValue=True(关门),距开门已过去约4小时。这期间住户明显在室内活动(开灯、开空调、做饭等),大门不可能真的敞开4小时。", "推理步骤5: 21:36出现门锁异常事件——连续两次收到 LockDoor 命令但锁状态始终为2(未锁定),随后触发 DoorLockAlarm(AlarmCode=0) 告警。AlarmCode=0 通常表示锁定失败告警,这与门传感器显示门未关闭的状态一致——锁无法锁上一扇'未关'的门。", "推理步骤6: 玄关灯工作正常:18:05开灯、22:06关灯,与住户进出活动吻合。", "推理步骤7: 综合判断:front_door_contact 传感器在18:05开门后未能及时上报关门状态,导致系统长时间认为门处于打开状态,进而引发21:36的门锁锁定失败告警。最可能的原因是传感器粘滞、磁铁偏移或无线通信丢包,导致关门事件丢失。"], "key_evidence": ["18:05:02 front_door_contact 报告开门(StateValue=False),之后长达约4小时无关门事件", "21:36 门锁连续两次执行 LockDoor 命令均失败(LockState保持为2),并触发 DoorLockAlarm(AlarmCode=0)", "22:06:50 才出现关门事件(StateValue=True),随后自动上锁成功(LockState=1)", "对比早晨07:17的正常出门流程,开关门间隔仅1秒,傍晚的4小时间隔明显异常"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置,确认磁铁与传感器之间的间距是否在有效范围内,是否存在物理偏移", "检查传感器电池电量,低电量可能导致状态上报不及时或丢失", "检查传感器与智能家居网关之间的无线信号质量,排除通信丢包问题", "检查门锁(front_door_lock)的机械部件是否正常,确认21:36锁定失败是否由传感器误报引起还是锁本身也有故障", "建议设置门传感器长时间处于'开'状态的告警规则(如超过5分钟未关门则推送通知),以便及时发现类似问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.334249258041382, "api_error": null} {"episode_id": "SQ1_TP_A_0044", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0044.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260673, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-02T01:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)在18:12住户回家开门时未记录到关门事件(StateValue=True),门可能处于长时间未关状态,直到21:50才补报关门。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有3个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其行为是否正常。\",\n \"推理步骤2: 早晨07:19出门序列完整:门锁解锁(LockState=2) → 门传感器开门(StateValue=False) → 6秒后关门(StateValue=True) → 门锁自动上锁(LockState=1),逻辑正常。\",\n \"推理步骤3: 傍晚18:12回家时,门锁解锁(LockState=2) → 门传感器报告开门(StateValue=False),但之后没有对应的关门事件(StateValue=True)。住户随后进入客厅、开灯、开空调,说明人已进屋且门应已关闭。\",\n \"推理步骤4: 直到21:50:33才出现 front_door_contact StateValue=True(关门),距离开门过去了约3小时38分钟。紧接着21:50:34门锁自动上锁。这意味着要么门真的开了近4小时(安全隐患),要么传感器未能及时检测到关门动作(设备故障)。\",\n \"推理步骤5: 从住户行为看,18:12进门后一直在室内活动(客厅、厨房做饭、洗碗机),没有再次出门的迹象,门大概率早已关闭。传感器却未报告关门状态,说明 front_door_contact 存在状态上报延迟或漏报的故障。\",\n \"推理步骤6: 另外注意凌晨01:15的门锁事件——连续两次 LockDoor 命令且均返回 LockState=2(未锁定),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警,说明门锁在该时段也出现过一次异常,但后续恢复正常工作。\"\n ],\n \"key_evidence\": [\n \"18:12:02 front_door_contact 报告开门(StateValue=False),之后长达3小时38分钟无关门事件\",\n \"21:50:33 才出现 front_door_contact StateValue=True,时间间隔异常\",\n \"01:15 门锁连续两次 LockDoor 命令均未成功锁定(LockState=2),并触发 DoorLockAlarm(AlarmCode=0)\",\n \"18:12之后住户持续在室内活动(客厅运动传感器、厨房灶具、洗碗机均有使用记录),无二次出门迹象,门应早已关闭\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和磁铁对齐情况,可能存在松动或偏移导致关门状态无法被正确检测\",\n \"清洁传感器触点,排除灰尘或异物干扰\",\n \"检查 front_door_contact 的电池电量或供电状态,低电量可能导致状态上报不及时\",\n \"排查凌晨01:15门锁锁定失败的原因(锁舌是否受阻、电机是否正常),确认门锁机械部件工作正常\",\n \"考虑为入户门传感器设置离线/超时告警规则,当开门状态持续超过一定时间(如5分钟)自动推送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)在18:12住户回家开门时未记录到关门事件(StateValue=True),门可能处于长时间未关状态,直到21:50才补报关门。", "reasoning": ["推理步骤1: entrance 区域共有3个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其行为是否正常。", "推理步骤2: 早晨07:19出门序列完整:门锁解锁(LockState=2) → 门传感器开门(StateValue=False) → 6秒后关门(StateValue=True) → 门锁自动上锁(LockState=1),逻辑正常。", "推理步骤3: 傍晚18:12回家时,门锁解锁(LockState=2) → 门传感器报告开门(StateValue=False),但之后没有对应的关门事件(StateValue=True)。住户随后进入客厅、开灯、开空调,说明人已进屋且门应已关闭。", "推理步骤4: 直到21:50:33才出现 front_door_contact StateValue=True(关门),距离开门过去了约3小时38分钟。紧接着21:50:34门锁自动上锁。这意味着要么门真的开了近4小时(安全隐患),要么传感器未能及时检测到关门动作(设备故障)。", "推理步骤5: 从住户行为看,18:12进门后一直在室内活动(客厅、厨房做饭、洗碗机),没有再次出门的迹象,门大概率早已关闭。传感器却未报告关门状态,说明 front_door_contact 存在状态上报延迟或漏报的故障。", "推理步骤6: 另外注意凌晨01:15的门锁事件——连续两次 LockDoor 命令且均返回 LockState=2(未锁定),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警,说明门锁在该时段也出现过一次异常,但后续恢复正常工作。"], "key_evidence": ["18:12:02 front_door_contact 报告开门(StateValue=False),之后长达3小时38分钟无关门事件", "21:50:33 才出现 front_door_contact StateValue=True,时间间隔异常", "01:15 门锁连续两次 LockDoor 命令均未成功锁定(LockState=2),并触发 DoorLockAlarm(AlarmCode=0)", "18:12之后住户持续在室内活动(客厅运动传感器、厨房灶具、洗碗机均有使用记录),无二次出门迹象,门应早已关闭"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和磁铁对齐情况,可能存在松动或偏移导致关门状态无法被正确检测", "清洁传感器触点,排除灰尘或异物干扰", "检查 front_door_contact 的电池电量或供电状态,低电量可能导致状态上报不及时", "排查凌晨01:15门锁锁定失败的原因(锁舌是否受阻、电机是否正常),确认门锁机械部件工作正常", "考虑为入户门传感器设置离线/超时告警规则,当开门状态持续超过一定时间(如5分钟)自动推送通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.884676694869995, "api_error": null} {"episode_id": "SQ1_TP_A_0045", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0045.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260674, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-22T21:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)在18:01住户回家开门后未记录到关门事件,直到21:55才报告门关闭,存在状态上报异常。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含三个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其工作状态。\",\n \"推理步骤2: 早晨07:28出门序列正常:门锁解锁(LockState=2) → 门打开(StateValue=False) → 门关闭(StateValue=True) → 门锁自动上锁(LockState=1),整个过程在9秒内完成,符合预期。\",\n \"推理步骤3: 傍晚18:01回家时,门锁解锁(LockState=2) → 门打开(StateValue=False),但之后没有关门事件(StateValue=True)。住户进门后开灯、开空调,说明人已进屋,门理应已关上。\",\n \"推理步骤4: 直到21:55:44才出现 front_door_contact StateValue=True(门关闭),距开门已过去近4小时。紧接着21:55:45门锁自动上锁。这意味着要么门真的开了近4小时(极不合理),要么传感器漏报了关门事件。\",\n \"推理步骤5: 21:24出现了门锁告警事件 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败/卡死告警。连续两次收到 LockDoor 命令且状态均为2(未锁定),说明门锁尝试上锁但失败,这与门传感器认为门仍处于打开状态一致。\",\n \"推理步骤6: 玄关灯在18:01开启、21:55关闭,行为与住户活动吻合,工作正常。\",\n \"推理步骤7: 综合判断:front_door_contact 传感器在18:01开门后未能及时上报关门状态,导致门锁无法正常自动上锁(21:24锁定失败告警),直到21:55才恢复。最可能的原因是传感器粘滞、错位或无线通信丢包,属于设备故障。\"\n ],\n \"key_evidence\": [\n \"18:01:02 front_door_contact 报告门打开(StateValue=False),之后近4小时无关门事件\",\n \"21:24:15 门锁连续两次执行 LockDoor 命令均失败(LockState保持2),并触发 DoorLockAlarm(AlarmCode=0)\",\n \"21:55:44 才出现关门事件(StateValue=True),随后门锁自动上锁成功\",\n \"对比早晨07:28序列,开门到关门仅6秒,傍晚却间隔近4小时,行为明显异常\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置,确认磁铁与传感器之间的间距是否正常、有无错位或松动\",\n \"清洁传感器表面,排除灰尘或异物导致的磁感应失灵\",\n \"检查传感器电池电量,低电量可能导致间歇性漏报\",\n \"在门锁设置中确认自动上锁策略,考虑增加定时上锁作为备用机制,避免因传感器故障导致门锁长时间未锁\",\n \"如问题反复出现,建议更换 front_door_contact 传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)在18:01住户回家开门后未记录到关门事件,直到21:55才报告门关闭,存在状态上报异常。", "reasoning": ["推理步骤1: entrance 区域包含三个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)。逐一检查其工作状态。", "推理步骤2: 早晨07:28出门序列正常:门锁解锁(LockState=2) → 门打开(StateValue=False) → 门关闭(StateValue=True) → 门锁自动上锁(LockState=1),整个过程在9秒内完成,符合预期。", "推理步骤3: 傍晚18:01回家时,门锁解锁(LockState=2) → 门打开(StateValue=False),但之后没有关门事件(StateValue=True)。住户进门后开灯、开空调,说明人已进屋,门理应已关上。", "推理步骤4: 直到21:55:44才出现 front_door_contact StateValue=True(门关闭),距开门已过去近4小时。紧接着21:55:45门锁自动上锁。这意味着要么门真的开了近4小时(极不合理),要么传感器漏报了关门事件。", "推理步骤5: 21:24出现了门锁告警事件 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败/卡死告警。连续两次收到 LockDoor 命令且状态均为2(未锁定),说明门锁尝试上锁但失败,这与门传感器认为门仍处于打开状态一致。", "推理步骤6: 玄关灯在18:01开启、21:55关闭,行为与住户活动吻合,工作正常。", "推理步骤7: 综合判断:front_door_contact 传感器在18:01开门后未能及时上报关门状态,导致门锁无法正常自动上锁(21:24锁定失败告警),直到21:55才恢复。最可能的原因是传感器粘滞、错位或无线通信丢包,属于设备故障。"], "key_evidence": ["18:01:02 front_door_contact 报告门打开(StateValue=False),之后近4小时无关门事件", "21:24:15 门锁连续两次执行 LockDoor 命令均失败(LockState保持2),并触发 DoorLockAlarm(AlarmCode=0)", "21:55:44 才出现关门事件(StateValue=True),随后门锁自动上锁成功", "对比早晨07:28序列,开门到关门仅6秒,傍晚却间隔近4小时,行为明显异常"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置,确认磁铁与传感器之间的间距是否正常、有无错位或松动", "清洁传感器表面,排除灰尘或异物导致的磁感应失灵", "检查传感器电池电量,低电量可能导致间歇性漏报", "在门锁设置中确认自动上锁策略,考虑增加定时上锁作为备用机制,避免因传感器故障导致门锁长时间未锁", "如问题反复出现,建议更换 front_door_contact 传感器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.187243938446045, "api_error": null} {"episode_id": "SQ1_TP_A_0051", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0051.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260680, "scenario_id": "DF-03", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-22T21:54:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室运动传感器在 21:54 前后出现快速反复触发(抖动),疑似传感器硬件故障或安装松动。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天数据正常,夜间约 22.0°C,午间峰值约 24.8°C,变化平滑且与客厅/厨房趋势一致,无异常跳变或 None 值,工作正常。\",\n \"推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,未见异常,工作正常。\",\n \"推理步骤3: 卧室运动传感器(bedroom_occupancy)在 21:54:00~21:55:10 的约 70 秒内,出现了 5 次状态翻转(1→0→1→0→1),间隔仅 5~30 秒,呈现典型的传感器抖动(chattering)模式。\",\n \"推理步骤4: 正常的人体活动(如进出房间)不会在如此短的时间内产生如此频繁的占用/空闲切换。对比当天 06:26 和 22:04 的正常触发,状态变化是单次且稳定的。\",\n \"推理步骤5: 该抖动发生在住户尚在客厅活动期间(客厅灯和空调直到 22:04 才关闭),卧室当时不太可能有人反复进出,进一步排除正常行为的可能性。\",\n \"推理步骤6: 置信度定为 medium 而非 high,是因为单次抖动事件也可能由宠物活动、传感器边缘区域的微小运动等偶发因素引起,需要持续观察是否复现。\"\n ],\n \"key_evidence\": [\n \"21:54:00~21:55:10 期间 bedroom_occupancy 在约 70 秒内发生 5 次状态翻转(1→0→1→0→1),间隔 5~30 秒,呈典型抖动模式\",\n \"同时段住户仍在客厅(客厅灯/空调 22:04 才关闭),卧室不应有频繁进出活动\",\n \"对比当天其他时段(06:26、22:04)运动传感器触发均为单次稳定变化\"\n ],\n \"recommended_actions\": [\n \"检查卧室运动传感器的安装是否牢固,确认没有松动或朝向偏移\",\n \"清洁传感器镜头表面,排除灰尘或昆虫干扰导致的误触发\",\n \"持续监控未来几天该传感器是否再次出现类似快速抖动,若复现则考虑更换传感器\",\n \"如有条件,可在传感器固件或自动化规则中增加去抖(debounce)逻辑,避免短时间内重复触发影响其他联动\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室运动传感器在 21:54 前后出现快速反复触发(抖动),疑似传感器硬件故障或安装松动。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天数据正常,夜间约 22.0°C,午间峰值约 24.8°C,变化平滑且与客厅/厨房趋势一致,无异常跳变或 None 值,工作正常。", "推理步骤2: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,未见异常,工作正常。", "推理步骤3: 卧室运动传感器(bedroom_occupancy)在 21:54:00~21:55:10 的约 70 秒内,出现了 5 次状态翻转(1→0→1→0→1),间隔仅 5~30 秒,呈现典型的传感器抖动(chattering)模式。", "推理步骤4: 正常的人体活动(如进出房间)不会在如此短的时间内产生如此频繁的占用/空闲切换。对比当天 06:26 和 22:04 的正常触发,状态变化是单次且稳定的。", "推理步骤5: 该抖动发生在住户尚在客厅活动期间(客厅灯和空调直到 22:04 才关闭),卧室当时不太可能有人反复进出,进一步排除正常行为的可能性。", "推理步骤6: 置信度定为 medium 而非 high,是因为单次抖动事件也可能由宠物活动、传感器边缘区域的微小运动等偶发因素引起,需要持续观察是否复现。"], "key_evidence": ["21:54:00~21:55:10 期间 bedroom_occupancy 在约 70 秒内发生 5 次状态翻转(1→0→1→0→1),间隔 5~30 秒,呈典型抖动模式", "同时段住户仍在客厅(客厅灯/空调 22:04 才关闭),卧室不应有频繁进出活动", "对比当天其他时段(06:26、22:04)运动传感器触发均为单次稳定变化"], "recommended_actions": ["检查卧室运动传感器的安装是否牢固,确认没有松动或朝向偏移", "清洁传感器镜头表面,排除灰尘或昆虫干扰导致的误触发", "持续监控未来几天该传感器是否再次出现类似快速抖动,若复现则考虑更换传感器", "如有条件,可在传感器固件或自动化规则中增加去抖(debounce)逻辑,避免短时间内重复触发影响其他联动"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.54705572128296, "api_error": null} {"episode_id": "SQ1_TP_A_0053", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0053.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260682, "scenario_id": "DF-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-04T03:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的温度传感器和运动传感器工作正常,数据符合预期规律。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。\",\n \"推理步骤2: 温度变化曲线合理——夜间(00:00-05:30)维持在约22.9-23.1°C,清晨6点后随日照升温,中午12:00-12:30达到峰值约25.8°C,午后逐步回落,晚间回到约23.3°C。这符合夏季(6月)一室一厅住宅的自然温度变化规律。\",\n \"推理步骤3: 18:15住户回家后开启空调(SystemMode=3,制冷模式),此后客厅温度从约24.5°C持续下降至21:57关闭空调时的约23.6°C,空调制冷效果在温度数据中得到正确反映,说明温度传感器响应灵敏且准确。\",\n \"推理步骤4: 客厅运动传感器(living_room_occupancy)在18:15住户进门后检测到占用(Occupancy=1),19:47再次确认占用,与住户在家活动的场景一致。白天住户外出期间(07:20离家后)无误触发记录,说明传感器工作正常、无误报。\",\n \"推理步骤5: 对比厨房温度传感器在19:00出现异常高温(28.35°C)以及两次上报 None 值的情况,客厅传感器全天无任何异常读数或空值,数据质量明显优于厨房传感器,进一步佐证其健康状态。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点均正常上报,无 None 值或异常跳变,温度范围 22.91°C ~ 25.83°C 符合夏季室内自然波动\",\n \"18:15开启空调后温度持续平稳下降(24.56°C → 23.63°C),传感器准确反映了空调制冷效果\",\n \"living_room_occupancy 仅在住户实际在家时段(18:15、19:47)触发,无深夜或无人时段的误报\"\n ],\n \"recommended_actions\": [\n \"客厅传感器无需处理,建议保持当前状态继续监测\",\n \"注意:厨房温度传感器存在异常(两次上报 None、19:00异常高温28.35°C),建议优先排查厨房传感器是否故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的温度传感器和运动传感器工作正常,数据符合预期规律。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。", "推理步骤2: 温度变化曲线合理——夜间(00:00-05:30)维持在约22.9-23.1°C,清晨6点后随日照升温,中午12:00-12:30达到峰值约25.8°C,午后逐步回落,晚间回到约23.3°C。这符合夏季(6月)一室一厅住宅的自然温度变化规律。", "推理步骤3: 18:15住户回家后开启空调(SystemMode=3,制冷模式),此后客厅温度从约24.5°C持续下降至21:57关闭空调时的约23.6°C,空调制冷效果在温度数据中得到正确反映,说明温度传感器响应灵敏且准确。", "推理步骤4: 客厅运动传感器(living_room_occupancy)在18:15住户进门后检测到占用(Occupancy=1),19:47再次确认占用,与住户在家活动的场景一致。白天住户外出期间(07:20离家后)无误触发记录,说明传感器工作正常、无误报。", "推理步骤5: 对比厨房温度传感器在19:00出现异常高温(28.35°C)以及两次上报 None 值的情况,客厅传感器全天无任何异常读数或空值,数据质量明显优于厨房传感器,进一步佐证其健康状态。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点均正常上报,无 None 值或异常跳变,温度范围 22.91°C ~ 25.83°C 符合夏季室内自然波动", "18:15开启空调后温度持续平稳下降(24.56°C → 23.63°C),传感器准确反映了空调制冷效果", "living_room_occupancy 仅在住户实际在家时段(18:15、19:47)触发,无深夜或无人时段的误报"], "recommended_actions": ["客厅传感器无需处理,建议保持当前状态继续监测", "注意:厨房温度传感器存在异常(两次上报 None、19:00异常高温28.35°C),建议优先排查厨房传感器是否故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.1307692527771, "api_error": null} {"episode_id": "SQ1_TP_A_0057", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0057.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20260686, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-26T09:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室窗帘电机疑似故障,下行关闭指令发出后持续处于运动状态,未在合理时间内到达目标位置。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天数据完整,每30分钟上报一次,数值在21.9°C~24.9°C之间波动,符合夏季室内温度的昼夜变化规律,传感器工作正常。\",\n \"推理步骤2: 卧室运动传感器(bedroom_occupancy)在06:44检测到有人、06:44:31检测到无人(住户去卫生间/厨房),22:11:18检测到有人、22:58:43检测到无人(住户入睡后传感器超时清零),触发时间与灯光、门锁等事件高度吻合,工作正常。\",\n \"推理步骤3: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,这在住户白天外出的场景下是合理的,传感器工作正常。\",\n \"推理步骤4: 卧室窗帘(bedroom_window)在06:44:13被打开(LiftPercent100ths=0,即完全打开),这是住户起床时的正常操作。\",\n \"推理步骤5: 09:51:00 卧室窗帘收到 DownOrClose 指令开始关闭,09:51:01 OperationalStatus=0b000010 表示电机正在下行运动。但09:51:30时仍在运动且位置仅到50%(5000),09:52:00时 OperationalStatus 仍为0b000010(仍在运动),之后日志中再无该设备的运动完成(OperationalStatus=0)事件。\",\n \"推理步骤6: 直到22:11:30窗帘位置突然变为10000(完全关闭),中间长达12小时没有任何状态更新,且缺少运动停止事件。正常窗帘从50%关闭到100%不应超过1-2分钟。这表明窗帘电机可能在09:52前后出现卡滞或通信中断,最终位置的跳变可能是住户手动操作或系统重置的结果。\"\n ],\n \"key_evidence\": [\n \"09:51:00 窗帘收到 DownOrClose 指令,09:51:01 开始运动(OperationalStatus=0b000010),09:51:30 位置仅到50%且仍在运动,09:52:00 仍显示运动中,之后无运动完成事件\",\n \"从09:52到22:11长达约12小时无窗帘状态更新,22:11:30位置直接跳变为10000(完全关闭),缺少正常的运动停止过渡事件\",\n \"卧室温度传感器、运动传感器、窗户传感器数据均正常,异常仅限于窗帘设备\"\n ],\n \"recommended_actions\": [\n \"检查卧室窗帘电机是否存在机械卡滞,清理导轨并测试手动开合是否顺畅\",\n \"检查窗帘控制器的网络连接稳定性,确认是否存在间歇性离线问题\",\n \"在智能家居平台中查看窗帘设备的离线/在线记录,排查09:52至22:11期间是否发生过设备掉线\",\n \"如问题反复出现,考虑更换窗帘电机或控制模块\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室窗帘电机疑似故障,下行关闭指令发出后持续处于运动状态,未在合理时间内到达目标位置。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天数据完整,每30分钟上报一次,数值在21.9°C~24.9°C之间波动,符合夏季室内温度的昼夜变化规律,传感器工作正常。", "推理步骤2: 卧室运动传感器(bedroom_occupancy)在06:44检测到有人、06:44:31检测到无人(住户去卫生间/厨房),22:11:18检测到有人、22:58:43检测到无人(住户入睡后传感器超时清零),触发时间与灯光、门锁等事件高度吻合,工作正常。", "推理步骤3: 卧室窗户传感器(bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持关闭状态,这在住户白天外出的场景下是合理的,传感器工作正常。", "推理步骤4: 卧室窗帘(bedroom_window)在06:44:13被打开(LiftPercent100ths=0,即完全打开),这是住户起床时的正常操作。", "推理步骤5: 09:51:00 卧室窗帘收到 DownOrClose 指令开始关闭,09:51:01 OperationalStatus=0b000010 表示电机正在下行运动。但09:51:30时仍在运动且位置仅到50%(5000),09:52:00时 OperationalStatus 仍为0b000010(仍在运动),之后日志中再无该设备的运动完成(OperationalStatus=0)事件。", "推理步骤6: 直到22:11:30窗帘位置突然变为10000(完全关闭),中间长达12小时没有任何状态更新,且缺少运动停止事件。正常窗帘从50%关闭到100%不应超过1-2分钟。这表明窗帘电机可能在09:52前后出现卡滞或通信中断,最终位置的跳变可能是住户手动操作或系统重置的结果。"], "key_evidence": ["09:51:00 窗帘收到 DownOrClose 指令,09:51:01 开始运动(OperationalStatus=0b000010),09:51:30 位置仅到50%且仍在运动,09:52:00 仍显示运动中,之后无运动完成事件", "从09:52到22:11长达约12小时无窗帘状态更新,22:11:30位置直接跳变为10000(完全关闭),缺少正常的运动停止过渡事件", "卧室温度传感器、运动传感器、窗户传感器数据均正常,异常仅限于窗帘设备"], "recommended_actions": ["检查卧室窗帘电机是否存在机械卡滞,清理导轨并测试手动开合是否顺畅", "检查窗帘控制器的网络连接稳定性,确认是否存在间歇性离线问题", "在智能家居平台中查看窗帘设备的离线/在线记录,排查09:52至22:11期间是否发生过设备掉线", "如问题反复出现,考虑更换窗帘电机或控制模块"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.68510103225708, "api_error": null} {"episode_id": "SQ1_TP_A_0061", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0061.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20260690, "scenario_id": "DF-05", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-16T19:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温跳变和多次读数丢失(None),同时烟雾报警器报告硬件故障,kitchen区域存在多个传感器工作异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约2464跳升至2834(约28.3°C),相比30分钟前上升了约3.7°C,这一跳变幅度远超正常波动(全天正常波动幅度约0.1-0.2°C/30min)。\",\n \"推理步骤2: 在19:04和19:35,厨房温度传感器报告MeasuredValue = None,表示传感器无法正常读取温度值,出现了数据丢失/读取失败。\",\n \"推理步骤3: 19:00的异常高温读数2834出现在灶具开启(19:03)之前,说明这不是灶具加热导致的正常升温,更可能是传感器本身出现故障产生的错误读数。\",\n \"推理步骤4: 19:30温度传感器再次报告2828的异常高值,而此时灶具已关闭(19:34关闭),且20:00之后温度恢复到2406的正常范围,进一步印证之前的异常读数是传感器故障所致。\",\n \"推理步骤5: 19:47烟雾报警器触发HardwareFaultAlert=True,ExpressedState=5(硬件故障状态),并发出HardwareFault事件,表明烟雾报警器自身检测到硬件问题,无法正常工作。\",\n \"推理步骤6: 两个传感器同时出现异常,可能存在共同原因(如厨房环境因素影响、电路问题、或油烟/蒸汽侵入传感器)。\"\n ],\n \"key_evidence\": [\n \"19:00和19:30厨房温度传感器读数异常跳升至2834/2828,远超同期其他房间温度变化趋势\",\n \"19:04和19:35厨房温度传感器报告MeasuredValue = None,出现读数丢失\",\n \"19:47烟雾报警器报告HardwareFaultAlert=True,ExpressedState=5,触发HardwareFault事件\",\n \"异常高温读数出现在灶具开启之前(19:00 vs 19:03),排除正常烹饪升温的解释\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房烟雾报警器硬件状态,必要时更换设备,确保火灾预警能力恢复\",\n \"检查厨房温度传感器的安装位置和状态,清洁或更换传感器\",\n \"在烟雾报警器修复前,加强人工巡检厨房安全,尤其是烹饪期间\",\n \"检查厨房传感器供电线路和通信链路,排查是否存在共性电气问题\",\n \"考虑将温度传感器安装位置远离灶具和油烟区域,减少环境干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温跳变和多次读数丢失(None),同时烟雾报警器报告硬件故障,kitchen区域存在多个传感器工作异常。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约2464跳升至2834(约28.3°C),相比30分钟前上升了约3.7°C,这一跳变幅度远超正常波动(全天正常波动幅度约0.1-0.2°C/30min)。", "推理步骤2: 在19:04和19:35,厨房温度传感器报告MeasuredValue = None,表示传感器无法正常读取温度值,出现了数据丢失/读取失败。", "推理步骤3: 19:00的异常高温读数2834出现在灶具开启(19:03)之前,说明这不是灶具加热导致的正常升温,更可能是传感器本身出现故障产生的错误读数。", "推理步骤4: 19:30温度传感器再次报告2828的异常高值,而此时灶具已关闭(19:34关闭),且20:00之后温度恢复到2406的正常范围,进一步印证之前的异常读数是传感器故障所致。", "推理步骤5: 19:47烟雾报警器触发HardwareFaultAlert=True,ExpressedState=5(硬件故障状态),并发出HardwareFault事件,表明烟雾报警器自身检测到硬件问题,无法正常工作。", "推理步骤6: 两个传感器同时出现异常,可能存在共同原因(如厨房环境因素影响、电路问题、或油烟/蒸汽侵入传感器)。"], "key_evidence": ["19:00和19:30厨房温度传感器读数异常跳升至2834/2828,远超同期其他房间温度变化趋势", "19:04和19:35厨房温度传感器报告MeasuredValue = None,出现读数丢失", "19:47烟雾报警器报告HardwareFaultAlert=True,ExpressedState=5,触发HardwareFault事件", "异常高温读数出现在灶具开启之前(19:00 vs 19:03),排除正常烹饪升温的解释"], "recommended_actions": ["立即检查厨房烟雾报警器硬件状态,必要时更换设备,确保火灾预警能力恢复", "检查厨房温度传感器的安装位置和状态,清洁或更换传感器", "在烟雾报警器修复前,加强人工巡检厨房安全,尤其是烹饪期间", "检查厨房传感器供电线路和通信链路,排查是否存在共性电气问题", "考虑将温度传感器安装位置远离灶具和油烟区域,减少环境干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.93445634841919, "api_error": null} {"episode_id": "SQ1_TP_A_0071", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0071.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260700, "scenario_id": "DF-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-04T03:01:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的温度传感器和运动传感器工作正常,数据合理且与环境变化一致。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。\",\n \"推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约 23.0°C,午间最高约 25.9°C,傍晚回家开空调后逐步降至 23.3°C,走势平滑无突变。\",\n \"推理步骤3: 客厅温度与卧室、厨房温度传感器的趋势高度一致(客厅略高于卧室约 0.8-1.0°C),三者之间无异常偏差,说明传感器读数可信,未出现漂移或故障。\",\n \"推理步骤4: 18:15 住户回家后开启空调(Thermostat.SystemMode=3,制冷模式),此后客厅温度从约 24.5°C 持续下降至 23.3°C,温度响应与空调运行完全吻合。\",\n \"推理步骤5: 客厅运动传感器(living_room_occupancy)在 18:15 住户进门后触发 Occupancy=1,20:05 再次确认有人,与开灯、开空调等操作时间线吻合,行为逻辑合理。\",\n \"推理步骤6: 对比厨房温度传感器在 18:00 和 18:30 出现异常高值 2866(28.66°C,偏离趋势约 4°C)以及 18:56 和 19:46 两次报 None 值,客厅传感器无任何此类异常,进一步印证其工作状态良好。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48个采样点无一缺失或异常值,温度范围 2291-2587(22.91°C-25.87°C),变化平滑连续\",\n \"living_room_occupancy 在 18:15 和 20:05 两次触发,与入户门开锁、开灯、开空调的时间线完全吻合\",\n \"18:15 开启空调制冷后,客厅温度从 24.5°C 稳步下降至 23.3°C,传感器准确反映了环境变化\"\n ],\n \"recommended_actions\": [\n \"客厅传感器无需处理,建议保持当前状态\",\n \"注意:厨房温度传感器存在异常(两次 None 值和异常高温读数 28.66°C),建议单独排查厨房传感器是否存在故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的温度传感器和运动传感器工作正常,数据合理且与环境变化一致。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无任何缺失或 None 值,采样频率完全正常。", "推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约 23.0°C,午间最高约 25.9°C,傍晚回家开空调后逐步降至 23.3°C,走势平滑无突变。", "推理步骤3: 客厅温度与卧室、厨房温度传感器的趋势高度一致(客厅略高于卧室约 0.8-1.0°C),三者之间无异常偏差,说明传感器读数可信,未出现漂移或故障。", "推理步骤4: 18:15 住户回家后开启空调(Thermostat.SystemMode=3,制冷模式),此后客厅温度从约 24.5°C 持续下降至 23.3°C,温度响应与空调运行完全吻合。", "推理步骤5: 客厅运动传感器(living_room_occupancy)在 18:15 住户进门后触发 Occupancy=1,20:05 再次确认有人,与开灯、开空调等操作时间线吻合,行为逻辑合理。", "推理步骤6: 对比厨房温度传感器在 18:00 和 18:30 出现异常高值 2866(28.66°C,偏离趋势约 4°C)以及 18:56 和 19:46 两次报 None 值,客厅传感器无任何此类异常,进一步印证其工作状态良好。"], "key_evidence": ["living_room_temp_sensor 全天48个采样点无一缺失或异常值,温度范围 2291-2587(22.91°C-25.87°C),变化平滑连续", "living_room_occupancy 在 18:15 和 20:05 两次触发,与入户门开锁、开灯、开空调的时间线完全吻合", "18:15 开启空调制冷后,客厅温度从 24.5°C 稳步下降至 23.3°C,传感器准确反映了环境变化"], "recommended_actions": ["客厅传感器无需处理,建议保持当前状态", "注意:厨房温度传感器存在异常(两次 None 值和异常高温读数 28.66°C),建议单独排查厨房传感器是否存在故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.281955242156982, "api_error": null} {"episode_id": "SQ1_TP_A_0073", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0073.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20260702, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-05T21:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域的温度传感器和运动传感器均工作正常,数据合理且与环境变化一致。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值,采样频率完全正常。\",\n \"推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约 22.9°C,午间最高约 25.8°C,傍晚逐步回落。整体波动范围 22.9°C~25.8°C,合理且无突变。\",\n \"推理步骤3: 18:06 住户回家后开启空调(制冷模式 SystemMode=3),此后客厅温度从约 24.5°C 持续下降至 23.3°C,说明温度传感器能正确反映空调制冷效果,响应灵敏。\",\n \"推理步骤4: 客厅运动传感器(living_room_occupancy)在 07:15 住户出门后无触发,18:06 住户回家后正确检测到占用(Occupancy=1),20:03 再次确认占用,与入户门锁/灯光等事件时间线吻合,无误报或漏报。\",\n \"推理步骤5: 对比厨房温度传感器在 19:05 和 19:49 出现两次 None 值(疑似故障),客厅传感器全天无任何异常读数,数据完整性良好。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点均正常上报,无缺失或 None 值,温度范围 2292~2581(约 22.9°C~25.8°C),符合夏季昼夜变化规律\",\n \"18:06 开启空调制冷后,温度从 2456 逐步降至 2333,传感器正确反映了环境温度变化\",\n \"客厅运动传感器在住户出门期间(07:15~18:06)无触发,回家后正确检测到人体存在,与门锁、灯光事件时间线一致\"\n ],\n \"recommended_actions\": [\n \"客厅传感器无需处理,建议保持当前状态继续监测\",\n \"注意:厨房温度传感器出现了两次 None 读数(19:05、19:49),建议排查厨房传感器是否存在间歇性故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域的温度传感器和运动传感器均工作正常,数据合理且与环境变化一致。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值,采样频率完全正常。", "推理步骤2: 温度变化曲线符合夏季昼夜规律——凌晨最低约 22.9°C,午间最高约 25.8°C,傍晚逐步回落。整体波动范围 22.9°C~25.8°C,合理且无突变。", "推理步骤3: 18:06 住户回家后开启空调(制冷模式 SystemMode=3),此后客厅温度从约 24.5°C 持续下降至 23.3°C,说明温度传感器能正确反映空调制冷效果,响应灵敏。", "推理步骤4: 客厅运动传感器(living_room_occupancy)在 07:15 住户出门后无触发,18:06 住户回家后正确检测到占用(Occupancy=1),20:03 再次确认占用,与入户门锁/灯光等事件时间线吻合,无误报或漏报。", "推理步骤5: 对比厨房温度传感器在 19:05 和 19:49 出现两次 None 值(疑似故障),客厅传感器全天无任何异常读数,数据完整性良好。"], "key_evidence": ["客厅温度传感器全天48个采样点均正常上报,无缺失或 None 值,温度范围 2292~2581(约 22.9°C~25.8°C),符合夏季昼夜变化规律", "18:06 开启空调制冷后,温度从 2456 逐步降至 2333,传感器正确反映了环境温度变化", "客厅运动传感器在住户出门期间(07:15~18:06)无触发,回家后正确检测到人体存在,与门锁、灯光事件时间线一致"], "recommended_actions": ["客厅传感器无需处理,建议保持当前状态继续监测", "注意:厨房温度传感器出现了两次 None 读数(19:05、19:49),建议排查厨房传感器是否存在间歇性故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.997796058654785, "api_error": null} {"episode_id": "SQ1_TP_B_0000", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0000.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20260629, "scenario_id": "DF-03", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-08T07:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器故障或误报。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,从凌晨约23°C到正午约25.8°C再回落,变化曲线平滑合理,温度传感器工作正常。\",\n \"推理步骤2: 次卧窗户传感器和窗帘全天无状态变化事件,无异常。\",\n \"推理步骤3: 次卧运动传感器在07:48:00~07:49:10期间出现快速交替触发(Occupancy在约30秒间隔内反复在0和1之间切换了5次),且最终停留在Occupancy=1状态。\",\n \"推理步骤4: 此时住户已于07:24出门(入户门解锁→开门→关门→自动上锁),家中应无人。在无人状态下次卧不应有运动检测。\",\n \"推理步骤5: 快速反复触发的模式(30秒周期的0→1交替)更符合传感器灵敏度过高或硬件故障的特征,而非真实人体移动。真实入侵者的运动模式通常不会如此规律地快速出现和消失。\",\n \"推理步骤6: 同时段无入户门开启记录、无窗户传感器触发,排除了外部入侵的可能性,进一步支持设备故障判断。\"\n ],\n \"key_evidence\": [\n \"07:48:00~07:49:10 次卧运动传感器在约70秒内触发5次状态变化(1→0→1→0→1),间隔极短且规律\",\n \"住户已于07:24离家(入户门手动解锁→开门→关门→自动上锁),家中应处于无人状态\",\n \"同时段入户门、次卧窗户等入侵相关传感器均无触发,排除入侵可能\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否对准了窗帘、空调出风口等可能引起误触发的物体\",\n \"适当降低次卧运动传感器的灵敏度设置\",\n \"观察该传感器后续是否继续出现类似的无人时段反复触发,若持续发生建议更换传感器硬件\",\n \"考虑设置离家模式下次卧运动传感器的告警规则,以便区分真实入侵和传感器误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器故障或误报。", "reasoning": ["推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,从凌晨约23°C到正午约25.8°C再回落,变化曲线平滑合理,温度传感器工作正常。", "推理步骤2: 次卧窗户传感器和窗帘全天无状态变化事件,无异常。", "推理步骤3: 次卧运动传感器在07:48:00~07:49:10期间出现快速交替触发(Occupancy在约30秒间隔内反复在0和1之间切换了5次),且最终停留在Occupancy=1状态。", "推理步骤4: 此时住户已于07:24出门(入户门解锁→开门→关门→自动上锁),家中应无人。在无人状态下次卧不应有运动检测。", "推理步骤5: 快速反复触发的模式(30秒周期的0→1交替)更符合传感器灵敏度过高或硬件故障的特征,而非真实人体移动。真实入侵者的运动模式通常不会如此规律地快速出现和消失。", "推理步骤6: 同时段无入户门开启记录、无窗户传感器触发,排除了外部入侵的可能性,进一步支持设备故障判断。"], "key_evidence": ["07:48:00~07:49:10 次卧运动传感器在约70秒内触发5次状态变化(1→0→1→0→1),间隔极短且规律", "住户已于07:24离家(入户门手动解锁→开门→关门→自动上锁),家中应处于无人状态", "同时段入户门、次卧窗户等入侵相关传感器均无触发,排除入侵可能"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否对准了窗帘、空调出风口等可能引起误触发的物体", "适当降低次卧运动传感器的灵敏度设置", "观察该传感器后续是否继续出现类似的无人时段反复触发,若持续发生建议更换传感器硬件", "考虑设置离家模式下次卧运动传感器的告警规则,以便区分真实入侵和传感器误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.154996156692505, "api_error": null} {"episode_id": "SQ1_TP_A_0074", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_A_0074.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20260703, "scenario_id": "DF-05", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-27T14:27:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房存在两项传感器异常:温度传感器多次报告 None 值且在 11:00-11:30 出现不合理高温读数,烟雾报警器报告硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:10、09:54、11:53、12:48、17:47、18:42),表明传感器在高温或灶具工作时反复失联或无法正常采集数据。\",\n \"推理步骤2: 在 11:00 和 11:30,灶具处于关闭状态(09:53 已关闭,11:52 才重新开启),但厨房温度传感器读数突然飙升至 2958/2952(约 29.5°C),而同一时段客厅仅约 25.5°C、卧室约 24.5°C。厨房在无热源运行时比其他房间高出约 4°C,且与前后时段自身读数(约 25.1-25.2°C)存在明显断层,这属于异常跳变,可能是传感器漂移或间歇性故障。\",\n \"推理步骤3: 厨房烟雾报警器在 14:27 报告 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。此时灶具已关闭近 1.5 小时,温度正常下降中,不存在真实烟雾/火灾场景,说明这是设备自身硬件故障而非环境触发。\",\n \"推理步骤4: 烟雾报警器故障后,整个下午及晚间日志中未见任何恢复事件(HardwareFaultAlert 未回到 False),说明故障持续存在,该报警器当前处于不可靠状态,无法正常履行烟雾/CO 检测职责。\",\n \"推理步骤5: 综合来看,厨房两个关键安全传感器均存在异常——温度传感器间歇性失效并出现异常读数,烟雾报警器硬件故障未恢复。这构成了厨房区域的安全监测盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:10、09:54、11:53、12:48、17:47、18:42 六次报告 MeasuredValue = None\",\n \"11:00-11:30 灶具关闭期间,厨房温度异常跳升至 2958/2952(约 29.5°C),与客厅/卧室温差达 4°C,与自身前后读数断层约 4.5°C\",\n \"14:27 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5 及 HardwareFault 事件,且全天未见恢复记录\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,硬件故障状态下无法提供火灾/CO 预警,这是最高优先级安全隐患\",\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数溢出返回 None;考虑重新校准或更换该传感器\",\n \"在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立式烟雾报警器作为备用\",\n \"排查 11:00-11:30 温度异常跳变原因,确认是传感器故障还是存在未被日志记录的热源\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房存在两项传感器异常:温度传感器多次报告 None 值且在 11:00-11:30 出现不合理高温读数,烟雾报警器报告硬件故障。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:10、09:54、11:53、12:48、17:47、18:42),表明传感器在高温或灶具工作时反复失联或无法正常采集数据。", "推理步骤2: 在 11:00 和 11:30,灶具处于关闭状态(09:53 已关闭,11:52 才重新开启),但厨房温度传感器读数突然飙升至 2958/2952(约 29.5°C),而同一时段客厅仅约 25.5°C、卧室约 24.5°C。厨房在无热源运行时比其他房间高出约 4°C,且与前后时段自身读数(约 25.1-25.2°C)存在明显断层,这属于异常跳变,可能是传感器漂移或间歇性故障。", "推理步骤3: 厨房烟雾报警器在 14:27 报告 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。此时灶具已关闭近 1.5 小时,温度正常下降中,不存在真实烟雾/火灾场景,说明这是设备自身硬件故障而非环境触发。", "推理步骤4: 烟雾报警器故障后,整个下午及晚间日志中未见任何恢复事件(HardwareFaultAlert 未回到 False),说明故障持续存在,该报警器当前处于不可靠状态,无法正常履行烟雾/CO 检测职责。", "推理步骤5: 综合来看,厨房两个关键安全传感器均存在异常——温度传感器间歇性失效并出现异常读数,烟雾报警器硬件故障未恢复。这构成了厨房区域的安全监测盲区。"], "key_evidence": ["厨房温度传感器在 09:10、09:54、11:53、12:48、17:47、18:42 六次报告 MeasuredValue = None", "11:00-11:30 灶具关闭期间,厨房温度异常跳升至 2958/2952(约 29.5°C),与客厅/卧室温差达 4°C,与自身前后读数断层约 4.5°C", "14:27 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5 及 HardwareFault 事件,且全天未见恢复记录"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,硬件故障状态下无法提供火灾/CO 预警,这是最高优先级安全隐患", "检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数溢出返回 None;考虑重新校准或更换该传感器", "在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立式烟雾报警器作为备用", "排查 11:00-11:30 温度异常跳变原因,确认是传感器故障还是存在未被日志记录的热源"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.70072364807129, "api_error": null} {"episode_id": "SQ1_TP_B_0009", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0009.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20260638, "scenario_id": "DF-04", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-27T20:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入口区域的运动传感器(entrance_occupancy)在全天有明确人员进出活动的情况下,未产生任何占用检测事件,疑似设备故障或离线。\",\n \"reasoning\": [\n \"推理步骤1: 检查整天日志中 entrance_occupancy 传感器的记录,发现全天24小时内该传感器没有产生任何 OccupancySensing.Occupancy 事件。\",\n \"推理步骤2: 然而日志显示 front_door_contact(入户门传感器)在 22:59:17 检测到门打开事件,front_door_lock 在 20:31 有锁门操作和报警事件、在 22:59:18 有自动上锁事件,说明确实有人经过玄关区域。\",\n \"推理步骤3: 对比 bathroom_occupancy 和 living_room_occupancy 等同类传感器,它们在有人活动时均正常上报了占用状态变化(如 08:34、10:10 等时刻),而 entrance_occupancy 在人员必然经过的情况下仍无任何输出。\",\n \"推理步骤4: 玄关灯(entrance_light)同样全天无任何开关记录,如果灯是联动运动传感器触发的,这进一步印证传感器未工作;如果灯是独立控制的,则说明玄关区域设备整体可能存在通信问题。\",\n \"推理步骤5: 综合判断,entrance_occupancy 传感器极大概率处于离线、电池耗尽或硬件故障状态。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy 全天(00:00-23:30)无任何 OccupancySensing.Occupancy 事件上报\",\n \"front_door_contact 在 22:59:17 检测到门打开,front_door_lock 在 20:31 和 22:59 有操作记录,证明有人经过玄关但运动传感器无响应\",\n \"同类传感器 bathroom_occupancy(08:34/09:10)和 living_room_occupancy(10:10)均正常工作\"\n ],\n \"recommended_actions\": [\n \"检查 entrance_occupancy 传感器的电池电量或供电状态\",\n \"在智能家居管理平台中确认该设备是否在线,尝试重新配对或重启设备\",\n \"检查玄关灯(entrance_light)是否也存在通信异常,排除该区域网络覆盖问题\",\n \"如确认硬件故障,及时更换传感器以恢复玄关区域的安防监测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入口区域的运动传感器(entrance_occupancy)在全天有明确人员进出活动的情况下,未产生任何占用检测事件,疑似设备故障或离线。", "reasoning": ["推理步骤1: 检查整天日志中 entrance_occupancy 传感器的记录,发现全天24小时内该传感器没有产生任何 OccupancySensing.Occupancy 事件。", "推理步骤2: 然而日志显示 front_door_contact(入户门传感器)在 22:59:17 检测到门打开事件,front_door_lock 在 20:31 有锁门操作和报警事件、在 22:59:18 有自动上锁事件,说明确实有人经过玄关区域。", "推理步骤3: 对比 bathroom_occupancy 和 living_room_occupancy 等同类传感器,它们在有人活动时均正常上报了占用状态变化(如 08:34、10:10 等时刻),而 entrance_occupancy 在人员必然经过的情况下仍无任何输出。", "推理步骤4: 玄关灯(entrance_light)同样全天无任何开关记录,如果灯是联动运动传感器触发的,这进一步印证传感器未工作;如果灯是独立控制的,则说明玄关区域设备整体可能存在通信问题。", "推理步骤5: 综合判断,entrance_occupancy 传感器极大概率处于离线、电池耗尽或硬件故障状态。"], "key_evidence": ["entrance_occupancy 全天(00:00-23:30)无任何 OccupancySensing.Occupancy 事件上报", "front_door_contact 在 22:59:17 检测到门打开,front_door_lock 在 20:31 和 22:59 有操作记录,证明有人经过玄关但运动传感器无响应", "同类传感器 bathroom_occupancy(08:34/09:10)和 living_room_occupancy(10:10)均正常工作"], "recommended_actions": ["检查 entrance_occupancy 传感器的电池电量或供电状态", "在智能家居管理平台中确认该设备是否在线,尝试重新配对或重启设备", "检查玄关灯(entrance_light)是否也存在通信异常,排除该区域网络覆盖问题", "如确认硬件故障,及时更换传感器以恢复玄关区域的安防监测能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.640978813171387, "api_error": null} {"episode_id": "SQ1_TP_B_0008", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0008.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20260637, "scenario_id": "DF-04", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-29T23:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在深夜出现异常重复锁门指令并触发门锁告警,同时入户门传感器在16:09开门后长时间未报告关门事件,存在传感器故障或门锁故障。\",\n \"reasoning\": [\n \"推理步骤1: 梳理 entrance 区域所有传感器事件。涉及设备包括 front_door_lock(门锁)、front_door_contact(门磁传感器)、entrance_light(玄关灯)、entrance_occupancy(玄关运动传感器)。\",\n \"推理步骤2: 分析 front_door_contact(门磁传感器)的状态序列。07:12:28 开门(False) → 07:12:29 关门(True),正常。16:09:02 开门(False),之后直到 22:35:19 才报告关门(True),中间间隔超过6小时没有任何门磁状态变化。但 17:51 住户明确通过门锁开门进入(门锁解锁+玄关运动传感器触发),门磁传感器却没有报告任何开/关事件,说明门磁传感器在 16:09 之后可能出现了故障或脱落。\",\n \"推理步骤3: 分析 front_door_lock 在 23:53 的异常行为。23:53:00 收到 LockDoor 命令,23:53:05 锁定(LockState=2);仅5秒后 23:53:10 再次收到 LockDoor 命令,23:53:15 再次锁定,并同时触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警(Lock Jammed),说明门锁机械部分可能卡住或第一次锁定未成功,系统重试后仍触发告警。\",\n \"推理步骤4: 分析 entrance_occupancy(玄关运动传感器)。07:12:29 和 16:09:03 和 17:51:03 均正常检测到人员经过,工作正常。\",\n \"推理步骤5: entrance_light(玄关灯)全天无任何事件记录,可能是住户未使用,也可能是设备离线,但仅凭日志无法确认故障,暂不判定异常。\",\n \"推理步骤6: 综合判断——front_door_contact 在 17:51 住户进门时未触发开/关事件,高度怀疑传感器故障(脱落、电量耗尽或通信中断);front_door_lock 深夜触发 DoorLockAlarm(AlarmCode=0) 表明门锁存在机械卡滞问题。两个核心安全设备均存在异常。\"\n ],\n \"key_evidence\": [\n \"17:51 门锁解锁并有人进入(entrance_occupancy 触发),但 front_door_contact 未报告任何开门/关门事件,传感器疑似失效\",\n \"16:09:02 front_door_contact 报告开门(False)后,直到 22:35:19 才报告关门(True),中间超过6小时无状态变化,与 17:51 的实际开关门行为矛盾\",\n \"23:53 门锁在5秒内收到两次 LockDoor 命令,并触发 DoorLockAlarm(AlarmCode=0),指示门锁卡滞(Lock Jammed)\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门磁传感器(front_door_contact)的安装状态、电池电量和无线连接,确认是否脱落或离线\",\n \"检查入户门锁(front_door_lock)的机械部件,清理锁舌和锁孔,排除卡滞问题\",\n \"门锁告警未解除前,建议手动确认门锁是否真正锁好,确保夜间安全\",\n \"考虑为门磁传感器启用低电量/离线告警通知,避免安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门锁在深夜出现异常重复锁门指令并触发门锁告警,同时入户门传感器在16:09开门后长时间未报告关门事件,存在传感器故障或门锁故障。", "reasoning": ["推理步骤1: 梳理 entrance 区域所有传感器事件。涉及设备包括 front_door_lock(门锁)、front_door_contact(门磁传感器)、entrance_light(玄关灯)、entrance_occupancy(玄关运动传感器)。", "推理步骤2: 分析 front_door_contact(门磁传感器)的状态序列。07:12:28 开门(False) → 07:12:29 关门(True),正常。16:09:02 开门(False),之后直到 22:35:19 才报告关门(True),中间间隔超过6小时没有任何门磁状态变化。但 17:51 住户明确通过门锁开门进入(门锁解锁+玄关运动传感器触发),门磁传感器却没有报告任何开/关事件,说明门磁传感器在 16:09 之后可能出现了故障或脱落。", "推理步骤3: 分析 front_door_lock 在 23:53 的异常行为。23:53:00 收到 LockDoor 命令,23:53:05 锁定(LockState=2);仅5秒后 23:53:10 再次收到 LockDoor 命令,23:53:15 再次锁定,并同时触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警(Lock Jammed),说明门锁机械部分可能卡住或第一次锁定未成功,系统重试后仍触发告警。", "推理步骤4: 分析 entrance_occupancy(玄关运动传感器)。07:12:29 和 16:09:03 和 17:51:03 均正常检测到人员经过,工作正常。", "推理步骤5: entrance_light(玄关灯)全天无任何事件记录,可能是住户未使用,也可能是设备离线,但仅凭日志无法确认故障,暂不判定异常。", "推理步骤6: 综合判断——front_door_contact 在 17:51 住户进门时未触发开/关事件,高度怀疑传感器故障(脱落、电量耗尽或通信中断);front_door_lock 深夜触发 DoorLockAlarm(AlarmCode=0) 表明门锁存在机械卡滞问题。两个核心安全设备均存在异常。"], "key_evidence": ["17:51 门锁解锁并有人进入(entrance_occupancy 触发),但 front_door_contact 未报告任何开门/关门事件,传感器疑似失效", "16:09:02 front_door_contact 报告开门(False)后,直到 22:35:19 才报告关门(True),中间超过6小时无状态变化,与 17:51 的实际开关门行为矛盾", "23:53 门锁在5秒内收到两次 LockDoor 命令,并触发 DoorLockAlarm(AlarmCode=0),指示门锁卡滞(Lock Jammed)"], "recommended_actions": ["立即检查入户门磁传感器(front_door_contact)的安装状态、电池电量和无线连接,确认是否脱落或离线", "检查入户门锁(front_door_lock)的机械部件,清理锁舌和锁孔,排除卡滞问题", "门锁告警未解除前,建议手动确认门锁是否真正锁好,确保夜间安全", "考虑为门磁传感器启用低电量/离线告警通知,避免安全盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.88617467880249, "api_error": null} {"episode_id": "SQ1_TP_B_0011", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0011.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260640, "scenario_id": "DF-05", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-08T18:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房烟雾报警器存在硬件故障,kitchen 区域存在多个传感器异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:31:05、07:09:00、18:32:00、18:53:00 共四次报告 MeasuredValue = None,表明传感器未能正常采集温度数据。\",\n \"推理步骤2: 这四次 None 值均出现在灶具 (kitchen_cook_surface) 开启期间或刚关闭后,说明传感器可能受灶具高温影响而失效,或存在与灶具联动的固件/通信缺陷。\",\n \"推理步骤3: 在非灶具使用时段,厨房温度传感器能正常上报数据(如每半小时的周期性温度读数均为正常数值),说明传感器并非完全损坏,而是在特定工况下间歇性失效。\",\n \"推理步骤4: 18:05:00 厨房烟雾报警器触发了 HardwareFaultAlert = True,ExpressedState = 5,并产生 HardwareFault 事件,表明烟雾报警器自身检测到硬件故障,这是一个独立的、严重的设备异常。\",\n \"推理步骤5: 烟雾报警器是厨房最关键的安全设备,其硬件故障意味着在真正发生烟雾/火灾时可能无法正常报警,安全风险显著升高。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:31:05、07:09:00、18:32:00、18:53:00 四次报告 MeasuredValue = None\",\n \"温度传感器 None 值均与灶具开启时段高度关联(06:30:35 开灶 → 06:31:05 None;18:31:30 开灶 → 18:32:00 None)\",\n \"kitchen_smoke_alarm 在 18:05:00 报告 HardwareFaultAlert = True, ExpressedState = 5, Event: HardwareFault()\",\n \"非灶具时段温度传感器数据正常,排除传感器完全损坏的可能\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房烟雾报警器,硬件故障状态下无法保障火灾预警能力,这是最高优先级\",\n \"排查厨房温度传感器在灶具使用期间失效的原因:检查传感器安装位置是否距灶具过近、是否受高温或油烟干扰\",\n \"在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立烟雾报警装置\",\n \"检查厨房窗户传感器状态——日志显示厨房窗户在 07:08:30 打开后直到 18:52:30 才再次出现开窗记录,期间未见关窗事件,确认窗户传感器是否正常工作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房烟雾报警器存在硬件故障,kitchen 区域存在多个传感器异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:31:05、07:09:00、18:32:00、18:53:00 共四次报告 MeasuredValue = None,表明传感器未能正常采集温度数据。", "推理步骤2: 这四次 None 值均出现在灶具 (kitchen_cook_surface) 开启期间或刚关闭后,说明传感器可能受灶具高温影响而失效,或存在与灶具联动的固件/通信缺陷。", "推理步骤3: 在非灶具使用时段,厨房温度传感器能正常上报数据(如每半小时的周期性温度读数均为正常数值),说明传感器并非完全损坏,而是在特定工况下间歇性失效。", "推理步骤4: 18:05:00 厨房烟雾报警器触发了 HardwareFaultAlert = True,ExpressedState = 5,并产生 HardwareFault 事件,表明烟雾报警器自身检测到硬件故障,这是一个独立的、严重的设备异常。", "推理步骤5: 烟雾报警器是厨房最关键的安全设备,其硬件故障意味着在真正发生烟雾/火灾时可能无法正常报警,安全风险显著升高。"], "key_evidence": ["kitchen_temp_sensor 在 06:31:05、07:09:00、18:32:00、18:53:00 四次报告 MeasuredValue = None", "温度传感器 None 值均与灶具开启时段高度关联(06:30:35 开灶 → 06:31:05 None;18:31:30 开灶 → 18:32:00 None)", "kitchen_smoke_alarm 在 18:05:00 报告 HardwareFaultAlert = True, ExpressedState = 5, Event: HardwareFault()", "非灶具时段温度传感器数据正常,排除传感器完全损坏的可能"], "recommended_actions": ["立即检修或更换厨房烟雾报警器,硬件故障状态下无法保障火灾预警能力,这是最高优先级", "排查厨房温度传感器在灶具使用期间失效的原因:检查传感器安装位置是否距灶具过近、是否受高温或油烟干扰", "在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立烟雾报警装置", "检查厨房窗户传感器状态——日志显示厨房窗户在 07:08:30 打开后直到 18:52:30 才再次出现开窗记录,期间未见关窗事件,确认窗户传感器是否正常工作"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.942070484161377, "api_error": null} {"episode_id": "SQ1_TP_B_0013", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0013.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20260642, "scenario_id": "DF-03", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-27T14:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在14:00出现快速反复触发(30秒内多次切换占用/无占用),疑似传感器故障或安装松动。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器全天数据与其他房间走势一致(夜间约22.9°C,午间峰值约25.8°C),温度值在合理范围内波动,无异常跳变,温度传感器工作正常。\",\n \"推理步骤2: 次卧窗户传感器和窗帘全天无状态变化事件上报,无法单独判断其好坏,但也未见异常信号。\",\n \"推理步骤3: 次卧运动传感器在14:00:00至14:01:10的70秒内产生了5次状态切换(占用→无占用→占用→无占用→占用),每次占用持续仅约30秒就变为无占用,随后5秒内又重新触发。这种高频抖动模式不符合正常人体活动特征。\",\n \"推理步骤4: 正常人进入房间后,运动传感器通常会保持占用状态数分钟;即使是路过,也不会在如此短的间隔内反复触发多次。这种模式更像是传感器灵敏度过高、安装位置不稳导致的误触发,或传感器硬件本身存在抖动故障。\",\n \"推理步骤5: 该时段次卧无灯光、空调、窗帘等任何联动操作,说明并非住户有意进出活动,进一步支持误触发的判断。\"\n ],\n \"key_evidence\": [\n \"14:00:00 occupancy=1 → 14:00:30 occupancy=0 → 14:00:35 occupancy=1 → 14:01:05 occupancy=0 → 14:01:10 occupancy=1,70秒内5次状态翻转\",\n \"每次占用/无占用间隔仅5秒或30秒,远低于正常人体活动的合理持续时间\",\n \"该时段次卧无任何灯光或其他设备联动,不像有人实际使用房间\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装是否牢固,排除因振动或松动导致的误触发\",\n \"检查传感器附近是否有风扇、窗帘飘动、宠物等可能干扰红外检测的因素\",\n \"适当降低运动传感器灵敏度,或增加去抖延迟时间以过滤短暂抖动\",\n \"持续观察该传感器后续是否仍出现类似高频抖动,若反复出现建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在14:00出现快速反复触发(30秒内多次切换占用/无占用),疑似传感器故障或安装松动。", "reasoning": ["推理步骤1: 次卧温度传感器全天数据与其他房间走势一致(夜间约22.9°C,午间峰值约25.8°C),温度值在合理范围内波动,无异常跳变,温度传感器工作正常。", "推理步骤2: 次卧窗户传感器和窗帘全天无状态变化事件上报,无法单独判断其好坏,但也未见异常信号。", "推理步骤3: 次卧运动传感器在14:00:00至14:01:10的70秒内产生了5次状态切换(占用→无占用→占用→无占用→占用),每次占用持续仅约30秒就变为无占用,随后5秒内又重新触发。这种高频抖动模式不符合正常人体活动特征。", "推理步骤4: 正常人进入房间后,运动传感器通常会保持占用状态数分钟;即使是路过,也不会在如此短的间隔内反复触发多次。这种模式更像是传感器灵敏度过高、安装位置不稳导致的误触发,或传感器硬件本身存在抖动故障。", "推理步骤5: 该时段次卧无灯光、空调、窗帘等任何联动操作,说明并非住户有意进出活动,进一步支持误触发的判断。"], "key_evidence": ["14:00:00 occupancy=1 → 14:00:30 occupancy=0 → 14:00:35 occupancy=1 → 14:01:05 occupancy=0 → 14:01:10 occupancy=1,70秒内5次状态翻转", "每次占用/无占用间隔仅5秒或30秒,远低于正常人体活动的合理持续时间", "该时段次卧无任何灯光或其他设备联动,不像有人实际使用房间"], "recommended_actions": ["检查次卧运动传感器的安装是否牢固,排除因振动或松动导致的误触发", "检查传感器附近是否有风扇、窗帘飘动、宠物等可能干扰红外检测的因素", "适当降低运动传感器灵敏度,或增加去抖延迟时间以过滤短暂抖动", "持续观察该传感器后续是否仍出现类似高频抖动,若反复出现建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.14247488975525, "api_error": null} {"episode_id": "SQ1_TP_B_0015", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0015.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20260644, "scenario_id": "DF-03", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-14T13:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在13:40出现快速反复触发(抖动),疑似传感器故障或安装松动。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器(second_bedroom_temp_sensor)全天读数在 2290~2578 范围内,与其他房间温度走势一致(夜间约23°C,午后峰值约25.7°C),温度传感器工作正常。\",\n \"推理步骤2: 次卧运动传感器在 13:40:00~13:41:10 期间出现了5次状态变化:占用→空闲→占用→空闲→占用,间隔分别为30秒、5秒、30秒、5秒,呈现明显的高频抖动模式。\",\n \"推理步骤3: 正常人体活动不会在5秒内反复离开又进入传感器检测区域;这种短间隔的0/1交替更符合传感器误触发、检测边界抖动或硬件接触不良的特征。\",\n \"推理步骤4: 次卧窗帘和窗户传感器全天无事件上报,排除了窗户被打开或窗帘大幅移动导致的干扰可能,进一步指向传感器自身问题。\",\n \"推理步骤5: 该抖动发生在白天下午、且次卧灯未被点亮,说明并非住户正常进出次卧的行为模式。\"\n ],\n \"key_evidence\": [\n \"13:40:00~13:41:10 期间运动传感器在约90秒内产生5次状态翻转(Occupancy 在0和1之间快速切换),最短间隔仅5秒\",\n \"次卧灯全天未开启,与运动传感器检测到'有人'的状态不一致\",\n \"次卧温度传感器读数正常,与全屋温度趋势吻合,排除环境异常因素\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置是否松动,确认探头朝向和固定状态\",\n \"排查传感器检测范围内是否有窗帘摆动、宠物活动或风扇等可能造成误触发的干扰源\",\n \"观察该传感器后续是否再次出现类似高频抖动,若反复出现建议更换传感器或调整灵敏度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在13:40出现快速反复触发(抖动),疑似传感器故障或安装松动。", "reasoning": ["推理步骤1: 次卧温度传感器(second_bedroom_temp_sensor)全天读数在 2290~2578 范围内,与其他房间温度走势一致(夜间约23°C,午后峰值约25.7°C),温度传感器工作正常。", "推理步骤2: 次卧运动传感器在 13:40:00~13:41:10 期间出现了5次状态变化:占用→空闲→占用→空闲→占用,间隔分别为30秒、5秒、30秒、5秒,呈现明显的高频抖动模式。", "推理步骤3: 正常人体活动不会在5秒内反复离开又进入传感器检测区域;这种短间隔的0/1交替更符合传感器误触发、检测边界抖动或硬件接触不良的特征。", "推理步骤4: 次卧窗帘和窗户传感器全天无事件上报,排除了窗户被打开或窗帘大幅移动导致的干扰可能,进一步指向传感器自身问题。", "推理步骤5: 该抖动发生在白天下午、且次卧灯未被点亮,说明并非住户正常进出次卧的行为模式。"], "key_evidence": ["13:40:00~13:41:10 期间运动传感器在约90秒内产生5次状态翻转(Occupancy 在0和1之间快速切换),最短间隔仅5秒", "次卧灯全天未开启,与运动传感器检测到'有人'的状态不一致", "次卧温度传感器读数正常,与全屋温度趋势吻合,排除环境异常因素"], "recommended_actions": ["检查次卧运动传感器的安装位置是否松动,确认探头朝向和固定状态", "排查传感器检测范围内是否有窗帘摆动、宠物活动或风扇等可能造成误触发的干扰源", "观察该传感器后续是否再次出现类似高频抖动,若反复出现建议更换传感器或调整灵敏度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.170919179916382, "api_error": null} {"episode_id": "SQ1_TP_B_0018", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0018.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260647, "scenario_id": "DF-05", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T06:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器存在硬件故障,厨房温度传感器在灶具使用期间多次报告 None 值,两个设备均工作异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房烟雾报警器在 06:49 报告了 HardwareFaultAlert=True、ExpressedState=5 并触发了 HardwareFault 事件,表明该设备自身检测到硬件级别故障。ExpressedState=5 对应 HardwareFault 状态,说明报警器已无法正常执行烟雾/CO 检测功能。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(07:02、07:24、18:34、19:06),而非正常的温度数值。这些 None 值出现在灶具使用前后,说明传感器在厨房温度变化较大时无法正常采集数据。\",\n \"推理步骤3: 对比其他房间的温度传感器,客厅、主卧、次卧的传感器在全天所有时间点均正常上报了有效温度值,从未出现 None,排除了系统性通信故障的可能。\",\n \"推理步骤4: 厨房温度传感器在非烹饪时段(如整点半点的定时上报)能正常返回数值,但在灶具开启后的短时间内就出现 None,可能是传感器受高温或油烟影响导致间歇性失灵。\",\n \"推理步骤5: 烟雾报警器硬件故障叠加温度传感器间歇性失效,意味着厨房区域的两道安全防线同时存在问题——一旦发生真实火灾或燃气泄漏,既无法报警也无法通过温度异常检测到危险。\"\n ],\n \"key_evidence\": [\n \"06:49 厨房烟雾报警器触发 HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault(),设备自报硬件故障\",\n \"厨房温度传感器在 07:02、07:24、18:34、19:06 四次报告 MeasuredValue=None,均与灶具使用时段高度关联\",\n \"同一时段其他房间温度传感器全部正常上报数值,排除系统级故障\",\n \"烟雾报警器故障后全天未见恢复事件(无 HardwareFaultAlert=False),说明故障持续存在\"\n ],\n \"recommended_actions\": [\n \"立即检查并更换或维修厨房烟雾报警器,该设备硬件故障导致火灾/CO检测能力完全丧失,属于高优先级安全隐患\",\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"在烟雾报警器修复前,避免无人看管的厨房烹饪操作,并考虑临时增设独立式烟雾报警器作为备用\",\n \"检查厨房温度传感器的固件版本,确认 None 值是否为已知 bug,如有可用更新则进行固件升级\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器存在硬件故障,厨房温度传感器在灶具使用期间多次报告 None 值,两个设备均工作异常。", "reasoning": ["推理步骤1: 厨房烟雾报警器在 06:49 报告了 HardwareFaultAlert=True、ExpressedState=5 并触发了 HardwareFault 事件,表明该设备自身检测到硬件级别故障。ExpressedState=5 对应 HardwareFault 状态,说明报警器已无法正常执行烟雾/CO 检测功能。", "推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(07:02、07:24、18:34、19:06),而非正常的温度数值。这些 None 值出现在灶具使用前后,说明传感器在厨房温度变化较大时无法正常采集数据。", "推理步骤3: 对比其他房间的温度传感器,客厅、主卧、次卧的传感器在全天所有时间点均正常上报了有效温度值,从未出现 None,排除了系统性通信故障的可能。", "推理步骤4: 厨房温度传感器在非烹饪时段(如整点半点的定时上报)能正常返回数值,但在灶具开启后的短时间内就出现 None,可能是传感器受高温或油烟影响导致间歇性失灵。", "推理步骤5: 烟雾报警器硬件故障叠加温度传感器间歇性失效,意味着厨房区域的两道安全防线同时存在问题——一旦发生真实火灾或燃气泄漏,既无法报警也无法通过温度异常检测到危险。"], "key_evidence": ["06:49 厨房烟雾报警器触发 HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault(),设备自报硬件故障", "厨房温度传感器在 07:02、07:24、18:34、19:06 四次报告 MeasuredValue=None,均与灶具使用时段高度关联", "同一时段其他房间温度传感器全部正常上报数值,排除系统级故障", "烟雾报警器故障后全天未见恢复事件(无 HardwareFaultAlert=False),说明故障持续存在"], "recommended_actions": ["立即检查并更换或维修厨房烟雾报警器,该设备硬件故障导致火灾/CO检测能力完全丧失,属于高优先级安全隐患", "检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "在烟雾报警器修复前,避免无人看管的厨房烹饪操作,并考虑临时增设独立式烟雾报警器作为备用", "检查厨房温度传感器的固件版本,确认 None 值是否为已知 bug,如有可用更新则进行固件升级"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.500600337982178, "api_error": null} {"episode_id": "SQ1_TP_B_0020", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0020.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20260649, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-21T20:38:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重故障:周期性上报格式异常的冗余数据,且从6月22日起读数完全固定为2350,丧失正常感知能力。\",\n \"reasoning\": [\n \"推理步骤1: 在6月21日的正常半小时周期上报之外,living_room_temp_sensor在08:00、12:00、18:00、22:00额外上报了缺少Cluster前缀的异常格式数据('MeasuredValue = 2350'而非'TemperatureMeasurement.MeasuredValue = ...'),其他三个温度传感器均无此现象,说明该设备存在固件或通信异常。\",\n \"推理步骤2: 这些异常格式上报的值与同时刻正常上报的值明显不一致。例如08:00正常值为2453但异常值为2350,12:00正常值为2574但异常值为2510,18:00正常值为2463但异常值为2400,22:00正常值为2361但异常值为2280。异常值始终低于正常值,且呈现某种固定偏移或滞后模式。\",\n \"推理步骤3: 从6月22日08:00起,living_room_temp_sensor仅以异常格式上报,且读数完全锁定在2350不再变化。对比6月21日全天温度在2291-2589之间随昼夜自然波动的正常模式,连续两天、跨越4个不同时段读数完全恒定是物理上不可能的。\",\n \"推理步骤4: 同期其他房间传感器(master_bedroom、second_bedroom、kitchen)在6月21日均正常工作且无异常格式上报,进一步排除了系统级问题,将故障定位到living_room_temp_sensor这一单个设备。\",\n \"推理步骤5: 该传感器可能在6月21日已开始出现间歇性故障(双重上报),到6月22日彻底失效,进入输出固定值的卡死状态。这意味着客厅的温度监测已完全失效,空调等依赖温度反馈的自动化控制也将无法正常工作。\"\n ],\n \"key_evidence\": [\n \"6月21日出现4次缺少'TemperatureMeasurement.'前缀的异常格式上报(08:00/12:00/18:00/22:00),值与正常上报不一致,其他传感器无此现象\",\n \"6月22日至6月23日期间,传感器读数完全固定为2350,跨越至少6次上报(两天多)无任何变化,而正常情况下室温应有明显昼夜波动\",\n \"6月22日起不再有正常格式(TemperatureMeasurement.MeasuredValue)的上报记录,仅剩异常格式数据\"\n ],\n \"recommended_actions\": [\n \"立即对living_room_temp_sensor执行设备重启/重置,检查是否能恢复正常上报\",\n \"检查该传感器的固件版本,与其他正常工作的温度传感器对比,必要时进行固件升级\",\n \"在传感器恢复前,暂时禁用依赖客厅温度数据的自动化规则(如空调自动调温),改为手动控制,避免因错误温度数据导致异常动作\",\n \"若重启无效,考虑更换该传感器硬件,并检查其Matter协议通信链路是否存在干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重故障:周期性上报格式异常的冗余数据,且从6月22日起读数完全固定为2350,丧失正常感知能力。", "reasoning": ["推理步骤1: 在6月21日的正常半小时周期上报之外,living_room_temp_sensor在08:00、12:00、18:00、22:00额外上报了缺少Cluster前缀的异常格式数据('MeasuredValue = 2350'而非'TemperatureMeasurement.MeasuredValue = ...'),其他三个温度传感器均无此现象,说明该设备存在固件或通信异常。", "推理步骤2: 这些异常格式上报的值与同时刻正常上报的值明显不一致。例如08:00正常值为2453但异常值为2350,12:00正常值为2574但异常值为2510,18:00正常值为2463但异常值为2400,22:00正常值为2361但异常值为2280。异常值始终低于正常值,且呈现某种固定偏移或滞后模式。", "推理步骤3: 从6月22日08:00起,living_room_temp_sensor仅以异常格式上报,且读数完全锁定在2350不再变化。对比6月21日全天温度在2291-2589之间随昼夜自然波动的正常模式,连续两天、跨越4个不同时段读数完全恒定是物理上不可能的。", "推理步骤4: 同期其他房间传感器(master_bedroom、second_bedroom、kitchen)在6月21日均正常工作且无异常格式上报,进一步排除了系统级问题,将故障定位到living_room_temp_sensor这一单个设备。", "推理步骤5: 该传感器可能在6月21日已开始出现间歇性故障(双重上报),到6月22日彻底失效,进入输出固定值的卡死状态。这意味着客厅的温度监测已完全失效,空调等依赖温度反馈的自动化控制也将无法正常工作。"], "key_evidence": ["6月21日出现4次缺少'TemperatureMeasurement.'前缀的异常格式上报(08:00/12:00/18:00/22:00),值与正常上报不一致,其他传感器无此现象", "6月22日至6月23日期间,传感器读数完全固定为2350,跨越至少6次上报(两天多)无任何变化,而正常情况下室温应有明显昼夜波动", "6月22日起不再有正常格式(TemperatureMeasurement.MeasuredValue)的上报记录,仅剩异常格式数据"], "recommended_actions": ["立即对living_room_temp_sensor执行设备重启/重置,检查是否能恢复正常上报", "检查该传感器的固件版本,与其他正常工作的温度传感器对比,必要时进行固件升级", "在传感器恢复前,暂时禁用依赖客厅温度数据的自动化规则(如空调自动调温),改为手动控制,避免因错误温度数据导致异常动作", "若重启无效,考虑更换该传感器硬件,并检查其Matter协议通信链路是否存在干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.72050404548645, "api_error": null} {"episode_id": "SQ1_TP_B_0025", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0025.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260654, "scenario_id": "DF-04", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-22T21:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门在18:20进门后长时间未关闭,直到22:00:22才检测到门关闭,且玄关运动传感器在住户离家/回家场景外未报告任何活动,存在传感器响应迟钝或门未正常关闭的可能。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含三个传感器/设备——front_door_lock(入户门锁)、front_door_contact(入户门传感器)、entrance_occupancy(玄关运动传感器)以及 entrance_light(玄关灯)。\",\n \"推理步骤2: 早晨07:13出门序列正常——门锁手动解锁(LockOperationType=1)、门打开(StateValue=False)、5秒后门关闭(StateValue=True)、自动上锁(LockOperationType=0),时序合理。\",\n \"推理步骤3: 傍晚18:20回家时,门锁解锁、门打开(StateValue=False)、玄关运动传感器触发、玄关灯亮起,但此后 front_door_contact 一直未报告门关闭(StateValue=True),直到22:00:22才出现关门事件,间隔长达约3小时40分钟。\",\n \"推理步骤4: 在这段时间内(18:20~22:00),住户明显在家活动(开空调、做饭、开洗碗机等),入户门却一直处于'开启'状态,这在正常居家场景下极不合理——通常进门后会随手关门。\",\n \"推理步骤5: 21:04出现了门锁异常事件——连续两次收到 LockDoor 命令且门锁状态为2(Unlocked),随后触发了 DoorLockAlarm(AlarmCode=0) 报警。AlarmCode=0 通常表示锁定失败告警,说明门锁尝试上锁但未能成功,这与门长时间未关闭的状态一致(门未关,锁无法锁上)。\",\n \"推理步骤6: 玄关运动传感器在全天仅在07:13和18:20两个时间点触发,整个白天和晚间住户在家活动期间(如往返厨房、客厅必经玄关)均无触发记录,可能存在传感器灵敏度不足或安装位置不佳的问题。\"\n ],\n \"key_evidence\": [\n \"18:20:02 front_door_contact 报告门打开(StateValue=False),直到22:00:22才报告门关闭(StateValue=True),间隔约3小时40分钟\",\n \"21:04:00~21:04:15 门锁连续两次收到LockDoor命令但状态仍为Unlocked(2),并触发DoorLockAlarm(AlarmCode=0)锁定失败告警\",\n \"玄关运动传感器全天仅在出门(07:13)和回家(18:20)时触发,住户在家期间无任何触发记录\"\n ],\n \"recommended_actions\": [\n \"检查入户门门磁传感器(front_door_contact)的安装位置和电池电量,确认是否存在接触不良或信号延迟问题\",\n \"检查入户门锁的机械部件和电子模块,排查21:04锁定失败告警的原因(可能是门未完全关合导致锁舌无法到位)\",\n \"检查玄关运动传感器(entrance_occupancy)的安装角度和灵敏度设置,验证其在日常通行时能否正常触发\",\n \"建议设置自动化规则:入户门打开超过5分钟未关闭时发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门在18:20进门后长时间未关闭,直到22:00:22才检测到门关闭,且玄关运动传感器在住户离家/回家场景外未报告任何活动,存在传感器响应迟钝或门未正常关闭的可能。", "reasoning": ["推理步骤1: entrance 区域包含三个传感器/设备——front_door_lock(入户门锁)、front_door_contact(入户门传感器)、entrance_occupancy(玄关运动传感器)以及 entrance_light(玄关灯)。", "推理步骤2: 早晨07:13出门序列正常——门锁手动解锁(LockOperationType=1)、门打开(StateValue=False)、5秒后门关闭(StateValue=True)、自动上锁(LockOperationType=0),时序合理。", "推理步骤3: 傍晚18:20回家时,门锁解锁、门打开(StateValue=False)、玄关运动传感器触发、玄关灯亮起,但此后 front_door_contact 一直未报告门关闭(StateValue=True),直到22:00:22才出现关门事件,间隔长达约3小时40分钟。", "推理步骤4: 在这段时间内(18:20~22:00),住户明显在家活动(开空调、做饭、开洗碗机等),入户门却一直处于'开启'状态,这在正常居家场景下极不合理——通常进门后会随手关门。", "推理步骤5: 21:04出现了门锁异常事件——连续两次收到 LockDoor 命令且门锁状态为2(Unlocked),随后触发了 DoorLockAlarm(AlarmCode=0) 报警。AlarmCode=0 通常表示锁定失败告警,说明门锁尝试上锁但未能成功,这与门长时间未关闭的状态一致(门未关,锁无法锁上)。", "推理步骤6: 玄关运动传感器在全天仅在07:13和18:20两个时间点触发,整个白天和晚间住户在家活动期间(如往返厨房、客厅必经玄关)均无触发记录,可能存在传感器灵敏度不足或安装位置不佳的问题。"], "key_evidence": ["18:20:02 front_door_contact 报告门打开(StateValue=False),直到22:00:22才报告门关闭(StateValue=True),间隔约3小时40分钟", "21:04:00~21:04:15 门锁连续两次收到LockDoor命令但状态仍为Unlocked(2),并触发DoorLockAlarm(AlarmCode=0)锁定失败告警", "玄关运动传感器全天仅在出门(07:13)和回家(18:20)时触发,住户在家期间无任何触发记录"], "recommended_actions": ["检查入户门门磁传感器(front_door_contact)的安装位置和电池电量,确认是否存在接触不良或信号延迟问题", "检查入户门锁的机械部件和电子模块,排查21:04锁定失败告警的原因(可能是门未完全关合导致锁舌无法到位)", "检查玄关运动传感器(entrance_occupancy)的安装角度和灵敏度设置,验证其在日常通行时能否正常触发", "建议设置自动化规则:入户门打开超过5分钟未关闭时发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.019249439239502, "api_error": null} {"episode_id": "SQ1_TP_B_0026", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0026.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20260655, "scenario_id": "DF-01", "total_events": 241, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T02:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)出现数据上报异常,疑似传感器故障或通信模块卡死。\",\n \"reasoning\": [\n \"推理步骤1: 6月3日全天,living_room_temp_sensor 通过标准 TemperatureMeasurement.MeasuredValue 正常上报温度,数值随时间自然波动(夜间约2297-2310,午间峰值约2585,晚间回落至2328)。\",\n \"推理步骤2: 同时观察到另一组非标准格式的上报记录(仅标注 MeasuredValue 而非完整的 TemperatureMeasurement.MeasuredValue),出现在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280),这些值与同时刻标准上报值存在明显偏差,提示传感器可能存在双通道上报或固件异常。\",\n \"推理步骤3: 从6月4日开始,标准格式的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩非标准格式的 MeasuredValue 上报,且数值固定为2350不再变化(6月4日08:00、12:00、18:00、22:00及6月5日08:00、12:00均为2350)。\",\n \"推理步骤4: 真实室温不可能在跨越两天、不同时段(早晨/中午/傍晚/深夜)始终保持完全相同的23.50°C,而同期其他房间传感器在6月3日表现出正常的昼夜温度波动。\",\n \"推理步骤5: 综合判断:传感器主测量通道已停止工作,当前仅以固定值通过备用/异常通道上报,属于典型的传感器卡死(stuck sensor)故障。\"\n ],\n \"key_evidence\": [\n \"6月4日至6月5日期间,living_room_temp_sensor 上报值固定为2350,跨越多个时段无任何变化\",\n \"6月4日起标准属性路径 TemperatureMeasurement.MeasuredValue 不再有任何上报记录\",\n \"6月3日出现非标准格式 MeasuredValue 与标准格式并存且数值不一致的现象(如08:00标准值2461 vs 非标准值2350)\",\n \"其他房间传感器在6月3日表现出正常的昼夜温差波动,排除全局环境因素\"\n ],\n \"recommended_actions\": [\n \"对 living_room_temp_sensor 执行设备重启或恢复出厂设置,观察是否恢复正常上报\",\n \"检查传感器固件版本,确认是否存在已知的双通道上报bug,必要时升级固件\",\n \"检查传感器与网关之间的通信链路质量(信号强度、丢包率),排除网络层故障\",\n \"若重启无效,考虑更换传感器硬件,该设备可能存在温度采集模块硬件损坏\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)出现数据上报异常,疑似传感器故障或通信模块卡死。", "reasoning": ["推理步骤1: 6月3日全天,living_room_temp_sensor 通过标准 TemperatureMeasurement.MeasuredValue 正常上报温度,数值随时间自然波动(夜间约2297-2310,午间峰值约2585,晚间回落至2328)。", "推理步骤2: 同时观察到另一组非标准格式的上报记录(仅标注 MeasuredValue 而非完整的 TemperatureMeasurement.MeasuredValue),出现在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280),这些值与同时刻标准上报值存在明显偏差,提示传感器可能存在双通道上报或固件异常。", "推理步骤3: 从6月4日开始,标准格式的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩非标准格式的 MeasuredValue 上报,且数值固定为2350不再变化(6月4日08:00、12:00、18:00、22:00及6月5日08:00、12:00均为2350)。", "推理步骤4: 真实室温不可能在跨越两天、不同时段(早晨/中午/傍晚/深夜)始终保持完全相同的23.50°C,而同期其他房间传感器在6月3日表现出正常的昼夜温度波动。", "推理步骤5: 综合判断:传感器主测量通道已停止工作,当前仅以固定值通过备用/异常通道上报,属于典型的传感器卡死(stuck sensor)故障。"], "key_evidence": ["6月4日至6月5日期间,living_room_temp_sensor 上报值固定为2350,跨越多个时段无任何变化", "6月4日起标准属性路径 TemperatureMeasurement.MeasuredValue 不再有任何上报记录", "6月3日出现非标准格式 MeasuredValue 与标准格式并存且数值不一致的现象(如08:00标准值2461 vs 非标准值2350)", "其他房间传感器在6月3日表现出正常的昼夜温差波动,排除全局环境因素"], "recommended_actions": ["对 living_room_temp_sensor 执行设备重启或恢复出厂设置,观察是否恢复正常上报", "检查传感器固件版本,确认是否存在已知的双通道上报bug,必要时升级固件", "检查传感器与网关之间的通信链路质量(信号强度、丢包率),排除网络层故障", "若重启无效,考虑更换传感器硬件,该设备可能存在温度采集模块硬件损坏"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.801512718200684, "api_error": null} {"episode_id": "SQ1_TP_B_0028", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0028.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20260657, "scenario_id": "DF-05", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-06T19:39:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房存在两项传感器异常:温度传感器多次报告 None 值且出现过异常高温读数,烟雾报警器报告硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:17、09:45、12:00、17:47、18:44),每次均发生在灶具开启或关闭前后。正常的温度传感器即使在高温环境下也应返回数值而非 None,这表明传感器在特定条件下出现读数丢失或通信故障。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告值为 2955 和 2953(约 29.5°C),而同一时段其他房间温度约为 25.4-25.5°C。厨房温度比其他房间高出约 4°C,且灶具在该时段并未处于开启状态(09:44 已关闭,11:59 才再次开启)。这一异常高温读数在无明显热源的情况下出现,指向传感器漂移或故障。\",\n \"推理步骤3: 烟雾报警器在 19:39 报告 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。此时厨房并无烹饪活动(灶具 18:43 已关闭),且厨房温度正常(约 24.4°C),排除了真实火灾触发的可能,确认为设备自身硬件故障。\",\n \"推理步骤4: 综合来看,厨房区域有两个独立的传感器同时存在问题——温度传感器间歇性失效并出现异常读数,烟雾报警器硬件故障。这削弱了厨房的安全监测能力,构成安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 09:17、09:45、12:00、17:47、18:44 五次报告 MeasuredValue = None\",\n \"kitchen_temp_sensor 在 11:00 和 11:30 报告约 29.5°C,而灶具未开启,其他房间仅约 25.5°C,偏差约 4°C\",\n \"kitchen_smoke_alarm 在 19:39 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件\",\n \"烟雾报警器故障时无烹饪活动、无高温,排除真实烟雾触发\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,硬件故障状态下无法正常检测烟雾和一氧化碳,存在严重安全盲区\",\n \"检查厨房温度传感器的安装位置和供电状态,排查间歇性 None 值的原因(可能是传感器过热保护、通信中断或硬件老化)\",\n \"校准或更换厨房温度传感器,解决无热源情况下异常高温读数的问题\",\n \"在传感器修复前,加强厨房人工巡检,尤其是烹饪时段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房存在两项传感器异常:温度传感器多次报告 None 值且出现过异常高温读数,烟雾报警器报告硬件故障。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:17、09:45、12:00、17:47、18:44),每次均发生在灶具开启或关闭前后。正常的温度传感器即使在高温环境下也应返回数值而非 None,这表明传感器在特定条件下出现读数丢失或通信故障。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告值为 2955 和 2953(约 29.5°C),而同一时段其他房间温度约为 25.4-25.5°C。厨房温度比其他房间高出约 4°C,且灶具在该时段并未处于开启状态(09:44 已关闭,11:59 才再次开启)。这一异常高温读数在无明显热源的情况下出现,指向传感器漂移或故障。", "推理步骤3: 烟雾报警器在 19:39 报告 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。此时厨房并无烹饪活动(灶具 18:43 已关闭),且厨房温度正常(约 24.4°C),排除了真实火灾触发的可能,确认为设备自身硬件故障。", "推理步骤4: 综合来看,厨房区域有两个独立的传感器同时存在问题——温度传感器间歇性失效并出现异常读数,烟雾报警器硬件故障。这削弱了厨房的安全监测能力,构成安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在 09:17、09:45、12:00、17:47、18:44 五次报告 MeasuredValue = None", "kitchen_temp_sensor 在 11:00 和 11:30 报告约 29.5°C,而灶具未开启,其他房间仅约 25.5°C,偏差约 4°C", "kitchen_smoke_alarm 在 19:39 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件", "烟雾报警器故障时无烹饪活动、无高温,排除真实烟雾触发"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,硬件故障状态下无法正常检测烟雾和一氧化碳,存在严重安全盲区", "检查厨房温度传感器的安装位置和供电状态,排查间歇性 None 值的原因(可能是传感器过热保护、通信中断或硬件老化)", "校准或更换厨房温度传感器,解决无热源情况下异常高温读数的问题", "在传感器修复前,加强厨房人工巡检,尤其是烹饪时段"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.241256713867188, "api_error": null} {"episode_id": "SQ1_TP_B_0030", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0030.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260659, "scenario_id": "DF-01", "total_events": 247, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-19T18:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重异常:间歇性发送非标准格式数据,且从6月20日起疑似卡死在固定值2350,不再反映真实温度变化。\",\n \"reasoning\": [\n \"推理步骤1: 正常的Matter协议温度上报格式为 TemperatureMeasurement.MeasuredValue,但该传感器在6月19日出现了4次仅标注为 MeasuredValue(缺少Cluster前缀)的上报记录,时间分别为 08:00、12:00、18:00、22:00,且这些值与同一时刻正常格式上报的值存在明显偏差(如08:00正常值2467 vs 异常值2350,12:00正常值2587 vs 异常值2510,22:00正常值2368 vs 异常值2280),说明传感器固件或通信模块存在间歇性故障,产生了格式错误且数值不准确的冗余上报。\",\n \"推理步骤2: 从6月19日23:30之后,该传感器不再有标准格式(TemperatureMeasurement.MeasuredValue)的上报记录。取而代之的是从6月20日08:00开始,仅以非标准格式(MeasuredValue)每隔数小时上报,且值始终固定为2350(即23.50°C)。\",\n \"推理步骤3: 对比同期其他传感器——master_bedroom_temp_sensor、second_bedroom_temp_sensor、kitchen_temp_sensor在6月19日全天温度随昼夜自然波动(夜间约22.9°C → 正午约25.8°C → 夜间约23.3°C),living_room_temp_sensor在6月19日也呈现相同的自然波动趋势,说明客厅温度不可能在6月20-21日恒定不变。固定值2350持续超过24小时,高度指向传感器读数卡死(stuck sensor)。\",\n \"推理步骤4: 综合两个异常——非标准Cluster格式上报和读数卡死,最可能的原因是传感器固件崩溃或硬件故障,导致其退化到一种降级模式:仅能以错误格式输出一个缓存的旧值。\"\n ],\n \"key_evidence\": [\n \"6月19日出现4次非标准格式上报(MeasuredValue而非TemperatureMeasurement.MeasuredValue),值与正常上报偏差显著:08:00(2350 vs 2467)、12:00(2510 vs 2587)、18:00(2400 vs 2462)、22:00(2280 vs 2368)\",\n \"6月20日08:00起至6月21日12:00,传感器仅以非标准格式上报,且读数恒定为2350,持续超过28小时无任何变化\",\n \"同期其他房间温度传感器均正常上报且数值随环境自然波动,排除全局系统故障的可能\",\n \"6月19日23:30后标准格式(TemperatureMeasurement.MeasuredValue)上报完全消失,上报频率也从每30分钟一次退化为数小时一次\"\n ],\n \"recommended_actions\": [\n \"立即对living_room_temp_sensor执行设备重启(断电重上电),观察是否恢复标准格式上报和正常温度波动\",\n \"若重启无效,检查传感器固件版本并尝试OTA升级,非标准格式上报可能是已知固件缺陷\",\n \"在传感器修复前,不要依赖客厅温度数据进行空调自动控制等联动,避免因错误读数导致异常动作\",\n \"检查该传感器的Matter协议订阅配置和网络连接质量,排除网关或网络层导致的数据丢失/篡改可能\",\n \"若硬件故障确认,更换传感器模块\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重异常:间歇性发送非标准格式数据,且从6月20日起疑似卡死在固定值2350,不再反映真实温度变化。", "reasoning": ["推理步骤1: 正常的Matter协议温度上报格式为 TemperatureMeasurement.MeasuredValue,但该传感器在6月19日出现了4次仅标注为 MeasuredValue(缺少Cluster前缀)的上报记录,时间分别为 08:00、12:00、18:00、22:00,且这些值与同一时刻正常格式上报的值存在明显偏差(如08:00正常值2467 vs 异常值2350,12:00正常值2587 vs 异常值2510,22:00正常值2368 vs 异常值2280),说明传感器固件或通信模块存在间歇性故障,产生了格式错误且数值不准确的冗余上报。", "推理步骤2: 从6月19日23:30之后,该传感器不再有标准格式(TemperatureMeasurement.MeasuredValue)的上报记录。取而代之的是从6月20日08:00开始,仅以非标准格式(MeasuredValue)每隔数小时上报,且值始终固定为2350(即23.50°C)。", "推理步骤3: 对比同期其他传感器——master_bedroom_temp_sensor、second_bedroom_temp_sensor、kitchen_temp_sensor在6月19日全天温度随昼夜自然波动(夜间约22.9°C → 正午约25.8°C → 夜间约23.3°C),living_room_temp_sensor在6月19日也呈现相同的自然波动趋势,说明客厅温度不可能在6月20-21日恒定不变。固定值2350持续超过24小时,高度指向传感器读数卡死(stuck sensor)。", "推理步骤4: 综合两个异常——非标准Cluster格式上报和读数卡死,最可能的原因是传感器固件崩溃或硬件故障,导致其退化到一种降级模式:仅能以错误格式输出一个缓存的旧值。"], "key_evidence": ["6月19日出现4次非标准格式上报(MeasuredValue而非TemperatureMeasurement.MeasuredValue),值与正常上报偏差显著:08:00(2350 vs 2467)、12:00(2510 vs 2587)、18:00(2400 vs 2462)、22:00(2280 vs 2368)", "6月20日08:00起至6月21日12:00,传感器仅以非标准格式上报,且读数恒定为2350,持续超过28小时无任何变化", "同期其他房间温度传感器均正常上报且数值随环境自然波动,排除全局系统故障的可能", "6月19日23:30后标准格式(TemperatureMeasurement.MeasuredValue)上报完全消失,上报频率也从每30分钟一次退化为数小时一次"], "recommended_actions": ["立即对living_room_temp_sensor执行设备重启(断电重上电),观察是否恢复标准格式上报和正常温度波动", "若重启无效,检查传感器固件版本并尝试OTA升级,非标准格式上报可能是已知固件缺陷", "在传感器修复前,不要依赖客厅温度数据进行空调自动控制等联动,避免因错误读数导致异常动作", "检查该传感器的Matter协议订阅配置和网络连接质量,排除网关或网络层导致的数据丢失/篡改可能", "若硬件故障确认,更换传感器模块"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.946585178375244, "api_error": null} {"episode_id": "SQ1_TP_B_0032", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0032.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260661, "scenario_id": "DF-06", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-08T07:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧窗帘在无人在家期间收到关闭指令且未完成动作,可能存在窗帘电机卡死或通信故障。\",\n \"reasoning\": [\n \"推理步骤1: 次卧共有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor),以及窗帘设备(second_bedroom_window)。需要逐一检查其工作状态。\",\n \"推理步骤2: 温度传感器方面,second_bedroom_temp_sensor 全天每30分钟稳定上报温度数据,数值从夜间约22.9°C逐步升至中午约25.7°C再回落至夜间约23.3°C,变化趋势与其他房间一致且无 None 值出现,工作正常。\",\n \"推理步骤3: 运动传感器方面,second_bedroom_occupancy 全天未上报任何占用事件。结合住户早上07:48出门、下午16:15和18:16回家的行为模式,以及主卧是主要活动卧室(有多次occupancy事件),次卧全天无人活动是合理的,传感器工作正常。\",\n \"推理步骤4: 窗户传感器方面,second_bedroom_window_contact 全天无状态变化事件上报,说明窗户始终保持关闭状态,属于正常。\",\n \"推理步骤5: 窗帘设备方面,07:53:00 收到 DownOrClose 指令,随后 OperationalStatus 持续报告 0b000010(表示正在向关闭方向运动)。07:53:30 上报 CurrentPositionLiftPercent100ths = 5000(即50%位置),但07:54:00 仍然报告 OperationalStatus = 0b000010,说明窗帘仍在运动中,之后再无任何状态更新(没有到达目标位置的完成报告,也没有 OperationalStatus 归零)。\",\n \"推理步骤6: 正常的窗帘关闭操作应在运动结束后上报 OperationalStatus = 0b000000(停止)并报告最终位置(接近10000即完全关闭)。此处窗帘停留在50%位置后失去后续状态更新,暗示电机可能卡住、通信中断或设备进入异常状态。\",\n \"推理步骤7: 该指令发生在07:53,住户已于07:48出门,可能是离家自动化场景触发的关窗帘操作,时间上合理,但执行未正常完成。\"\n ],\n \"key_evidence\": [\n \"07:53:00 次卧窗帘收到 DownOrClose 指令,07:53:30 位置报告为50%(CurrentPositionLiftPercent100ths=5000),07:54:00 OperationalStatus 仍为 0b000010(运动中),此后再无任何状态更新\",\n \"对比晚间22:11:22主卧窗帘正常上报 CurrentPositionLiftPercent100ths=10000(完全关闭),次卧窗帘缺少类似的完成状态报告\",\n \"次卧温度传感器和窗户传感器全天数据正常,异常仅限于窗帘设备\"\n ],\n \"recommended_actions\": [\n \"检查次卧窗帘当前实际位置,确认是否卡在50%处未完成关闭\",\n \"尝试对次卧窗帘发送 StopMotion 后重新发送 DownOrClose 指令,观察是否能恢复正常运行\",\n \"检查窗帘电机导轨是否有异物阻挡,以及设备固件和通信连接是否正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧窗帘在无人在家期间收到关闭指令且未完成动作,可能存在窗帘电机卡死或通信故障。", "reasoning": ["推理步骤1: 次卧共有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor),以及窗帘设备(second_bedroom_window)。需要逐一检查其工作状态。", "推理步骤2: 温度传感器方面,second_bedroom_temp_sensor 全天每30分钟稳定上报温度数据,数值从夜间约22.9°C逐步升至中午约25.7°C再回落至夜间约23.3°C,变化趋势与其他房间一致且无 None 值出现,工作正常。", "推理步骤3: 运动传感器方面,second_bedroom_occupancy 全天未上报任何占用事件。结合住户早上07:48出门、下午16:15和18:16回家的行为模式,以及主卧是主要活动卧室(有多次occupancy事件),次卧全天无人活动是合理的,传感器工作正常。", "推理步骤4: 窗户传感器方面,second_bedroom_window_contact 全天无状态变化事件上报,说明窗户始终保持关闭状态,属于正常。", "推理步骤5: 窗帘设备方面,07:53:00 收到 DownOrClose 指令,随后 OperationalStatus 持续报告 0b000010(表示正在向关闭方向运动)。07:53:30 上报 CurrentPositionLiftPercent100ths = 5000(即50%位置),但07:54:00 仍然报告 OperationalStatus = 0b000010,说明窗帘仍在运动中,之后再无任何状态更新(没有到达目标位置的完成报告,也没有 OperationalStatus 归零)。", "推理步骤6: 正常的窗帘关闭操作应在运动结束后上报 OperationalStatus = 0b000000(停止)并报告最终位置(接近10000即完全关闭)。此处窗帘停留在50%位置后失去后续状态更新,暗示电机可能卡住、通信中断或设备进入异常状态。", "推理步骤7: 该指令发生在07:53,住户已于07:48出门,可能是离家自动化场景触发的关窗帘操作,时间上合理,但执行未正常完成。"], "key_evidence": ["07:53:00 次卧窗帘收到 DownOrClose 指令,07:53:30 位置报告为50%(CurrentPositionLiftPercent100ths=5000),07:54:00 OperationalStatus 仍为 0b000010(运动中),此后再无任何状态更新", "对比晚间22:11:22主卧窗帘正常上报 CurrentPositionLiftPercent100ths=10000(完全关闭),次卧窗帘缺少类似的完成状态报告", "次卧温度传感器和窗户传感器全天数据正常,异常仅限于窗帘设备"], "recommended_actions": ["检查次卧窗帘当前实际位置,确认是否卡在50%处未完成关闭", "尝试对次卧窗帘发送 StopMotion 后重新发送 DownOrClose 指令,观察是否能恢复正常运行", "检查窗帘电机导轨是否有异物阻挡,以及设备固件和通信连接是否正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.031747817993164, "api_error": null} {"episode_id": "SQ1_TP_B_0033", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0033.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20260662, "scenario_id": "DF-03", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-10T09:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器硬件故障或干扰。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:42 关灯、锁门出门上班,至 15:57 才有人开门回来。次卧在这段时间内应无人活动。\",\n \"推理步骤2: 然而在 09:22:00~09:23:10 期间,次卧运动传感器在约1分钟内连续触发了5次状态变化(1→0→1→0→1),每次间隔仅约5~30秒,呈现异常的高频抖动模式。\",\n \"推理步骤3: 正常的人体活动不会在30秒内反复出现'有人→无人→有人'的快速切换;且此时入户门锁处于锁定状态、入户门传感器显示关闭,没有任何人员进出的记录。\",\n \"推理步骤4: 次卧温度传感器在同一时段读数正常(与其他房间一致地缓慢上升),排除了环境剧烈变化导致误触发的可能。\",\n \"推理步骤5: 综合判断,该运动传感器存在硬件故障(如PIR元件灵敏度漂移、接线松动)或受到外部干扰(如阳光直射、宠物、窗帘飘动等),导致误报。\"\n ],\n \"key_evidence\": [\n \"09:22:00~09:23:10 次卧运动传感器在约1分钟内产生5次状态翻转(Occupancy 1→0→1→0→1),间隔极短(5~30秒)\",\n \"该时段住户已于 07:42 出门且入户门处于锁定关闭状态,家中应无人\",\n \"次卧温度传感器读数正常,无环境异常佐证有人活动\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、热源变化等可能导致PIR误触发的因素\",\n \"检查次卧窗户是否关闭,排除外部动物或气流干扰的可能\",\n \"清洁传感器镜头,检查设备固件版本并更新;如问题持续,考虑更换传感器硬件\",\n \"在自动化规则中对该传感器增加去抖逻辑(如连续检测到占用超过60秒才触发告警),减少误报对安防系统的影响\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器硬件故障或干扰。", "reasoning": ["推理步骤1: 住户于 07:42 关灯、锁门出门上班,至 15:57 才有人开门回来。次卧在这段时间内应无人活动。", "推理步骤2: 然而在 09:22:00~09:23:10 期间,次卧运动传感器在约1分钟内连续触发了5次状态变化(1→0→1→0→1),每次间隔仅约5~30秒,呈现异常的高频抖动模式。", "推理步骤3: 正常的人体活动不会在30秒内反复出现'有人→无人→有人'的快速切换;且此时入户门锁处于锁定状态、入户门传感器显示关闭,没有任何人员进出的记录。", "推理步骤4: 次卧温度传感器在同一时段读数正常(与其他房间一致地缓慢上升),排除了环境剧烈变化导致误触发的可能。", "推理步骤5: 综合判断,该运动传感器存在硬件故障(如PIR元件灵敏度漂移、接线松动)或受到外部干扰(如阳光直射、宠物、窗帘飘动等),导致误报。"], "key_evidence": ["09:22:00~09:23:10 次卧运动传感器在约1分钟内产生5次状态翻转(Occupancy 1→0→1→0→1),间隔极短(5~30秒)", "该时段住户已于 07:42 出门且入户门处于锁定关闭状态,家中应无人", "次卧温度传感器读数正常,无环境异常佐证有人活动"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、热源变化等可能导致PIR误触发的因素", "检查次卧窗户是否关闭,排除外部动物或气流干扰的可能", "清洁传感器镜头,检查设备固件版本并更新;如问题持续,考虑更换传感器硬件", "在自动化规则中对该传感器增加去抖逻辑(如连续检测到占用超过60秒才触发告警),减少误报对安防系统的影响"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.197166442871094, "api_error": null} {"episode_id": "SQ1_TP_B_0034", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0034.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260663, "scenario_id": "DF-04", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-08T07:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁存在锁定故障并触发告警,且玄关运动传感器在住户在家期间长时间无任何触发记录,疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 07:23:00 门锁连续两次发送 LockDoor 命令,且两次返回 LockState=2(Unlocked),随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中表示 LockJammed(锁体卡住),说明门锁尝试上锁但机械执行失败。\",\n \"推理步骤3: 07:26:32 住户最终通过手动方式(OperationSource=Manual)开锁出门,说明远程/自动锁定确实失败了,住户不得不手动操作。\",\n \"推理步骤4: 玄关运动传感器(entrance_occupancy)全天仅在 07:26:35 和 18:05:03 各触发一次(对应早出晚归经过玄关),但 16:19 时入户门有开锁和开门记录,玄关运动传感器却没有任何触发。这不合理——有人开门进入必然经过玄关,传感器应当检测到运动。\",\n \"推理步骤5: 16:19 的进入事件中,门锁解锁、门传感器检测到开门、但 entrance_occupancy 无响应,而 living_room_occupancy 也没有后续触发,直到 18:05 才有完整的入户序列。这表明 16:19 时玄关运动传感器可能已经存在漏检或响应延迟问题。\",\n \"推理步骤6: 玄关灯(entrance_light)全天无任何开关记录,虽然可能是住户习惯不开玄关灯,但结合运动传感器的异常,也值得关注是否联动自动化已失效。\"\n ],\n \"key_evidence\": [\n \"07:23:00-07:23:15 门锁连续两次 LockDoor 命令均返回 LockState=2(Unlocked),并触发 DoorLockAlarm(AlarmCode=0) 即 LockJammed 告警\",\n \"16:19:00 入户门解锁并开门(front_door_contact=False),但 entrance_occupancy 未触发任何占用事件,存在漏检\",\n \"玄关运动传感器全天仅记录 2 次触发,与 3 次出入门事件不匹配(07:26、16:19、18:05 共 3 次,但传感器仅响应了 2 次)\"\n ],\n \"recommended_actions\": [\n \"检查入户门锁机械结构,清理锁舌和锁孔,排除 LockJammed 的物理原因;如问题持续,联系锁具厂商维修或更换锁体\",\n \"检查玄关运动传感器(entrance_occupancy)的安装位置、电池电量和网络连接状态,确认其是否存在离线、低电量或感应盲区问题\",\n \"在排查期间,建议将入户门锁的自动上锁功能暂时关闭,避免因锁体卡住导致无法正常出入\",\n \"检查玄关灯与运动传感器的联动自动化规则是否正常运行\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门锁存在锁定故障并触发告警,且玄关运动传感器在住户在家期间长时间无任何触发记录,疑似离线或故障。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 07:23:00 门锁连续两次发送 LockDoor 命令,且两次返回 LockState=2(Unlocked),随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中表示 LockJammed(锁体卡住),说明门锁尝试上锁但机械执行失败。", "推理步骤3: 07:26:32 住户最终通过手动方式(OperationSource=Manual)开锁出门,说明远程/自动锁定确实失败了,住户不得不手动操作。", "推理步骤4: 玄关运动传感器(entrance_occupancy)全天仅在 07:26:35 和 18:05:03 各触发一次(对应早出晚归经过玄关),但 16:19 时入户门有开锁和开门记录,玄关运动传感器却没有任何触发。这不合理——有人开门进入必然经过玄关,传感器应当检测到运动。", "推理步骤5: 16:19 的进入事件中,门锁解锁、门传感器检测到开门、但 entrance_occupancy 无响应,而 living_room_occupancy 也没有后续触发,直到 18:05 才有完整的入户序列。这表明 16:19 时玄关运动传感器可能已经存在漏检或响应延迟问题。", "推理步骤6: 玄关灯(entrance_light)全天无任何开关记录,虽然可能是住户习惯不开玄关灯,但结合运动传感器的异常,也值得关注是否联动自动化已失效。"], "key_evidence": ["07:23:00-07:23:15 门锁连续两次 LockDoor 命令均返回 LockState=2(Unlocked),并触发 DoorLockAlarm(AlarmCode=0) 即 LockJammed 告警", "16:19:00 入户门解锁并开门(front_door_contact=False),但 entrance_occupancy 未触发任何占用事件,存在漏检", "玄关运动传感器全天仅记录 2 次触发,与 3 次出入门事件不匹配(07:26、16:19、18:05 共 3 次,但传感器仅响应了 2 次)"], "recommended_actions": ["检查入户门锁机械结构,清理锁舌和锁孔,排除 LockJammed 的物理原因;如问题持续,联系锁具厂商维修或更换锁体", "检查玄关运动传感器(entrance_occupancy)的安装位置、电池电量和网络连接状态,确认其是否存在离线、低电量或感应盲区问题", "在排查期间,建议将入户门锁的自动上锁功能暂时关闭,避免因锁体卡住导致无法正常出入", "检查玄关灯与运动传感器的联动自动化规则是否正常运行"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.174380779266357, "api_error": null} {"episode_id": "SQ1_TP_B_0037", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0037.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260666, "scenario_id": "DF-03", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-01T00:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在深夜无人活动时段出现高频率反复触发,疑似传感器故障或干扰。\",\n \"reasoning\": [\n \"推理步骤1: 次卧运动传感器在 00:40:00 至 00:41:10 的约70秒内,Occupancy 状态在 0 和 1 之间快速切换了5次(1→0→1→0→1),每次间隔仅约5-30秒。\",\n \"推理步骤2: 该时间段为凌晨00:40,属于深夜时段。从全天日志来看,住户约06:11起床(主卧运动传感器触发),07:33出门,17:43回家,22:14就寝。凌晨00:40应处于深度睡眠阶段,且住户睡在主卧而非次卧。\",\n \"推理步骤3: 正常的人体运动不会在30秒内反复出现如此规律的开/关切换模式。如果有人经过,传感器通常会保持占用状态一段时间后才归零,而不是5秒就清零又立刻重新触发。\",\n \"推理步骤4: 次卧温度传感器全天数据与其他房间高度一致,温度变化曲线正常(夜间约23°C,午间峰值约25.8°C),未见异常波动,说明次卧温度传感器工作正常。\",\n \"推理步骤5: 次卧窗户传感器全天无任何状态变化事件,无入侵迹象,排除有人从窗户进入的可能性。入户门在该时段也处于锁定状态,排除外人进入的可能。\",\n \"推理步骤6: 综合判断,该运动传感器的异常触发更可能是传感器本身的故障(如PIR传感器灵敏度漂移、电磁干扰、昆虫经过、或传感器老化导致的误触发),而非真实的人体活动。\"\n ],\n \"key_evidence\": [\n \"00:40:00-00:41:10 次卧运动传感器在70秒内发生5次状态切换(Occupancy 1→0→1→0→1),间隔极短(5-30秒)\",\n \"该时段为凌晨,住户睡在主卧(06:11主卧运动传感器才首次触发),次卧不应有人活动\",\n \"次卧窗户传感器和入户门锁在该时段无任何异常事件,排除入侵可能\",\n \"次卧温度传感器全天读数正常,与其他房间一致,说明并非所有次卧传感器都有问题\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否对准窗户或有窗帘、宠物等可能造成误触发的干扰源\",\n \"查看传感器电池电量或供电状态,低电量可能导致传感器行为异常\",\n \"适当降低运动传感器灵敏度,或调整其检测区域以减少误报\",\n \"持续监测该传感器,若类似高频抖动反复出现,建议更换传感器硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在深夜无人活动时段出现高频率反复触发,疑似传感器故障或干扰。", "reasoning": ["推理步骤1: 次卧运动传感器在 00:40:00 至 00:41:10 的约70秒内,Occupancy 状态在 0 和 1 之间快速切换了5次(1→0→1→0→1),每次间隔仅约5-30秒。", "推理步骤2: 该时间段为凌晨00:40,属于深夜时段。从全天日志来看,住户约06:11起床(主卧运动传感器触发),07:33出门,17:43回家,22:14就寝。凌晨00:40应处于深度睡眠阶段,且住户睡在主卧而非次卧。", "推理步骤3: 正常的人体运动不会在30秒内反复出现如此规律的开/关切换模式。如果有人经过,传感器通常会保持占用状态一段时间后才归零,而不是5秒就清零又立刻重新触发。", "推理步骤4: 次卧温度传感器全天数据与其他房间高度一致,温度变化曲线正常(夜间约23°C,午间峰值约25.8°C),未见异常波动,说明次卧温度传感器工作正常。", "推理步骤5: 次卧窗户传感器全天无任何状态变化事件,无入侵迹象,排除有人从窗户进入的可能性。入户门在该时段也处于锁定状态,排除外人进入的可能。", "推理步骤6: 综合判断,该运动传感器的异常触发更可能是传感器本身的故障(如PIR传感器灵敏度漂移、电磁干扰、昆虫经过、或传感器老化导致的误触发),而非真实的人体活动。"], "key_evidence": ["00:40:00-00:41:10 次卧运动传感器在70秒内发生5次状态切换(Occupancy 1→0→1→0→1),间隔极短(5-30秒)", "该时段为凌晨,住户睡在主卧(06:11主卧运动传感器才首次触发),次卧不应有人活动", "次卧窗户传感器和入户门锁在该时段无任何异常事件,排除入侵可能", "次卧温度传感器全天读数正常,与其他房间一致,说明并非所有次卧传感器都有问题"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否对准窗户或有窗帘、宠物等可能造成误触发的干扰源", "查看传感器电池电量或供电状态,低电量可能导致传感器行为异常", "适当降低运动传感器灵敏度,或调整其检测区域以减少误报", "持续监测该传感器,若类似高频抖动反复出现,建议更换传感器硬件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.330486536026, "api_error": null} {"episode_id": "SQ1_TP_B_0038", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0038.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20260667, "scenario_id": "DF-05", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-06T10:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房存在两个传感器异常:温度传感器多次报告 None 值且出现一次异常高温读数,烟雾报警器报告硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在做饭期间多次报告 MeasuredValue = None(09:23、09:41、12:02、12:33、17:58、18:30),表明传感器在灶具开启后频繁丢失读数。正常传感器即使在高温环境下也应返回有效数值而非 None。\",\n \"推理步骤2: 12:00 时厨房温度传感器报告 2984(约29.84°C),而同一时刻其他三个房间温度在 2573-2590 范围内(约25.7-25.9°C),厨房温度比其他房间高出约4°C。虽然做饭会导致厨房升温,但此时灶具尚未开启(12:01才开灯、12:01:30才开灶),这个异常高温读数缺乏合理解释,可能是传感器读数漂移或故障。\",\n \"推理步骤3: 12:30 时厨房温度仍为 2975(约29.75°C),灶具在 12:01:30 开启、12:32 关闭,做饭期间温度维持异常高位可部分解释,但结合 None 值频发,传感器整体可靠性存疑。\",\n \"推理步骤4: 10:33 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5 并触发 HardwareFault 事件。ExpressedState=5 对应 HardwareFault 状态,说明烟雾报警器自身检测到硬件级别故障,这不是误报而是设备自诊断结果。\",\n \"推理步骤5: 烟雾报警器硬件故障意味着在真正发生火灾或一氧化碳泄漏时可能无法正常报警,这是严重的安全隐患。温度传感器的 None 值和异常读数则会影响智能家居系统对厨房环境的准确判断。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在一天内6次报告 MeasuredValue = None(09:23、09:41、12:02、12:33、17:58、18:30),均发生在灶具操作前后\",\n \"12:00 时灶具尚未开启,kitchen_temp_sensor 读数 2984 比其他房间高出约 400 个单位(~4°C),属于异常偏高\",\n \"10:33 kitchen_smoke_alarm 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件,确认烟雾报警器存在硬件故障\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,硬件故障状态下无法保障火灾和一氧化碳检测功能,这是最高优先级\",\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或热损伤,考虑重新校准或更换\",\n \"在烟雾报警器修复前,避免无人看管的厨房烹饪操作,并考虑临时增加独立式烟雾报警器作为备用\",\n \"检查温度传感器的供电和通信链路,频繁的 None 值可能指向传感器间歇性断连或固件缺陷,必要时进行固件更新\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房存在两个传感器异常:温度传感器多次报告 None 值且出现一次异常高温读数,烟雾报警器报告硬件故障。", "reasoning": ["推理步骤1: 厨房温度传感器在做饭期间多次报告 MeasuredValue = None(09:23、09:41、12:02、12:33、17:58、18:30),表明传感器在灶具开启后频繁丢失读数。正常传感器即使在高温环境下也应返回有效数值而非 None。", "推理步骤2: 12:00 时厨房温度传感器报告 2984(约29.84°C),而同一时刻其他三个房间温度在 2573-2590 范围内(约25.7-25.9°C),厨房温度比其他房间高出约4°C。虽然做饭会导致厨房升温,但此时灶具尚未开启(12:01才开灯、12:01:30才开灶),这个异常高温读数缺乏合理解释,可能是传感器读数漂移或故障。", "推理步骤3: 12:30 时厨房温度仍为 2975(约29.75°C),灶具在 12:01:30 开启、12:32 关闭,做饭期间温度维持异常高位可部分解释,但结合 None 值频发,传感器整体可靠性存疑。", "推理步骤4: 10:33 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5 并触发 HardwareFault 事件。ExpressedState=5 对应 HardwareFault 状态,说明烟雾报警器自身检测到硬件级别故障,这不是误报而是设备自诊断结果。", "推理步骤5: 烟雾报警器硬件故障意味着在真正发生火灾或一氧化碳泄漏时可能无法正常报警,这是严重的安全隐患。温度传感器的 None 值和异常读数则会影响智能家居系统对厨房环境的准确判断。"], "key_evidence": ["kitchen_temp_sensor 在一天内6次报告 MeasuredValue = None(09:23、09:41、12:02、12:33、17:58、18:30),均发生在灶具操作前后", "12:00 时灶具尚未开启,kitchen_temp_sensor 读数 2984 比其他房间高出约 400 个单位(~4°C),属于异常偏高", "10:33 kitchen_smoke_alarm 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件,确认烟雾报警器存在硬件故障"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,硬件故障状态下无法保障火灾和一氧化碳检测功能,这是最高优先级", "检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或热损伤,考虑重新校准或更换", "在烟雾报警器修复前,避免无人看管的厨房烹饪操作,并考虑临时增加独立式烟雾报警器作为备用", "检查温度传感器的供电和通信链路,频繁的 None 值可能指向传感器间歇性断连或固件缺陷,必要时进行固件更新"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.73471474647522, "api_error": null} {"episode_id": "SQ1_TP_B_0046", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0046.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20260675, "scenario_id": "DF-06", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-22T21:54:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧窗帘执行关闭命令后持续处于运动状态,未能到达目标位置,疑似窗帘电机卡住或机械故障。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器(second_bedroom_temp_sensor)全天每30分钟正常上报温度数据,数值在 2291~2589 范围内,与其他房间温度趋势一致,无异常跳变或缺失,工作正常。\",\n \"推理步骤2: 次卧运动传感器(second_bedroom_occupancy)全天无占用事件上报,与住户白天外出、晚间主要活动在主卧和客厅的行为模式一致,属于正常静默状态。\",\n \"推理步骤3: 次卧窗户传感器(second_bedroom_window_contact)全天无状态变化事件,说明窗户始终保持关闭,工作正常。\",\n \"推理步骤4: 次卧窗帘(second_bedroom_window)在 21:54:00 收到 DownOrClose 命令后,21:54:01 开始运动(OperationalStatus = 0b000010 表示向下运动中),21:54:30 位置到达 50%(CurrentPositionLiftPercent100ths = 5000)但仍在运动,21:55:00 仍报告运动状态(OperationalStatus = 0b000010),之后再无状态更新。\",\n \"推理步骤5: 正常的窗帘关闭操作应在到达目标位置(通常为 10000 即完全关闭)后将 OperationalStatus 归零并报告最终位置。该窗帘在 50% 位置后持续运动超过30秒仍未完成,且此后不再有任何完成或停止的状态上报,说明窗帘可能卡在中间位置或电机出现故障。\"\n ],\n \"key_evidence\": [\n \"21:54:30 窗帘位置仅到达 50%(CurrentPositionLiftPercent100ths = 5000)且仍在运动\",\n \"21:55:00 OperationalStatus 仍为 0b000010(运动中),之后再无完成或停止的状态上报\",\n \"次卧温度传感器、运动传感器、窗户传感器全天数据正常,异常仅限于窗帘设备\"\n ],\n \"recommended_actions\": [\n \"检查次卧窗帘导轨是否有异物阻挡或帘布卡住的情况\",\n \"尝试对窗帘电机进行手动复位或重新下发关闭/停止命令,观察是否恢复正常\",\n \"如果问题反复出现,检查窗帘电机是否需要维修或更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧窗帘执行关闭命令后持续处于运动状态,未能到达目标位置,疑似窗帘电机卡住或机械故障。", "reasoning": ["推理步骤1: 次卧温度传感器(second_bedroom_temp_sensor)全天每30分钟正常上报温度数据,数值在 2291~2589 范围内,与其他房间温度趋势一致,无异常跳变或缺失,工作正常。", "推理步骤2: 次卧运动传感器(second_bedroom_occupancy)全天无占用事件上报,与住户白天外出、晚间主要活动在主卧和客厅的行为模式一致,属于正常静默状态。", "推理步骤3: 次卧窗户传感器(second_bedroom_window_contact)全天无状态变化事件,说明窗户始终保持关闭,工作正常。", "推理步骤4: 次卧窗帘(second_bedroom_window)在 21:54:00 收到 DownOrClose 命令后,21:54:01 开始运动(OperationalStatus = 0b000010 表示向下运动中),21:54:30 位置到达 50%(CurrentPositionLiftPercent100ths = 5000)但仍在运动,21:55:00 仍报告运动状态(OperationalStatus = 0b000010),之后再无状态更新。", "推理步骤5: 正常的窗帘关闭操作应在到达目标位置(通常为 10000 即完全关闭)后将 OperationalStatus 归零并报告最终位置。该窗帘在 50% 位置后持续运动超过30秒仍未完成,且此后不再有任何完成或停止的状态上报,说明窗帘可能卡在中间位置或电机出现故障。"], "key_evidence": ["21:54:30 窗帘位置仅到达 50%(CurrentPositionLiftPercent100ths = 5000)且仍在运动", "21:55:00 OperationalStatus 仍为 0b000010(运动中),之后再无完成或停止的状态上报", "次卧温度传感器、运动传感器、窗户传感器全天数据正常,异常仅限于窗帘设备"], "recommended_actions": ["检查次卧窗帘导轨是否有异物阻挡或帘布卡住的情况", "尝试对窗帘电机进行手动复位或重新下发关闭/停止命令,观察是否恢复正常", "如果问题反复出现,检查窗帘电机是否需要维修或更换"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.191120386123657, "api_error": null} {"episode_id": "SQ1_TP_B_0047", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0047.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260676, "scenario_id": "DF-03", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-25T09:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器故障或误报。\",\n \"reasoning\": [\n \"推理步骤1: 次卧有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor)。温度传感器和窗户传感器在整个日志周期内表现正常。\",\n \"推理步骤2: 次卧温度传感器全天读数与其他房间高度一致,从凌晨约23.0°C到中午约25.8°C再回落到约23.3°C,变化平滑合理,无异常跳变或None值,工作正常。\",\n \"推理步骤3: 次卧窗户传感器全天无任何状态变化事件上报,说明窗户始终保持关闭状态,表现正常。\",\n \"推理步骤4: 次卧运动传感器在09:13:00-09:14:10期间出现快速反复触发:1→0→1→0→1,在约70秒内切换了5次状态。这种高频抖动模式不符合正常人体活动特征。\",\n \"推理步骤5: 结合上下文,住户在07:23已出门(前门解锁→开门→关门→自动上锁),直到16:26才有人回来。09:13时家中应无人,次卧运动传感器不应被触发。\",\n \"推理步骤6: 如果是入侵,应伴随门窗传感器触发或前门锁操作,但该时段无任何此类事件。且运动传感器的快速抖动(每隔约30秒切换)更像是传感器硬件抖动或干扰,而非真实人体移动。\"\n ],\n \"key_evidence\": [\n \"09:13:00-09:14:10 次卧运动传感器在约70秒内状态切换5次(1→0→1→0→1),呈现异常高频抖动\",\n \"该时段住户已于07:23出门,家中应无人,前门处于锁定状态\",\n \"同时段无任何门窗传感器触发,排除实际入侵可能\",\n \"次卧温度传感器和窗户传感器全天工作正常,异常仅限于运动传感器\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否有窗帘飘动、宠物活动或阳光直射等可能导致误触发的环境因素\",\n \"清洁传感器镜头,检查是否有灰尘或蜘蛛网干扰PIR感应\",\n \"观察该传感器是否在后续日期持续出现类似无人时段的抖动,若反复出现建议更换传感器\",\n \"可考虑调整传感器灵敏度或增加去抖延迟,减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在无人居住期间出现快速反复触发,疑似传感器故障或误报。", "reasoning": ["推理步骤1: 次卧有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor)。温度传感器和窗户传感器在整个日志周期内表现正常。", "推理步骤2: 次卧温度传感器全天读数与其他房间高度一致,从凌晨约23.0°C到中午约25.8°C再回落到约23.3°C,变化平滑合理,无异常跳变或None值,工作正常。", "推理步骤3: 次卧窗户传感器全天无任何状态变化事件上报,说明窗户始终保持关闭状态,表现正常。", "推理步骤4: 次卧运动传感器在09:13:00-09:14:10期间出现快速反复触发:1→0→1→0→1,在约70秒内切换了5次状态。这种高频抖动模式不符合正常人体活动特征。", "推理步骤5: 结合上下文,住户在07:23已出门(前门解锁→开门→关门→自动上锁),直到16:26才有人回来。09:13时家中应无人,次卧运动传感器不应被触发。", "推理步骤6: 如果是入侵,应伴随门窗传感器触发或前门锁操作,但该时段无任何此类事件。且运动传感器的快速抖动(每隔约30秒切换)更像是传感器硬件抖动或干扰,而非真实人体移动。"], "key_evidence": ["09:13:00-09:14:10 次卧运动传感器在约70秒内状态切换5次(1→0→1→0→1),呈现异常高频抖动", "该时段住户已于07:23出门,家中应无人,前门处于锁定状态", "同时段无任何门窗传感器触发,排除实际入侵可能", "次卧温度传感器和窗户传感器全天工作正常,异常仅限于运动传感器"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否有窗帘飘动、宠物活动或阳光直射等可能导致误触发的环境因素", "清洁传感器镜头,检查是否有灰尘或蜘蛛网干扰PIR感应", "观察该传感器是否在后续日期持续出现类似无人时段的抖动,若反复出现建议更换传感器", "可考虑调整传感器灵敏度或增加去抖延迟,减少误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.938130855560303, "api_error": null} {"episode_id": "SQ1_TP_B_0050", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0050.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260679, "scenario_id": "DF-06", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-30T08:01:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧窗帘在无人且住户外出期间收到关闭指令后持续处于运动状态,未能到达目标位置,疑似窗帘电机卡住或机械故障。\",\n \"reasoning\": [\n \"推理步骤1: 次卧有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor),以及窗帘设备(second_bedroom_window)和灯(second_bedroom_light)。\",\n \"推理步骤2: 温度传感器数据正常,全天从约23°C逐步升至约25.8°C再回落至约23.4°C,与其他房间温度走势一致,无异常跳变或None值,传感器工作正常。\",\n \"推理步骤3: 窗户传感器(second_bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持同一状态(关闭),这在无人居住的次卧中属于正常。\",\n \"推理步骤4: 运动传感器(second_bedroom_occupancy)全天无任何触发记录,与次卧无人使用的场景一致,传感器本身无异常。\",\n \"推理步骤5: 重点异常在窗帘设备——08:01:00收到DownOrClose指令,08:01:01 OperationalStatus变为0b000010(表示正在向下运动),08:01:30仍为0b000010且位置仅到50%(CurrentPositionLiftPercent100ths=5000),08:02:00 OperationalStatus依然是0b000010(仍在运动中)。此后再无该设备的状态更新。\",\n \"推理步骤6: 正常窗帘完成关闭动作后,OperationalStatus应归零(0b000000)且位置应到达目标值(通常为10000即完全关闭)。该窗帘在至少1分钟内持续显示运动状态,停在50%位置后不再上报,说明可能卡住或电机故障导致无法完成动作。\",\n \"推理步骤7: 该指令发生在08:01,住户已于07:34出门,属于远程或定时自动化指令,无人在场确认窗帘实际状态。\"\n ],\n \"key_evidence\": [\n \"08:01:00 窗帘收到DownOrClose指令,08:01:01起OperationalStatus持续为0b000010(运动中),08:01:30位置仅到50%,08:02:00仍显示运动状态,之后无完成事件上报\",\n \"温度传感器全天数据与其他房间高度一致,无异常值或None,工作正常\",\n \"运动传感器和窗户传感器全天无事件,与次卧无人使用的场景吻合,属正常\"\n ],\n \"recommended_actions\": [\n \"检查次卧窗帘当前实际位置和OperationalStatus,确认是否仍卡在运动状态\",\n \"检查窗帘导轨是否有异物阻挡或帘布是否卡住,排除机械故障\",\n \"尝试对窗帘发送StopMotion指令后重新执行DownOrClose,观察是否能正常完成\",\n \"若问题反复出现,检查窗帘电机是否过载或需要维护更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧窗帘在无人且住户外出期间收到关闭指令后持续处于运动状态,未能到达目标位置,疑似窗帘电机卡住或机械故障。", "reasoning": ["推理步骤1: 次卧有三个传感器——运动传感器(second_bedroom_occupancy)、窗户传感器(second_bedroom_window_contact)、温度传感器(second_bedroom_temp_sensor),以及窗帘设备(second_bedroom_window)和灯(second_bedroom_light)。", "推理步骤2: 温度传感器数据正常,全天从约23°C逐步升至约25.8°C再回落至约23.4°C,与其他房间温度走势一致,无异常跳变或None值,传感器工作正常。", "推理步骤3: 窗户传感器(second_bedroom_window_contact)全天无状态变化事件上报,说明窗户始终保持同一状态(关闭),这在无人居住的次卧中属于正常。", "推理步骤4: 运动传感器(second_bedroom_occupancy)全天无任何触发记录,与次卧无人使用的场景一致,传感器本身无异常。", "推理步骤5: 重点异常在窗帘设备——08:01:00收到DownOrClose指令,08:01:01 OperationalStatus变为0b000010(表示正在向下运动),08:01:30仍为0b000010且位置仅到50%(CurrentPositionLiftPercent100ths=5000),08:02:00 OperationalStatus依然是0b000010(仍在运动中)。此后再无该设备的状态更新。", "推理步骤6: 正常窗帘完成关闭动作后,OperationalStatus应归零(0b000000)且位置应到达目标值(通常为10000即完全关闭)。该窗帘在至少1分钟内持续显示运动状态,停在50%位置后不再上报,说明可能卡住或电机故障导致无法完成动作。", "推理步骤7: 该指令发生在08:01,住户已于07:34出门,属于远程或定时自动化指令,无人在场确认窗帘实际状态。"], "key_evidence": ["08:01:00 窗帘收到DownOrClose指令,08:01:01起OperationalStatus持续为0b000010(运动中),08:01:30位置仅到50%,08:02:00仍显示运动状态,之后无完成事件上报", "温度传感器全天数据与其他房间高度一致,无异常值或None,工作正常", "运动传感器和窗户传感器全天无事件,与次卧无人使用的场景吻合,属正常"], "recommended_actions": ["检查次卧窗帘当前实际位置和OperationalStatus,确认是否仍卡在运动状态", "检查窗帘导轨是否有异物阻挡或帘布是否卡住,排除机械故障", "尝试对窗帘发送StopMotion指令后重新执行DownOrClose,观察是否能正常完成", "若问题反复出现,检查窗帘电机是否过载或需要维护更换"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.029756784439087, "api_error": null} {"episode_id": "SQ1_TP_B_0052", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0052.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260681, "scenario_id": "DF-04", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-04T03:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在凌晨3:10出现锁定失败并触发告警,且玄关运动传感器在住户出门/回家时未能可靠检测到运动。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含三个关键设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)和玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 凌晨03:10,门锁连续两次收到 LockDoor 命令,但两次返回的 LockState 均为 2(Unlocked),说明锁舌未能成功上锁。随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中代表 LockJammed(锁体卡住),这是一个明确的硬件故障信号。\",\n \"推理步骤3: 早晨07:28住户出门时,运动传感器检测到了玄关有人(Occupancy=1),门锁手动解锁(LockOperationType=1),门开关传感器记录了开门(False)和关门(True),门锁自动上锁(LockOperationType=0, LockState=1),这一系列流程正常。\",\n \"推理步骤4: 傍晚18:01住户回家时,门锁手动解锁、门传感器记录开门,运动传感器检测到有人——但注意入户门传感器在住户回家后始终没有记录关门事件(StateValue=True),直到22:03才关门上锁。这意味着入户门从18:01到22:03之间保持开启状态约4小时,虽然可能是住户有意为之,但也可能是门传感器漏报了关门事件。\",\n \"推理步骤5: 玄关运动传感器在18:01:03检测到有人后,在18:01:10再次报告有人,但此后住户明显在家活动(客厅有占用、开灯、开空调),玄关传感器却没有在住户22:03关门离开玄关区域时报告任何状态变化(没有 Occupancy=0 的记录),说明该传感器可能存在状态更新不及时或漏报的问题。\"\n ],\n \"key_evidence\": [\n \"03:10:05 和 03:10:15 门锁两次执行 LockDoor 命令后 LockState 均为 2(未锁定),随后触发 DoorLockAlarm(AlarmCode=0) 即 LockJammed 告警\",\n \"18:01:02 入户门开启后,直到 22:03:42 才记录关门,中间长达约4小时门处于开启状态\",\n \"玄关运动传感器在 18:01 之后以及 22:03 住户关门时段均无 Occupancy=0 的清除记录,存在状态未正常复位的嫌疑\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁机械结构,清理锁舌和锁孔,排除 LockJammed 故障。如问题持续,考虑更换锁体或联系厂商维修\",\n \"检查玄关运动传感器的安装位置和灵敏度设置,确认其能正确检测进出玄关的人员并及时复位 Occupancy 状态\",\n \"检查入户门磁传感器的安装间距和对齐情况,确认其能可靠检测开关门事件,排除漏报可能\",\n \"建议为门锁 LockJammed 告警配置即时推送通知,确保住户第一时间知晓门锁故障,避免安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在凌晨3:10出现锁定失败并触发告警,且玄关运动传感器在住户出门/回家时未能可靠检测到运动。", "reasoning": ["推理步骤1: entrance 区域包含三个关键设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)和玄关运动传感器(entrance_occupancy)。", "推理步骤2: 凌晨03:10,门锁连续两次收到 LockDoor 命令,但两次返回的 LockState 均为 2(Unlocked),说明锁舌未能成功上锁。随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中代表 LockJammed(锁体卡住),这是一个明确的硬件故障信号。", "推理步骤3: 早晨07:28住户出门时,运动传感器检测到了玄关有人(Occupancy=1),门锁手动解锁(LockOperationType=1),门开关传感器记录了开门(False)和关门(True),门锁自动上锁(LockOperationType=0, LockState=1),这一系列流程正常。", "推理步骤4: 傍晚18:01住户回家时,门锁手动解锁、门传感器记录开门,运动传感器检测到有人——但注意入户门传感器在住户回家后始终没有记录关门事件(StateValue=True),直到22:03才关门上锁。这意味着入户门从18:01到22:03之间保持开启状态约4小时,虽然可能是住户有意为之,但也可能是门传感器漏报了关门事件。", "推理步骤5: 玄关运动传感器在18:01:03检测到有人后,在18:01:10再次报告有人,但此后住户明显在家活动(客厅有占用、开灯、开空调),玄关传感器却没有在住户22:03关门离开玄关区域时报告任何状态变化(没有 Occupancy=0 的记录),说明该传感器可能存在状态更新不及时或漏报的问题。"], "key_evidence": ["03:10:05 和 03:10:15 门锁两次执行 LockDoor 命令后 LockState 均为 2(未锁定),随后触发 DoorLockAlarm(AlarmCode=0) 即 LockJammed 告警", "18:01:02 入户门开启后,直到 22:03:42 才记录关门,中间长达约4小时门处于开启状态", "玄关运动传感器在 18:01 之后以及 22:03 住户关门时段均无 Occupancy=0 的清除记录,存在状态未正常复位的嫌疑"], "recommended_actions": ["立即检查入户门锁机械结构,清理锁舌和锁孔,排除 LockJammed 故障。如问题持续,考虑更换锁体或联系厂商维修", "检查玄关运动传感器的安装位置和灵敏度设置,确认其能正确检测进出玄关的人员并及时复位 Occupancy 状态", "检查入户门磁传感器的安装间距和对齐情况,确认其能可靠检测开关门事件,排除漏报可能", "建议为门锁 LockJammed 告警配置即时推送通知,确保住户第一时间知晓门锁故障,避免安全隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.15557050704956, "api_error": null} {"episode_id": "SQ1_TP_B_0055", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0055.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20260684, "scenario_id": "DF-03", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-14T13:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧运动传感器在无人居住时段出现快速反复触发,疑似传感器故障或误报。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,均呈现正常的昼夜温度曲线(夜间约22.9-23.1°C,午间峰值约25.7-25.8°C,傍晚逐步回落),温度传感器工作正常。\",\n \"推理步骤2: 次卧运动传感器在13:56:00-13:57:10期间出现了快速交替触发模式:Occupancy在约30秒内反复切换(1→0→1→0→1),共5次状态变化,间隔极短(30秒、5秒、30秒、5秒)。\",\n \"推理步骤3: 这种快速反复触发模式不符合正常人类活动特征。正常进入房间应表现为Occupancy=1持续一段时间,而非在30秒内多次切换。如果是人经过,通常只会触发一次短暂的占用事件。\",\n \"推理步骤4: 整个24小时日志中,除温度数据外,次卧仅在这一个时间窗口有运动事件,且全屋其他运动传感器(客厅、主卧、卫生间、玄关)均无任何触发记录,说明该时段家中大概率无人。\",\n \"推理步骤5: 在无人在家的情况下出现这种快速抖动式触发,更可能是传感器本身的问题,如PIR传感器受到热源干扰(午后阳光直射、空调气流)、灵敏度阈值边界抖动,或硬件接触不良导致的信号抖动。\"\n ],\n \"key_evidence\": [\n \"13:56:00-13:57:10期间运动传感器在约70秒内产生5次状态变化(1→0→1→0→1),切换间隔仅5-30秒,呈现典型的信号抖动模式\",\n \"该时段全屋无其他任何运动传感器触发、无门锁/门窗开关事件,表明家中大概率无人\",\n \"次卧温度传感器数据完全正常,与其他房间一致,排除环境异常因素\"\n ],\n \"recommended_actions\": [\n \"检查次卧运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、空调出风口气流等可能导致PIR误触发的干扰源\",\n \"观察该传感器是否在后续几天持续出现类似的快速抖动触发,若反复出现则考虑更换传感器或调整灵敏度\",\n \"如传感器支持灵敏度配置,可适当降低灵敏度或增加去抖时间(debounce),减少边界状态下的误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧运动传感器在无人居住时段出现快速反复触发,疑似传感器故障或误报。", "reasoning": ["推理步骤1: 次卧温度传感器全天数据与其他房间高度一致,均呈现正常的昼夜温度曲线(夜间约22.9-23.1°C,午间峰值约25.7-25.8°C,傍晚逐步回落),温度传感器工作正常。", "推理步骤2: 次卧运动传感器在13:56:00-13:57:10期间出现了快速交替触发模式:Occupancy在约30秒内反复切换(1→0→1→0→1),共5次状态变化,间隔极短(30秒、5秒、30秒、5秒)。", "推理步骤3: 这种快速反复触发模式不符合正常人类活动特征。正常进入房间应表现为Occupancy=1持续一段时间,而非在30秒内多次切换。如果是人经过,通常只会触发一次短暂的占用事件。", "推理步骤4: 整个24小时日志中,除温度数据外,次卧仅在这一个时间窗口有运动事件,且全屋其他运动传感器(客厅、主卧、卫生间、玄关)均无任何触发记录,说明该时段家中大概率无人。", "推理步骤5: 在无人在家的情况下出现这种快速抖动式触发,更可能是传感器本身的问题,如PIR传感器受到热源干扰(午后阳光直射、空调气流)、灵敏度阈值边界抖动,或硬件接触不良导致的信号抖动。"], "key_evidence": ["13:56:00-13:57:10期间运动传感器在约70秒内产生5次状态变化(1→0→1→0→1),切换间隔仅5-30秒,呈现典型的信号抖动模式", "该时段全屋无其他任何运动传感器触发、无门锁/门窗开关事件,表明家中大概率无人", "次卧温度传感器数据完全正常,与其他房间一致,排除环境异常因素"], "recommended_actions": ["检查次卧运动传感器的安装位置,确认是否有阳光直射、窗帘飘动、空调出风口气流等可能导致PIR误触发的干扰源", "观察该传感器是否在后续几天持续出现类似的快速抖动触发,若反复出现则考虑更换传感器或调整灵敏度", "如传感器支持灵敏度配置,可适当降低灵敏度或增加去抖时间(debounce),减少边界状态下的误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.75689387321472, "api_error": null} {"episode_id": "SQ1_TP_B_0066", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0066.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20260695, "scenario_id": "DF-01", "total_events": 247, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-12T11:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重上报异常和读数固化故障,疑似传感器硬件或固件缺陷。\",\n \"reasoning\": [\n \"推理步骤1: 在同一时间戳下,living_room_temp_sensor 出现了两条不同的温度上报——一条使用标准 Cluster 路径 TemperatureMeasurement.MeasuredValue,另一条使用非标准的短路径 MeasuredValue,且两者数值不一致。例如 06-12T08:00 分别报 2468 和 2350,06-12T12:00 分别报 2576 和 2510,06-12T18:00 分别报 2462 和 2400,06-12T22:00 分别报 2353 和 2280。这说明传感器存在异常的双通道上报行为,短路径上报不符合 Matter 协议标准的 Cluster.Attribute 格式。\",\n \"推理步骤2: 从 06-13 开始,标准路径 TemperatureMeasurement.MeasuredValue 的上报完全消失,仅剩非标准短路径 MeasuredValue 的上报,且读数固定为 2350(23.50°C),在 06-13T08:00、12:00、18:00、22:00 以及 06-14T08:00、12:00 六个采样点全部为 2350,不随时间和环境变化。\",\n \"推理步骤3: 对比同期其他传感器(master_bedroom、second_bedroom、kitchen),它们在 06-12 全天的温度读数随昼夜自然波动(夜间约 22.9-23.1°C,午间峰值约 25.7-25.9°C),符合正常物理规律。而 living_room_temp_sensor 从 06-13 起完全丧失了这种自然波动,说明传感器已不再进行真实测量。\",\n \"推理步骤4: 综合来看,该传感器可能经历了固件异常导致双通道上报(06-12 期间),随后标准上报通道失效,退化为仅输出固定缓存值的故障模式。这属于典型的传感器固件 bug 或硬件采集模块失效。\"\n ],\n \"key_evidence\": [\n \"06-12 当天出现 4 次同时间戳双重上报:08:00(2468/2350)、12:00(2576/2510)、18:00(2462/2400)、22:00(2353/2280),标准路径与非标准短路径 MeasuredValue 数值不一致\",\n \"06-13 起标准 TemperatureMeasurement.MeasuredValue 上报消失,仅剩非标准 MeasuredValue 且读数固化为 2350,跨越 06-13 至 06-14 共 6 个采样点无任何变化\",\n \"非标准短路径 MeasuredValue 不符合 Matter 协议 Cluster.Attribute 规范格式\",\n \"同期其他房间传感器温度正常波动,排除全局环境因素\"\n ],\n \"recommended_actions\": [\n \"立即对 living_room_temp_sensor 执行固件重置或设备重启,观察是否恢复标准 Cluster 路径上报和正常温度波动\",\n \"检查该传感器的固件版本,与厂商确认是否存在已知的双通道上报 bug,必要时升级固件\",\n \"在传感器恢复前,不要依赖客厅温度数据进行空调联动或安全告警判断,避免因读数失真导致误判\",\n \"若重启后仍输出固定值,建议更换传感器硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重上报异常和读数固化故障,疑似传感器硬件或固件缺陷。", "reasoning": ["推理步骤1: 在同一时间戳下,living_room_temp_sensor 出现了两条不同的温度上报——一条使用标准 Cluster 路径 TemperatureMeasurement.MeasuredValue,另一条使用非标准的短路径 MeasuredValue,且两者数值不一致。例如 06-12T08:00 分别报 2468 和 2350,06-12T12:00 分别报 2576 和 2510,06-12T18:00 分别报 2462 和 2400,06-12T22:00 分别报 2353 和 2280。这说明传感器存在异常的双通道上报行为,短路径上报不符合 Matter 协议标准的 Cluster.Attribute 格式。", "推理步骤2: 从 06-13 开始,标准路径 TemperatureMeasurement.MeasuredValue 的上报完全消失,仅剩非标准短路径 MeasuredValue 的上报,且读数固定为 2350(23.50°C),在 06-13T08:00、12:00、18:00、22:00 以及 06-14T08:00、12:00 六个采样点全部为 2350,不随时间和环境变化。", "推理步骤3: 对比同期其他传感器(master_bedroom、second_bedroom、kitchen),它们在 06-12 全天的温度读数随昼夜自然波动(夜间约 22.9-23.1°C,午间峰值约 25.7-25.9°C),符合正常物理规律。而 living_room_temp_sensor 从 06-13 起完全丧失了这种自然波动,说明传感器已不再进行真实测量。", "推理步骤4: 综合来看,该传感器可能经历了固件异常导致双通道上报(06-12 期间),随后标准上报通道失效,退化为仅输出固定缓存值的故障模式。这属于典型的传感器固件 bug 或硬件采集模块失效。"], "key_evidence": ["06-12 当天出现 4 次同时间戳双重上报:08:00(2468/2350)、12:00(2576/2510)、18:00(2462/2400)、22:00(2353/2280),标准路径与非标准短路径 MeasuredValue 数值不一致", "06-13 起标准 TemperatureMeasurement.MeasuredValue 上报消失,仅剩非标准 MeasuredValue 且读数固化为 2350,跨越 06-13 至 06-14 共 6 个采样点无任何变化", "非标准短路径 MeasuredValue 不符合 Matter 协议 Cluster.Attribute 规范格式", "同期其他房间传感器温度正常波动,排除全局环境因素"], "recommended_actions": ["立即对 living_room_temp_sensor 执行固件重置或设备重启,观察是否恢复标准 Cluster 路径上报和正常温度波动", "检查该传感器的固件版本,与厂商确认是否存在已知的双通道上报 bug,必要时升级固件", "在传感器恢复前,不要依赖客厅温度数据进行空调联动或安全告警判断,避免因读数失真导致误判", "若重启后仍输出固定值,建议更换传感器硬件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.23355460166931, "api_error": null} {"episode_id": "SQ1_TP_B_0056", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0056.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20260685, "scenario_id": "DF-04", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-29T09:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门传感器(front_door_contact)在下午出门期间未记录到关门状态,且玄关运动传感器在多次有人经过时未能持续触发,存在传感器故障或状态上报丢失。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 3 个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关运动传感器(entrance_occupancy)。逐一检查它们的行为一致性。\",\n \"推理步骤2: 07:21 早晨出门序列:门锁解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1) → 门传感器关(True) → 门锁自动上锁(LockState=1)。这个序列完整且合理。\",\n \"推理步骤3: 16:07 下午进门序列:门锁解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1)。但之后没有 front_door_contact 恢复为 True(关门)的记录,也没有门锁重新上锁的记录。门传感器显示门一直处于打开状态,直到 22:24 才出现 True。\",\n \"推理步骤4: 18:17 晚间进门序列:门锁再次解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1)。同样没有关门(True)记录,也没有上锁记录。这意味着从 16:07 到 22:24 超过 6 小时,门传感器要么一直显示开门,要么漏报了关门事件。\",\n \"推理步骤5: 22:24 出现 front_door_contact = True 和自动上锁,说明传感器本身并非完全失效,但中间两次进出(16:07 和 18:17)的关门事件均丢失,这不符合正常使用模式——正常情况下人进门后会关门。\",\n \"推理步骤6: 09:07 门锁收到两次连续 LockDoor 命令并触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败告警。此时住户已出门(07:21),这可能是远程操作或自动化规则触发,但连续两次锁门命令加告警暗示门锁存在间歇性通信或机械问题。\",\n \"推理步骤7: 玄关运动传感器(entrance_occupancy)仅在有人进出时触发了 Occupancy=1,但全天没有任何 Occupancy=0(无人)的恢复记录。正常的占用传感器应在人离开后一段时间恢复为 0。这表明该传感器可能存在状态恢复上报异常。\"\n ],\n \"key_evidence\": [\n \"16:07 和 18:17 两次进门后,front_door_contact 均未上报关门(True)事件,关门状态丢失长达 6 小时以上\",\n \"09:07 门锁连续收到两次 LockDoor 命令后触发 DoorLockAlarm(AlarmCode=0) 告警\",\n \"entrance_occupancy 全天仅有 Occupancy=1 的触发记录,从未恢复为 0\",\n \"16:07 至 22:24 期间门锁未记录任何上锁操作,与正常居家习惯不符\"\n ],\n \"recommended_actions\": [\n \"检查入户门传感器(front_door_contact)的安装位置和电池电量,确认磁铁与传感器之间的间距是否正常,排除物理偏移导致的漏报\",\n \"检查门锁(front_door_lock)的机械状态和固件版本,针对 09:07 的 DoorLockAlarm 进行诊断,确认是否存在锁舌卡滞或通信超时问题\",\n \"检查玄关运动传感器(entrance_occupancy)的 Occupancy 恢复超时配置(PIROccupiedToUnoccupiedDelay),确认是否正常上报无人状态\",\n \"建议在自动化规则中增加门传感器长时间处于'开'状态的告警(如超过 5 分钟未关门则推送通知),以便及时发现异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门传感器(front_door_contact)在下午出门期间未记录到关门状态,且玄关运动传感器在多次有人经过时未能持续触发,存在传感器故障或状态上报丢失。", "reasoning": ["推理步骤1: entrance 区域共有 3 个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关运动传感器(entrance_occupancy)。逐一检查它们的行为一致性。", "推理步骤2: 07:21 早晨出门序列:门锁解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1) → 门传感器关(True) → 门锁自动上锁(LockState=1)。这个序列完整且合理。", "推理步骤3: 16:07 下午进门序列:门锁解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1)。但之后没有 front_door_contact 恢复为 True(关门)的记录,也没有门锁重新上锁的记录。门传感器显示门一直处于打开状态,直到 22:24 才出现 True。", "推理步骤4: 18:17 晚间进门序列:门锁再次解锁(LockState=2) → 门传感器开(False) → 玄关运动触发(1)。同样没有关门(True)记录,也没有上锁记录。这意味着从 16:07 到 22:24 超过 6 小时,门传感器要么一直显示开门,要么漏报了关门事件。", "推理步骤5: 22:24 出现 front_door_contact = True 和自动上锁,说明传感器本身并非完全失效,但中间两次进出(16:07 和 18:17)的关门事件均丢失,这不符合正常使用模式——正常情况下人进门后会关门。", "推理步骤6: 09:07 门锁收到两次连续 LockDoor 命令并触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败告警。此时住户已出门(07:21),这可能是远程操作或自动化规则触发,但连续两次锁门命令加告警暗示门锁存在间歇性通信或机械问题。", "推理步骤7: 玄关运动传感器(entrance_occupancy)仅在有人进出时触发了 Occupancy=1,但全天没有任何 Occupancy=0(无人)的恢复记录。正常的占用传感器应在人离开后一段时间恢复为 0。这表明该传感器可能存在状态恢复上报异常。"], "key_evidence": ["16:07 和 18:17 两次进门后,front_door_contact 均未上报关门(True)事件,关门状态丢失长达 6 小时以上", "09:07 门锁连续收到两次 LockDoor 命令后触发 DoorLockAlarm(AlarmCode=0) 告警", "entrance_occupancy 全天仅有 Occupancy=1 的触发记录,从未恢复为 0", "16:07 至 22:24 期间门锁未记录任何上锁操作,与正常居家习惯不符"], "recommended_actions": ["检查入户门传感器(front_door_contact)的安装位置和电池电量,确认磁铁与传感器之间的间距是否正常,排除物理偏移导致的漏报", "检查门锁(front_door_lock)的机械状态和固件版本,针对 09:07 的 DoorLockAlarm 进行诊断,确认是否存在锁舌卡滞或通信超时问题", "检查玄关运动传感器(entrance_occupancy)的 Occupancy 恢复超时配置(PIROccupiedToUnoccupiedDelay),确认是否正常上报无人状态", "建议在自动化规则中增加门传感器长时间处于'开'状态的告警(如超过 5 分钟未关门则推送通知),以便及时发现异常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.42047095298767, "api_error": null} {"episode_id": "SQ1_TP_B_0070", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0070.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20260699, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-28T21:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"entrance 区域的玄关运动传感器(entrance_occupancy)和玄关灯(entrance_light)在整个24小时日志中无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 在整整24小时的日志中,entrance_occupancy 和 entrance_light 没有产生任何一条状态上报记录,而 front_door_contact 同样全天无记录(但门锁有记录)。\",\n \"推理步骤3: front_door_lock 在 21:03 有两次 LockDoor 指令和状态上报(LockState=2,即未锁定/锁定失败),并触发了 DoorLockAlarm(AlarmCode=0) 事件,说明门锁本身在线且有通信能力。\",\n \"推理步骤4: 门锁在 21:03 有操作活动,正常情况下玄关运动传感器应当检测到人体存在并上报 Occupancy 状态变化,但 entrance_occupancy 全天静默,这高度异常。\",\n \"推理步骤5: 其他区域的运动传感器虽然在本日志中也未出现(日志以温度为主),但 entrance 区域的特殊性在于:它是出入必经之路,且门锁确认有人操作,运动传感器却无任何响应,指向传感器故障或离线。\",\n \"推理步骤6: entrance_light 全天无状态变化记录,结合运动传感器静默,可能是整个玄关区域的传感器/灯具通信链路存在问题,或设备已掉线。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy 在24小时内零上报,而同时段 front_door_lock 在 21:03 有明确的人为操作记录\",\n \"entrance_light 全天无任何状态变化记录\",\n \"front_door_contact(入户门传感器)全天也无上报,但门锁记录显示门有被操作\",\n \"front_door_lock 在 21:03 连续两次锁门失败(LockState=2)并触发 DoorLockAlarm(AlarmCode=0),说明有人在场但玄关传感器未响应\"\n ],\n \"recommended_actions\": [\n \"立即检查 entrance_occupancy(玄关运动传感器)的供电状态和电池电量,确认设备是否在线\",\n \"检查 entrance_light(玄关灯)的网络连接状态,确认其是否仍在 Matter 网络中\",\n \"检查 front_door_contact(入户门传感器)是否正常工作,可手动开关门测试是否有状态上报\",\n \"排查玄关区域的 Matter 网络覆盖情况,可能存在局部信号盲区导致多个设备同时离线\",\n \"同时关注 front_door_lock 的锁门失败问题(LockState=2 + AlarmCode=0),检查门锁机械部件和电量\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "entrance 区域的玄关运动传感器(entrance_occupancy)和玄关灯(entrance_light)在整个24小时日志中无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 在整整24小时的日志中,entrance_occupancy 和 entrance_light 没有产生任何一条状态上报记录,而 front_door_contact 同样全天无记录(但门锁有记录)。", "推理步骤3: front_door_lock 在 21:03 有两次 LockDoor 指令和状态上报(LockState=2,即未锁定/锁定失败),并触发了 DoorLockAlarm(AlarmCode=0) 事件,说明门锁本身在线且有通信能力。", "推理步骤4: 门锁在 21:03 有操作活动,正常情况下玄关运动传感器应当检测到人体存在并上报 Occupancy 状态变化,但 entrance_occupancy 全天静默,这高度异常。", "推理步骤5: 其他区域的运动传感器虽然在本日志中也未出现(日志以温度为主),但 entrance 区域的特殊性在于:它是出入必经之路,且门锁确认有人操作,运动传感器却无任何响应,指向传感器故障或离线。", "推理步骤6: entrance_light 全天无状态变化记录,结合运动传感器静默,可能是整个玄关区域的传感器/灯具通信链路存在问题,或设备已掉线。"], "key_evidence": ["entrance_occupancy 在24小时内零上报,而同时段 front_door_lock 在 21:03 有明确的人为操作记录", "entrance_light 全天无任何状态变化记录", "front_door_contact(入户门传感器)全天也无上报,但门锁记录显示门有被操作", "front_door_lock 在 21:03 连续两次锁门失败(LockState=2)并触发 DoorLockAlarm(AlarmCode=0),说明有人在场但玄关传感器未响应"], "recommended_actions": ["立即检查 entrance_occupancy(玄关运动传感器)的供电状态和电池电量,确认设备是否在线", "检查 entrance_light(玄关灯)的网络连接状态,确认其是否仍在 Matter 网络中", "检查 front_door_contact(入户门传感器)是否正常工作,可手动开关门测试是否有状态上报", "排查玄关区域的 Matter 网络覆盖情况,可能存在局部信号盲区导致多个设备同时离线", "同时关注 front_door_lock 的锁门失败问题(LockState=2 + AlarmCode=0),检查门锁机械部件和电量"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.011464834213257, "api_error": null} {"episode_id": "SQ1_TP_B_0076", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0076.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20260705, "scenario_id": "DF-05", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-11T19:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房存在两个传感器异常:温度传感器间歇性失效(两次报告 None)且曾出现异常高温读数,烟雾报警器发生硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:00 和 18:30 报告了 2853 和 2861(约 28.5°C-28.6°C),而同一时段其他房间温度均在 24.5°C 左右,厨房温度异常偏高约 4°C,且此时灶具尚未开启(18:55 才开启),排除烹饪导致的正常升温。\",\n \"推理步骤2: 厨房温度传感器在 18:56 和 19:48 两次报告 MeasuredValue = None,表示传感器读数丢失或采集失败。正常传感器不应返回空值,这是典型的传感器故障或通信异常表现。\",\n \"推理步骤3: 值得注意的是,19:00 和 19:30 温度传感器又恢复了正常读数(2442、2443),说明故障是间歇性的,传感器并非完全损坏,但可靠性已不可信。\",\n \"推理步骤4: 厨房烟雾报警器在 19:17 报告了 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。这意味着烟雾报警器自身检测到硬件级别的故障,已无法正常执行烟雾/CO 检测功能。\",\n \"推理步骤5: 烟雾报警器硬件故障发生在灶具使用期间(18:55-19:47),此时厨房正处于最需要烟雾监测的高风险时段,报警器失效带来严重的安全隐患。\"\n ],\n \"key_evidence\": [\n \"18:00 和 18:30 厨房温度传感器读数异常飙升至 2853/2861(约 28.5°C),远高于同期其他房间(约 24.5°C),且灶具尚未开启\",\n \"18:56 和 19:48 厨房温度传感器两次报告 MeasuredValue = None,表明间歇性采集失败\",\n \"19:17 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5,并触发 HardwareFault 事件,确认硬件故障\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器(kitchen_smoke_alarm),硬件故障状态下无法提供火灾/CO 预警,这是最高优先级\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置和连接状态,排查间歇性 None 读数和异常高温读数的原因(可能是传感器老化、接触不良或受热源干扰)\",\n \"在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立式烟雾报警器作为备用\",\n \"检查厨房窗户传感器状态——日志显示 19:47 厨房窗户被打开后一直未关闭,如无人在厨房应确认是否需要关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房存在两个传感器异常:温度传感器间歇性失效(两次报告 None)且曾出现异常高温读数,烟雾报警器发生硬件故障。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:00 和 18:30 报告了 2853 和 2861(约 28.5°C-28.6°C),而同一时段其他房间温度均在 24.5°C 左右,厨房温度异常偏高约 4°C,且此时灶具尚未开启(18:55 才开启),排除烹饪导致的正常升温。", "推理步骤2: 厨房温度传感器在 18:56 和 19:48 两次报告 MeasuredValue = None,表示传感器读数丢失或采集失败。正常传感器不应返回空值,这是典型的传感器故障或通信异常表现。", "推理步骤3: 值得注意的是,19:00 和 19:30 温度传感器又恢复了正常读数(2442、2443),说明故障是间歇性的,传感器并非完全损坏,但可靠性已不可信。", "推理步骤4: 厨房烟雾报警器在 19:17 报告了 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。这意味着烟雾报警器自身检测到硬件级别的故障,已无法正常执行烟雾/CO 检测功能。", "推理步骤5: 烟雾报警器硬件故障发生在灶具使用期间(18:55-19:47),此时厨房正处于最需要烟雾监测的高风险时段,报警器失效带来严重的安全隐患。"], "key_evidence": ["18:00 和 18:30 厨房温度传感器读数异常飙升至 2853/2861(约 28.5°C),远高于同期其他房间(约 24.5°C),且灶具尚未开启", "18:56 和 19:48 厨房温度传感器两次报告 MeasuredValue = None,表明间歇性采集失败", "19:17 烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5,并触发 HardwareFault 事件,确认硬件故障"], "recommended_actions": ["立即检查或更换厨房烟雾报警器(kitchen_smoke_alarm),硬件故障状态下无法提供火灾/CO 预警,这是最高优先级", "检查厨房温度传感器(kitchen_temp_sensor)的安装位置和连接状态,排查间歇性 None 读数和异常高温读数的原因(可能是传感器老化、接触不良或受热源干扰)", "在烟雾报警器修复前,避免无人看管使用灶具,并考虑临时增设独立式烟雾报警器作为备用", "检查厨房窗户传感器状态——日志显示 19:47 厨房窗户被打开后一直未关闭,如无人在厨房应确认是否需要关闭"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.699593544006348, "api_error": null} {"episode_id": "SQ1_TP_C_0001", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0001.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260630, "scenario_id": "DF-04", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-15T14:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器(entrance_occupancy)在多次有人通过入户门时仅偶尔触发,且玄关灯(entrance_light)全天无任何开关记录,疑似设备故障或离线。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 全天共有4次明确的入户门开关事件(07:31 出门、15:58 回家、18:19 回家、22:48 锁门确认),入户门锁和门磁传感器在这些时刻均正常上报状态,工作正常。\",\n \"推理步骤3: 玄关运动传感器(entrance_occupancy)在07:31:32和15:58:03、18:19:03触发了Occupancy=1,共3次检测到有人,但全天从未上报过Occupancy=0(无人)的恢复事件。正常的运动传感器应在人离开后一段时间内回报无人状态,缺失恢复事件说明传感器可能存在状态上报异常。\",\n \"推理步骤4: 玄关灯(entrance_light)全天24小时内没有任何开关记录。考虑到每次进出门都经过玄关,且其他区域(厨房、餐厅、卧室等)的灯都有正常的开关记录,玄关灯完全无动作是不正常的。如果玄关灯与运动传感器联动,传感器异常可能导致灯无法自动触发;如果是手动控制,则灯本身可能离线或故障。\",\n \"推理步骤5: 综合来看,entrance_occupancy 缺少恢复事件(Occupancy=0),entrance_light 全天零记录,两个设备均表现异常,最可能的原因是设备故障或通信异常。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy 全天触发3次 Occupancy=1,但从未上报 Occupancy=0 恢复事件\",\n \"entrance_light 全天无任何 OnOff 状态变化记录,而同期其他房间灯均有正常开关\",\n \"front_door_lock 和 front_door_contact 在相同时段工作正常,排除了整个区域网络中断的可能\",\n \"每次进出门(07:31、15:58、18:19)都必经玄关,玄关灯理应有使用记录\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器(entrance_occupancy)的电池电量和网络连接状态,确认其是否能正常上报 Occupancy=0 恢复事件\",\n \"检查玄关灯(entrance_light)是否在线,尝试手动或远程开关测试其响应\",\n \"如果玄关灯与运动传感器存在自动化联动规则,检查该规则是否正常运行\",\n \"查看这两个设备的诊断日志(如 Matter 协议的 Diagnostics Cluster),确认是否有通信超时或离线记录\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器(entrance_occupancy)在多次有人通过入户门时仅偶尔触发,且玄关灯(entrance_light)全天无任何开关记录,疑似设备故障或离线。", "reasoning": ["推理步骤1: entrance 区域共有4个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 全天共有4次明确的入户门开关事件(07:31 出门、15:58 回家、18:19 回家、22:48 锁门确认),入户门锁和门磁传感器在这些时刻均正常上报状态,工作正常。", "推理步骤3: 玄关运动传感器(entrance_occupancy)在07:31:32和15:58:03、18:19:03触发了Occupancy=1,共3次检测到有人,但全天从未上报过Occupancy=0(无人)的恢复事件。正常的运动传感器应在人离开后一段时间内回报无人状态,缺失恢复事件说明传感器可能存在状态上报异常。", "推理步骤4: 玄关灯(entrance_light)全天24小时内没有任何开关记录。考虑到每次进出门都经过玄关,且其他区域(厨房、餐厅、卧室等)的灯都有正常的开关记录,玄关灯完全无动作是不正常的。如果玄关灯与运动传感器联动,传感器异常可能导致灯无法自动触发;如果是手动控制,则灯本身可能离线或故障。", "推理步骤5: 综合来看,entrance_occupancy 缺少恢复事件(Occupancy=0),entrance_light 全天零记录,两个设备均表现异常,最可能的原因是设备故障或通信异常。"], "key_evidence": ["entrance_occupancy 全天触发3次 Occupancy=1,但从未上报 Occupancy=0 恢复事件", "entrance_light 全天无任何 OnOff 状态变化记录,而同期其他房间灯均有正常开关", "front_door_lock 和 front_door_contact 在相同时段工作正常,排除了整个区域网络中断的可能", "每次进出门(07:31、15:58、18:19)都必经玄关,玄关灯理应有使用记录"], "recommended_actions": ["检查玄关运动传感器(entrance_occupancy)的电池电量和网络连接状态,确认其是否能正常上报 Occupancy=0 恢复事件", "检查玄关灯(entrance_light)是否在线,尝试手动或远程开关测试其响应", "如果玄关灯与运动传感器存在自动化联动规则,检查该规则是否正常运行", "查看这两个设备的诊断日志(如 Matter 协议的 Diagnostics Cluster),确认是否有通信超时或离线记录"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.672399759292603, "api_error": null} {"episode_id": "SQ1_TP_B_0077", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_B_0077.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20260706, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-14T13:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重故障:周期性上报格式异常的幽灵读数,且从6月15日起主通道数据完全停止,仅剩异常通道以固定值2350持续上报,传感器疑似硬件故障或固件异常。\",\n \"reasoning\": [\n \"推理步骤1: 6月14日全天,living_room_temp_sensor 通过标准 TemperatureMeasurement.MeasuredValue 属性正常上报温度,数值随昼夜自然波动(夜间约22.9°C → 午间峰值约25.8°C → 夜间回落至23.3°C),这部分数据与其他房间传感器趋势一致,属于正常行为。\",\n \"推理步骤2: 但在6月14日的08:00、12:00、18:00、22:00四个时间点,living_room_temp_sensor额外上报了缺少Cluster前缀的异常属性'MeasuredValue = 2350/2510/2400/2280'。这些读数不符合Matter协议标准的 TemperatureMeasurement.MeasuredValue 格式,且上报值与同一时刻标准通道的值存在明显偏差(如08:00标准值2455 vs 异常值2350,差异超过1°C),说明这不是简单的重复上报,而是传感器存在异常的第二数据通道。\",\n \"推理步骤3: 从6月15日08:00开始,标准的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩异常格式的 MeasuredValue 通道在继续上报。更严重的是,6月15日和6月16日的所有读数全部固定为2350(23.50°C),跨越了白天和夜晚、两个完整日期共6个采样点,完全没有任何温度波动。\",\n \"推理步骤4: 对比同期其他房间传感器(master_bedroom、second_bedroom、kitchen)在6月14日均呈现正常的昼夜温度曲线和合理波动,而客厅传感器在6月15日后输出恒定值,这在物理上不可能——即使空调恒温运行也会有微小波动。恒定值2350恰好是6月14日异常通道首次出现时的数值,高度疑似传感器固件崩溃后卡在了一个缓存值上。\",\n \"推理步骤5: 综合判断:传感器经历了渐进式故障——先是出现异常数据通道(6月14日白天),随后主通道彻底失效(6月15日起),最终只输出格式错误的固定值。这属于典型的传感器硬件退化或固件崩溃故障模式。\"\n ],\n \"key_evidence\": [\n \"6月14日08:00/12:00/18:00/22:00出现4次非标准格式上报'MeasuredValue'(缺少TemperatureMeasurement Cluster前缀),与标准通道同时存在但数值不一致\",\n \"6月15日起标准TemperatureMeasurement.MeasuredValue通道完全停止上报,其他三个房间传感器在6月14日23:30后也无数据(可能是日志截断),但客厅传感器的异常通道仍在继续\",\n \"6月15日08:00至6月16日12:00,跨越2天共6个采样点,异常通道读数恒定为2350,无任何波动,物理上不合理\",\n \"6月14日异常通道的读数与标准通道存在系统性偏低(08:00差105、12:00差68、18:00差67、22:00差84),偏差不恒定,排除了简单的校准偏移\"\n ],\n \"recommended_actions\": [\n \"立即对 living_room_temp_sensor 执行固件重置或断电重启,观察是否恢复标准 TemperatureMeasurement.MeasuredValue 上报\",\n \"检查传感器固件版本,如有可用更新则升级固件以修复可能的协议栈异常\",\n \"若重启后仍输出固定值或非标准格式数据,更换该温度传感器硬件\",\n \"在传感器恢复前,客厅空调的自动温控逻辑不应依赖该传感器数据,建议临时切换为手动模式或使用其他房间传感器作为参考\",\n \"在智能家居平台中添加传感器健康监测规则:当温度读数连续N个周期无变化或上报格式异常时自动告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重故障:周期性上报格式异常的幽灵读数,且从6月15日起主通道数据完全停止,仅剩异常通道以固定值2350持续上报,传感器疑似硬件故障或固件异常。", "reasoning": ["推理步骤1: 6月14日全天,living_room_temp_sensor 通过标准 TemperatureMeasurement.MeasuredValue 属性正常上报温度,数值随昼夜自然波动(夜间约22.9°C → 午间峰值约25.8°C → 夜间回落至23.3°C),这部分数据与其他房间传感器趋势一致,属于正常行为。", "推理步骤2: 但在6月14日的08:00、12:00、18:00、22:00四个时间点,living_room_temp_sensor额外上报了缺少Cluster前缀的异常属性'MeasuredValue = 2350/2510/2400/2280'。这些读数不符合Matter协议标准的 TemperatureMeasurement.MeasuredValue 格式,且上报值与同一时刻标准通道的值存在明显偏差(如08:00标准值2455 vs 异常值2350,差异超过1°C),说明这不是简单的重复上报,而是传感器存在异常的第二数据通道。", "推理步骤3: 从6月15日08:00开始,标准的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩异常格式的 MeasuredValue 通道在继续上报。更严重的是,6月15日和6月16日的所有读数全部固定为2350(23.50°C),跨越了白天和夜晚、两个完整日期共6个采样点,完全没有任何温度波动。", "推理步骤4: 对比同期其他房间传感器(master_bedroom、second_bedroom、kitchen)在6月14日均呈现正常的昼夜温度曲线和合理波动,而客厅传感器在6月15日后输出恒定值,这在物理上不可能——即使空调恒温运行也会有微小波动。恒定值2350恰好是6月14日异常通道首次出现时的数值,高度疑似传感器固件崩溃后卡在了一个缓存值上。", "推理步骤5: 综合判断:传感器经历了渐进式故障——先是出现异常数据通道(6月14日白天),随后主通道彻底失效(6月15日起),最终只输出格式错误的固定值。这属于典型的传感器硬件退化或固件崩溃故障模式。"], "key_evidence": ["6月14日08:00/12:00/18:00/22:00出现4次非标准格式上报'MeasuredValue'(缺少TemperatureMeasurement Cluster前缀),与标准通道同时存在但数值不一致", "6月15日起标准TemperatureMeasurement.MeasuredValue通道完全停止上报,其他三个房间传感器在6月14日23:30后也无数据(可能是日志截断),但客厅传感器的异常通道仍在继续", "6月15日08:00至6月16日12:00,跨越2天共6个采样点,异常通道读数恒定为2350,无任何波动,物理上不合理", "6月14日异常通道的读数与标准通道存在系统性偏低(08:00差105、12:00差68、18:00差67、22:00差84),偏差不恒定,排除了简单的校准偏移"], "recommended_actions": ["立即对 living_room_temp_sensor 执行固件重置或断电重启,观察是否恢复标准 TemperatureMeasurement.MeasuredValue 上报", "检查传感器固件版本,如有可用更新则升级固件以修复可能的协议栈异常", "若重启后仍输出固定值或非标准格式数据,更换该温度传感器硬件", "在传感器恢复前,客厅空调的自动温控逻辑不应依赖该传感器数据,建议临时切换为手动模式或使用其他房间传感器作为参考", "在智能家居平台中添加传感器健康监测规则:当温度读数连续N个周期无变化或上报格式异常时自动告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.825593948364258, "api_error": null} {"episode_id": "SQ1_TP_C_0005", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0005.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260634, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-09T08:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在双重故障:间歇性读数丢失(报告 None)以及出现不符合 Matter 协议规范的异常属性上报,且后期读数固定不变,疑似传感器已失效或固件异常。\",\n \"reasoning\": [\n \"推理步骤1: kitchen_temp_sensor 在灶具开启期间多次报告 MeasuredValue = None(06:46:10、07:03:00、18:15:00、19:29:00),而同一时段其他三个温度传感器均正常上报数值。None 值表示传感器采集链路存在间歇性故障。\",\n \"推理步骤2: kitchen_temp_sensor 除了正常的 TemperatureMeasurement.MeasuredValue 属性外,还额外上报了不带 Cluster 前缀的 'MeasuredValue' 属性(08:00:00、12:00:00、18:00:00、22:00:00 以及次日多次)。这不符合 Matter 协议 TemperatureMeasurement Cluster 的标准属性路径格式,说明设备固件或通信协议栈存在异常。\",\n \"推理步骤3: 对比两组读数,标准属性 TemperatureMeasurement.MeasuredValue 与异常属性 MeasuredValue 在同一时刻存在显著偏差。例如 08:00 标准值 2455 vs 异常值 2350(差约 10.5°C),12:00 标准值 2579 vs 异常值 2510(差约 6.9°C),18:00 标准值 2464 vs 异常值 2400(差约 6.4°C)。两个通道读数不一致,说明至少有一个数据源不可信。\",\n \"推理步骤4: 从 6 月 10 日起,异常属性 MeasuredValue 的值固定为 2350 不再变化(10 日 08:00、12:00、18:00、22:00 和 11 日 08:00、12:00 均为 2350),而同期标准属性 TemperatureMeasurement.MeasuredValue 已不再上报。这表明传感器的正常测量功能可能已完全停止,仅残留一个固定值的异常上报通道,高度疑似传感器硬件故障或固件卡死。\",\n \"推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)和漏水传感器(kitchen_water_leak)在整个日志期间无任何上报记录。虽然无事件可能意味着未触发,但结合厨房温度传感器的故障,需要关注厨房区域其他传感器的健康状态,避免在真正发生火灾或漏水时无法告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:46:10、07:03:00、18:15:00、19:29:00 四次报告 TemperatureMeasurement.MeasuredValue = None\",\n \"kitchen_temp_sensor 在 08:00、12:00、18:00、22:00 出现不带 Cluster 前缀的异常属性 'MeasuredValue',与标准属性同时刻读数偏差 6~10°C\",\n \"6 月 10 日起标准属性 TemperatureMeasurement.MeasuredValue 停止上报,异常属性 MeasuredValue 固定为 2350 不再变化\",\n \"同期其他三个房间的温度传感器(living_room、master_bedroom、kids_room)均正常工作,排除系统性问题\"\n ],\n \"recommended_actions\": [\n \"立即对 kitchen_temp_sensor 执行设备重启或恢复出厂设置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报\",\n \"检查 kitchen_temp_sensor 的固件版本,如有可用更新则升级固件以修复异常属性上报问题\",\n \"若重启和固件更新无法解决问题,建议更换该温度传感器硬件\",\n \"在传感器修复前,加强厨房区域的人工安全巡查,特别是灶具使用期间的温度监控\",\n \"对厨房烟雾报警器(kitchen_smoke_alarm)和漏水传感器(kitchen_water_leak)进行一次手动功能测试,确认其处于正常工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在双重故障:间歇性读数丢失(报告 None)以及出现不符合 Matter 协议规范的异常属性上报,且后期读数固定不变,疑似传感器已失效或固件异常。", "reasoning": ["推理步骤1: kitchen_temp_sensor 在灶具开启期间多次报告 MeasuredValue = None(06:46:10、07:03:00、18:15:00、19:29:00),而同一时段其他三个温度传感器均正常上报数值。None 值表示传感器采集链路存在间歇性故障。", "推理步骤2: kitchen_temp_sensor 除了正常的 TemperatureMeasurement.MeasuredValue 属性外,还额外上报了不带 Cluster 前缀的 'MeasuredValue' 属性(08:00:00、12:00:00、18:00:00、22:00:00 以及次日多次)。这不符合 Matter 协议 TemperatureMeasurement Cluster 的标准属性路径格式,说明设备固件或通信协议栈存在异常。", "推理步骤3: 对比两组读数,标准属性 TemperatureMeasurement.MeasuredValue 与异常属性 MeasuredValue 在同一时刻存在显著偏差。例如 08:00 标准值 2455 vs 异常值 2350(差约 10.5°C),12:00 标准值 2579 vs 异常值 2510(差约 6.9°C),18:00 标准值 2464 vs 异常值 2400(差约 6.4°C)。两个通道读数不一致,说明至少有一个数据源不可信。", "推理步骤4: 从 6 月 10 日起,异常属性 MeasuredValue 的值固定为 2350 不再变化(10 日 08:00、12:00、18:00、22:00 和 11 日 08:00、12:00 均为 2350),而同期标准属性 TemperatureMeasurement.MeasuredValue 已不再上报。这表明传感器的正常测量功能可能已完全停止,仅残留一个固定值的异常上报通道,高度疑似传感器硬件故障或固件卡死。", "推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)和漏水传感器(kitchen_water_leak)在整个日志期间无任何上报记录。虽然无事件可能意味着未触发,但结合厨房温度传感器的故障,需要关注厨房区域其他传感器的健康状态,避免在真正发生火灾或漏水时无法告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:46:10、07:03:00、18:15:00、19:29:00 四次报告 TemperatureMeasurement.MeasuredValue = None", "kitchen_temp_sensor 在 08:00、12:00、18:00、22:00 出现不带 Cluster 前缀的异常属性 'MeasuredValue',与标准属性同时刻读数偏差 6~10°C", "6 月 10 日起标准属性 TemperatureMeasurement.MeasuredValue 停止上报,异常属性 MeasuredValue 固定为 2350 不再变化", "同期其他三个房间的温度传感器(living_room、master_bedroom、kids_room)均正常工作,排除系统性问题"], "recommended_actions": ["立即对 kitchen_temp_sensor 执行设备重启或恢复出厂设置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报", "检查 kitchen_temp_sensor 的固件版本,如有可用更新则升级固件以修复异常属性上报问题", "若重启和固件更新无法解决问题,建议更换该温度传感器硬件", "在传感器修复前,加强厨房区域的人工安全巡查,特别是灶具使用期间的温度监控", "对厨房烟雾报警器(kitchen_smoke_alarm)和漏水传感器(kitchen_water_leak)进行一次手动功能测试,确认其处于正常工作状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.413411617279053, "api_error": null} {"episode_id": "SQ1_TP_C_0010", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0010.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20260639, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-23T22:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重上报异常和数值固化故障,疑似设备固件缺陷或硬件损坏。\",\n \"reasoning\": [\n \"推理步骤1: 在同一时间戳,living_room_temp_sensor 出现了两条不同格式的温度上报。例如 08:00 同时上报了 TemperatureMeasurement.MeasuredValue=2460 和 MeasuredValue=2350,后者缺少 Cluster 前缀 'TemperatureMeasurement',属于非标准 Matter 协议上报格式。这种双重上报在 12:00、18:00、22:00 均重复出现,而其他房间的温度传感器从未出现此现象。\",\n \"推理步骤2: 非标准格式的 MeasuredValue 读数与正常 Cluster 上报的读数存在显著偏差。08:00 正常值 2460 vs 异常值 2350(差 110,即 1.1°C);12:00 正常值 2590 vs 异常值 2510(差 80);18:00 正常值 2450 vs 异常值 2400(差 50);22:00 正常值 2354 vs 异常值 2280(差 74)。两组数据系统性不一致,说明传感器内部可能存在两个独立的上报通道在竞争。\",\n \"推理步骤3: 进入 6月24日和25日后,情况进一步恶化。该传感器仅剩非标准格式的 MeasuredValue 上报,且数值完全固化为 2350,不再随时间变化。6月24日 08:00/12:00/18:00/22:00 和 6月25日 08:00/12:00 全部为 2350。而正常情况下,6月23日的数据显示室温在一天内有明显的昼夜波动(夜间约 22.9°C 到午间约 25.9°C),固定值 23.50°C 完全不符合物理规律。\",\n \"推理步骤4: 同时,6月24-25日期间正常的 TemperatureMeasurement.MeasuredValue 格式上报完全消失,说明传感器的标准 Matter Cluster 上报功能已经失效,仅残留一个异常通道在输出固定值。\",\n \"推理步骤5: 其他房间(master_bedroom、kids_room、kitchen)的温度传感器在整个 6月23日期间均正常工作,上报格式标准且数值合理波动,排除了系统级平台故障的可能性,问题定位在 living_room_temp_sensor 这一单个设备上。\"\n ],\n \"key_evidence\": [\n \"6月23日出现4次双重上报:08:00(2460 vs 2350)、12:00(2590 vs 2510)、18:00(2450 vs 2400)、22:00(2354 vs 2280),异常上报缺少 TemperatureMeasurement Cluster 前缀\",\n \"6月24-25日标准格式上报完全消失,仅剩非标准 MeasuredValue 且数值固化为 2350,持续至少 28 小时无任何变化\",\n \"同期其他三个温度传感器工作完全正常,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"立即对 living_room_temp_sensor 执行设备重启(power cycle),观察是否恢复标准 TemperatureMeasurement.MeasuredValue 上报\",\n \"若重启无效,尝试对该传感器进行 OTA 固件更新或恢复出厂设置,修复可能的固件异常\",\n \"检查该传感器的 Matter 设备认证和 Cluster 配置,确认是否存在非标准 Endpoint 导致的重复上报\",\n \"若软件手段无法修复,更换 living_room_temp_sensor 硬件,当前设备可能存在传感元件或通信模块损坏\",\n \"在修复期间,可临时参考客厅空调自带温控或相邻房间温度数据来辅助判断客厅实际温度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重上报异常和数值固化故障,疑似设备固件缺陷或硬件损坏。", "reasoning": ["推理步骤1: 在同一时间戳,living_room_temp_sensor 出现了两条不同格式的温度上报。例如 08:00 同时上报了 TemperatureMeasurement.MeasuredValue=2460 和 MeasuredValue=2350,后者缺少 Cluster 前缀 'TemperatureMeasurement',属于非标准 Matter 协议上报格式。这种双重上报在 12:00、18:00、22:00 均重复出现,而其他房间的温度传感器从未出现此现象。", "推理步骤2: 非标准格式的 MeasuredValue 读数与正常 Cluster 上报的读数存在显著偏差。08:00 正常值 2460 vs 异常值 2350(差 110,即 1.1°C);12:00 正常值 2590 vs 异常值 2510(差 80);18:00 正常值 2450 vs 异常值 2400(差 50);22:00 正常值 2354 vs 异常值 2280(差 74)。两组数据系统性不一致,说明传感器内部可能存在两个独立的上报通道在竞争。", "推理步骤3: 进入 6月24日和25日后,情况进一步恶化。该传感器仅剩非标准格式的 MeasuredValue 上报,且数值完全固化为 2350,不再随时间变化。6月24日 08:00/12:00/18:00/22:00 和 6月25日 08:00/12:00 全部为 2350。而正常情况下,6月23日的数据显示室温在一天内有明显的昼夜波动(夜间约 22.9°C 到午间约 25.9°C),固定值 23.50°C 完全不符合物理规律。", "推理步骤4: 同时,6月24-25日期间正常的 TemperatureMeasurement.MeasuredValue 格式上报完全消失,说明传感器的标准 Matter Cluster 上报功能已经失效,仅残留一个异常通道在输出固定值。", "推理步骤5: 其他房间(master_bedroom、kids_room、kitchen)的温度传感器在整个 6月23日期间均正常工作,上报格式标准且数值合理波动,排除了系统级平台故障的可能性,问题定位在 living_room_temp_sensor 这一单个设备上。"], "key_evidence": ["6月23日出现4次双重上报:08:00(2460 vs 2350)、12:00(2590 vs 2510)、18:00(2450 vs 2400)、22:00(2354 vs 2280),异常上报缺少 TemperatureMeasurement Cluster 前缀", "6月24-25日标准格式上报完全消失,仅剩非标准 MeasuredValue 且数值固化为 2350,持续至少 28 小时无任何变化", "同期其他三个温度传感器工作完全正常,排除系统性故障"], "recommended_actions": ["立即对 living_room_temp_sensor 执行设备重启(power cycle),观察是否恢复标准 TemperatureMeasurement.MeasuredValue 上报", "若重启无效,尝试对该传感器进行 OTA 固件更新或恢复出厂设置,修复可能的固件异常", "检查该传感器的 Matter 设备认证和 Cluster 配置,确认是否存在非标准 Endpoint 导致的重复上报", "若软件手段无法修复,更换 living_room_temp_sensor 硬件,当前设备可能存在传感元件或通信模块损坏", "在修复期间,可临时参考客厅空调自带温控或相邻房间温度数据来辅助判断客厅实际温度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.735376358032227, "api_error": null} {"episode_id": "SQ1_TP_C_0014", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0014.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260643, "scenario_id": "DF-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-30T02:22:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天48个采样点(每30分钟一次)均正常上报数值,无任何 None/null 缺失值,与厨房温度传感器多次出现 None 形成对比\",\n \"推理步骤2: 温度数据走势合理——凌晨约23.0°C,随日间升温至中午峰值约25.9°C,傍晚逐步回落至夜间约23.3°C,符合6月底夏季自然温度变化曲线,且与其他房间传感器趋势高度一致\",\n \"推理步骤3: 温度读数波动范围为22.90°C~25.90°C,各相邻采样点之间变化幅度平稳(通常在0.1~0.3°C之间),无突变或异常跳跃\",\n \"推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:03检测到有人(起床),22:22再次检测到有人(就寝),与灯光开关事件时间吻合(06:03开灯、07:47关灯出门、22:22关灯就寝),行为模式完全合理\",\n \"推理步骤5: 主卧窗帘在22:22关闭(100%),与就寝时间一致,属于正常操作\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48个采样点均有有效数值,无 None 缺失,数据连续完整\",\n \"温度范围 22.90°C~25.90°C,日变化曲线与同户其他三个温度传感器高度一致\",\n \"master_bedroom_occupancy 在06:03和22:22两次触发,与灯光、窗帘操作时间逻辑自洽\",\n \"相邻采样点温度变化平稳,无异常突变或传感器漂移迹象\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\",\n \"建议关注厨房温度传感器(kitchen_temp_sensor)多次上报 None 值的问题,可能存在设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器均按预期运行", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)在全天48个采样点(每30分钟一次)均正常上报数值,无任何 None/null 缺失值,与厨房温度传感器多次出现 None 形成对比", "推理步骤2: 温度数据走势合理——凌晨约23.0°C,随日间升温至中午峰值约25.9°C,傍晚逐步回落至夜间约23.3°C,符合6月底夏季自然温度变化曲线,且与其他房间传感器趋势高度一致", "推理步骤3: 温度读数波动范围为22.90°C~25.90°C,各相邻采样点之间变化幅度平稳(通常在0.1~0.3°C之间),无突变或异常跳跃", "推理步骤4: 主卧运动传感器(master_bedroom_occupancy)在06:03检测到有人(起床),22:22再次检测到有人(就寝),与灯光开关事件时间吻合(06:03开灯、07:47关灯出门、22:22关灯就寝),行为模式完全合理", "推理步骤5: 主卧窗帘在22:22关闭(100%),与就寝时间一致,属于正常操作"], "key_evidence": ["master_bedroom_temp_sensor 全天48个采样点均有有效数值,无 None 缺失,数据连续完整", "温度范围 22.90°C~25.90°C,日变化曲线与同户其他三个温度传感器高度一致", "master_bedroom_occupancy 在06:03和22:22两次触发,与灯光、窗帘操作时间逻辑自洽", "相邻采样点温度变化平稳,无异常突变或传感器漂移迹象"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好", "建议关注厨房温度传感器(kitchen_temp_sensor)多次上报 None 值的问题,可能存在设备故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.86782693862915, "api_error": null} {"episode_id": "SQ1_TP_C_0016", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0016.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20260645, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T09:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器(living_room_temp_sensor)存在双重上报异常和读数固化故障,疑似设备硬件或固件缺陷。\",\n \"reasoning\": [\n \"推理步骤1: 在正常的 TemperatureMeasurement.MeasuredValue 上报之外,living_room_temp_sensor 还以非标准格式 'MeasuredValue = xxxx'(缺少 Cluster 前缀 TemperatureMeasurement)额外上报了数据,分别出现在 08:00、12:00、18:00、22:00,且这些值与同一时刻标准上报值存在明显偏差(如 08:00 标准值 2467 vs 异常值 2350,12:00 标准值 2584 vs 异常值 2510,22:00 标准值 2361 vs 异常值 2280)。这说明传感器内部可能存在两个上报通道或固件 bug,导致同一时刻产生两条矛盾的温度读数。\",\n \"推理步骤2: 从 6月27日起,living_room_temp_sensor 完全停止了标准格式的 TemperatureMeasurement.MeasuredValue 上报,仅剩非标准格式 'MeasuredValue = 2350' 的数据,且读数固定为 2350 不再变化(6月27日 08:00/12:00/18:00/22:00 和 6月28日 08:00/12:00 均为 2350)。对比同期其他房间传感器在 6月26日的正常温度波动(日间升温、夜间降温),客厅传感器读数完全静止,明显不符合物理规律。\",\n \"推理步骤3: 其他三个温度传感器(master_bedroom、kids_room、kitchen)在整个 6月26日期间均以标准 TemperatureMeasurement.MeasuredValue 格式正常上报,且温度曲线呈现合理的昼夜波动(夜间约 22.9-23.1°C,午间峰值约 25.8-25.9°C),未出现任何非标准格式或读数固化现象。这进一步确认问题仅出在 living_room_temp_sensor 这一台设备上。\",\n \"推理步骤4: 6月27日之后其他传感器的数据完全缺失(日志中无记录),而 living_room_temp_sensor 却仍在以非标准格式上报固定值,这种行为模式更像是传感器进入了某种降级/故障模式——测量功能失效,仅重复输出一个缓存的旧值。\"\n ],\n \"key_evidence\": [\n \"6月26日 living_room_temp_sensor 在 08:00、12:00、18:00、22:00 出现非标准格式的重复上报('MeasuredValue = xxxx',缺少 TemperatureMeasurement Cluster 前缀),且数值与同时刻标准上报存在 60-117 单位(0.6-1.17°C)的偏差\",\n \"6月27日起 living_room_temp_sensor 完全停止标准格式上报,仅以非标准格式输出固定值 2350,持续至少 28 小时(6月27日 08:00 至 6月28日 12:00),读数无任何波动\",\n \"同期其他房间传感器(master_bedroom、kids_room、kitchen)在 6月26日全天工作正常,温度曲线合理,无非标准格式上报\"\n ],\n \"recommended_actions\": [\n \"立即对 living_room_temp_sensor 执行设备重启/重置操作,观察是否恢复标准格式上报和正常温度波动\",\n \"检查该传感器的固件版本,与厂商确认是否存在已知的双通道上报 bug,必要时升级固件\",\n \"在传感器恢复前,可临时参考相邻房间(如 kitchen_temp_sensor)的温度数据作为客厅温度的近似参考\",\n \"在系统侧增加传感器健康检查规则:当某传感器连续多次上报完全相同的值、或出现非标准 Cluster 格式的数据时,自动触发告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器(living_room_temp_sensor)存在双重上报异常和读数固化故障,疑似设备硬件或固件缺陷。", "reasoning": ["推理步骤1: 在正常的 TemperatureMeasurement.MeasuredValue 上报之外,living_room_temp_sensor 还以非标准格式 'MeasuredValue = xxxx'(缺少 Cluster 前缀 TemperatureMeasurement)额外上报了数据,分别出现在 08:00、12:00、18:00、22:00,且这些值与同一时刻标准上报值存在明显偏差(如 08:00 标准值 2467 vs 异常值 2350,12:00 标准值 2584 vs 异常值 2510,22:00 标准值 2361 vs 异常值 2280)。这说明传感器内部可能存在两个上报通道或固件 bug,导致同一时刻产生两条矛盾的温度读数。", "推理步骤2: 从 6月27日起,living_room_temp_sensor 完全停止了标准格式的 TemperatureMeasurement.MeasuredValue 上报,仅剩非标准格式 'MeasuredValue = 2350' 的数据,且读数固定为 2350 不再变化(6月27日 08:00/12:00/18:00/22:00 和 6月28日 08:00/12:00 均为 2350)。对比同期其他房间传感器在 6月26日的正常温度波动(日间升温、夜间降温),客厅传感器读数完全静止,明显不符合物理规律。", "推理步骤3: 其他三个温度传感器(master_bedroom、kids_room、kitchen)在整个 6月26日期间均以标准 TemperatureMeasurement.MeasuredValue 格式正常上报,且温度曲线呈现合理的昼夜波动(夜间约 22.9-23.1°C,午间峰值约 25.8-25.9°C),未出现任何非标准格式或读数固化现象。这进一步确认问题仅出在 living_room_temp_sensor 这一台设备上。", "推理步骤4: 6月27日之后其他传感器的数据完全缺失(日志中无记录),而 living_room_temp_sensor 却仍在以非标准格式上报固定值,这种行为模式更像是传感器进入了某种降级/故障模式——测量功能失效,仅重复输出一个缓存的旧值。"], "key_evidence": ["6月26日 living_room_temp_sensor 在 08:00、12:00、18:00、22:00 出现非标准格式的重复上报('MeasuredValue = xxxx',缺少 TemperatureMeasurement Cluster 前缀),且数值与同时刻标准上报存在 60-117 单位(0.6-1.17°C)的偏差", "6月27日起 living_room_temp_sensor 完全停止标准格式上报,仅以非标准格式输出固定值 2350,持续至少 28 小时(6月27日 08:00 至 6月28日 12:00),读数无任何波动", "同期其他房间传感器(master_bedroom、kids_room、kitchen)在 6月26日全天工作正常,温度曲线合理,无非标准格式上报"], "recommended_actions": ["立即对 living_room_temp_sensor 执行设备重启/重置操作,观察是否恢复标准格式上报和正常温度波动", "检查该传感器的固件版本,与厂商确认是否存在已知的双通道上报 bug,必要时升级固件", "在传感器恢复前,可临时参考相邻房间(如 kitchen_temp_sensor)的温度数据作为客厅温度的近似参考", "在系统侧增加传感器健康检查规则:当某传感器连续多次上报完全相同的值、或出现非标准 Cluster 格式的数据时,自动触发告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.53834867477417, "api_error": null} {"episode_id": "SQ1_TP_C_0017", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0017.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260646, "scenario_id": "DF-03", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-20T19:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在19:00出现短时间内反复触发(30秒间隔快速切换占用/未占用),疑似传感器抖动或硬件故障。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器方面,将其与客厅、儿童房、厨房的温度数据对比,四个房间全天温度走势高度一致(夜间约23°C,午间峰值约25.9°C,傍晚回落),主卧温度传感器未出现偏离其他房间的异常读数,工作正常。\",\n \"推理步骤2: 主卧运动传感器在19:00:00至19:01:10的70秒内,产生了5次状态变化(占用→未占用→占用→未占用→占用),每次占用持续仅约30秒就切换为未占用,随后不到5秒又切换回占用。\",\n \"推理步骤3: 正常人体活动不会导致运动传感器在30秒内反复从'有人'变为'无人'再变回'有人'——典型的PIR传感器有延迟保持时间(通常数十秒到数分钟),不应如此快速地报告'无人'。\",\n \"推理步骤4: 这种快速抖动模式更符合传感器灵敏度阈值边界抖动、安装位置受干扰(如空调气流、窗帘摆动)、或传感器硬件老化导致的误触发,而非真实的人员进出。\",\n \"推理步骤5: 整个24小时日志中,主卧运动传感器仅在这一个时间段有事件记录,且集中爆发,进一步支持这是一次异常抖动而非持续性的正常使用。\"\n ],\n \"key_evidence\": [\n \"19:00:00 Occupancy=1 → 19:00:30 Occupancy=0 → 19:00:35 Occupancy=1 → 19:01:05 Occupancy=0 → 19:01:10 Occupancy=1,70秒内5次状态翻转\",\n \"每次'无人'状态仅持续5秒(19:00:30→19:00:35、19:01:05→19:01:10),远低于正常PIR传感器的保持时间\",\n \"主卧温度传感器全天数据与其他房间一致,无异常,排除环境因素导致的全面传感器问题\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装位置,确认是否正对空调出风口或窗帘等可能造成气流干扰的位置\",\n \"检查传感器固件版本,如有更新建议升级;同时确认传感器的灵敏度和保持时间(hold time)配置是否合理\",\n \"持续监测该传感器未来几天的行为,如果抖动频繁出现,建议更换传感器硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在19:00出现短时间内反复触发(30秒间隔快速切换占用/未占用),疑似传感器抖动或硬件故障。", "reasoning": ["推理步骤1: 主卧温度传感器方面,将其与客厅、儿童房、厨房的温度数据对比,四个房间全天温度走势高度一致(夜间约23°C,午间峰值约25.9°C,傍晚回落),主卧温度传感器未出现偏离其他房间的异常读数,工作正常。", "推理步骤2: 主卧运动传感器在19:00:00至19:01:10的70秒内,产生了5次状态变化(占用→未占用→占用→未占用→占用),每次占用持续仅约30秒就切换为未占用,随后不到5秒又切换回占用。", "推理步骤3: 正常人体活动不会导致运动传感器在30秒内反复从'有人'变为'无人'再变回'有人'——典型的PIR传感器有延迟保持时间(通常数十秒到数分钟),不应如此快速地报告'无人'。", "推理步骤4: 这种快速抖动模式更符合传感器灵敏度阈值边界抖动、安装位置受干扰(如空调气流、窗帘摆动)、或传感器硬件老化导致的误触发,而非真实的人员进出。", "推理步骤5: 整个24小时日志中,主卧运动传感器仅在这一个时间段有事件记录,且集中爆发,进一步支持这是一次异常抖动而非持续性的正常使用。"], "key_evidence": ["19:00:00 Occupancy=1 → 19:00:30 Occupancy=0 → 19:00:35 Occupancy=1 → 19:01:05 Occupancy=0 → 19:01:10 Occupancy=1,70秒内5次状态翻转", "每次'无人'状态仅持续5秒(19:00:30→19:00:35、19:01:05→19:01:10),远低于正常PIR传感器的保持时间", "主卧温度传感器全天数据与其他房间一致,无异常,排除环境因素导致的全面传感器问题"], "recommended_actions": ["检查主卧运动传感器的安装位置,确认是否正对空调出风口或窗帘等可能造成气流干扰的位置", "检查传感器固件版本,如有更新建议升级;同时确认传感器的灵敏度和保持时间(hold time)配置是否合理", "持续监测该传感器未来几天的行为,如果抖动频繁出现,建议更换传感器硬件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.17007827758789, "api_error": null} {"episode_id": "SQ1_TP_C_0022", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0022.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260651, "scenario_id": "DF-02", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T20:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天48个采样点(每30分钟一次)均正常上报,无数据缺失或上报中断,说明设备通信链路正常。\",\n \"推理步骤2: 主卧温度变化趋势与客厅、儿童房、厨房三个传感器高度一致——凌晨低温约22.9~23.1°C,午间峰值约25.9°C,夜间回落至23.4°C,呈现典型的夏季昼夜温度曲线。\",\n \"推理步骤3: 主卧与其他房间同一时刻的温差始终在±0.2°C以内,未出现单个传感器偏离群体的漂移或跳变,排除传感器精度退化或故障的可能。\",\n \"推理步骤4: 全天温度范围22.9~25.9°C,未出现突变(如30秒内跳升5°C以上)或固定值卡死的情况,排除短路、开路等硬件故障。\",\n \"推理步骤5: 06:00左右各房间同步出现约1°C的快速升温,符合日出后太阳辐射导致的自然升温,并非异常事件。\"\n ],\n \"key_evidence\": [\n \"主卧传感器全天48个数据点无缺失,上报间隔稳定为30分钟\",\n \"主卧与其他三个房间传感器的同时刻读数偏差始终在±0.2°C以内,趋势完全同步\",\n \"全天温度范围22.9~25.9°C,变化平滑无突变,符合夏季自然昼夜温度曲线\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,传感器运行状态良好\",\n \"可继续保持当前30分钟的采样频率进行常规监测\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧温度传感器工作正常,读数与其他房间传感器高度一致,符合自然昼夜温度变化规律。", "reasoning": ["推理步骤1: 主卧温度传感器全天48个采样点(每30分钟一次)均正常上报,无数据缺失或上报中断,说明设备通信链路正常。", "推理步骤2: 主卧温度变化趋势与客厅、儿童房、厨房三个传感器高度一致——凌晨低温约22.9~23.1°C,午间峰值约25.9°C,夜间回落至23.4°C,呈现典型的夏季昼夜温度曲线。", "推理步骤3: 主卧与其他房间同一时刻的温差始终在±0.2°C以内,未出现单个传感器偏离群体的漂移或跳变,排除传感器精度退化或故障的可能。", "推理步骤4: 全天温度范围22.9~25.9°C,未出现突变(如30秒内跳升5°C以上)或固定值卡死的情况,排除短路、开路等硬件故障。", "推理步骤5: 06:00左右各房间同步出现约1°C的快速升温,符合日出后太阳辐射导致的自然升温,并非异常事件。"], "key_evidence": ["主卧传感器全天48个数据点无缺失,上报间隔稳定为30分钟", "主卧与其他三个房间传感器的同时刻读数偏差始终在±0.2°C以内,趋势完全同步", "全天温度范围22.9~25.9°C,变化平滑无突变,符合夏季自然昼夜温度曲线"], "recommended_actions": ["无需采取措施,传感器运行状态良好", "可继续保持当前30分钟的采样频率进行常规监测"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.091639280319214, "api_error": null} {"episode_id": "SQ1_TP_C_0023", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0023.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260652, "scenario_id": "DF-06", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-15T21:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"儿童房区域所有传感器工作正常,数据采集连续且数值合理。\",\n \"reasoning\": [\n \"推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)从 00:00 到 23:30 每 30 分钟持续上报数据,无任何缺失或 None 值。温度从夜间约 22.9°C 逐步升至午间峰值约 25.8°C,再回落至夜间约 23.4°C,符合夏季(6月15日)自然昼夜温度变化曲线。\",\n \"推理步骤2: 儿童房运动传感器(kids_room_occupancy)在 06:46 检测到有人(孩子起床)、16:16 检测到有人(放学回家),两次触发时间与日常作息高度吻合,且与同时段的灯光、门锁事件相互印证。\",\n \"推理步骤3: 儿童房窗帘(kids_room_window)在 06:46 打开(Percent100ths=0,全开),21:02 开始关闭,21:05 完全关闭(Percent100ths=10000),早开晚关符合正常生活习惯。关闭过程中 OperationalStatus 持续为 0b000010(正在下降),约 3 分钟完成,机械运行正常。\",\n \"推理步骤4: 儿童房窗户传感器(kids_room_window_contact)全天无开关事件上报,说明窗户始终保持关闭状态,这在夏季高温天气下是合理的。\",\n \"推理步骤5: 儿童房灯(kids_room_light)在 06:46 开启、07:25 关闭(出门)、16:16 开启(回家)、21:05 关闭(睡觉),开关时间与运动传感器和门锁事件完全对应,联动逻辑正常。\",\n \"推理步骤6: 对比其他房间传感器,厨房温度传感器在 07:03、07:12、18:48、19:13 出现了多次 None 值,而儿童房温度传感器全天无此问题,进一步确认儿童房传感器数据采集稳定可靠。\"\n ],\n \"key_evidence\": [\n \"kids_room_temp_sensor 全天 48 个采样点数据完整,无 None 值,温度范围 22.93°C~25.80°C,变化平滑合理\",\n \"kids_room_occupancy 在 06:46 和 16:16 两次触发,与门锁开锁、灯光开启事件时间一致,传感器响应正常\",\n \"kids_room_window 窗帘从 06:46 全开到 21:05 全关,运行状态转换完整(0→5000→10000),机械和位置反馈正常\",\n \"kids_room_window_contact 全天无异常状态变化,窗户保持关闭\",\n \"kids_room_light 四次开关操作均与人员活动事件吻合\"\n ],\n \"recommended_actions\": [\n \"儿童房传感器当前无需维护,建议保持定期巡检\",\n \"可关注厨房温度传感器多次上报 None 值的问题,优先排查该设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "儿童房区域所有传感器工作正常,数据采集连续且数值合理。", "reasoning": ["推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)从 00:00 到 23:30 每 30 分钟持续上报数据,无任何缺失或 None 值。温度从夜间约 22.9°C 逐步升至午间峰值约 25.8°C,再回落至夜间约 23.4°C,符合夏季(6月15日)自然昼夜温度变化曲线。", "推理步骤2: 儿童房运动传感器(kids_room_occupancy)在 06:46 检测到有人(孩子起床)、16:16 检测到有人(放学回家),两次触发时间与日常作息高度吻合,且与同时段的灯光、门锁事件相互印证。", "推理步骤3: 儿童房窗帘(kids_room_window)在 06:46 打开(Percent100ths=0,全开),21:02 开始关闭,21:05 完全关闭(Percent100ths=10000),早开晚关符合正常生活习惯。关闭过程中 OperationalStatus 持续为 0b000010(正在下降),约 3 分钟完成,机械运行正常。", "推理步骤4: 儿童房窗户传感器(kids_room_window_contact)全天无开关事件上报,说明窗户始终保持关闭状态,这在夏季高温天气下是合理的。", "推理步骤5: 儿童房灯(kids_room_light)在 06:46 开启、07:25 关闭(出门)、16:16 开启(回家)、21:05 关闭(睡觉),开关时间与运动传感器和门锁事件完全对应,联动逻辑正常。", "推理步骤6: 对比其他房间传感器,厨房温度传感器在 07:03、07:12、18:48、19:13 出现了多次 None 值,而儿童房温度传感器全天无此问题,进一步确认儿童房传感器数据采集稳定可靠。"], "key_evidence": ["kids_room_temp_sensor 全天 48 个采样点数据完整,无 None 值,温度范围 22.93°C~25.80°C,变化平滑合理", "kids_room_occupancy 在 06:46 和 16:16 两次触发,与门锁开锁、灯光开启事件时间一致,传感器响应正常", "kids_room_window 窗帘从 06:46 全开到 21:05 全关,运行状态转换完整(0→5000→10000),机械和位置反馈正常", "kids_room_window_contact 全天无异常状态变化,窗户保持关闭", "kids_room_light 四次开关操作均与人员活动事件吻合"], "recommended_actions": ["儿童房传感器当前无需维护,建议保持定期巡检", "可关注厨房温度传感器多次上报 None 值的问题,优先排查该设备故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.66280961036682, "api_error": null} {"episode_id": "SQ1_TP_C_0027", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0027.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260656, "scenario_id": "DF-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-15T14:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器和运动传感器的数据均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。温度从夜间约 22.9°C 逐步升至午间峰值约 25.8°C,再回落至夜间约 23.3°C,符合夏季(6月15日)自然昼夜温度变化曲线。\",\n \"推理步骤2: 主卧温度与其他房间(客厅、儿童房、厨房)的温度走势高度一致,各时间点偏差在 ±0.2°C 以内,不存在单一传感器异常偏高或偏低的情况,排除传感器漂移或故障。\",\n \"推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:21 再次检测到有人(就寝),与当天灯光开关、窗帘操作的时间线完全吻合:06:08 开灯 → 06:48 去主卫 → 07:13 关灯出门 → 22:21 回卧室关窗帘就寝,是典型的工作日作息模式。\",\n \"推理步骤4: 对比厨房温度传感器在灶具开启期间多次报告 None 值(06:54、18:36、19:21),主卧温度传感器全天48个采样点均正常返回数值,数据完整性为 100%。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48次采样均有有效数值,无 None 或异常跳变,温度范围 22.90°C ~ 25.81°C,符合夏季室内自然波动\",\n \"master_bedroom_occupancy 仅在 06:08 和 22:21 触发,与主卧灯光、窗帘、主卫使用等事件时间线完全一致,无深夜异常触发\",\n \"主卧温度曲线与其他三个房间传感器高度同步,排除单点传感器故障的可能\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域传感器运行状态良好\",\n \"可关注厨房温度传感器在灶具使用期间多次报告 None 值的问题,可能存在热干扰或传感器故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器和运动传感器的数据均符合预期。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。温度从夜间约 22.9°C 逐步升至午间峰值约 25.8°C,再回落至夜间约 23.3°C,符合夏季(6月15日)自然昼夜温度变化曲线。", "推理步骤2: 主卧温度与其他房间(客厅、儿童房、厨房)的温度走势高度一致,各时间点偏差在 ±0.2°C 以内,不存在单一传感器异常偏高或偏低的情况,排除传感器漂移或故障。", "推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:21 再次检测到有人(就寝),与当天灯光开关、窗帘操作的时间线完全吻合:06:08 开灯 → 06:48 去主卫 → 07:13 关灯出门 → 22:21 回卧室关窗帘就寝,是典型的工作日作息模式。", "推理步骤4: 对比厨房温度传感器在灶具开启期间多次报告 None 值(06:54、18:36、19:21),主卧温度传感器全天48个采样点均正常返回数值,数据完整性为 100%。"], "key_evidence": ["master_bedroom_temp_sensor 全天48次采样均有有效数值,无 None 或异常跳变,温度范围 22.90°C ~ 25.81°C,符合夏季室内自然波动", "master_bedroom_occupancy 仅在 06:08 和 22:21 触发,与主卧灯光、窗帘、主卫使用等事件时间线完全一致,无深夜异常触发", "主卧温度曲线与其他三个房间传感器高度同步,排除单点传感器故障的可能"], "recommended_actions": ["无需采取措施,主卧区域传感器运行状态良好", "可关注厨房温度传感器在灶具使用期间多次报告 None 值的问题,可能存在热干扰或传感器故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.268306732177734, "api_error": null} {"episode_id": "SQ1_TP_C_0031", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0031.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260660, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-01T00:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在深夜出现高频率抖动(30秒间隔反复触发),疑似传感器故障或灵敏度异常。\",\n \"reasoning\": [\n \"推理步骤1: 在00:00:00至00:01:10的70秒内,master_bedroom_occupancy传感器出现了5次状态变化(1→0→1→0→1),间隔仅约30秒,这种高频抖动在正常睡眠场景中不合理。\",\n \"推理步骤2: 正常睡眠中人体翻身可能触发运动传感器,但PIR传感器通常有延迟释放机制(典型为1-3分钟),30秒内反复切换0/1状态不符合正常PIR传感器行为特征。\",\n \"推理步骤3: 主卧温度传感器工作正常,全天温度读数在22.9°C至25.9°C之间平稳变化,符合夏季室内温度的自然波动规律,无异常。\",\n \"推理步骤4: 排除入侵可能——该时段入户门锁处于锁定状态,无其他区域运动传感器触发,且后续06:11主卧传感器恢复正常工作模式,说明不是安全威胁而是设备层面的问题。\"\n ],\n \"key_evidence\": [\n \"00:00:00-00:01:10期间master_bedroom_occupancy在70秒内出现5次状态翻转(Occupancy在0和1之间快速切换)\",\n \"每次占用状态仅维持约30秒就释放,远低于PIR传感器正常的延迟释放时间\",\n \"主卧温度传感器全天数据正常(2292-2589范围,即22.9°C-25.9°C),无异常读数\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的灵敏度设置,适当降低灵敏度或增加延迟释放时间\",\n \"确认传感器安装位置是否对准空调出风口、窗帘等可能引起误触发的物体\",\n \"持续监测该传感器是否再次出现深夜高频抖动,若反复出现建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在深夜出现高频率抖动(30秒间隔反复触发),疑似传感器故障或灵敏度异常。", "reasoning": ["推理步骤1: 在00:00:00至00:01:10的70秒内,master_bedroom_occupancy传感器出现了5次状态变化(1→0→1→0→1),间隔仅约30秒,这种高频抖动在正常睡眠场景中不合理。", "推理步骤2: 正常睡眠中人体翻身可能触发运动传感器,但PIR传感器通常有延迟释放机制(典型为1-3分钟),30秒内反复切换0/1状态不符合正常PIR传感器行为特征。", "推理步骤3: 主卧温度传感器工作正常,全天温度读数在22.9°C至25.9°C之间平稳变化,符合夏季室内温度的自然波动规律,无异常。", "推理步骤4: 排除入侵可能——该时段入户门锁处于锁定状态,无其他区域运动传感器触发,且后续06:11主卧传感器恢复正常工作模式,说明不是安全威胁而是设备层面的问题。"], "key_evidence": ["00:00:00-00:01:10期间master_bedroom_occupancy在70秒内出现5次状态翻转(Occupancy在0和1之间快速切换)", "每次占用状态仅维持约30秒就释放,远低于PIR传感器正常的延迟释放时间", "主卧温度传感器全天数据正常(2292-2589范围,即22.9°C-25.9°C),无异常读数"], "recommended_actions": ["检查主卧运动传感器的灵敏度设置,适当降低灵敏度或增加延迟释放时间", "确认传感器安装位置是否对准空调出风口、窗帘等可能引起误触发的物体", "持续监测该传感器是否再次出现深夜高频抖动,若反复出现建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.683773517608643, "api_error": null} {"episode_id": "SQ1_TP_C_0039", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0039.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20260668, "scenario_id": "DF-04", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-24T23:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在23:33出现重复锁门命令并触发DoorLockAlarm(AlarmCode=0),提示锁具可能存在机械或电气故障;同时入户门传感器在15:56开门后未记录到关门事件。\",\n \"reasoning\": [\n \"推理步骤1: entrance区域包含front_door_lock、front_door_contact、entrance_light、entrance_occupancy四个设备。逐一检查其行为模式。\",\n \"推理步骤2: front_door_lock在23:33:00收到LockDoor命令,5秒后报告LockState=2(已解锁),紧接着23:33:10再次收到LockDoor命令,23:33:15再次报告LockState=2,随后触发DoorLockAlarm(AlarmCode=0)。AlarmCode=0通常表示锁定失败(Lock Jammed)告警,说明门锁尝试上锁但未能成功完成机械动作。\",\n \"推理步骤3: front_door_contact在15:56:02报告StateValue=False(门打开),但此后直到22:20:32才报告StateValue=True(门关闭)。中间18:14:02也报告了一次False(开门),但没有对应的True(关门)事件记录在18:14之后、22:20之前。这可能是传感器漏报,也可能门确实长时间未完全关合。\",\n \"推理步骤4: entrance_occupancy和entrance_light在有人进出时正常触发(07:19、15:56、18:14均有occupancy=1记录),玄关灯未见异常触发,这两个设备工作正常。\",\n \"推理步骤5: 综合来看,门锁存在锁定失败告警(硬件故障信号),门磁传感器可能存在漏报关门事件的情况,两者均属于设备故障范畴。\"\n ],\n \"key_evidence\": [\n \"23:33:00-23:33:15 门锁连续两次收到LockDoor命令但LockState始终为2(未锁定),最终触发DoorLockAlarm(AlarmCode=0)即Lock Jammed告警\",\n \"15:56:02 front_door_contact报告开门(False),但直到22:20:32才有关门(True)记录,中间18:14:02又有一次开门记录却无对应关门记录,疑似门磁传感器漏报\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁机械结构,确认锁舌是否卡住或门框对位是否正常,必要时进行润滑或维修\",\n \"检查front_door_contact门磁传感器的安装位置和电池电量,确认是否存在信号丢失或安装偏移导致的漏报\",\n \"在门锁故障修复前,建议启用备用安全措施(如手动反锁链条),并设置门锁告警的即时通知推送\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在23:33出现重复锁门命令并触发DoorLockAlarm(AlarmCode=0),提示锁具可能存在机械或电气故障;同时入户门传感器在15:56开门后未记录到关门事件。", "reasoning": ["推理步骤1: entrance区域包含front_door_lock、front_door_contact、entrance_light、entrance_occupancy四个设备。逐一检查其行为模式。", "推理步骤2: front_door_lock在23:33:00收到LockDoor命令,5秒后报告LockState=2(已解锁),紧接着23:33:10再次收到LockDoor命令,23:33:15再次报告LockState=2,随后触发DoorLockAlarm(AlarmCode=0)。AlarmCode=0通常表示锁定失败(Lock Jammed)告警,说明门锁尝试上锁但未能成功完成机械动作。", "推理步骤3: front_door_contact在15:56:02报告StateValue=False(门打开),但此后直到22:20:32才报告StateValue=True(门关闭)。中间18:14:02也报告了一次False(开门),但没有对应的True(关门)事件记录在18:14之后、22:20之前。这可能是传感器漏报,也可能门确实长时间未完全关合。", "推理步骤4: entrance_occupancy和entrance_light在有人进出时正常触发(07:19、15:56、18:14均有occupancy=1记录),玄关灯未见异常触发,这两个设备工作正常。", "推理步骤5: 综合来看,门锁存在锁定失败告警(硬件故障信号),门磁传感器可能存在漏报关门事件的情况,两者均属于设备故障范畴。"], "key_evidence": ["23:33:00-23:33:15 门锁连续两次收到LockDoor命令但LockState始终为2(未锁定),最终触发DoorLockAlarm(AlarmCode=0)即Lock Jammed告警", "15:56:02 front_door_contact报告开门(False),但直到22:20:32才有关门(True)记录,中间18:14:02又有一次开门记录却无对应关门记录,疑似门磁传感器漏报"], "recommended_actions": ["立即检查入户门锁机械结构,确认锁舌是否卡住或门框对位是否正常,必要时进行润滑或维修", "检查front_door_contact门磁传感器的安装位置和电池电量,确认是否存在信号丢失或安装偏移导致的漏报", "在门锁故障修复前,建议启用备用安全措施(如手动反锁链条),并设置门锁告警的即时通知推送"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.6682288646698, "api_error": null} {"episode_id": "SQ1_TP_C_0040", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0040.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20260669, "scenario_id": "DF-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-10T09:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度和占用检测数据均符合预期模式\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天每30分钟稳定上报数据,无缺失(未出现 None 值),数值从夜间约22.9°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化曲线\",\n \"推理步骤2: 主卧温度与其他房间(客厅、儿童房、厨房)的温度趋势高度一致,各时间点偏差在±0.2°C以内,无异常偏离\",\n \"推理步骤3: 主卧运动传感器在06:09检测到占用(起床),22:13再次检测到占用(就寝),与灯光开关时间吻合(06:09开灯、22:13关灯),行为模式合理\",\n \"推理步骤4: 主卧窗帘在22:13关闭(10000 = 完全关闭),与就寝时间一致,属于正常操作\",\n \"推理步骤5: 对比厨房温度传感器多次报告 None 值的情况,主卧传感器无此问题,数据连续性良好\"\n ],\n \"key_evidence\": [\n \"温度传感器全天48个采样点均正常上报,数值范围2292-2587(22.92°C-25.87°C),无异常跳变或缺失\",\n \"运动传感器在06:09和22:13两次触发,与住户起床和就寝的灯光/窗帘操作时间完全吻合\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域所有传感器运行状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度和占用检测数据均符合预期模式", "reasoning": ["推理步骤1: 主卧温度传感器全天每30分钟稳定上报数据,无缺失(未出现 None 值),数值从夜间约22.9°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化曲线", "推理步骤2: 主卧温度与其他房间(客厅、儿童房、厨房)的温度趋势高度一致,各时间点偏差在±0.2°C以内,无异常偏离", "推理步骤3: 主卧运动传感器在06:09检测到占用(起床),22:13再次检测到占用(就寝),与灯光开关时间吻合(06:09开灯、22:13关灯),行为模式合理", "推理步骤4: 主卧窗帘在22:13关闭(10000 = 完全关闭),与就寝时间一致,属于正常操作", "推理步骤5: 对比厨房温度传感器多次报告 None 值的情况,主卧传感器无此问题,数据连续性良好"], "key_evidence": ["温度传感器全天48个采样点均正常上报,数值范围2292-2587(22.92°C-25.87°C),无异常跳变或缺失", "运动传感器在06:09和22:13两次触发,与住户起床和就寝的灯光/窗帘操作时间完全吻合"], "recommended_actions": ["无需采取措施,主卧区域所有传感器运行状态良好"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.789458990097046, "api_error": null} {"episode_id": "SQ1_TP_C_0043", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0043.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20260672, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-24T23:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在深夜出现快速反复触发(占用/无占用交替),疑似传感器故障或信号抖动。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器全天工作正常,数值在 22.91°C ~ 25.59°C 之间随昼夜自然波动,与其他房间趋势一致,无异常。\",\n \"推理步骤2: 主卧运动传感器在白天的触发模式合理——06:17 起床、22:10 回卧室就寝,与全屋活动时间线吻合。\",\n \"推理步骤3: 但在 23:34:00 ~ 23:35:10 的约 70 秒内,主卧运动传感器出现了 5 次状态翻转(占用→无占用→占用→无占用→占用),间隔仅 30 秒和 5 秒。此时住户应已入睡(22:10 关灯、关窗帘、锁门),正常睡眠中不应产生如此高频的占用状态切换。\",\n \"推理步骤4: 如果是住户翻身或起夜,通常表现为一次占用触发后持续一段时间,而非秒级的反复抖动。这种快速交替更符合传感器灵敏度过高、安装位置受干扰(如窗帘飘动、空调气流)或硬件接触不良导致的信号抖动特征。\",\n \"推理步骤5: 另外注意这几条日志的属性格式为 'Occupancy = 1/0' 而非标准的 'OccupancySensing.Occupancy = 1/0',与该传感器早期日志格式不一致,可能暗示固件或通信层存在异常。\"\n ],\n \"key_evidence\": [\n \"23:34:00 ~ 23:35:10 期间主卧运动传感器在约 70 秒内发生 5 次状态翻转(1→0→1→0→1),间隔最短仅 5 秒\",\n \"此时段住户已于 22:10 关灯就寝,深夜睡眠状态下不应出现如此高频的占用切换\",\n \"该时段日志属性名称格式(Occupancy)与之前标准格式(OccupancySensing.Occupancy)不一致\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装位置,确认是否受窗帘飘动、空调气流或宠物等干扰源影响\",\n \"查看传感器固件版本,确认属性上报格式不一致是否为固件 bug,必要时升级固件\",\n \"适当降低运动传感器灵敏度或增加去抖延迟(debounce),减少睡眠期间的误触发\",\n \"持续监测该传感器后续几天的深夜行为,若抖动持续出现则考虑更换硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在深夜出现快速反复触发(占用/无占用交替),疑似传感器故障或信号抖动。", "reasoning": ["推理步骤1: 主卧温度传感器全天工作正常,数值在 22.91°C ~ 25.59°C 之间随昼夜自然波动,与其他房间趋势一致,无异常。", "推理步骤2: 主卧运动传感器在白天的触发模式合理——06:17 起床、22:10 回卧室就寝,与全屋活动时间线吻合。", "推理步骤3: 但在 23:34:00 ~ 23:35:10 的约 70 秒内,主卧运动传感器出现了 5 次状态翻转(占用→无占用→占用→无占用→占用),间隔仅 30 秒和 5 秒。此时住户应已入睡(22:10 关灯、关窗帘、锁门),正常睡眠中不应产生如此高频的占用状态切换。", "推理步骤4: 如果是住户翻身或起夜,通常表现为一次占用触发后持续一段时间,而非秒级的反复抖动。这种快速交替更符合传感器灵敏度过高、安装位置受干扰(如窗帘飘动、空调气流)或硬件接触不良导致的信号抖动特征。", "推理步骤5: 另外注意这几条日志的属性格式为 'Occupancy = 1/0' 而非标准的 'OccupancySensing.Occupancy = 1/0',与该传感器早期日志格式不一致,可能暗示固件或通信层存在异常。"], "key_evidence": ["23:34:00 ~ 23:35:10 期间主卧运动传感器在约 70 秒内发生 5 次状态翻转(1→0→1→0→1),间隔最短仅 5 秒", "此时段住户已于 22:10 关灯就寝,深夜睡眠状态下不应出现如此高频的占用切换", "该时段日志属性名称格式(Occupancy)与之前标准格式(OccupancySensing.Occupancy)不一致"], "recommended_actions": ["检查主卧运动传感器的安装位置,确认是否受窗帘飘动、空调气流或宠物等干扰源影响", "查看传感器固件版本,确认属性上报格式不一致是否为固件 bug,必要时升级固件", "适当降低运动传感器灵敏度或增加去抖延迟(debounce),减少睡眠期间的误触发", "持续监测该传感器后续几天的深夜行为,若抖动持续出现则考虑更换硬件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.59998345375061, "api_error": null} {"episode_id": "SQ1_TP_C_0041", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0041.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260670, "scenario_id": "DF-05", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-08T08:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器发生硬件故障,丧失烟雾/CO检测能力,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 客厅区域共有以下传感器——温度传感器(living_room_temp_sensor)、运动传感器(living_room_occupancy)、烟雾报警器(living_room_smoke_alarm)、窗户传感器(living_room_window_contact_1/2)。逐一检查其日志状态。\",\n \"推理步骤2: 温度传感器从00:00到23:30每半小时稳定上报数据,数值在2292~2588范围内(约22.9°C~25.9°C),符合夏季室内温度的正常日变化曲线(凌晨低、午后高、夜间回落),无异常跳变或缺失,工作正常。\",\n \"推理步骤3: 运动传感器在18:03:08检测到有人(Occupancy=1),与入户门开锁、客厅灯和空调开启的时间吻合,行为合理,工作正常。\",\n \"推理步骤4: 客厅烟雾报警器在08:56:00上报了三条关键事件——HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault()。ExpressedState=5对应Matter SmokeCoAlarm Cluster中的'HardwareFault'状态,表明设备自检发现硬件级故障。\",\n \"推理步骤5: 该故障发生在08:56,此后整天日志中未见该报警器恢复正常(无HardwareFaultAlert=False或ExpressedState恢复为0的记录),说明故障持续存在,设备一直处于失效状态。\",\n \"推理步骤6: 此时家中无人(07:47全家出门),烟雾报警器失效意味着如果发生火灾或CO泄漏,该区域将无法报警,风险显著。\",\n \"推理步骤7: 窗户传感器(living_room_window_contact_1/2)在全天日志中无状态变化事件,说明窗户保持原始状态未被打开,属于正常情况。\"\n ],\n \"key_evidence\": [\n \"08:56:00 living_room_smoke_alarm | HardwareFaultAlert = True\",\n \"08:56:00 living_room_smoke_alarm | ExpressedState = 5(对应HardwareFault状态)\",\n \"08:56:00 living_room_smoke_alarm | Event: HardwareFault()\",\n \"故障发生后至日志结束(23:30),未见任何恢复记录,故障持续超过14小时\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅烟雾报警器硬件状态,尝试手动复位或断电重启\",\n \"若复位无效,尽快更换该烟雾报警器,避免长时间处于无烟雾/CO监控状态\",\n \"在报警器修复前,可考虑将厨房烟雾报警器的灵敏度适当提高,或临时增设独立式烟雾报警器覆盖客厅区域\",\n \"检查报警器的生产日期和使用年限,烟雾报警器通常建议每10年更换一次\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器发生硬件故障,丧失烟雾/CO检测能力,存在安全监控盲区。", "reasoning": ["推理步骤1: 客厅区域共有以下传感器——温度传感器(living_room_temp_sensor)、运动传感器(living_room_occupancy)、烟雾报警器(living_room_smoke_alarm)、窗户传感器(living_room_window_contact_1/2)。逐一检查其日志状态。", "推理步骤2: 温度传感器从00:00到23:30每半小时稳定上报数据,数值在2292~2588范围内(约22.9°C~25.9°C),符合夏季室内温度的正常日变化曲线(凌晨低、午后高、夜间回落),无异常跳变或缺失,工作正常。", "推理步骤3: 运动传感器在18:03:08检测到有人(Occupancy=1),与入户门开锁、客厅灯和空调开启的时间吻合,行为合理,工作正常。", "推理步骤4: 客厅烟雾报警器在08:56:00上报了三条关键事件——HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault()。ExpressedState=5对应Matter SmokeCoAlarm Cluster中的'HardwareFault'状态,表明设备自检发现硬件级故障。", "推理步骤5: 该故障发生在08:56,此后整天日志中未见该报警器恢复正常(无HardwareFaultAlert=False或ExpressedState恢复为0的记录),说明故障持续存在,设备一直处于失效状态。", "推理步骤6: 此时家中无人(07:47全家出门),烟雾报警器失效意味着如果发生火灾或CO泄漏,该区域将无法报警,风险显著。", "推理步骤7: 窗户传感器(living_room_window_contact_1/2)在全天日志中无状态变化事件,说明窗户保持原始状态未被打开,属于正常情况。"], "key_evidence": ["08:56:00 living_room_smoke_alarm | HardwareFaultAlert = True", "08:56:00 living_room_smoke_alarm | ExpressedState = 5(对应HardwareFault状态)", "08:56:00 living_room_smoke_alarm | Event: HardwareFault()", "故障发生后至日志结束(23:30),未见任何恢复记录,故障持续超过14小时"], "recommended_actions": ["立即检查客厅烟雾报警器硬件状态,尝试手动复位或断电重启", "若复位无效,尽快更换该烟雾报警器,避免长时间处于无烟雾/CO监控状态", "在报警器修复前,可考虑将厨房烟雾报警器的灵敏度适当提高,或临时增设独立式烟雾报警器覆盖客厅区域", "检查报警器的生产日期和使用年限,烟雾报警器通常建议每10年更换一次"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.497854948043823, "api_error": null} {"episode_id": "SQ1_TP_C_0054", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0054.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260683, "scenario_id": "DF-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-11T10:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无任何 None 值或数据缺失,覆盖从 00:00 到 23:30 的完整周期。\",\n \"推理步骤2: 温度变化趋势合理——凌晨约 23.0°C,清晨 6:00 起随日照升温,中午 12:00-13:00 达到峰值约 25.7-25.8°C,午后逐步回落,晚间回到约 23.3°C,符合夏季(6月)自然昼夜温度曲线。\",\n \"推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:20 再次检测到有人活动(就寝),与灯光开关事件时间吻合(06:08 开灯、22:20 关灯),行为模式完全合理。\",\n \"推理步骤4: 主卧窗帘在 22:20 关闭(位置 10000 = 100% 关闭),与就寝时间一致,属于正常操作。\",\n \"推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(06:50、07:28、18:21、19:16),主卧温度传感器全天无一次 None 上报,数据完整性良好。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48个采样点均正常上报,无 None 值,温度范围 22.91°C ~ 25.80°C,变化平滑合理\",\n \"master_bedroom_occupancy 在 06:08 和 22:20 触发,与主卧灯光开关时间精确匹配,符合起床/就寝的生活规律\",\n \"master_bedroom_window_contact 全天无异常开合事件,窗帘在就寝时正常关闭\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域所有传感器运行状态良好\",\n \"建议关注厨房温度传感器多次上报 None 值的问题,可能存在设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,温度传感器、运动传感器均按预期运行。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无任何 None 值或数据缺失,覆盖从 00:00 到 23:30 的完整周期。", "推理步骤2: 温度变化趋势合理——凌晨约 23.0°C,清晨 6:00 起随日照升温,中午 12:00-13:00 达到峰值约 25.7-25.8°C,午后逐步回落,晚间回到约 23.3°C,符合夏季(6月)自然昼夜温度曲线。", "推理步骤3: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:20 再次检测到有人活动(就寝),与灯光开关事件时间吻合(06:08 开灯、22:20 关灯),行为模式完全合理。", "推理步骤4: 主卧窗帘在 22:20 关闭(位置 10000 = 100% 关闭),与就寝时间一致,属于正常操作。", "推理步骤5: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(06:50、07:28、18:21、19:16),主卧温度传感器全天无一次 None 上报,数据完整性良好。"], "key_evidence": ["master_bedroom_temp_sensor 全天48个采样点均正常上报,无 None 值,温度范围 22.91°C ~ 25.80°C,变化平滑合理", "master_bedroom_occupancy 在 06:08 和 22:20 触发,与主卧灯光开关时间精确匹配,符合起床/就寝的生活规律", "master_bedroom_window_contact 全天无异常开合事件,窗帘在就寝时正常关闭"], "recommended_actions": ["无需采取措施,主卧区域所有传感器运行状态良好", "建议关注厨房温度传感器多次上报 None 值的问题,可能存在设备故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.710044384002686, "api_error": null} {"episode_id": "SQ1_TP_C_0048", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0048.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20260677, "scenario_id": "DF-05", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-24T11:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房烟雾报警器发生硬件故障,kitchen 区域存在多个设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器(kitchen_temp_sensor)在 07:00:00、07:05:10、18:19:00、18:57:00 共出现 4 次 MeasuredValue = None 的读数,表明传感器间歇性失效,无法正常采集温度数据。\",\n \"推理步骤2: 这些 None 值出现的时间点与厨房灶具(kitchen_cook_surface)的使用高度相关——07:00 前后灶具开启、18:18~18:56 灶具开启期间均出现 None。灶具工作时恰恰是最需要温度监测的时段,传感器在此时失效会带来安全隐患。\",\n \"推理步骤3: 在 None 值出现后的下一个正常采样周期,传感器又恢复了正常数值(如 07:00 报 None 后紧接着报 2425,18:57 报 None 后 19:00 报 2437),说明这不是传感器永久损坏,而是间歇性故障,可能与高温环境干扰、供电不稳或通信丢包有关。\",\n \"推理步骤4: 厨房烟雾报警器(kitchen_smoke_alarm)在 11:40 报告了 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。这意味着烟雾报警器自身检测到硬件级别的问题,已无法保证正常的烟雾/CO 检测功能。\",\n \"推理步骤5: 温度传感器间歇性失效 + 烟雾报警器硬件故障同时存在于厨房区域,使得该区域的火灾预警能力严重下降。如果发生燃气泄漏或明火,系统可能无法及时检测和报警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:00、07:05:10、18:19:00、18:57:00 四次报告 MeasuredValue = None\",\n \"kitchen_smoke_alarm 在 11:40:00 报告 HardwareFaultAlert = True, ExpressedState = 5, 触发 HardwareFault 事件\",\n \"温度传感器的 None 值与灶具使用时段高度吻合,在非烹饪时段读数正常\",\n \"烟雾报警器硬件故障后直到日志结束(23:30)未见恢复记录\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房烟雾报警器硬件状态,尝试复位;若无法恢复,尽快更换设备,确保厨房火灾预警能力\",\n \"排查厨房温度传感器的安装位置是否距灶具过近,高温可能导致传感器间歇性超出工作范围\",\n \"检查厨房温度传感器的供电和无线通信链路质量,排除电池电量不足或信号干扰导致的间歇性丢数\",\n \"在烟雾报警器修复前,烹饪时应保持厨房窗户通风并加强人工看护,避免无人看管灶具\",\n \"考虑为厨房增加冗余温度传感器或独立燃气泄漏检测器,提升安全冗余度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房烟雾报警器发生硬件故障,kitchen 区域存在多个设备异常。", "reasoning": ["推理步骤1: 厨房温度传感器(kitchen_temp_sensor)在 07:00:00、07:05:10、18:19:00、18:57:00 共出现 4 次 MeasuredValue = None 的读数,表明传感器间歇性失效,无法正常采集温度数据。", "推理步骤2: 这些 None 值出现的时间点与厨房灶具(kitchen_cook_surface)的使用高度相关——07:00 前后灶具开启、18:18~18:56 灶具开启期间均出现 None。灶具工作时恰恰是最需要温度监测的时段,传感器在此时失效会带来安全隐患。", "推理步骤3: 在 None 值出现后的下一个正常采样周期,传感器又恢复了正常数值(如 07:00 报 None 后紧接着报 2425,18:57 报 None 后 19:00 报 2437),说明这不是传感器永久损坏,而是间歇性故障,可能与高温环境干扰、供电不稳或通信丢包有关。", "推理步骤4: 厨房烟雾报警器(kitchen_smoke_alarm)在 11:40 报告了 HardwareFaultAlert = True,ExpressedState = 5(硬件故障状态),并触发了 HardwareFault 事件。这意味着烟雾报警器自身检测到硬件级别的问题,已无法保证正常的烟雾/CO 检测功能。", "推理步骤5: 温度传感器间歇性失效 + 烟雾报警器硬件故障同时存在于厨房区域,使得该区域的火灾预警能力严重下降。如果发生燃气泄漏或明火,系统可能无法及时检测和报警。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:00、07:05:10、18:19:00、18:57:00 四次报告 MeasuredValue = None", "kitchen_smoke_alarm 在 11:40:00 报告 HardwareFaultAlert = True, ExpressedState = 5, 触发 HardwareFault 事件", "温度传感器的 None 值与灶具使用时段高度吻合,在非烹饪时段读数正常", "烟雾报警器硬件故障后直到日志结束(23:30)未见恢复记录"], "recommended_actions": ["立即检查厨房烟雾报警器硬件状态,尝试复位;若无法恢复,尽快更换设备,确保厨房火灾预警能力", "排查厨房温度传感器的安装位置是否距灶具过近,高温可能导致传感器间歇性超出工作范围", "检查厨房温度传感器的供电和无线通信链路质量,排除电池电量不足或信号干扰导致的间歇性丢数", "在烟雾报警器修复前,烹饪时应保持厨房窗户通风并加强人工看护,避免无人看管灶具", "考虑为厨房增加冗余温度传感器或独立燃气泄漏检测器,提升安全冗余度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.32666563987732, "api_error": null} {"episode_id": "SQ1_TP_C_0058", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0058.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20260687, "scenario_id": "DF-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-24T23:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"主卧区域传感器工作正常,所有读数和行为模式符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。温度从凌晨约 23.0°C 逐步升至中午峰值约 25.9°C,傍晚后回落至约 23.3°C,符合夏季(6月)自然昼夜温度变化曲线。\",\n \"推理步骤2: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:13 再次检测到有人(回卧室就寝),白天无触发——与住户早出晚归的作息完全吻合。\",\n \"推理步骤3: 主卧窗帘(master_bedroom_window)在 22:13 关闭(位置 10000 = 100% 关闭),属于睡前拉窗帘的正常行为。主卧窗户传感器(master_bedroom_window_contact)全天无状态变化事件,说明窗户始终保持关闭,无异常开启。\",\n \"推理步骤4: 主卧灯(master_bedroom_light)06:08 开启、07:17 关闭(出门前)、22:13 短暂后关闭(就寝),开关时间与运动传感器和门锁事件高度一致,无深夜异常亮灯。\",\n \"推理步骤5: 与厨房温度传感器出现多次 None 值相比,主卧温度传感器全天48个采样点数据完整,传感器通信链路稳定,无设备故障迹象。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 全天48次上报均有有效数值(22.9°C ~ 25.9°C),无 None 或异常跳变\",\n \"master_bedroom_occupancy 仅在 06:08 和 22:13 触发,与起床和就寝时间吻合\",\n \"master_bedroom_window 在 22:13 关闭窗帘,master_bedroom_window_contact 全天无异常开启事件\",\n \"master_bedroom_light 的开关时序与人员活动事件完全匹配\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,主卧区域所有传感器运行状态良好\",\n \"可关注厨房温度传感器多次报告 None 值的问题,与主卧形成对比,厨房传感器可能存在故障\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "主卧区域传感器工作正常,所有读数和行为模式符合预期。", "reasoning": ["推理步骤1: 主卧温度传感器(master_bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无 None 值。温度从凌晨约 23.0°C 逐步升至中午峰值约 25.9°C,傍晚后回落至约 23.3°C,符合夏季(6月)自然昼夜温度变化曲线。", "推理步骤2: 主卧运动传感器(master_bedroom_occupancy)在 06:08 检测到有人活动(起床),22:13 再次检测到有人(回卧室就寝),白天无触发——与住户早出晚归的作息完全吻合。", "推理步骤3: 主卧窗帘(master_bedroom_window)在 22:13 关闭(位置 10000 = 100% 关闭),属于睡前拉窗帘的正常行为。主卧窗户传感器(master_bedroom_window_contact)全天无状态变化事件,说明窗户始终保持关闭,无异常开启。", "推理步骤4: 主卧灯(master_bedroom_light)06:08 开启、07:17 关闭(出门前)、22:13 短暂后关闭(就寝),开关时间与运动传感器和门锁事件高度一致,无深夜异常亮灯。", "推理步骤5: 与厨房温度传感器出现多次 None 值相比,主卧温度传感器全天48个采样点数据完整,传感器通信链路稳定,无设备故障迹象。"], "key_evidence": ["master_bedroom_temp_sensor 全天48次上报均有有效数值(22.9°C ~ 25.9°C),无 None 或异常跳变", "master_bedroom_occupancy 仅在 06:08 和 22:13 触发,与起床和就寝时间吻合", "master_bedroom_window 在 22:13 关闭窗帘,master_bedroom_window_contact 全天无异常开启事件", "master_bedroom_light 的开关时序与人员活动事件完全匹配"], "recommended_actions": ["无需采取措施,主卧区域所有传感器运行状态良好", "可关注厨房温度传感器多次报告 None 值的问题,与主卧形成对比,厨房传感器可能存在故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.21567177772522, "api_error": null} {"episode_id": "SQ1_TP_C_0060", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0060.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260689, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-01T00:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在深夜出现高频抖动(短时间内反复触发占用/无占用),疑似传感器故障或接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 在 00:22:00 至 00:23:10 的约1分钟内,master_bedroom_occupancy 传感器产生了5次状态变化(1→0→1→0→1),每次间隔仅5-30秒,呈现快速抖动模式。\",\n \"推理步骤2: 正常的人体活动(如翻身、起夜)通常不会导致运动传感器在如此短的间隔内反复切换。PIR传感器一般有延迟保持机制,正常情况下不会在5秒内从占用变为无占用。\",\n \"推理步骤3: 对比当天其他时段(06:13、22:45),同一传感器的触发模式正常——单次触发后保持稳定状态,没有出现类似抖动。这说明抖动并非常态。\",\n \"推理步骤4: 主卧温度传感器工作正常,全天每30分钟稳定上报数据,数值在22.9°C至25.87°C之间合理波动,与其他房间温度趋势一致,无异常。\",\n \"推理步骤5: 综合判断,温度传感器正常,但运动传感器存在间歇性抖动故障的可能。由于仅出现一次且后续恢复正常,置信度为中等。\"\n ],\n \"key_evidence\": [\n \"00:22:00-00:23:10 期间 master_bedroom_occupancy 在约50秒内产生5次状态翻转(Occupancy 在0和1之间快速切换),间隔最短仅5秒\",\n \"同一传感器在当天其他时段(06:13、22:45)触发行为正常,无抖动现象\",\n \"主卧温度传感器全天数据连续、稳定,未出现 None 值或异常跳变\"\n ],\n \"recommended_actions\": [\n \"持续监控 master_bedroom_occupancy 传感器,观察未来几天是否再次出现类似的高频抖动模式\",\n \"检查传感器的安装位置是否稳固,排除松动或朝向窗帘/空调出风口等可能导致误触发的物理因素\",\n \"如抖动反复出现,考虑更换传感器或调整其灵敏度/延迟保持时间参数\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在深夜出现高频抖动(短时间内反复触发占用/无占用),疑似传感器故障或接触不良。", "reasoning": ["推理步骤1: 在 00:22:00 至 00:23:10 的约1分钟内,master_bedroom_occupancy 传感器产生了5次状态变化(1→0→1→0→1),每次间隔仅5-30秒,呈现快速抖动模式。", "推理步骤2: 正常的人体活动(如翻身、起夜)通常不会导致运动传感器在如此短的间隔内反复切换。PIR传感器一般有延迟保持机制,正常情况下不会在5秒内从占用变为无占用。", "推理步骤3: 对比当天其他时段(06:13、22:45),同一传感器的触发模式正常——单次触发后保持稳定状态,没有出现类似抖动。这说明抖动并非常态。", "推理步骤4: 主卧温度传感器工作正常,全天每30分钟稳定上报数据,数值在22.9°C至25.87°C之间合理波动,与其他房间温度趋势一致,无异常。", "推理步骤5: 综合判断,温度传感器正常,但运动传感器存在间歇性抖动故障的可能。由于仅出现一次且后续恢复正常,置信度为中等。"], "key_evidence": ["00:22:00-00:23:10 期间 master_bedroom_occupancy 在约50秒内产生5次状态翻转(Occupancy 在0和1之间快速切换),间隔最短仅5秒", "同一传感器在当天其他时段(06:13、22:45)触发行为正常,无抖动现象", "主卧温度传感器全天数据连续、稳定,未出现 None 值或异常跳变"], "recommended_actions": ["持续监控 master_bedroom_occupancy 传感器,观察未来几天是否再次出现类似的高频抖动模式", "检查传感器的安装位置是否稳固,排除松动或朝向窗帘/空调出风口等可能导致误触发的物理因素", "如抖动反复出现,考虑更换传感器或调整其灵敏度/延迟保持时间参数"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.834856033325195, "api_error": null} {"episode_id": "SQ1_TP_C_0062", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0062.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20260691, "scenario_id": "DF-06", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-26T23:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房窗帘在23:17收到关闭指令后持续处于运动状态,未能到达目标位置,疑似机械卡住或电机故障。\",\n \"reasoning\": [\n \"推理步骤1: 23:17:00 儿童房窗帘收到 DownOrClose 指令,OperationalStatus 变为 0b000010(表示正在向下/关闭方向运动)。\",\n \"推理步骤2: 23:17:30 窗帘位置报告为 5000(50%),仍在运动中(OperationalStatus = 0b000010)。\",\n \"推理步骤3: 23:18:00 窗帘 OperationalStatus 仍为 0b000010,说明经过1分钟仍未完成关闭动作。正常窗帘从完全打开(10000)到完全关闭(0)不应持续超过30-60秒,且30秒内只移动了50%后似乎停滞。\",\n \"推理步骤4: 日志在23:18之后没有窗帘到达终点(OperationalStatus = 0,位置 = 10000 即完全关闭)的记录,表明窗帘可能卡在中间位置持续尝试运动。\",\n \"推理步骤5: 儿童房其他传感器工作正常——温度传感器全天每30分钟规律上报,数值与其他房间一致且符合昼夜温度变化规律;运动传感器在06:11和16:32正常触发,与开灯/开门等事件吻合;窗户接触传感器无异常报告。\"\n ],\n \"key_evidence\": [\n \"23:17:00 至 23:18:00 窗帘 OperationalStatus 持续为 0b000010(运动中),超过正常完成时间\",\n \"23:17:30 位置为 5000(50%),之后无到达目标位置的记录\",\n \"儿童房温度传感器、运动传感器、窗户传感器全天数据正常,排除区域性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查儿童房窗帘导轨是否有异物阻挡或帘布是否卡住\",\n \"手动发送 StopMotion 指令停止电机,避免电机长时间堵转过热\",\n \"如果问题反复出现,检查窗帘电机是否需要维护或更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "儿童房窗帘在23:17收到关闭指令后持续处于运动状态,未能到达目标位置,疑似机械卡住或电机故障。", "reasoning": ["推理步骤1: 23:17:00 儿童房窗帘收到 DownOrClose 指令,OperationalStatus 变为 0b000010(表示正在向下/关闭方向运动)。", "推理步骤2: 23:17:30 窗帘位置报告为 5000(50%),仍在运动中(OperationalStatus = 0b000010)。", "推理步骤3: 23:18:00 窗帘 OperationalStatus 仍为 0b000010,说明经过1分钟仍未完成关闭动作。正常窗帘从完全打开(10000)到完全关闭(0)不应持续超过30-60秒,且30秒内只移动了50%后似乎停滞。", "推理步骤4: 日志在23:18之后没有窗帘到达终点(OperationalStatus = 0,位置 = 10000 即完全关闭)的记录,表明窗帘可能卡在中间位置持续尝试运动。", "推理步骤5: 儿童房其他传感器工作正常——温度传感器全天每30分钟规律上报,数值与其他房间一致且符合昼夜温度变化规律;运动传感器在06:11和16:32正常触发,与开灯/开门等事件吻合;窗户接触传感器无异常报告。"], "key_evidence": ["23:17:00 至 23:18:00 窗帘 OperationalStatus 持续为 0b000010(运动中),超过正常完成时间", "23:17:30 位置为 5000(50%),之后无到达目标位置的记录", "儿童房温度传感器、运动传感器、窗户传感器全天数据正常,排除区域性通信故障"], "recommended_actions": ["检查儿童房窗帘导轨是否有异物阻挡或帘布是否卡住", "手动发送 StopMotion 指令停止电机,避免电机长时间堵转过热", "如果问题反复出现,检查窗帘电机是否需要维护或更换"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.795316457748413, "api_error": null} {"episode_id": "SQ1_TP_C_0068", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0068.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260697, "scenario_id": "DF-05", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-15T22:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房烟雾报警器在 22:08 触发硬件故障告警,kitchen 区域存在至少两个设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器 (kitchen_temp_sensor) 在 07:00:09、07:13:00、18:23:00、19:25:00 四次报告 MeasuredValue = None,表示传感器未能返回有效温度读数。\",\n \"推理步骤2: 这些 None 值均出现在灶具 (kitchen_cook_surface) 开启或刚关闭后不久,可能是烹饪产生的高温或油烟干扰了传感器工作,也可能是传感器本身存在间歇性故障。\",\n \"推理步骤3: 值得注意的是,每次 None 之后的下一个整点读数又恢复了正常数值(如 07:30 报 2426、18:30 报 2457、19:30 报 2426),说明传感器并非完全失效,而是在特定条件下间歇性丢失数据。\",\n \"推理步骤4: 厨房烟雾报警器 (kitchen_smoke_alarm) 在 22:08 触发了 HardwareFaultAlert = True、ExpressedState = 5 以及 HardwareFault 事件。此时并无烹饪活动,厨房温度约 23.5°C,不存在真实火灾条件,因此这是设备自身硬件故障而非真实烟雾告警。\",\n \"推理步骤5: 两个厨房传感器设备同时存在异常:温度传感器间歇性失效 + 烟雾报警器硬件故障,需要排查是否存在共同原因(如供电不稳、通信干扰)或各自独立的硬件问题。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:09、07:13:00、18:23:00、19:25:00 四次报告 MeasuredValue = None\",\n \"None 值均与灶具使用时段高度相关(灶具 06:59-07:12 开启、18:22-19:24 开启)\",\n \"kitchen_smoke_alarm 在 22:08 触发 HardwareFaultAlert = True 和 ExpressedState = 5(硬件故障状态)\",\n \"烟雾报警器故障时无任何烹饪活动,厨房温度正常(约 23.5°C),排除真实火警\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房烟雾报警器硬件状态,必要时更换设备,确保火灾监测能力不中断\",\n \"检查厨房温度传感器的安装位置,若距灶具过近应重新选址,避免烹饪高温导致读数异常\",\n \"排查厨房区域传感器的供电和 Matter 网络通信质量,确认是否存在共性基础设施问题\",\n \"在烟雾报警器修复前,考虑将客厅烟雾报警器 (living_room_smoke_alarm) 的告警灵敏度适当提高,作为临时补偿措施\",\n \"对厨房温度传感器进行固件检查或重置,观察 None 值是否仍然出现\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房烟雾报警器在 22:08 触发硬件故障告警,kitchen 区域存在至少两个设备异常。", "reasoning": ["推理步骤1: 厨房温度传感器 (kitchen_temp_sensor) 在 07:00:09、07:13:00、18:23:00、19:25:00 四次报告 MeasuredValue = None,表示传感器未能返回有效温度读数。", "推理步骤2: 这些 None 值均出现在灶具 (kitchen_cook_surface) 开启或刚关闭后不久,可能是烹饪产生的高温或油烟干扰了传感器工作,也可能是传感器本身存在间歇性故障。", "推理步骤3: 值得注意的是,每次 None 之后的下一个整点读数又恢复了正常数值(如 07:30 报 2426、18:30 报 2457、19:30 报 2426),说明传感器并非完全失效,而是在特定条件下间歇性丢失数据。", "推理步骤4: 厨房烟雾报警器 (kitchen_smoke_alarm) 在 22:08 触发了 HardwareFaultAlert = True、ExpressedState = 5 以及 HardwareFault 事件。此时并无烹饪活动,厨房温度约 23.5°C,不存在真实火灾条件,因此这是设备自身硬件故障而非真实烟雾告警。", "推理步骤5: 两个厨房传感器设备同时存在异常:温度传感器间歇性失效 + 烟雾报警器硬件故障,需要排查是否存在共同原因(如供电不稳、通信干扰)或各自独立的硬件问题。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:09、07:13:00、18:23:00、19:25:00 四次报告 MeasuredValue = None", "None 值均与灶具使用时段高度相关(灶具 06:59-07:12 开启、18:22-19:24 开启)", "kitchen_smoke_alarm 在 22:08 触发 HardwareFaultAlert = True 和 ExpressedState = 5(硬件故障状态)", "烟雾报警器故障时无任何烹饪活动,厨房温度正常(约 23.5°C),排除真实火警"], "recommended_actions": ["立即检查厨房烟雾报警器硬件状态,必要时更换设备,确保火灾监测能力不中断", "检查厨房温度传感器的安装位置,若距灶具过近应重新选址,避免烹饪高温导致读数异常", "排查厨房区域传感器的供电和 Matter 网络通信质量,确认是否存在共性基础设施问题", "在烟雾报警器修复前,考虑将客厅烟雾报警器 (living_room_smoke_alarm) 的告警灵敏度适当提高,作为临时补偿措施", "对厨房温度传感器进行固件检查或重置,观察 None 值是否仍然出现"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.416638374328613, "api_error": null} {"episode_id": "SQ1_TP_C_0069", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0069.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20260698, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-13T12:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"entrance 区域的两个传感器(玄关运动传感器 entrance_occupancy 和入户门传感器 front_door_contact)在整个 24 小时日志中无任何数据上报,疑似设备离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。\",\n \"推理步骤2: 在整整 24 小时的日志中,front_door_contact 和 entrance_occupancy 没有产生任何一条状态上报事件。\",\n \"推理步骤3: 入户门锁(front_door_lock)在 12:34 有 LockDoor 指令和 LockState 变化记录,说明入户门确实有人操作过,门锁本身在线。\",\n \"推理步骤4: 门锁被操作时,入户门传感器(front_door_contact)理应检测到门的开合状态变化并上报,但日志中完全没有对应的 BooleanState 事件,这高度异常。\",\n \"推理步骤5: 同理,有人在门口操作门锁,玄关运动传感器(entrance_occupancy)也应检测到人体存在并上报 Occupancy 事件,但同样完全缺失。\",\n \"推理步骤6: 其他区域的同类传感器(如 dining_room_occupancy、living_room_occupancy 等)虽然在本日志中也未出现事件,但 entrance 区域有明确的人为活动佐证(门锁操作),因此 entrance 传感器的静默不能用'无人经过'来解释。\",\n \"推理步骤7: 综合判断,front_door_contact 和 entrance_occupancy 最可能处于离线、电池耗尽或硬件故障状态,属于设备故障。\"\n ],\n \"key_evidence\": [\n \"12:34 入户门锁有两次 LockDoor 操作及 LockState 变化,证明有人在入户门活动\",\n \"front_door_contact 全天零上报——门锁操作时未检测到门的开合\",\n \"entrance_occupancy 全天零上报——门口有人活动时未检测到运动\",\n \"门锁还触发了 DoorLockAlarm(AlarmCode=0) 事件,表明锁定过程可能存在异常,进一步说明门口确有活动\"\n ],\n \"recommended_actions\": [\n \"立即检查 front_door_contact 和 entrance_occupancy 的设备在线状态和电池电量\",\n \"尝试对两个传感器进行手动触发测试(开关门、在玄关走动),确认是否能正常上报\",\n \"如确认离线,更换电池或重新配网;如硬件故障则更换设备\",\n \"入户门传感器是安防核心设备,在修复前建议启用门锁自身的告警功能作为临时替代方案\",\n \"排查 DoorLockAlarm(AlarmCode=0) 的含义(通常为锁定失败告警),确认门锁机械部分是否正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "entrance 区域的两个传感器(玄关运动传感器 entrance_occupancy 和入户门传感器 front_door_contact)在整个 24 小时日志中无任何数据上报,疑似设备离线或故障。", "reasoning": ["推理步骤1: entrance 区域共有 4 个设备——入户门锁(front_door_lock)、入户门传感器(front_door_contact)、玄关灯(entrance_light)、玄关运动传感器(entrance_occupancy)。", "推理步骤2: 在整整 24 小时的日志中,front_door_contact 和 entrance_occupancy 没有产生任何一条状态上报事件。", "推理步骤3: 入户门锁(front_door_lock)在 12:34 有 LockDoor 指令和 LockState 变化记录,说明入户门确实有人操作过,门锁本身在线。", "推理步骤4: 门锁被操作时,入户门传感器(front_door_contact)理应检测到门的开合状态变化并上报,但日志中完全没有对应的 BooleanState 事件,这高度异常。", "推理步骤5: 同理,有人在门口操作门锁,玄关运动传感器(entrance_occupancy)也应检测到人体存在并上报 Occupancy 事件,但同样完全缺失。", "推理步骤6: 其他区域的同类传感器(如 dining_room_occupancy、living_room_occupancy 等)虽然在本日志中也未出现事件,但 entrance 区域有明确的人为活动佐证(门锁操作),因此 entrance 传感器的静默不能用'无人经过'来解释。", "推理步骤7: 综合判断,front_door_contact 和 entrance_occupancy 最可能处于离线、电池耗尽或硬件故障状态,属于设备故障。"], "key_evidence": ["12:34 入户门锁有两次 LockDoor 操作及 LockState 变化,证明有人在入户门活动", "front_door_contact 全天零上报——门锁操作时未检测到门的开合", "entrance_occupancy 全天零上报——门口有人活动时未检测到运动", "门锁还触发了 DoorLockAlarm(AlarmCode=0) 事件,表明锁定过程可能存在异常,进一步说明门口确有活动"], "recommended_actions": ["立即检查 front_door_contact 和 entrance_occupancy 的设备在线状态和电池电量", "尝试对两个传感器进行手动触发测试(开关门、在玄关走动),确认是否能正常上报", "如确认离线,更换电池或重新配网;如硬件故障则更换设备", "入户门传感器是安防核心设备,在修复前建议启用门锁自身的告警功能作为临时替代方案", "排查 DoorLockAlarm(AlarmCode=0) 的含义(通常为锁定失败告警),确认门锁机械部分是否正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.683271169662476, "api_error": null} {"episode_id": "SQ1_TP_C_0072", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_C_0072.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260701, "scenario_id": "DF-03", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-20T19:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在19:55-19:56期间出现快速反复触发(抖动),可能存在传感器故障或安装松动问题。\",\n \"reasoning\": [\n \"推理步骤1: 主卧温度传感器方面,全天温度变化范围约为22.92°C至25.81°C,与其他房间(客厅、儿童房、厨房)的变化趋势高度一致,呈现正常的昼夜温度曲线(凌晨低、中午高、傍晚回落),无异常温度偏离,温度传感器工作正常。\",\n \"推理步骤2: 主卧运动传感器在19:55:00至19:56:10的约70秒内,产生了5次状态变化(1→0→1→0→1),每次占用/清除间隔仅约30秒。这种高频抖动模式不符合正常人体活动特征——正常情况下人进入房间后运动传感器应保持占用状态一段时间,而非在30秒内反复切换。\",\n \"推理步骤3: 整个24小时日志中,除了这一段70秒的密集触发外,主卧运动传感器没有任何其他事件记录。全天无活动而突然出现短时间密集抖动,更倾向于传感器硬件抖动、安装松动或探测区域边缘干扰(如窗帘飘动、热源变化),而非真实的入侵行为(入侵通常伴随门锁/门磁等其他传感器联动事件,但日志中均无此类记录)。\"\n ],\n \"key_evidence\": [\n \"19:55:00-19:56:10期间运动传感器在70秒内产生5次状态翻转(Occupancy 1→0→1→0→1),每次间隔仅约30秒\",\n \"全天24小时仅此一段运动事件,其余时间无任何触发记录\",\n \"同时段入户门锁、入户门磁、主卧窗户传感器均无任何事件,排除入侵可能\",\n \"主卧温度传感器全天数据与其他房间一致,变化趋势正常,无异常\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装是否牢固,确认没有松动或倾斜\",\n \"排查传感器探测范围内是否有干扰源(如正对窗帘、空调出风口、宠物活动区域等)\",\n \"持续观察未来几天该传感器是否再次出现类似短时间密集抖动,若反复出现建议更换传感器或调整灵敏度\",\n \"如确认无人在家期间频繁触发,可考虑启用传感器去抖(debounce)策略,避免误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧运动传感器在19:55-19:56期间出现快速反复触发(抖动),可能存在传感器故障或安装松动问题。", "reasoning": ["推理步骤1: 主卧温度传感器方面,全天温度变化范围约为22.92°C至25.81°C,与其他房间(客厅、儿童房、厨房)的变化趋势高度一致,呈现正常的昼夜温度曲线(凌晨低、中午高、傍晚回落),无异常温度偏离,温度传感器工作正常。", "推理步骤2: 主卧运动传感器在19:55:00至19:56:10的约70秒内,产生了5次状态变化(1→0→1→0→1),每次占用/清除间隔仅约30秒。这种高频抖动模式不符合正常人体活动特征——正常情况下人进入房间后运动传感器应保持占用状态一段时间,而非在30秒内反复切换。", "推理步骤3: 整个24小时日志中,除了这一段70秒的密集触发外,主卧运动传感器没有任何其他事件记录。全天无活动而突然出现短时间密集抖动,更倾向于传感器硬件抖动、安装松动或探测区域边缘干扰(如窗帘飘动、热源变化),而非真实的入侵行为(入侵通常伴随门锁/门磁等其他传感器联动事件,但日志中均无此类记录)。"], "key_evidence": ["19:55:00-19:56:10期间运动传感器在70秒内产生5次状态翻转(Occupancy 1→0→1→0→1),每次间隔仅约30秒", "全天24小时仅此一段运动事件,其余时间无任何触发记录", "同时段入户门锁、入户门磁、主卧窗户传感器均无任何事件,排除入侵可能", "主卧温度传感器全天数据与其他房间一致,变化趋势正常,无异常"], "recommended_actions": ["检查主卧运动传感器的安装是否牢固,确认没有松动或倾斜", "排查传感器探测范围内是否有干扰源(如正对窗帘、空调出风口、宠物活动区域等)", "持续观察未来几天该传感器是否再次出现类似短时间密集抖动,若反复出现建议更换传感器或调整灵敏度", "如确认无人在家期间频繁触发,可考虑启用传感器去抖(debounce)策略,避免误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 3, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.800349473953247, "api_error": null} {"episode_id": "SQ1_TP_D_0002", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0002.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20260631, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-10T09:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在双重故障:在灶具使用期间持续报告 None(空值),且烟雾报警器报告硬件故障,导致厨房安全监测能力严重下降。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中三次灶具使用期间(06:04、10:54、17:05)均报告 MeasuredValue = None,说明传感器在灶具开启后无法正常读数。\",\n \"推理步骤2: 灶具关闭后,传感器仍然立即报告 None(06:35、11:27、17:25),直到下一个整点半点的定时采样周期才恢复正常数值,说明故障与灶具运行存在关联但恢复存在延迟。\",\n \"推理步骤3: 对比客厅和卧室温度传感器,它们在全天所有采样点均正常返回数值,从未出现 None,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。\",\n \"推理步骤4: 可能的故障原因是灶具产生的高温或电磁干扰导致传感器读数超出量程或通信异常,传感器以 None 代替无效读数。\",\n \"推理步骤5: 09:15 厨房烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5(硬件故障状态),且触发了 HardwareFault 事件。这意味着厨房的烟雾/CO 检测能力也已失效。\",\n \"推理步骤6: 对于独居老人家庭,厨房温度传感器和烟雾报警器是防范火灾和燃气泄漏的核心安全设备。两者同时存在故障,意味着厨房在烹饪时处于安全监测盲区,风险极高。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(06:04、06:35、10:54、11:27、17:05、17:25),而非灶具使用时段读数正常\",\n \"厨房烟雾报警器在 09:15 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件,且此后日志中未见恢复记录\",\n \"同一时段客厅和卧室温度传感器始终正常返回数值,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房烟雾报警器,硬件故障状态下无法检测烟雾和一氧化碳,这是最紧急的安全隐患\",\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数\",\n \"在传感器修复前,建议老人烹饪时保持厨房窗户通风,并由家人或护理人员远程关注灶具使用时长\",\n \"考虑为厨房温度传感器增加耐高温防护罩,或将其重新部署到远离灶具但仍能监测厨房整体温度的位置\",\n \"联系设备厂商确认温度传感器报告 None 的具体触发条件(量程溢出、通信超时还是硬件保护机制)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在双重故障:在灶具使用期间持续报告 None(空值),且烟雾报警器报告硬件故障,导致厨房安全监测能力严重下降。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中三次灶具使用期间(06:04、10:54、17:05)均报告 MeasuredValue = None,说明传感器在灶具开启后无法正常读数。", "推理步骤2: 灶具关闭后,传感器仍然立即报告 None(06:35、11:27、17:25),直到下一个整点半点的定时采样周期才恢复正常数值,说明故障与灶具运行存在关联但恢复存在延迟。", "推理步骤3: 对比客厅和卧室温度传感器,它们在全天所有采样点均正常返回数值,从未出现 None,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。", "推理步骤4: 可能的故障原因是灶具产生的高温或电磁干扰导致传感器读数超出量程或通信异常,传感器以 None 代替无效读数。", "推理步骤5: 09:15 厨房烟雾报警器报告 HardwareFaultAlert = True、ExpressedState = 5(硬件故障状态),且触发了 HardwareFault 事件。这意味着厨房的烟雾/CO 检测能力也已失效。", "推理步骤6: 对于独居老人家庭,厨房温度传感器和烟雾报警器是防范火灾和燃气泄漏的核心安全设备。两者同时存在故障,意味着厨房在烹饪时处于安全监测盲区,风险极高。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(06:04、06:35、10:54、11:27、17:05、17:25),而非灶具使用时段读数正常", "厨房烟雾报警器在 09:15 报告 HardwareFaultAlert = True,ExpressedState = 5,触发 HardwareFault 事件,且此后日志中未见恢复记录", "同一时段客厅和卧室温度传感器始终正常返回数值,排除系统性故障"], "recommended_actions": ["立即检修或更换厨房烟雾报警器,硬件故障状态下无法检测烟雾和一氧化碳,这是最紧急的安全隐患", "检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数", "在传感器修复前,建议老人烹饪时保持厨房窗户通风,并由家人或护理人员远程关注灶具使用时长", "考虑为厨房温度传感器增加耐高温防护罩,或将其重新部署到远离灶具但仍能监测厨房整体温度的位置", "联系设备厂商确认温度传感器报告 None 的具体触发条件(量程溢出、通信超时还是硬件保护机制)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.602940797805786, "api_error": null} {"episode_id": "SQ1_TP_D_0003", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0003.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20260632, "scenario_id": "DF-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-16T15:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"卧室区域所有传感器工作正常,数据采集和响应均符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无None值。夜间温度约21.9°C,午间峰值约24.7°C,符合夏季室内自然温度变化曲线。\",\n \"推理步骤2: 卧室运动传感器(bedroom_occupancy)在05:28、12:25、14:07、20:55四个时间点检测到占用,分别对应老人起床、午休、午休起身、晚间就寝,与独居老人的日常作息高度吻合。\",\n \"推理步骤3: 卧室窗帘(bedroom_window)在05:28打开(0%)、12:25关闭(10000即100%)午休遮光、14:07再次打开(0%)、20:55晚间关闭(10000即100%),操作逻辑合理,与运动传感器的触发时间一致,说明设备联动正常。\",\n \"推理步骤4: 卧室灯(bedroom_light)在05:28开启配合起床、20:55短暂开启后关闭配合就寝,床头灯全天无异常事件。卧室窗户传感器(bedroom_window_contact)全天无开关事件,说明窗户保持关闭状态,属正常情况。\",\n \"推理步骤5: 对比厨房温度传感器多次出现MeasuredValue=None的情况,卧室温度传感器从未出现None值,数据连续性良好,进一步确认卧室传感器工作稳定。\"\n ],\n \"key_evidence\": [\n \"bedroom_temp_sensor 全天48个采样点数据完整,无None值,温度范围21.91°C~24.77°C,变化平滑合理\",\n \"bedroom_occupancy 四次触发(05:28/12:25/14:07/20:55)与老人起床、午休、起身、就寝的作息完全吻合\",\n \"bedroom_window 窗帘四次动作与运动传感器触发时间精确对应,设备联动响应正常\",\n \"bedroom_light 开关时间与起床和就寝场景匹配,无异常闪烁或无故触发\"\n ],\n \"recommended_actions\": [\n \"卧室传感器当前状态良好,建议保持定期巡检周期不变\",\n \"注意厨房温度传感器多次报告None值,建议优先排查厨房传感器是否存在故障或受灶具热源干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "卧室区域所有传感器工作正常,数据采集和响应均符合预期。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报一次数据,无缺失、无None值。夜间温度约21.9°C,午间峰值约24.7°C,符合夏季室内自然温度变化曲线。", "推理步骤2: 卧室运动传感器(bedroom_occupancy)在05:28、12:25、14:07、20:55四个时间点检测到占用,分别对应老人起床、午休、午休起身、晚间就寝,与独居老人的日常作息高度吻合。", "推理步骤3: 卧室窗帘(bedroom_window)在05:28打开(0%)、12:25关闭(10000即100%)午休遮光、14:07再次打开(0%)、20:55晚间关闭(10000即100%),操作逻辑合理,与运动传感器的触发时间一致,说明设备联动正常。", "推理步骤4: 卧室灯(bedroom_light)在05:28开启配合起床、20:55短暂开启后关闭配合就寝,床头灯全天无异常事件。卧室窗户传感器(bedroom_window_contact)全天无开关事件,说明窗户保持关闭状态,属正常情况。", "推理步骤5: 对比厨房温度传感器多次出现MeasuredValue=None的情况,卧室温度传感器从未出现None值,数据连续性良好,进一步确认卧室传感器工作稳定。"], "key_evidence": ["bedroom_temp_sensor 全天48个采样点数据完整,无None值,温度范围21.91°C~24.77°C,变化平滑合理", "bedroom_occupancy 四次触发(05:28/12:25/14:07/20:55)与老人起床、午休、起身、就寝的作息完全吻合", "bedroom_window 窗帘四次动作与运动传感器触发时间精确对应,设备联动响应正常", "bedroom_light 开关时间与起床和就寝场景匹配,无异常闪烁或无故触发"], "recommended_actions": ["卧室传感器当前状态良好,建议保持定期巡检周期不变", "注意厨房温度传感器多次报告None值,建议优先排查厨房传感器是否存在故障或受灶具热源干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.268024921417236, "api_error": null} {"episode_id": "SQ1_TP_D_0012", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0012.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20260641, "scenario_id": "DF-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T10:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度和占用数据均符合预期模式\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报一次数据,无缺失或None值,数据连续性良好\",\n \"推理步骤2: 温度变化曲线合理——夜间约22.9-23.1°C,白天随气温上升至峰值约25.9°C(12:00),午后逐步回落至夜间23.3°C,符合夏季自然温度波动规律\",\n \"推理步骤3: 客厅运动传感器在住户活动时段(08:32回家、13:55午休后、19:37晚间)正确触发Occupancy=1,与灯光开关事件时间吻合,逻辑一致\",\n \"推理步骤4: 客厅灯光在有人时开启、离开时关闭(07:01出门前无客厅活动、12:20关灯去午休、20:20关灯去洗漱),行为模式与独居老人日常作息匹配\",\n \"推理步骤5: 对比厨房温度传感器在灶具开启时出现多次None值(传感器可能受高温干扰),客厅传感器全天无此现象,进一步确认客厅传感器状态健康\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48个采样点均正常上报数值,无None或异常跳变\",\n \"客厅运动传感器触发时间与入户门开锁、灯光操作等事件高度吻合(08:32、13:55、19:37)\",\n \"温度日变化范围22.9°C-25.9°C,波动平缓且符合季节特征\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,客厅传感器运行状态良好\",\n \"建议关注厨房温度传感器在灶具使用期间报告None值的问题,可能需要检查其耐热性或安装位置\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度和占用数据均符合预期模式", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报一次数据,无缺失或None值,数据连续性良好", "推理步骤2: 温度变化曲线合理——夜间约22.9-23.1°C,白天随气温上升至峰值约25.9°C(12:00),午后逐步回落至夜间23.3°C,符合夏季自然温度波动规律", "推理步骤3: 客厅运动传感器在住户活动时段(08:32回家、13:55午休后、19:37晚间)正确触发Occupancy=1,与灯光开关事件时间吻合,逻辑一致", "推理步骤4: 客厅灯光在有人时开启、离开时关闭(07:01出门前无客厅活动、12:20关灯去午休、20:20关灯去洗漱),行为模式与独居老人日常作息匹配", "推理步骤5: 对比厨房温度传感器在灶具开启时出现多次None值(传感器可能受高温干扰),客厅传感器全天无此现象,进一步确认客厅传感器状态健康"], "key_evidence": ["客厅温度传感器全天48个采样点均正常上报数值,无None或异常跳变", "客厅运动传感器触发时间与入户门开锁、灯光操作等事件高度吻合(08:32、13:55、19:37)", "温度日变化范围22.9°C-25.9°C,波动平缓且符合季节特征"], "recommended_actions": ["无需采取措施,客厅传感器运行状态良好", "建议关注厨房温度传感器在灶具使用期间报告None值的问题,可能需要检查其耐热性或安装位置"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.484123706817627, "api_error": null} {"episode_id": "SQ1_TP_D_0024", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0024.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20260653, "scenario_id": "DF-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-01T00:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开启/关闭前后反复报告 None 值,存在间歇性故障,可能导致无法及时检测厨房高温风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在常规半小时周期上报中数据正常(值在 2290-2580 范围内波动),但在灶具操作前后多次报告 MeasuredValue = None。\",\n \"推理步骤2: 具体出现 None 的时间点共 6 次——05:51:07(灶具开启后)、06:41:00(灶具关闭后)、10:56:00(灶具开启后)、11:27:00(灶具关闭后)、17:10:00(灶具开启后)、17:31:00(灶具关闭后)。每次灶具状态变化后约 30 秒到 1 分钟内,温度传感器都会上报一次 None。\",\n \"推理步骤3: 这种模式高度规律——仅在灶具 OnOff 状态切换后立即出现,而在正常的半小时定时上报周期中从未出现 None,说明这不是随机通信丢包,而是与灶具操作存在因果关联。\",\n \"推理步骤4: 可能的故障原因包括:灶具开关时产生的电磁干扰导致传感器瞬时读数异常;传感器在灶具附近温度骤变时超出量程或采样失败;传感器与灶具共用电路,开关瞬间电压波动影响传感器工作。\",\n \"推理步骤5: 对于独居老人场景,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间(恰恰是最需要监测的时段)无法正常读数,将形成安全监测盲区。\"\n ],\n \"key_evidence\": [\n \"灶具每次开启或关闭后约 30-60 秒,kitchen_temp_sensor 均报告 MeasuredValue = None,共出现 6 次(05:51、06:41、10:56、11:27、17:10、17:31)\",\n \"在非灶具操作时段,同一传感器的半小时定时上报全部正常,无任何 None 值\",\n \"故障模式与灶具 OnOff 状态切换严格一一对应,具有明确的时间因果关系\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器与灶具之间的物理距离和电气连接,排查电磁干扰或共用电路问题\",\n \"检查传感器固件版本,确认是否存在已知的瞬态读数异常 bug,必要时升级固件\",\n \"考虑将温度传感器迁移到远离灶具但仍能有效监测厨房温度的位置,或增加一个冗余温度传感器\",\n \"在传感器报告 None 期间,系统应保持上一次有效读数并标记为 stale,而非静默丢弃,确保不会遗漏高温报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开启/关闭前后反复报告 None 值,存在间歇性故障,可能导致无法及时检测厨房高温风险。", "reasoning": ["推理步骤1: 厨房温度传感器在常规半小时周期上报中数据正常(值在 2290-2580 范围内波动),但在灶具操作前后多次报告 MeasuredValue = None。", "推理步骤2: 具体出现 None 的时间点共 6 次——05:51:07(灶具开启后)、06:41:00(灶具关闭后)、10:56:00(灶具开启后)、11:27:00(灶具关闭后)、17:10:00(灶具开启后)、17:31:00(灶具关闭后)。每次灶具状态变化后约 30 秒到 1 分钟内,温度传感器都会上报一次 None。", "推理步骤3: 这种模式高度规律——仅在灶具 OnOff 状态切换后立即出现,而在正常的半小时定时上报周期中从未出现 None,说明这不是随机通信丢包,而是与灶具操作存在因果关联。", "推理步骤4: 可能的故障原因包括:灶具开关时产生的电磁干扰导致传感器瞬时读数异常;传感器在灶具附近温度骤变时超出量程或采样失败;传感器与灶具共用电路,开关瞬间电压波动影响传感器工作。", "推理步骤5: 对于独居老人场景,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间(恰恰是最需要监测的时段)无法正常读数,将形成安全监测盲区。"], "key_evidence": ["灶具每次开启或关闭后约 30-60 秒,kitchen_temp_sensor 均报告 MeasuredValue = None,共出现 6 次(05:51、06:41、10:56、11:27、17:10、17:31)", "在非灶具操作时段,同一传感器的半小时定时上报全部正常,无任何 None 值", "故障模式与灶具 OnOff 状态切换严格一一对应,具有明确的时间因果关系"], "recommended_actions": ["检查厨房温度传感器与灶具之间的物理距离和电气连接,排查电磁干扰或共用电路问题", "检查传感器固件版本,确认是否存在已知的瞬态读数异常 bug,必要时升级固件", "考虑将温度传感器迁移到远离灶具但仍能有效监测厨房温度的位置,或增加一个冗余温度传感器", "在传感器报告 None 期间,系统应保持上一次有效读数并标记为 stale,而非静默丢弃,确保不会遗漏高温报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.231658935546875, "api_error": null} {"episode_id": "SQ1_TP_D_0035", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0035.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20260664, "scenario_id": "DF-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T15:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器和运动传感器均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无任何缺失或 None 值。温度从夜间约23.0°C逐步升至中午峰值约25.75°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化曲线。\",\n \"推理步骤2: 客厅温度与卧室、厨房温度传感器的变化趋势高度一致(同升同降),三者之间的温差保持稳定(客厅略高于卧室约1°C,与厨房接近),不存在某个传感器偏离整体趋势的情况,排除温度传感器漂移或故障。\",\n \"推理步骤3: 客厅运动传感器在合理时段触发——08:27老人外出回家后检测到占用、14:06午休后检测到占用、19:39晚间检测到占用,与老人的日常活动轨迹(出门→回家→午休→起床→晚间活动→就寝)完全吻合。\",\n \"推理步骤4: 客厅灯的开关行为与运动传感器联动正常:08:27回家后开灯、12:29去卧室午休时关灯、14:06起床后重新开灯、19:39调暗亮度(LevelControl=11)、20:32就寝前关灯,逻辑自洽。\",\n \"推理步骤5: 对比厨房温度传感器在灶具使用期间多次报告 None 值(06:02、06:23、10:56、11:39、16:56、17:33),客厅温度传感器全天48个采样点均正常返回数值,数据完整性为100%。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48次采样均有有效数值,无 None 或异常跳变,温度范围 2291~2575(约22.9°C~25.8°C)符合夏季室内正常波动\",\n \"客厅运动传感器仅在老人实际活动时段(08:27、14:06、19:39)触发,与入户门锁、卧室传感器等其他设备的活动时间线完全吻合\",\n \"客厅灯的亮灭时间与运动传感器检测结果一致,设备联动逻辑正常\"\n ],\n \"recommended_actions\": [\n \"客厅传感器状态良好,无需采取措施\",\n \"建议关注厨房温度传感器在灶具使用期间多次报告 None 值的问题,可能存在设备故障或受高温干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器和运动传感器均表现符合预期。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无任何缺失或 None 值。温度从夜间约23.0°C逐步升至中午峰值约25.75°C,再回落至夜间约23.3°C,符合夏季自然昼夜温度变化曲线。", "推理步骤2: 客厅温度与卧室、厨房温度传感器的变化趋势高度一致(同升同降),三者之间的温差保持稳定(客厅略高于卧室约1°C,与厨房接近),不存在某个传感器偏离整体趋势的情况,排除温度传感器漂移或故障。", "推理步骤3: 客厅运动传感器在合理时段触发——08:27老人外出回家后检测到占用、14:06午休后检测到占用、19:39晚间检测到占用,与老人的日常活动轨迹(出门→回家→午休→起床→晚间活动→就寝)完全吻合。", "推理步骤4: 客厅灯的开关行为与运动传感器联动正常:08:27回家后开灯、12:29去卧室午休时关灯、14:06起床后重新开灯、19:39调暗亮度(LevelControl=11)、20:32就寝前关灯,逻辑自洽。", "推理步骤5: 对比厨房温度传感器在灶具使用期间多次报告 None 值(06:02、06:23、10:56、11:39、16:56、17:33),客厅温度传感器全天48个采样点均正常返回数值,数据完整性为100%。"], "key_evidence": ["客厅温度传感器全天48次采样均有有效数值,无 None 或异常跳变,温度范围 2291~2575(约22.9°C~25.8°C)符合夏季室内正常波动", "客厅运动传感器仅在老人实际活动时段(08:27、14:06、19:39)触发,与入户门锁、卧室传感器等其他设备的活动时间线完全吻合", "客厅灯的亮灭时间与运动传感器检测结果一致,设备联动逻辑正常"], "recommended_actions": ["客厅传感器状态良好,无需采取措施", "建议关注厨房温度传感器在灶具使用期间多次报告 None 值的问题,可能存在设备故障或受高温干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.86008930206299, "api_error": null} {"episode_id": "SQ1_TP_D_0042", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0042.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20260671, "scenario_id": "DF-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T15:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"客厅区域传感器工作正常,温度传感器和运动传感器均表现符合预期。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无任何缺失(未出现 None 值),数据连续性良好。\",\n \"推理步骤2: 温度变化趋势合理——夜间约22.9°C,随日照升温至中午峰值约25.8°C,午后逐步回落至夜间约23.3°C,符合夏季(6月)自然昼夜温度曲线。\",\n \"推理步骤3: 客厅温度与厨房温度高度一致(差值通常在0.1°C以内),与卧室温度保持合理的1-2°C偏差(卧室夜间窗帘关闭、空间较小,温度略低属正常),各传感器之间交叉验证一致。\",\n \"推理步骤4: 客厅运动传感器在合理时段触发——08:24老人回家后检测到占用、14:10午休后检测到占用、19:40晚间检测到占用,与老人的出入门记录和其他房间活动时间线吻合。\",\n \"推理步骤5: 客厅灯光控制与运动传感器联动正常(08:24开灯、19:40调光至45、20:37关灯),且灯具亮度调节功能(LevelControl)工作正常。\",\n \"推理步骤6: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(05:56、06:24、11:02、11:28、17:10、17:32),客厅温度传感器全天48个采样点无一缺失,传感器健康状态良好。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器全天48次上报均有有效数值,无 None 值,数据完整率100%\",\n \"温度范围 22.91°C ~ 25.78°C,变化平滑且符合夏季昼夜自然规律\",\n \"客厅运动传感器在 08:24、14:10、19:40 三个时段触发,与入户门开锁记录及其他房间活动时间线一致\",\n \"客厅灯在运动检测后正常开启/调光/关闭,设备联动响应正常\"\n ],\n \"recommended_actions\": [\n \"客厅传感器无需处理,建议保持当前状态继续监测\",\n \"注意:厨房温度传感器多次上报 None 值,建议优先排查厨房温度传感器是否存在故障或受灶具高温干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "客厅区域传感器工作正常,温度传感器和运动传感器均表现符合预期。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟稳定上报数据,无任何缺失(未出现 None 值),数据连续性良好。", "推理步骤2: 温度变化趋势合理——夜间约22.9°C,随日照升温至中午峰值约25.8°C,午后逐步回落至夜间约23.3°C,符合夏季(6月)自然昼夜温度曲线。", "推理步骤3: 客厅温度与厨房温度高度一致(差值通常在0.1°C以内),与卧室温度保持合理的1-2°C偏差(卧室夜间窗帘关闭、空间较小,温度略低属正常),各传感器之间交叉验证一致。", "推理步骤4: 客厅运动传感器在合理时段触发——08:24老人回家后检测到占用、14:10午休后检测到占用、19:40晚间检测到占用,与老人的出入门记录和其他房间活动时间线吻合。", "推理步骤5: 客厅灯光控制与运动传感器联动正常(08:24开灯、19:40调光至45、20:37关灯),且灯具亮度调节功能(LevelControl)工作正常。", "推理步骤6: 对比厨房温度传感器多次出现 MeasuredValue = None 的情况(05:56、06:24、11:02、11:28、17:10、17:32),客厅温度传感器全天48个采样点无一缺失,传感器健康状态良好。"], "key_evidence": ["客厅温度传感器全天48次上报均有有效数值,无 None 值,数据完整率100%", "温度范围 22.91°C ~ 25.78°C,变化平滑且符合夏季昼夜自然规律", "客厅运动传感器在 08:24、14:10、19:40 三个时段触发,与入户门开锁记录及其他房间活动时间线一致", "客厅灯在运动检测后正常开启/调光/关闭,设备联动响应正常"], "recommended_actions": ["客厅传感器无需处理,建议保持当前状态继续监测", "注意:厨房温度传感器多次上报 None 值,建议优先排查厨房温度传感器是否存在故障或受灶具高温干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.14984369277954, "api_error": null} {"episode_id": "SQ1_TP_D_0049", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0049.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260678, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-06T19:38:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅窗帘在关闭过程中疑似卡住,OperationalStatus 持续显示运动状态但未见归零完成信号。\",\n \"reasoning\": [\n \"推理步骤1: 客厅共有5个传感器/执行器——温度传感器、运动传感器、灯、窗帘、窗户接触传感器、烟雾报警器。逐一检查其日志表现。\",\n \"推理步骤2: 温度传感器(living_room_temp_sensor)从凌晨00:00的2302(23.02°C)到中午12:00峰值2585(25.85°C),再回落到23:30的2337(23.37°C),变化平滑且与室外日间升温/夜间降温规律一致,与其他房间温度趋势同步,无异常跳变或None值,工作正常。\",\n \"推理步骤3: 运动传感器(living_room_occupancy)在08:36:09、14:05:13、19:38:00三次检测到占用,均与老人从其他房间移动过来的时间线吻合(如08:36开门回家、14:05午休后起身、19:38晚间活动),触发时机合理,工作正常。\",\n \"推理步骤4: 客厅灯(living_room_light)在08:36:19开启、12:35:00关闭(老人去午休)、14:05:19再次开启、20:22:00关闭(老人去洗漱准备睡觉),开关时间与运动传感器和老人活动轨迹一致。19:38:02还报告了LevelControl.CurrentLevel=12的调光操作,功能正常。\",\n \"推理步骤5: 客厅窗帘(living_room_window)在19:38:00收到DownOrClose命令,19:38:01报告OperationalStatus=0b000010(表示正在向关闭方向运动),19:38:30报告位置到达50%且仍在运动,19:39:00仍报告OperationalStatus=0b000010(仍在运动)。此后日志中再无该设备的状态更新——没有OperationalStatus归零(停止)的记录,也没有CurrentPositionLiftPercent100ths到达10000(完全关闭)的记录。\",\n \"推理步骤6: 正常窗帘关闭操作应在运动完成后报告OperationalStatus=0b000000和最终位置。从19:38:00到19:39:00已过1分钟仍在运动且只到50%,之后无任何完成事件,可能是窗帘电机卡住、轨道受阻或通信中断导致状态未更新。\",\n \"推理步骤7: 客厅窗户接触传感器(living_room_window_contact)和烟雾报警器(living_room_smoke_alarm)全天无事件触发,对于接触传感器说明窗户未被打开/关闭(正常),烟雾报警器无触发也属正常。\",\n \"推理步骤8: 综合来看,温度传感器、运动传感器、灯、窗户传感器、烟雾报警器均工作正常。唯一异常是窗帘设备在执行关闭命令后缺少运动完成的状态反馈,存在设备故障嫌疑。置信度为medium,因为也有可能是日志采集截断导致后续事件未被记录。\"\n ],\n \"key_evidence\": [\n \"19:38:01 ~ 19:39:00 窗帘OperationalStatus持续为0b000010(运动中),之后再无该设备的状态更新事件\",\n \"19:38:30 窗帘位置仅到达50%(5000),未见到达完全关闭(10000)的记录\",\n \"温度传感器全天48个读数均为有效数值,变化曲线平滑合理,无None值\",\n \"运动传感器3次触发均与老人活动轨迹时间线吻合\",\n \"客厅灯开关及调光操作均与人员活动一致\"\n ],\n \"recommended_actions\": [\n \"检查客厅窗帘电机及轨道是否存在物理卡阻,手动测试窗帘能否正常开合\",\n \"查看窗帘设备的Matter通信连接状态,确认是否存在离线或通信中断问题\",\n \"尝试重新发送窗帘定位命令,观察是否能正常响应并报告完成状态\",\n \"如问题持续,考虑重启窗帘控制器或检查固件版本是否需要更新\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅窗帘在关闭过程中疑似卡住,OperationalStatus 持续显示运动状态但未见归零完成信号。", "reasoning": ["推理步骤1: 客厅共有5个传感器/执行器——温度传感器、运动传感器、灯、窗帘、窗户接触传感器、烟雾报警器。逐一检查其日志表现。", "推理步骤2: 温度传感器(living_room_temp_sensor)从凌晨00:00的2302(23.02°C)到中午12:00峰值2585(25.85°C),再回落到23:30的2337(23.37°C),变化平滑且与室外日间升温/夜间降温规律一致,与其他房间温度趋势同步,无异常跳变或None值,工作正常。", "推理步骤3: 运动传感器(living_room_occupancy)在08:36:09、14:05:13、19:38:00三次检测到占用,均与老人从其他房间移动过来的时间线吻合(如08:36开门回家、14:05午休后起身、19:38晚间活动),触发时机合理,工作正常。", "推理步骤4: 客厅灯(living_room_light)在08:36:19开启、12:35:00关闭(老人去午休)、14:05:19再次开启、20:22:00关闭(老人去洗漱准备睡觉),开关时间与运动传感器和老人活动轨迹一致。19:38:02还报告了LevelControl.CurrentLevel=12的调光操作,功能正常。", "推理步骤5: 客厅窗帘(living_room_window)在19:38:00收到DownOrClose命令,19:38:01报告OperationalStatus=0b000010(表示正在向关闭方向运动),19:38:30报告位置到达50%且仍在运动,19:39:00仍报告OperationalStatus=0b000010(仍在运动)。此后日志中再无该设备的状态更新——没有OperationalStatus归零(停止)的记录,也没有CurrentPositionLiftPercent100ths到达10000(完全关闭)的记录。", "推理步骤6: 正常窗帘关闭操作应在运动完成后报告OperationalStatus=0b000000和最终位置。从19:38:00到19:39:00已过1分钟仍在运动且只到50%,之后无任何完成事件,可能是窗帘电机卡住、轨道受阻或通信中断导致状态未更新。", "推理步骤7: 客厅窗户接触传感器(living_room_window_contact)和烟雾报警器(living_room_smoke_alarm)全天无事件触发,对于接触传感器说明窗户未被打开/关闭(正常),烟雾报警器无触发也属正常。", "推理步骤8: 综合来看,温度传感器、运动传感器、灯、窗户传感器、烟雾报警器均工作正常。唯一异常是窗帘设备在执行关闭命令后缺少运动完成的状态反馈,存在设备故障嫌疑。置信度为medium,因为也有可能是日志采集截断导致后续事件未被记录。"], "key_evidence": ["19:38:01 ~ 19:39:00 窗帘OperationalStatus持续为0b000010(运动中),之后再无该设备的状态更新事件", "19:38:30 窗帘位置仅到达50%(5000),未见到达完全关闭(10000)的记录", "温度传感器全天48个读数均为有效数值,变化曲线平滑合理,无None值", "运动传感器3次触发均与老人活动轨迹时间线吻合", "客厅灯开关及调光操作均与人员活动一致"], "recommended_actions": ["检查客厅窗帘电机及轨道是否存在物理卡阻,手动测试窗帘能否正常开合", "查看窗帘设备的Matter通信连接状态,确认是否存在离线或通信中断问题", "尝试重新发送窗帘定位命令,观察是否能正常响应并报告完成状态", "如问题持续,考虑重启窗帘控制器或检查固件版本是否需要更新"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.76151704788208, "api_error": null} {"episode_id": "SQ1_TP_D_0059", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0059.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20260688, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-26T17:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室窗帘电机疑似卡死,17:16 下发关闭指令后持续运行超过10分钟未到达目标位置,且日志中无最终完成状态。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报温度数据,数值在21.9°C~24.86°C之间随昼夜自然波动,无缺失、无None值、无异常跳变,工作正常。\",\n \"推理步骤2: 卧室运动传感器(bedroom_occupancy)在05:28、12:20、13:55、20:44四个时段检测到占用,与老人起床、午休、午休起身、晚间就寝的生活节奏吻合,触发时间合理,工作正常。\",\n \"推理步骤3: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报。结合窗帘多次开合但窗户始终未被打开,这属于正常情况(窗帘操作不等于开窗),传感器无异常。\",\n \"推理步骤4: 卧室窗帘(bedroom_window)在05:28关闭(0%)、12:20打开(100%)、13:55关闭(0%)三次操作均瞬间到位,状态正常。但17:16:00收到DownOrClose指令后,OperationalStatus持续为0b000010(正在关闭),17:16:30时位置仅到达50%,17:17:00仍在运行状态,此后日志中再无该设备的位置更新或运行停止记录。\",\n \"推理步骤5: 直到20:44窗帘突然报告位置为100%(全开),这与17:16的关闭指令方向相反,说明17:16的关闭操作很可能未成功完成,中间状态不明。结合运行超过1分钟仍未到位(前三次操作均在数秒内完成),存在电机卡滞或机械故障的可能。\",\n \"推理步骤6: 卧室灯(bedroom_light)和床头灯在05:28开启、20:44短暂开启后关闭,符合老人作息,工作正常。\"\n ],\n \"key_evidence\": [\n \"17:16:00 窗帘收到DownOrClose指令,17:16:30位置仅到50%且OperationalStatus仍为0b000010(运行中),17:17:00仍未停止,而此前三次窗帘操作均在数秒内瞬间完成\",\n \"17:16关闭指令后无最终到位(0%)或停止的日志记录,下一次状态直接跳到20:44的100%(全开),方向与指令相反\",\n \"温度传感器、运动传感器、窗户接触传感器全天数据完整且符合预期,无异常\"\n ],\n \"recommended_actions\": [\n \"检查卧室窗帘电机及导轨是否存在机械卡阻或异物阻挡\",\n \"查看窗帘控制器是否有错误码或过载保护记录,确认电机健康状态\",\n \"对窗帘执行一次手动开合测试,观察是否能正常到达目标位置并停止\",\n \"如故障确认,及时维修或更换窗帘电机,避免长时间堵转导致过热风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "卧室窗帘电机疑似卡死,17:16 下发关闭指令后持续运行超过10分钟未到达目标位置,且日志中无最终完成状态。", "reasoning": ["推理步骤1: 卧室温度传感器(bedroom_temp_sensor)全天每30分钟稳定上报温度数据,数值在21.9°C~24.86°C之间随昼夜自然波动,无缺失、无None值、无异常跳变,工作正常。", "推理步骤2: 卧室运动传感器(bedroom_occupancy)在05:28、12:20、13:55、20:44四个时段检测到占用,与老人起床、午休、午休起身、晚间就寝的生活节奏吻合,触发时间合理,工作正常。", "推理步骤3: 卧室窗户接触传感器(bedroom_window_contact)全天无状态变化事件上报。结合窗帘多次开合但窗户始终未被打开,这属于正常情况(窗帘操作不等于开窗),传感器无异常。", "推理步骤4: 卧室窗帘(bedroom_window)在05:28关闭(0%)、12:20打开(100%)、13:55关闭(0%)三次操作均瞬间到位,状态正常。但17:16:00收到DownOrClose指令后,OperationalStatus持续为0b000010(正在关闭),17:16:30时位置仅到达50%,17:17:00仍在运行状态,此后日志中再无该设备的位置更新或运行停止记录。", "推理步骤5: 直到20:44窗帘突然报告位置为100%(全开),这与17:16的关闭指令方向相反,说明17:16的关闭操作很可能未成功完成,中间状态不明。结合运行超过1分钟仍未到位(前三次操作均在数秒内完成),存在电机卡滞或机械故障的可能。", "推理步骤6: 卧室灯(bedroom_light)和床头灯在05:28开启、20:44短暂开启后关闭,符合老人作息,工作正常。"], "key_evidence": ["17:16:00 窗帘收到DownOrClose指令,17:16:30位置仅到50%且OperationalStatus仍为0b000010(运行中),17:17:00仍未停止,而此前三次窗帘操作均在数秒内瞬间完成", "17:16关闭指令后无最终到位(0%)或停止的日志记录,下一次状态直接跳到20:44的100%(全开),方向与指令相反", "温度传感器、运动传感器、窗户接触传感器全天数据完整且符合预期,无异常"], "recommended_actions": ["检查卧室窗帘电机及导轨是否存在机械卡阻或异物阻挡", "查看窗帘控制器是否有错误码或过载保护记录,确认电机健康状态", "对窗帘执行一次手动开合测试,观察是否能正常到达目标位置并停止", "如故障确认,及时维修或更换窗帘电机,避免长时间堵转导致过热风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.20689821243286, "api_error": null} {"episode_id": "SQ1_TP_D_0063", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0063.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260692, "scenario_id": "DF-04", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-21T20:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁存在异常告警事件,且玄关运动传感器在老人外出归来时未触发,疑似故障。\",\n \"reasoning\": [\n \"推理步骤1: entrance 区域包含 front_door_lock、front_door_contact、entrance_light 和 entrance_occupancy 四个设备。\",\n \"推理步骤2: 在 06:53 老人出门时,entrance_occupancy 正常触发(Occupancy=1),说明当时传感器工作正常。\",\n \"推理步骤3: 在 08:36 老人回家时,front_door_lock 解锁、front_door_contact 开门均有记录,但 entrance_occupancy 未触发任何事件,人直接出现在 living_room_occupancy 中。这说明玄关运动传感器在此次经过时未检测到人体,存在漏检。\",\n \"推理步骤4: 在 20:08 出现了 front_door_lock 的 DoorLockAlarm(AlarmCode=0) 事件。AlarmCode=0 通常表示 LockJammed(锁体卡住)告警,说明门锁在执行上锁命令时遇到了机械故障。连续两次 LockDoor 命令且状态均为 LockState=2(Unlocked),进一步印证锁体未能成功上锁。\",\n \"推理步骤5: 20:52 时 front_door_lock 自动上锁成功(LockState=1),说明锁体后来恢复了工作,但间歇性卡锁对独居老人的安全构成隐患。\",\n \"推理步骤6: 整日 entrance_light(玄关灯)从未被触发开启,结合老人多次经过玄关的事实,如果玄关灯是联动运动传感器的自动灯,则进一步佐证 entrance_occupancy 传感器存在间歇性失灵。\"\n ],\n \"key_evidence\": [\n \"08:36 老人回家时 entrance_occupancy 未触发,但 06:53 出门时曾正常触发——传感器间歇性漏检\",\n \"20:08:15 front_door_lock 触发 DoorLockAlarm(AlarmCode=0),表示锁体卡住告警\",\n \"20:08 连续两次 LockDoor 命令后 LockState 仍为 2(未锁定),锁体未能执行上锁\",\n \"全天 entrance_light 从未被触发,与多次有人经过玄关的事实不符\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器(entrance_occupancy)的安装位置和电池电量,清洁传感器镜头,必要时更换设备\",\n \"对入户门锁进行机械检修,检查锁舌、门框对位是否正常,排除卡锁隐患\",\n \"在门锁卡锁问题修复前,建议启用备用安全措施(如门链或通知家属远程确认锁门状态)\",\n \"检查玄关灯的自动化联动规则是否正常配置,确认是否因传感器故障导致灯未亮\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "入户门锁存在异常告警事件,且玄关运动传感器在老人外出归来时未触发,疑似故障。", "reasoning": ["推理步骤1: entrance 区域包含 front_door_lock、front_door_contact、entrance_light 和 entrance_occupancy 四个设备。", "推理步骤2: 在 06:53 老人出门时,entrance_occupancy 正常触发(Occupancy=1),说明当时传感器工作正常。", "推理步骤3: 在 08:36 老人回家时,front_door_lock 解锁、front_door_contact 开门均有记录,但 entrance_occupancy 未触发任何事件,人直接出现在 living_room_occupancy 中。这说明玄关运动传感器在此次经过时未检测到人体,存在漏检。", "推理步骤4: 在 20:08 出现了 front_door_lock 的 DoorLockAlarm(AlarmCode=0) 事件。AlarmCode=0 通常表示 LockJammed(锁体卡住)告警,说明门锁在执行上锁命令时遇到了机械故障。连续两次 LockDoor 命令且状态均为 LockState=2(Unlocked),进一步印证锁体未能成功上锁。", "推理步骤5: 20:52 时 front_door_lock 自动上锁成功(LockState=1),说明锁体后来恢复了工作,但间歇性卡锁对独居老人的安全构成隐患。", "推理步骤6: 整日 entrance_light(玄关灯)从未被触发开启,结合老人多次经过玄关的事实,如果玄关灯是联动运动传感器的自动灯,则进一步佐证 entrance_occupancy 传感器存在间歇性失灵。"], "key_evidence": ["08:36 老人回家时 entrance_occupancy 未触发,但 06:53 出门时曾正常触发——传感器间歇性漏检", "20:08:15 front_door_lock 触发 DoorLockAlarm(AlarmCode=0),表示锁体卡住告警", "20:08 连续两次 LockDoor 命令后 LockState 仍为 2(未锁定),锁体未能执行上锁", "全天 entrance_light 从未被触发,与多次有人经过玄关的事实不符"], "recommended_actions": ["检查玄关运动传感器(entrance_occupancy)的安装位置和电池电量,清洁传感器镜头,必要时更换设备", "对入户门锁进行机械检修,检查锁舌、门框对位是否正常,排除卡锁隐患", "在门锁卡锁问题修复前,建议启用备用安全措施(如门链或通知家属远程确认锁门状态)", "检查玄关灯的自动化联动规则是否正常配置,确认是否因传感器故障导致灯未亮"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.63852024078369, "api_error": null} {"episode_id": "SQ1_TP_D_0064", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0064.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20260693, "scenario_id": "DF-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-23T22:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅窗户传感器(living_room_window_contact)全天无任何数据上报,疑似离线或故障。\",\n \"reasoning\": [\n \"推理步骤1: 客厅区域共部署了7个设备:客厅灯、空调、温度传感器、运动传感器、窗帘、窗户传感器、烟雾报警器。逐一检查其在日志中的活动情况。\",\n \"推理步骤2: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次温度数据,从00:00到23:30共48条记录,数值在2291~2588范围内(约22.9°C~25.9°C),符合夏季室内温度的正常日变化曲线(夜间低、午间高),工作完全正常。\",\n \"推理步骤3: 客厅运动传感器(living_room_occupancy)在08:38、13:59、19:27三个时段检测到占用,与老人回家(08:38开门)、午休后起身(13:59)、晚间活动(19:27)的生活节奏吻合,工作正常。\",\n \"推理步骤4: 客厅灯(living_room_light)在08:38开启、12:35关闭、13:59再开启、19:27调光至16%(level=41/254)、20:27关闭,操作时间与运动传感器检测到的活动一致,工作正常。\",\n \"推理步骤5: 客厅烟雾报警器(living_room_smoke_alarm)全天无告警事件上报。考虑到全天无火灾/烟雾/CO事件发生(厨房烟雾报警器同样未触发),烟雾报警器无事件属于正常静默状态,不构成异常。\",\n \"推理步骤6: 客厅空调(living_room_ac)全天无任何状态变化记录。当天温度最高约25.8°C,老人可能未觉得需要开空调,属于合理的未使用状态,不构成异常。\",\n \"推理步骤7: 客厅窗帘(living_room_window)全天无状态变化。对比卧室窗帘有多次开合操作,客厅窗帘完全静默略显异常,但老人可能习惯不动客厅窗帘,单独来看不足以判定故障。\",\n \"推理步骤8: 客厅窗户传感器(living_room_window_contact)全天24小时无任何数据上报——既没有开窗事件,也没有周期性的状态心跳报告。对比同类型的入户门传感器(front_door_contact)和卧室窗户传感器(bedroom_window_contact),前者有多次状态变化,后者虽也无变化但卧室窗户确实可能未开。然而contact_sensor类设备通常会周期性上报当前状态作为心跳,living_room_window_contact完全没有任何记录,存在设备离线或通信故障的可能。\",\n \"推理步骤9: 综合判断——客厅温度传感器、运动传感器、灯具均工作正常;烟雾报警器和空调的静默属于合理状态;但窗户传感器全天零上报值得关注,对于独居老人家庭,窗户传感器是安防的重要一环,如果离线意味着窗户被打开时无法检测到入侵。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 全天48次定时上报,数值范围2291~2588,温度曲线平滑合理\",\n \"living_room_occupancy 在08:38/13:59/19:27正常检测到人体活动\",\n \"living_room_light 有5次状态变化(开/关/调光),与人体活动时间吻合\",\n \"living_room_window_contact 全天24小时零上报,无状态变化也无心跳记录,疑似离线\",\n \"同类contact_sensor设备 front_door_contact 有多次正常上报作为对比\"\n ],\n \"recommended_actions\": [\n \"检查客厅窗户传感器(living_room_window_contact)的在线状态和电池电量,确认是否离线或电量耗尽\",\n \"如确认传感器故障,尽快更换电池或重新配对设备,避免安防盲区\",\n \"在传感器恢复前,提醒老人注意客厅窗户的手动锁闭,或临时加强其他安防措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅窗户传感器(living_room_window_contact)全天无任何数据上报,疑似离线或故障。", "reasoning": ["推理步骤1: 客厅区域共部署了7个设备:客厅灯、空调、温度传感器、运动传感器、窗帘、窗户传感器、烟雾报警器。逐一检查其在日志中的活动情况。", "推理步骤2: 客厅温度传感器(living_room_temp_sensor)全天每30分钟稳定上报一次温度数据,从00:00到23:30共48条记录,数值在2291~2588范围内(约22.9°C~25.9°C),符合夏季室内温度的正常日变化曲线(夜间低、午间高),工作完全正常。", "推理步骤3: 客厅运动传感器(living_room_occupancy)在08:38、13:59、19:27三个时段检测到占用,与老人回家(08:38开门)、午休后起身(13:59)、晚间活动(19:27)的生活节奏吻合,工作正常。", "推理步骤4: 客厅灯(living_room_light)在08:38开启、12:35关闭、13:59再开启、19:27调光至16%(level=41/254)、20:27关闭,操作时间与运动传感器检测到的活动一致,工作正常。", "推理步骤5: 客厅烟雾报警器(living_room_smoke_alarm)全天无告警事件上报。考虑到全天无火灾/烟雾/CO事件发生(厨房烟雾报警器同样未触发),烟雾报警器无事件属于正常静默状态,不构成异常。", "推理步骤6: 客厅空调(living_room_ac)全天无任何状态变化记录。当天温度最高约25.8°C,老人可能未觉得需要开空调,属于合理的未使用状态,不构成异常。", "推理步骤7: 客厅窗帘(living_room_window)全天无状态变化。对比卧室窗帘有多次开合操作,客厅窗帘完全静默略显异常,但老人可能习惯不动客厅窗帘,单独来看不足以判定故障。", "推理步骤8: 客厅窗户传感器(living_room_window_contact)全天24小时无任何数据上报——既没有开窗事件,也没有周期性的状态心跳报告。对比同类型的入户门传感器(front_door_contact)和卧室窗户传感器(bedroom_window_contact),前者有多次状态变化,后者虽也无变化但卧室窗户确实可能未开。然而contact_sensor类设备通常会周期性上报当前状态作为心跳,living_room_window_contact完全没有任何记录,存在设备离线或通信故障的可能。", "推理步骤9: 综合判断——客厅温度传感器、运动传感器、灯具均工作正常;烟雾报警器和空调的静默属于合理状态;但窗户传感器全天零上报值得关注,对于独居老人家庭,窗户传感器是安防的重要一环,如果离线意味着窗户被打开时无法检测到入侵。"], "key_evidence": ["living_room_temp_sensor 全天48次定时上报,数值范围2291~2588,温度曲线平滑合理", "living_room_occupancy 在08:38/13:59/19:27正常检测到人体活动", "living_room_light 有5次状态变化(开/关/调光),与人体活动时间吻合", "living_room_window_contact 全天24小时零上报,无状态变化也无心跳记录,疑似离线", "同类contact_sensor设备 front_door_contact 有多次正常上报作为对比"], "recommended_actions": ["检查客厅窗户传感器(living_room_window_contact)的在线状态和电池电量,确认是否离线或电量耗尽", "如确认传感器故障,尽快更换电池或重新配对设备,避免安防盲区", "在传感器恢复前,提醒老人注意客厅窗户的手动锁闭,或临时加强其他安防措施"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.728106021881104, "api_error": null} {"episode_id": "SQ1_TP_D_0065", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0065.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20260694, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-28T16:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器存在双重上报异常及数值冻结故障,疑似传感器硬件或通信模块失效。\",\n \"reasoning\": [\n \"推理步骤1: 在6月28日,living_room_temp_sensor 在正常的 TemperatureMeasurement.MeasuredValue 上报之外,还出现了缺少 Cluster 前缀的异常格式上报(仅为 MeasuredValue),分别发生在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280)。正常 Matter 协议上报应始终使用完整的 TemperatureMeasurement.MeasuredValue 格式,格式不一致说明设备固件或通信栈存在异常。\",\n \"推理步骤2: 同一时刻出现两条不同数值的上报(如08:00正常上报2469 vs 异常上报2350,12:00正常上报2571 vs 异常上报2510),两个读数之间存在明显偏差(约60-120个单位,即0.6-1.2°C),说明传感器内部可能存在两个冲突的数据源或缓存错误。\",\n \"推理步骤3: 从6月29日开始,正常格式的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩异常格式的 MeasuredValue 上报,且数值固定为2350不再变化。6月29日08:00到6月30日12:00,跨越两天四次上报全部为2350,而同期室外温度应有昼夜波动,其他房间传感器在6月28日也呈现正常的昼夜温度曲线(卧室21.9-24.8°C,厨房23.0-25.9°C)。客厅温度完全不变是不合理的。\",\n \"推理步骤4: 数值冻结在2350(23.5°C)恰好是一个常见的默认/回退值,进一步佐证传感器已停止实际测量,转而输出固定默认值。\",\n \"推理步骤5: 该传感器位于独居老人家中的客厅,温度监测对于老人健康安全(如中暑、低温症预警)至关重要,传感器失效意味着丧失了环境安全监控能力。\"\n ],\n \"key_evidence\": [\n \"6月28日出现4次异常格式上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),与正常上报同时存在但数值不一致:08:00(2350 vs 2469)、12:00(2510 vs 2571)、18:00(2400 vs 2463)、22:00(2280 vs 2361)\",\n \"6月29日起正常格式上报完全停止,仅剩异常格式上报,且数值冻结为2350,从6月29日08:00至6月30日12:00共6次上报全部为2350,无任何温度波动\",\n \"同期其他房间传感器(bedroom_temp_sensor、kitchen_temp_sensor)在6月28日均呈现正常的昼夜温度变化曲线,排除全局系统故障的可能\"\n ],\n \"recommended_actions\": [\n \"立即对 living_room_temp_sensor 进行重启/断电重置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报及温度波动\",\n \"检查传感器固件版本,如有可用更新则升级固件以修复异常格式上报问题\",\n \"若重置后仍输出固定值或异常格式,应更换该温度传感器硬件\",\n \"在传感器修复前,考虑临时利用相邻房间(卧室/厨房)的温度数据作为客厅环境的参考估算,确保独居老人的高温/低温预警不中断\",\n \"在系统层面增加传感器健康监测规则:当同一传感器连续多次上报完全相同的数值或出现非标准属性格式时,自动触发告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器存在双重上报异常及数值冻结故障,疑似传感器硬件或通信模块失效。", "reasoning": ["推理步骤1: 在6月28日,living_room_temp_sensor 在正常的 TemperatureMeasurement.MeasuredValue 上报之外,还出现了缺少 Cluster 前缀的异常格式上报(仅为 MeasuredValue),分别发生在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280)。正常 Matter 协议上报应始终使用完整的 TemperatureMeasurement.MeasuredValue 格式,格式不一致说明设备固件或通信栈存在异常。", "推理步骤2: 同一时刻出现两条不同数值的上报(如08:00正常上报2469 vs 异常上报2350,12:00正常上报2571 vs 异常上报2510),两个读数之间存在明显偏差(约60-120个单位,即0.6-1.2°C),说明传感器内部可能存在两个冲突的数据源或缓存错误。", "推理步骤3: 从6月29日开始,正常格式的 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩异常格式的 MeasuredValue 上报,且数值固定为2350不再变化。6月29日08:00到6月30日12:00,跨越两天四次上报全部为2350,而同期室外温度应有昼夜波动,其他房间传感器在6月28日也呈现正常的昼夜温度曲线(卧室21.9-24.8°C,厨房23.0-25.9°C)。客厅温度完全不变是不合理的。", "推理步骤4: 数值冻结在2350(23.5°C)恰好是一个常见的默认/回退值,进一步佐证传感器已停止实际测量,转而输出固定默认值。", "推理步骤5: 该传感器位于独居老人家中的客厅,温度监测对于老人健康安全(如中暑、低温症预警)至关重要,传感器失效意味着丧失了环境安全监控能力。"], "key_evidence": ["6月28日出现4次异常格式上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),与正常上报同时存在但数值不一致:08:00(2350 vs 2469)、12:00(2510 vs 2571)、18:00(2400 vs 2463)、22:00(2280 vs 2361)", "6月29日起正常格式上报完全停止,仅剩异常格式上报,且数值冻结为2350,从6月29日08:00至6月30日12:00共6次上报全部为2350,无任何温度波动", "同期其他房间传感器(bedroom_temp_sensor、kitchen_temp_sensor)在6月28日均呈现正常的昼夜温度变化曲线,排除全局系统故障的可能"], "recommended_actions": ["立即对 living_room_temp_sensor 进行重启/断电重置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报及温度波动", "检查传感器固件版本,如有可用更新则升级固件以修复异常格式上报问题", "若重置后仍输出固定值或异常格式,应更换该温度传感器硬件", "在传感器修复前,考虑临时利用相邻房间(卧室/厨房)的温度数据作为客厅环境的参考估算,确保独居老人的高温/低温预警不中断", "在系统层面增加传感器健康监测规则:当同一传感器连续多次上报完全相同的数值或出现非标准属性格式时,自动触发告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.983964443206787, "api_error": null} {"episode_id": "SQ1_TP_D_0067", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0067.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20260696, "scenario_id": "DF-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T09:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间反复报告 None(空值),存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在大部分时间(每30分钟)正常上报温度数据,数值在 2292-2582 范围内波动,与客厅/卧室趋势一致,说明传感器基线功能存在。\",\n \"推理步骤2: 但在灶具开启后约30秒至1分钟内,传感器连续三次出现 MeasuredValue = None 的情况——分别发生在 05:56:07(灶具 05:55:37 开启)、11:00:00(灶具 10:59:30 开启)、16:56:00(灶具 16:55:30 开启),呈现高度规律性的关联。\",\n \"推理步骤3: 灶具关闭后约1分钟,传感器同样报告 None(06:35:00、11:34:00、17:35:00),说明在灶具状态切换的瞬间传感器均会失效。\",\n \"推理步骤4: 每次 None 出现后,到下一个30分钟整点采样时传感器又恢复正常数值,说明这不是永久性硬件损坏,而是间歇性故障。\",\n \"推理步骤5: 正常的温度传感器即使在高温环境下也应返回数值(可能是较高的读数),而非 None。None 通常表示传感器读取失败、通信超时或内部错误,可能原因包括:灶具产生的电磁干扰(EMI)影响传感器通信、传感器安装位置过近导致瞬时过热保护触发、或传感器固件在快速温变时存在 bug。\"\n ],\n \"key_evidence\": [\n \"灶具三次使用期间(05:55-06:34、10:59-11:33、16:55-17:34),温度传感器均在开启后和关闭后各报告一次 MeasuredValue = None,共计6次空值\",\n \"None 仅在灶具状态变化时出现,其余时段(全天48个常规采样点)传感器均正常上报数值,故障与灶具操作高度相关\",\n \"每次 None 后传感器自动恢复,属于间歇性而非持续性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器与灶具的物理距离,若过近应重新安装到远离热源和电磁干扰的位置\",\n \"检查传感器固件版本,如有更新应升级,以修复可能的快速温变处理 bug\",\n \"在传感器与灶具之间排查电磁干扰问题,必要时增加屏蔽或更换通信信道\",\n \"考虑对该传感器设置 None 值告警规则,当连续出现空值时及时通知住户或家属,避免在真正发生厨房火灾/高温时传感器恰好失效而漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间反复报告 None(空值),存在间歇性故障。", "reasoning": ["推理步骤1: 厨房温度传感器在大部分时间(每30分钟)正常上报温度数据,数值在 2292-2582 范围内波动,与客厅/卧室趋势一致,说明传感器基线功能存在。", "推理步骤2: 但在灶具开启后约30秒至1分钟内,传感器连续三次出现 MeasuredValue = None 的情况——分别发生在 05:56:07(灶具 05:55:37 开启)、11:00:00(灶具 10:59:30 开启)、16:56:00(灶具 16:55:30 开启),呈现高度规律性的关联。", "推理步骤3: 灶具关闭后约1分钟,传感器同样报告 None(06:35:00、11:34:00、17:35:00),说明在灶具状态切换的瞬间传感器均会失效。", "推理步骤4: 每次 None 出现后,到下一个30分钟整点采样时传感器又恢复正常数值,说明这不是永久性硬件损坏,而是间歇性故障。", "推理步骤5: 正常的温度传感器即使在高温环境下也应返回数值(可能是较高的读数),而非 None。None 通常表示传感器读取失败、通信超时或内部错误,可能原因包括:灶具产生的电磁干扰(EMI)影响传感器通信、传感器安装位置过近导致瞬时过热保护触发、或传感器固件在快速温变时存在 bug。"], "key_evidence": ["灶具三次使用期间(05:55-06:34、10:59-11:33、16:55-17:34),温度传感器均在开启后和关闭后各报告一次 MeasuredValue = None,共计6次空值", "None 仅在灶具状态变化时出现,其余时段(全天48个常规采样点)传感器均正常上报数值,故障与灶具操作高度相关", "每次 None 后传感器自动恢复,属于间歇性而非持续性故障"], "recommended_actions": ["检查厨房温度传感器与灶具的物理距离,若过近应重新安装到远离热源和电磁干扰的位置", "检查传感器固件版本,如有更新应升级,以修复可能的快速温变处理 bug", "在传感器与灶具之间排查电磁干扰问题,必要时增加屏蔽或更换通信信道", "考虑对该传感器设置 None 值告警规则,当连续出现空值时及时通知住户或家属,避免在真正发生厨房火灾/高温时传感器恰好失效而漏报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.511395931243896, "api_error": null} {"episode_id": "SQ1_TP_D_0075", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0075.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20260704, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-05T17:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器发生硬件故障,已丧失烟雾/CO检测能力;客厅温度传感器工作正常,其余客厅设备无异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器全天每30分钟上报一次数据,从未缺失或报告None,数值在22.97°C~25.82°C之间随昼夜自然波动,与卧室、厨房传感器趋势一致,判定温度传感器工作正常。\",\n \"推理步骤2: 客厅运动传感器在08:21、14:02、19:29等时段检测到占用状态,与入户门开关、客厅灯操作等事件在时间上吻合,行为合理,判定运动传感器工作正常。\",\n \"推理步骤3: 客厅窗户传感器(living_room_window_contact)全天无状态变化事件,说明窗户始终保持关闭,属于正常静默状态,判定工作正常。\",\n \"推理步骤4: 客厅烟雾报警器在17:35上报 HardwareFaultAlert=True、ExpressedState=5(对应硬件故障状态)并触发 HardwareFault 事件。这表明设备自检发现内部硬件问题,已进入故障状态,无法可靠执行烟雾或CO检测功能。\",\n \"推理步骤5: 该故障发生时厨房灶具刚于17:31关闭,客厅温度正常下降中(约24.75°C),无火灾迹象,因此排除真实烟雾触发的可能,确认为设备自身硬件故障。\",\n \"推理步骤6: 对于独居老人家庭,烟雾报警器是关键安全设备。硬件故障意味着一旦发生火灾或CO泄漏,该报警器将无法发出警报,构成严重安全隐患。\"\n ],\n \"key_evidence\": [\n \"[17:35] living_room_smoke_alarm | HardwareFaultAlert = True\",\n \"[17:35] living_room_smoke_alarm | ExpressedState = 5(硬件故障状态)\",\n \"[17:35] living_room_smoke_alarm | Event: HardwareFault()\",\n \"客厅温度传感器全天48个采样点数据完整,数值随昼夜合理波动,无异常\",\n \"客厅运动传感器多次正常检测到人员活动,与其他设备事件时序一致\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换客厅烟雾报警器,恢复火灾和CO检测能力\",\n \"在烟雾报警器修复前,提醒老人注意用火安全,必要时临时放置独立式烟雾报警器\",\n \"检查厨房烟雾报警器(kitchen_smoke_alarm)是否正常工作,确保至少有一个可用的烟雾检测设备\",\n \"联系设备厂商或物业维保人员进行专业检修,确认故障原因(传感器老化、电池问题或电路故障)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器发生硬件故障,已丧失烟雾/CO检测能力;客厅温度传感器工作正常,其余客厅设备无异常。", "reasoning": ["推理步骤1: 客厅温度传感器全天每30分钟上报一次数据,从未缺失或报告None,数值在22.97°C~25.82°C之间随昼夜自然波动,与卧室、厨房传感器趋势一致,判定温度传感器工作正常。", "推理步骤2: 客厅运动传感器在08:21、14:02、19:29等时段检测到占用状态,与入户门开关、客厅灯操作等事件在时间上吻合,行为合理,判定运动传感器工作正常。", "推理步骤3: 客厅窗户传感器(living_room_window_contact)全天无状态变化事件,说明窗户始终保持关闭,属于正常静默状态,判定工作正常。", "推理步骤4: 客厅烟雾报警器在17:35上报 HardwareFaultAlert=True、ExpressedState=5(对应硬件故障状态)并触发 HardwareFault 事件。这表明设备自检发现内部硬件问题,已进入故障状态,无法可靠执行烟雾或CO检测功能。", "推理步骤5: 该故障发生时厨房灶具刚于17:31关闭,客厅温度正常下降中(约24.75°C),无火灾迹象,因此排除真实烟雾触发的可能,确认为设备自身硬件故障。", "推理步骤6: 对于独居老人家庭,烟雾报警器是关键安全设备。硬件故障意味着一旦发生火灾或CO泄漏,该报警器将无法发出警报,构成严重安全隐患。"], "key_evidence": ["[17:35] living_room_smoke_alarm | HardwareFaultAlert = True", "[17:35] living_room_smoke_alarm | ExpressedState = 5(硬件故障状态)", "[17:35] living_room_smoke_alarm | Event: HardwareFault()", "客厅温度传感器全天48个采样点数据完整,数值随昼夜合理波动,无异常", "客厅运动传感器多次正常检测到人员活动,与其他设备事件时序一致"], "recommended_actions": ["立即检查或更换客厅烟雾报警器,恢复火灾和CO检测能力", "在烟雾报警器修复前,提醒老人注意用火安全,必要时临时放置独立式烟雾报警器", "检查厨房烟雾报警器(kitchen_smoke_alarm)是否正常工作,确保至少有一个可用的烟雾检测设备", "联系设备厂商或物业维保人员进行专业检修,确认故障原因(传感器老化、电池问题或电路故障)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.921152591705322, "api_error": null} {"episode_id": "SQ1_TP_D_0078", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0078.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20260707, "scenario_id": "DF-04", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-13T12:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"玄关运动传感器(entrance_occupancy)疑似存在故障,多次有人通过入户门但传感器仅记录到少量触发事件,且从未报告occupancy=0的离开状态。\",\n \"reasoning\": [\n \"推理步骤1: entrance区域有两个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)。分析日志中所有出入事件。\",\n \"推理步骤2: 全天共有3次明确的出入门事件:07:07(出门)、08:36(回家)、以及20:38时门锁自动上锁。但entrance_occupancy仅在07:07和08:36两次触发了occupancy=1。\",\n \"推理步骤3: 玄关运动传感器在整个24小时日志中从未报告过occupancy=0(无人状态),这意味着传感器触发后没有正常复位,或者复位事件丢失。正常的运动传感器应在人离开后一段时间内报告occupancy=0。\",\n \"推理步骤4: 对比其他运动传感器(如bathroom_occupancy在05:50:49和20:39:58正常报告了occupancy=0),entrance_occupancy的行为明显异常。\",\n \"推理步骤5: 20:38时门锁执行了自动上锁,门传感器报告关闭状态,但此时entrance_occupancy没有任何触发记录,说明老人从卫生间经过玄关区域检查门锁或门自动上锁时,传感器未能检测到活动。\"\n ],\n \"key_evidence\": [\n \"entrance_occupancy全天仅触发2次(07:07:09和08:36:03),且从未报告occupancy=0复位状态\",\n \"对比bathroom_occupancy正常报告了occupancy=0(05:50:49和20:39:58),entrance_occupancy行为异常\",\n \"20:38时front_door_lock自动上锁、front_door_contact报告门关闭,但entrance_occupancy无任何响应\"\n ],\n \"recommended_actions\": [\n \"检查玄关运动传感器的电池电量或供电状态,可能电量不足导致灵敏度下降\",\n \"检查传感器是否存在固件问题导致occupancy=0状态无法正常上报\",\n \"考虑重新校准或更换玄关运动传感器,确保入户区域的安全监控完整性\",\n \"对于独居老人场景,入户区域传感器的可靠性至关重要(防入侵检测),建议尽快修复\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "玄关运动传感器(entrance_occupancy)疑似存在故障,多次有人通过入户门但传感器仅记录到少量触发事件,且从未报告occupancy=0的离开状态。", "reasoning": ["推理步骤1: entrance区域有两个传感器——入户门锁(front_door_lock)、入户门传感器(front_door_contact)和玄关运动传感器(entrance_occupancy)。分析日志中所有出入事件。", "推理步骤2: 全天共有3次明确的出入门事件:07:07(出门)、08:36(回家)、以及20:38时门锁自动上锁。但entrance_occupancy仅在07:07和08:36两次触发了occupancy=1。", "推理步骤3: 玄关运动传感器在整个24小时日志中从未报告过occupancy=0(无人状态),这意味着传感器触发后没有正常复位,或者复位事件丢失。正常的运动传感器应在人离开后一段时间内报告occupancy=0。", "推理步骤4: 对比其他运动传感器(如bathroom_occupancy在05:50:49和20:39:58正常报告了occupancy=0),entrance_occupancy的行为明显异常。", "推理步骤5: 20:38时门锁执行了自动上锁,门传感器报告关闭状态,但此时entrance_occupancy没有任何触发记录,说明老人从卫生间经过玄关区域检查门锁或门自动上锁时,传感器未能检测到活动。"], "key_evidence": ["entrance_occupancy全天仅触发2次(07:07:09和08:36:03),且从未报告occupancy=0复位状态", "对比bathroom_occupancy正常报告了occupancy=0(05:50:49和20:39:58),entrance_occupancy行为异常", "20:38时front_door_lock自动上锁、front_door_contact报告门关闭,但entrance_occupancy无任何响应"], "recommended_actions": ["检查玄关运动传感器的电池电量或供电状态,可能电量不足导致灵敏度下降", "检查传感器是否存在固件问题导致occupancy=0状态无法正常上报", "考虑重新校准或更换玄关运动传感器,确保入户区域的安全监控完整性", "对于独居老人场景,入户区域传感器的可靠性至关重要(防入侵检测),建议尽快修复"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.428626537322998, "api_error": null} {"episode_id": "SQ1_TP_D_0079", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq1\\SQ1_TP_D_0079.json", "metadata": {"sq_type": "SQ1", "sq_name": "设备健康诊断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20260708, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T17:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器出现数据异常:正常Cluster报告与异常简写报告并存,且从6月27日起设备仅输出固定值2350的简写格式数据,正常的TemperatureMeasurement.MeasuredValue报告完全停止,表明传感器固件故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 6月26日期间,living_room_temp_sensor同时输出两种格式的数据——正常格式'TemperatureMeasurement.MeasuredValue'和异常简写格式'MeasuredValue'。简写格式出现在08:00、12:00、18:00、22:00,其读数与同时刻正常格式读数不一致(如08:00正常值2460 vs 简写值2350,12:00正常值2585 vs 简写值2510)。\",\n \"推理步骤2: 从6月27日08:00开始,正常的TemperatureMeasurement.MeasuredValue报告完全消失,传感器仅输出简写格式'MeasuredValue',且数值固定为2350不再变化,持续到6月28日12:00仍为2350。\",\n \"推理步骤3: 对比同期其他传感器(bedroom_temp_sensor、kitchen_temp_sensor),它们在6月26日23:30后也不再有数据出现,但living_room_temp_sensor的异常更为明显——输出固定不变的值说明传感器可能卡在某个状态,不再真实测量环境温度。\",\n \"推理步骤4: 固定值2350(23.50°C)恰好是一个'默认值'特征,结合Cluster属性报告格式从标准Matter格式退化为简写格式,高度怀疑传感器固件崩溃后进入了降级/回退模式,仅能输出默认值。\"\n ],\n \"key_evidence\": [\n \"6月26日出现双重报告:正常格式与简写格式'MeasuredValue'并存,且数值不一致(08:00: 2460 vs 2350, 12:00: 2585 vs 2510, 18:00: 2465 vs 2400, 22:00: 2368 vs 2280)\",\n \"6月27日起仅剩简写格式报告,数值锁定为2350不再变化(跨越6月27日08:00/12:00/18:00/22:00和6月28日08:00/12:00共6个采样点全部为2350)\",\n \"正常的TemperatureMeasurement.MeasuredValue属性报告从6月27日起完全停止\",\n \"其他房间传感器在6月26日期间温度随时间正常波动,而living_room_temp_sensor的简写值却保持恒定\"\n ],\n \"recommended_actions\": [\n \"立即对living_room_temp_sensor执行设备重启/重置操作,尝试恢复正常Matter协议通信\",\n \"检查传感器固件版本,如有可用更新则进行OTA升级\",\n \"在传感器恢复前,使用相邻房间温度数据作为客厅温度的参考估计,确保独居老人的环境温度监控不中断\",\n \"若重启后仍输出固定值或简写格式,考虑更换传感器硬件\",\n \"排查Matter网络通信质量,确认是否存在网络层面导致属性报告格式退化的问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器出现数据异常:正常Cluster报告与异常简写报告并存,且从6月27日起设备仅输出固定值2350的简写格式数据,正常的TemperatureMeasurement.MeasuredValue报告完全停止,表明传感器固件故障或通信异常。", "reasoning": ["推理步骤1: 6月26日期间,living_room_temp_sensor同时输出两种格式的数据——正常格式'TemperatureMeasurement.MeasuredValue'和异常简写格式'MeasuredValue'。简写格式出现在08:00、12:00、18:00、22:00,其读数与同时刻正常格式读数不一致(如08:00正常值2460 vs 简写值2350,12:00正常值2585 vs 简写值2510)。", "推理步骤2: 从6月27日08:00开始,正常的TemperatureMeasurement.MeasuredValue报告完全消失,传感器仅输出简写格式'MeasuredValue',且数值固定为2350不再变化,持续到6月28日12:00仍为2350。", "推理步骤3: 对比同期其他传感器(bedroom_temp_sensor、kitchen_temp_sensor),它们在6月26日23:30后也不再有数据出现,但living_room_temp_sensor的异常更为明显——输出固定不变的值说明传感器可能卡在某个状态,不再真实测量环境温度。", "推理步骤4: 固定值2350(23.50°C)恰好是一个'默认值'特征,结合Cluster属性报告格式从标准Matter格式退化为简写格式,高度怀疑传感器固件崩溃后进入了降级/回退模式,仅能输出默认值。"], "key_evidence": ["6月26日出现双重报告:正常格式与简写格式'MeasuredValue'并存,且数值不一致(08:00: 2460 vs 2350, 12:00: 2585 vs 2510, 18:00: 2465 vs 2400, 22:00: 2368 vs 2280)", "6月27日起仅剩简写格式报告,数值锁定为2350不再变化(跨越6月27日08:00/12:00/18:00/22:00和6月28日08:00/12:00共6个采样点全部为2350)", "正常的TemperatureMeasurement.MeasuredValue属性报告从6月27日起完全停止", "其他房间传感器在6月26日期间温度随时间正常波动,而living_room_temp_sensor的简写值却保持恒定"], "recommended_actions": ["立即对living_room_temp_sensor执行设备重启/重置操作,尝试恢复正常Matter协议通信", "检查传感器固件版本,如有可用更新则进行OTA升级", "在传感器恢复前,使用相邻房间温度数据作为客厅温度的参考估计,确保独居老人的环境温度监控不中断", "若重启后仍输出固定值或简写格式,考虑更换传感器硬件", "排查Matter网络通信质量,确认是否存在网络层面导致属性报告格式退化的问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.614116668701172, "api_error": null} {"episode_id": "SQ2_FP_A_0308", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0308.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20260937, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-17T08:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次数据丢失(None),同时厨房窗户在做饭结束后开启但未关闭,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2485 跳升至 2856(28.56°C),而同一时刻客厅和卧室温度仍在正常下降趋势中(2461/2356),半小时后 18:30 厨房读数进一步升至 2866。这一跳变幅度约 3.7°C,远超正常波动范围,且与其他房间趋势完全背离。\",\n \"推理步骤2: 18:48 灶具开启后,18:49 厨房温度传感器报告 MeasuredValue = None(数据丢失)。19:00 恢复为 2433 的正常值。19:35 灶具关闭后,19:36 再次报告 None。传感器在灶具操作前后两次出现空值,说明传感器可能受高温影响导致读数异常或通信中断。\",\n \"推理步骤3: 18:00 的异常高温发生在灶具开启(18:48)之前约 48 分钟,住户尚未回家(18:09 才开门),因此这次高温不可能是烹饪导致的。排除烹饪因素后,传感器自身故障(如元件老化、接触不良)是最合理的解释。\",\n \"推理步骤4: 厨房烟雾报警器全天未触发任何事件,进一步排除了真实火灾或烟雾的可能性,佐证这是传感器故障而非实际环境异常。\",\n \"推理步骤5: 19:35 厨房窗户打开(StateValue=False),但直到日志结束(23:30)都未见关闭事件。这本身不是严重威胁,但在住户已于 21:55 进入卧室就寝的情况下,厨房窗户整夜未关存在一定安全隐患(入侵风险、雨水等)。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~2485 骤升至 2856,18:30 进一步升至 2866,而此时住户尚未到家、灶具未开启\",\n \"18:49 和 19:36 厨房温度传感器两次报告 MeasuredValue = None(数据丢失),均与灶具操作时间高度相关\",\n \"烟雾报警器全天无告警,排除真实火灾风险\",\n \"19:35 厨房窗户打开后至日志结束未关闭,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热影响,必要时重新定位或更换传感器\",\n \"排查传感器固件版本和通信链路,针对两次 None 值进行诊断,确认是传感器硬件故障还是网络丢包\",\n \"设置自动化规则:当住户进入就寝模式时,检查并提醒关闭厨房窗户\",\n \"考虑为厨房温度传感器设置合理阈值告警(如超过 27°C 且烟雾报警器未触发时,标记为传感器异常而非火灾)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次数据丢失(None),同时厨房窗户在做饭结束后开启但未关闭,存在设备故障风险。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2485 跳升至 2856(28.56°C),而同一时刻客厅和卧室温度仍在正常下降趋势中(2461/2356),半小时后 18:30 厨房读数进一步升至 2866。这一跳变幅度约 3.7°C,远超正常波动范围,且与其他房间趋势完全背离。", "推理步骤2: 18:48 灶具开启后,18:49 厨房温度传感器报告 MeasuredValue = None(数据丢失)。19:00 恢复为 2433 的正常值。19:35 灶具关闭后,19:36 再次报告 None。传感器在灶具操作前后两次出现空值,说明传感器可能受高温影响导致读数异常或通信中断。", "推理步骤3: 18:00 的异常高温发生在灶具开启(18:48)之前约 48 分钟,住户尚未回家(18:09 才开门),因此这次高温不可能是烹饪导致的。排除烹饪因素后,传感器自身故障(如元件老化、接触不良)是最合理的解释。", "推理步骤4: 厨房烟雾报警器全天未触发任何事件,进一步排除了真实火灾或烟雾的可能性,佐证这是传感器故障而非实际环境异常。", "推理步骤5: 19:35 厨房窗户打开(StateValue=False),但直到日志结束(23:30)都未见关闭事件。这本身不是严重威胁,但在住户已于 21:55 进入卧室就寝的情况下,厨房窗户整夜未关存在一定安全隐患(入侵风险、雨水等)。"], "key_evidence": ["18:00 厨房温度从 ~2485 骤升至 2856,18:30 进一步升至 2866,而此时住户尚未到家、灶具未开启", "18:49 和 19:36 厨房温度传感器两次报告 MeasuredValue = None(数据丢失),均与灶具操作时间高度相关", "烟雾报警器全天无告警,排除真实火灾风险", "19:35 厨房窗户打开后至日志结束未关闭,住户已就寝"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热影响,必要时重新定位或更换传感器", "排查传感器固件版本和通信链路,针对两次 None 值进行诊断,确认是传感器硬件故障还是网络丢包", "设置自动化规则:当住户进入就寝模式时,检查并提醒关闭厨房窗户", "考虑为厨房温度传感器设置合理阈值告警(如超过 27°C 且烟雾报警器未触发时,标记为传感器异常而非火灾)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.612077474594116, "api_error": null} {"episode_id": "SQ2_FP_A_0311", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0311.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20260940, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-17T21:52:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数并在烹饪期间两次报告null值,疑似传感器故障或曾存在真实高温隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00厨房温度传感器突然从约24.7°C跳升至28.65°C(MeasuredValue 2865),而同一时刻客厅和卧室温度仍在正常下降趋势中(2461/2360),排除全屋升温的可能。\",\n \"推理步骤2: 18:30厨房温度仍维持在28.63°C的高位,但此时灶具尚未开启(灶具在18:50才打开),说明这次高温不是烹饪导致的,属于异常读数。\",\n \"推理步骤3: 18:51(灶具刚开启后)和19:35(灶具关闭后)厨房温度传感器两次报告MeasuredValue=None,表明传感器出现了读数丢失/故障。正常传感器不应返回null。\",\n \"推理步骤4: 19:00温度恢复为24.29°C,与客厅(24.45°C)基本一致,之后读数恢复正常。结合之前的异常高温和null值,高度怀疑传感器本身存在间歇性故障。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除了真实火灾风险,但传感器故障意味着厨房的温度监控存在盲区,降低了火灾预警能力。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度异常跳升至2865(28.65°C),较前一读数2479(24.79°C)骤升近4°C,且灶具当时未开启\",\n \"18:51和19:35厨房温度传感器两次报告MeasuredValue=None,出现读数丢失\",\n \"18:30高温持续(2863),但灶具直到18:50才开启,无法用烹饪解释该高温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器或更换电池,必要时更换设备\",\n \"排查传感器安装位置是否靠近热源(如冰箱散热口、阳光直射处),避免环境干扰\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保烟雾报警器工作正常\",\n \"考虑为厨房温度传感器设置null值告警规则,一旦出现读数丢失立即通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数并在烹饪期间两次报告null值,疑似传感器故障或曾存在真实高温隐患。", "reasoning": ["推理步骤1: 18:00厨房温度传感器突然从约24.7°C跳升至28.65°C(MeasuredValue 2865),而同一时刻客厅和卧室温度仍在正常下降趋势中(2461/2360),排除全屋升温的可能。", "推理步骤2: 18:30厨房温度仍维持在28.63°C的高位,但此时灶具尚未开启(灶具在18:50才打开),说明这次高温不是烹饪导致的,属于异常读数。", "推理步骤3: 18:51(灶具刚开启后)和19:35(灶具关闭后)厨房温度传感器两次报告MeasuredValue=None,表明传感器出现了读数丢失/故障。正常传感器不应返回null。", "推理步骤4: 19:00温度恢复为24.29°C,与客厅(24.45°C)基本一致,之后读数恢复正常。结合之前的异常高温和null值,高度怀疑传感器本身存在间歇性故障。", "推理步骤5: 烟雾报警器全天未触发,排除了真实火灾风险,但传感器故障意味着厨房的温度监控存在盲区,降低了火灾预警能力。"], "key_evidence": ["18:00厨房温度异常跳升至2865(28.65°C),较前一读数2479(24.79°C)骤升近4°C,且灶具当时未开启", "18:51和19:35厨房温度传感器两次报告MeasuredValue=None,出现读数丢失", "18:30高温持续(2863),但灶具直到18:50才开启,无法用烹饪解释该高温"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器或更换电池,必要时更换设备", "排查传感器安装位置是否靠近热源(如冰箱散热口、阳光直射处),避免环境干扰", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保烟雾报警器工作正常", "考虑为厨房温度传感器设置null值告警规则,一旦出现读数丢失立即通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.271023273468018, "api_error": null} {"episode_id": "SQ2_FP_A_0320", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0320.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20260949, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "bedroom", "injection_time": "2026-06-10T15:38:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间出现异常读数跳变和两次 None 值,同时下午有未经正常开锁流程的陌生用户(UserIndex=5)远程开门进入。\",\n \"reasoning\": [\n \"推理步骤1: 15:38 入户门锁通过 OperationSource=3(远程/网络方式)被 UserIndex=5 解锁,但日志中没有对应的门传感器开关记录(front_door_contact 无状态变化),也没有住户的正常出门/回家模式匹配。住户早上 07:20 手动开锁出门,晚上 18:28 手动开锁回家,这是一致的生活模式。而 15:38 的远程开锁事件来源和用户身份不明,需要确认 UserIndex=5 是否为授权用户。\",\n \"推理步骤2: 19:00 厨房温度传感器瞬间从 ~24.6°C 跳升至 28.38°C,这一跳变幅度异常大(约 3.8°C 瞬升),虽然灶具在 19:00:30 才开启,但温度在灶具开启前就已飙升,时序上不合理。\",\n \"推理步骤3: 19:01 和 19:48 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回 None,这可能是传感器在高温环境下出现故障、通信中断或数据异常。\",\n \"推理步骤4: 19:30 厨房温度恢复报告为 28.44°C,灶具在 19:47 关闭后温度逐步回落至 24°C 左右,说明灶具使用本身是正常的烹饪行为,但传感器的 None 值和初始跳变仍属异常。\",\n \"推理步骤5: 其余设备行为均符合单人居住的正常作息模式——早起(06:25)、洗漱、早餐、出门上班(07:20)、晚归(18:28)、做饭、看电视/休息、睡觉(22:44),温度曲线也符合夏季白天升温夜间降温的自然规律。厨房窗户在做完饭后打开通风也是合理行为。\"\n ],\n \"key_evidence\": [\n \"15:38 front_door_lock 被 OperationSource=3(远程)UserIndex=5 解锁,无对应门传感器开关记录,与住户手动开锁的习惯不符\",\n \"19:00 厨房温度从 ~24.6°C 瞬间跳至 28.38°C,灶具尚未开启时温度已异常升高\",\n \"19:01 和 19:48 厨房温度传感器两次报告 MeasuredValue = None,传感器数据丢失\"\n ],\n \"recommended_actions\": [\n \"立即确认 UserIndex=5 的身份和授权状态,如果不是已知授权用户,应立即删除该用户凭证并审查门锁访问日志\",\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否因靠近灶具导致高温干扰或传感器本身存在故障\",\n \"对温度传感器的 None 值设置告警规则,连续出现 None 时自动通知住户,避免在真正火灾场景下丧失温度监测能力\",\n \"建议为远程开锁操作增加二次确认机制(如手机推送确认),防止未授权的远程访问\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间出现异常读数跳变和两次 None 值,同时下午有未经正常开锁流程的陌生用户(UserIndex=5)远程开门进入。", "reasoning": ["推理步骤1: 15:38 入户门锁通过 OperationSource=3(远程/网络方式)被 UserIndex=5 解锁,但日志中没有对应的门传感器开关记录(front_door_contact 无状态变化),也没有住户的正常出门/回家模式匹配。住户早上 07:20 手动开锁出门,晚上 18:28 手动开锁回家,这是一致的生活模式。而 15:38 的远程开锁事件来源和用户身份不明,需要确认 UserIndex=5 是否为授权用户。", "推理步骤2: 19:00 厨房温度传感器瞬间从 ~24.6°C 跳升至 28.38°C,这一跳变幅度异常大(约 3.8°C 瞬升),虽然灶具在 19:00:30 才开启,但温度在灶具开启前就已飙升,时序上不合理。", "推理步骤3: 19:01 和 19:48 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回 None,这可能是传感器在高温环境下出现故障、通信中断或数据异常。", "推理步骤4: 19:30 厨房温度恢复报告为 28.44°C,灶具在 19:47 关闭后温度逐步回落至 24°C 左右,说明灶具使用本身是正常的烹饪行为,但传感器的 None 值和初始跳变仍属异常。", "推理步骤5: 其余设备行为均符合单人居住的正常作息模式——早起(06:25)、洗漱、早餐、出门上班(07:20)、晚归(18:28)、做饭、看电视/休息、睡觉(22:44),温度曲线也符合夏季白天升温夜间降温的自然规律。厨房窗户在做完饭后打开通风也是合理行为。"], "key_evidence": ["15:38 front_door_lock 被 OperationSource=3(远程)UserIndex=5 解锁,无对应门传感器开关记录,与住户手动开锁的习惯不符", "19:00 厨房温度从 ~24.6°C 瞬间跳至 28.38°C,灶具尚未开启时温度已异常升高", "19:01 和 19:48 厨房温度传感器两次报告 MeasuredValue = None,传感器数据丢失"], "recommended_actions": ["立即确认 UserIndex=5 的身份和授权状态,如果不是已知授权用户,应立即删除该用户凭证并审查门锁访问日志", "检查厨房温度传感器的硬件状态和安装位置,确认是否因靠近灶具导致高温干扰或传感器本身存在故障", "对温度传感器的 None 值设置告警规则,连续出现 None 时自动通知住户,避免在真正火灾场景下丧失温度监测能力", "建议为远程开锁操作增加二次确认机制(如手机推送确认),防止未授权的远程访问"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.302712202072144, "api_error": null} {"episode_id": "SQ2_FP_A_0322", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0322.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20260951, "scenario_id": "WD-01", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-07T09:16:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.56°C),疑似传感器故障或存在未被察觉的热源。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间(09:10、11:52、18:00)以及灶具关闭后(09:42、12:55、18:56)多次报告 MeasuredValue = None,一天内共出现 6 次空值。其他两个温度传感器全天无任何 None 值,说明这不是系统性问题,而是该传感器自身异常。\",\n \"推理步骤2: 11:00 厨房温度传感器报告 2956(即 29.56°C),而同一时刻客厅为 25.60°C、卧室为 24.57°C。厨房温度比其他房间高出约 4-5°C,且此时灶具处于关闭状态(09:41 已关闭,11:51 才重新开启)。在灶具未使用的情况下出现如此大的温差是不正常的。\",\n \"推理步骤3: 11:30 厨房仍然报告 2943(29.43°C),持续异常高温。直到 12:00 才回落到 25.89°C。这段无灶具运行期间的持续高温,要么说明传感器读数漂移/故障,要么说明厨房存在未被监测到的异常热源。\",\n \"推理步骤4: 温度传感器与灶具开关存在时序关联——每次灶具开启后约 30 秒传感器就报 None,灶具关闭后约 1 分钟也报 None。这种规律性暗示传感器可能受到灶具电磁干扰,或者传感器安装位置过于靠近灶具导致超量程。\",\n \"推理步骤5: 其余事件均属正常生活模式:早晨起床(08:38-08:40)、三餐做饭、晚间关灯锁门就寝(23:12),卫生间短暂漏水报警(09:16-09:18,2 分钟内自动恢复,可能是洗手溅水触发),入户门自动上锁,整体生活节奏无入侵或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(09:10、09:42、11:52、12:55、18:00、18:56),其他传感器无此现象\",\n \"11:00-11:30 灶具未运行期间,厨房温度飙升至 29.56°C / 29.43°C,比同时刻客厅高约 4°C,属于异常偏差\",\n \"每次灶具开关操作后约 30-60 秒传感器即报 None,呈现高度规律性的故障模式\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时重新安置到远离热源和电磁干扰的位置\",\n \"对厨房温度传感器进行校准测试或更换,排除硬件老化/故障的可能\",\n \"在传感器修复前,加强对厨房烟雾报警器的关注,因为温度传感器的不可靠可能导致无法及时发现厨房过热风险\",\n \"卫生间漏水传感器虽然 2 分钟内恢复正常,但建议留意后续是否再次触发,排除管道缓慢渗漏的可能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.56°C),疑似传感器故障或存在未被察觉的热源。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间(09:10、11:52、18:00)以及灶具关闭后(09:42、12:55、18:56)多次报告 MeasuredValue = None,一天内共出现 6 次空值。其他两个温度传感器全天无任何 None 值,说明这不是系统性问题,而是该传感器自身异常。", "推理步骤2: 11:00 厨房温度传感器报告 2956(即 29.56°C),而同一时刻客厅为 25.60°C、卧室为 24.57°C。厨房温度比其他房间高出约 4-5°C,且此时灶具处于关闭状态(09:41 已关闭,11:51 才重新开启)。在灶具未使用的情况下出现如此大的温差是不正常的。", "推理步骤3: 11:30 厨房仍然报告 2943(29.43°C),持续异常高温。直到 12:00 才回落到 25.89°C。这段无灶具运行期间的持续高温,要么说明传感器读数漂移/故障,要么说明厨房存在未被监测到的异常热源。", "推理步骤4: 温度传感器与灶具开关存在时序关联——每次灶具开启后约 30 秒传感器就报 None,灶具关闭后约 1 分钟也报 None。这种规律性暗示传感器可能受到灶具电磁干扰,或者传感器安装位置过于靠近灶具导致超量程。", "推理步骤5: 其余事件均属正常生活模式:早晨起床(08:38-08:40)、三餐做饭、晚间关灯锁门就寝(23:12),卫生间短暂漏水报警(09:16-09:18,2 分钟内自动恢复,可能是洗手溅水触发),入户门自动上锁,整体生活节奏无入侵或火灾迹象。"], "key_evidence": ["厨房温度传感器一天内 6 次报告 MeasuredValue = None(09:10、09:42、11:52、12:55、18:00、18:56),其他传感器无此现象", "11:00-11:30 灶具未运行期间,厨房温度飙升至 29.56°C / 29.43°C,比同时刻客厅高约 4°C,属于异常偏差", "每次灶具开关操作后约 30-60 秒传感器即报 None,呈现高度规律性的故障模式"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时重新安置到远离热源和电磁干扰的位置", "对厨房温度传感器进行校准测试或更换,排除硬件老化/故障的可能", "在传感器修复前,加强对厨房烟雾报警器的关注,因为温度传感器的不可靠可能导致无法及时发现厨房过热风险", "卫生间漏水传感器虽然 2 分钟内恢复正常,但建议留意后续是否再次触发,排除管道缓慢渗漏的可能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.118814945220947, "api_error": null} {"episode_id": "SQ2_FP_A_0327", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0327.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20260956, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-16T09:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障或受高温影响失灵\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约2456跳升至2833(即从24.56°C跳到28.33°C),30分钟内上升近4°C,远超正常波动幅度\",\n \"推理步骤2: 19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None,表示传感器无法正常读取数据,出现两次数据丢失\",\n \"推理步骤3: 虽然19:14灶具开启可以解释厨房温度上升,但传感器报告None值属于设备异常——正常传感器即使在高温环境下也应返回数值而非空值\",\n \"推理步骤4: 19:31灶具关闭后用户开窗通风,20:00温度恢复至2403,说明并非持续性火灾风险,但传感器的None值问题需要关注\",\n \"推理步骤5: 其余事件(起床、出门、回家、做饭、睡觉)均符合单人住户一天的正常生活模式,无入侵或其他安全威胁迹象\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从2456骤升至2833(+3.77°C),19:30仍为2837\",\n \"19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None(数据丢失)\",\n \"灶具在19:14开启、19:31关闭,时间上与温度异常吻合但不能解释None值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温影响传感器工作\",\n \"对厨房温度传感器进行功能测试或固件更新,排除硬件故障\",\n \"考虑为传感器设置高温保护阈值告警,当温度异常跳变或返回None时及时通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障或受高温影响失灵", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约2456跳升至2833(即从24.56°C跳到28.33°C),30分钟内上升近4°C,远超正常波动幅度", "推理步骤2: 19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None,表示传感器无法正常读取数据,出现两次数据丢失", "推理步骤3: 虽然19:14灶具开启可以解释厨房温度上升,但传感器报告None值属于设备异常——正常传感器即使在高温环境下也应返回数值而非空值", "推理步骤4: 19:31灶具关闭后用户开窗通风,20:00温度恢复至2403,说明并非持续性火灾风险,但传感器的None值问题需要关注", "推理步骤5: 其余事件(起床、出门、回家、做饭、睡觉)均符合单人住户一天的正常生活模式,无入侵或其他安全威胁迹象"], "key_evidence": ["19:00 厨房温度从2456骤升至2833(+3.77°C),19:30仍为2837", "19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None(数据丢失)", "灶具在19:14开启、19:31关闭,时间上与温度异常吻合但不能解释None值"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温影响传感器工作", "对厨房温度传感器进行功能测试或固件更新,排除硬件故障", "考虑为传感器设置高温保护阈值告警,当温度异常跳变或返回None时及时通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.42154026031494, "api_error": null} {"episode_id": "SQ2_FP_A_0329", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0329.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260958, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-02T07:23:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次空值(None)报告,疑似传感器故障或曾存在真实高温隐患\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.64°C,而此时灶具尚未开启(灶具 18:49 才开),客厅和卧室温度同期无异常升高,说明这不是全屋环境变化,而是厨房局部异常。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.53°C,持续约 30 分钟的异常高温。随后 18:50 和 19:54 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null,这是典型的传感器故障或过载保护信号。\",\n \"推理步骤3: 19:00 厨房温度恢复到 24.33°C,与客厅温度基本一致,说明异常高温已消失。但 None 值出现在灶具使用期间(18:49-19:53),可能是灶具高温导致传感器超量程或通信中断。\",\n \"推理步骤4: 综合来看,18:00 的异常高温发生在灶具开启前 49 分钟,无法用正常烹饪解释。可能原因包括:传感器本身故障产生虚假高温读数,或厨房确实存在过不明热源。两次 None 值进一步佐证传感器工作状态不稳定。\",\n \"推理步骤5: 其余事件均属正常生活模式——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作均为授权用户(UserIndex=1),07:23 的一次 LockOperationError 后立即成功解锁属于正常输错密码/指纹重试,不构成入侵威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约 24.85°C 骤升至 28.64°C,而灶具直到 18:49 才开启,客厅/卧室同期温度无对应升高\",\n \"18:30 厨房温度仍为 28.53°C,异常高温持续至少 30 分钟\",\n \"18:50 和 19:54 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数异常或通信故障\",\n \"19:00 温度恢复正常(24.33°C),异常为间歇性而非持续性\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否存在硬件故障或受到外部热源干扰(如阳光直射、靠近电器排热口)\",\n \"排查 18:00 前后厨房是否有未被记录的热源(如烤箱、微波炉等非智能设备的使用),排除真实高温隐患\",\n \"关注传感器返回 None 值的问题,检查传感器固件版本和通信链路稳定性,必要时更换传感器\",\n \"考虑为厨房温度传感器设置异常阈值告警(如超过 27°C 或出现 null 值时立即通知),以便及时发现类似问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次空值(None)报告,疑似传感器故障或曾存在真实高温隐患", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.64°C,而此时灶具尚未开启(灶具 18:49 才开),客厅和卧室温度同期无异常升高,说明这不是全屋环境变化,而是厨房局部异常。", "推理步骤2: 18:30 厨房温度仍高达 28.53°C,持续约 30 分钟的异常高温。随后 18:50 和 19:54 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null,这是典型的传感器故障或过载保护信号。", "推理步骤3: 19:00 厨房温度恢复到 24.33°C,与客厅温度基本一致,说明异常高温已消失。但 None 值出现在灶具使用期间(18:49-19:53),可能是灶具高温导致传感器超量程或通信中断。", "推理步骤4: 综合来看,18:00 的异常高温发生在灶具开启前 49 分钟,无法用正常烹饪解释。可能原因包括:传感器本身故障产生虚假高温读数,或厨房确实存在过不明热源。两次 None 值进一步佐证传感器工作状态不稳定。", "推理步骤5: 其余事件均属正常生活模式——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作均为授权用户(UserIndex=1),07:23 的一次 LockOperationError 后立即成功解锁属于正常输错密码/指纹重试,不构成入侵威胁。"], "key_evidence": ["18:00 厨房温度从约 24.85°C 骤升至 28.64°C,而灶具直到 18:49 才开启,客厅/卧室同期温度无对应升高", "18:30 厨房温度仍为 28.53°C,异常高温持续至少 30 分钟", "18:50 和 19:54 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数异常或通信故障", "19:00 温度恢复正常(24.33°C),异常为间歇性而非持续性"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否存在硬件故障或受到外部热源干扰(如阳光直射、靠近电器排热口)", "排查 18:00 前后厨房是否有未被记录的热源(如烤箱、微波炉等非智能设备的使用),排除真实高温隐患", "关注传感器返回 None 值的问题,检查传感器固件版本和通信链路稳定性,必要时更换传感器", "考虑为厨房温度传感器设置异常阈值告警(如超过 27°C 或出现 null 值时立即通知),以便及时发现类似问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.64755392074585, "api_error": null} {"episode_id": "SQ2_FP_A_0332", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0332.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20260961, "scenario_id": "INS-04", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-06T11:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.45°C / 29.59°C),疑似传感器故障或存在未被察觉的热源隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中共出现 4 次 MeasuredValue = None 的情况(08:59、12:51、18:16、18:53),均发生在灶具开启或关闭前后。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受高温影响出现间歇性故障。\",\n \"推理步骤2: 在 11:00 时,厨房温度传感器报告 2945(即 29.45°C),而同一时刻客厅为 25.40°C、卧室为 24.51°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 09:54 已关闭,11:45 才重新开启)。11:30 进一步升至 29.59°C。在灶具关闭的情况下厨房温度不应持续异常攀升,这可能是传感器读数漂移/故障,也可能暗示厨房存在未知热源。\",\n \"推理步骤3: 对比其他时段,灶具关闭后厨房温度通常与客厅温度接近(差值 < 1°C),但 11:00-11:30 时段差值达到 4°C 以上,属于明显偏离正常模式。12:00 恢复到 25.75°C 说明异常是暂时性的,更倾向于传感器故障而非真实火灾风险,但不能完全排除短暂热源事件。\",\n \"推理步骤4: 其余设备行为均属正常——住户约 08:19 起床、三餐规律用灶、23:04 就寝锁门、空调制冷模式运行、门锁操作有合法用户索引(UserIndex=5),无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 08:59、12:51、18:16、18:53 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"11:00 厨房温度突增至 2945(29.45°C),11:30 达 2959(29.59°C),而此时灶具处于关闭状态(09:54 关闭,11:45 才重新开启),与客厅/卧室温差异常达 4-5°C\",\n \"12:00 厨房温度恢复至 2575(25.75°C),异常为短暂性,指向传感器故障或瞬时热源事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热辐射影响导致读数丢失和漂移,必要时更换或重新定位传感器\",\n \"排查 11:00-11:30 时段厨房是否存在未记录的热源(如烤箱、电热水壶等非 Matter 联网设备),确认异常高温的真实原因\",\n \"考虑为厨房温度传感器设置异常值告警规则:当读数为 None 或温度突变超过 3°C/30min 时自动推送通知\",\n \"烟雾报警器在该时段未触发,说明未达到烟雾/CO 阈值,但建议定期测试烟雾报警器以确保其工作正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.45°C / 29.59°C),疑似传感器故障或存在未被察觉的热源隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中共出现 4 次 MeasuredValue = None 的情况(08:59、12:51、18:16、18:53),均发生在灶具开启或关闭前后。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受高温影响出现间歇性故障。", "推理步骤2: 在 11:00 时,厨房温度传感器报告 2945(即 29.45°C),而同一时刻客厅为 25.40°C、卧室为 24.51°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 09:54 已关闭,11:45 才重新开启)。11:30 进一步升至 29.59°C。在灶具关闭的情况下厨房温度不应持续异常攀升,这可能是传感器读数漂移/故障,也可能暗示厨房存在未知热源。", "推理步骤3: 对比其他时段,灶具关闭后厨房温度通常与客厅温度接近(差值 < 1°C),但 11:00-11:30 时段差值达到 4°C 以上,属于明显偏离正常模式。12:00 恢复到 25.75°C 说明异常是暂时性的,更倾向于传感器故障而非真实火灾风险,但不能完全排除短暂热源事件。", "推理步骤4: 其余设备行为均属正常——住户约 08:19 起床、三餐规律用灶、23:04 就寝锁门、空调制冷模式运行、门锁操作有合法用户索引(UserIndex=5),无入侵迹象。"], "key_evidence": ["厨房温度传感器在 08:59、12:51、18:16、18:53 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "11:00 厨房温度突增至 2945(29.45°C),11:30 达 2959(29.59°C),而此时灶具处于关闭状态(09:54 关闭,11:45 才重新开启),与客厅/卧室温差异常达 4-5°C", "12:00 厨房温度恢复至 2575(25.75°C),异常为短暂性,指向传感器故障或瞬时热源事件"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热辐射影响导致读数丢失和漂移,必要时更换或重新定位传感器", "排查 11:00-11:30 时段厨房是否存在未记录的热源(如烤箱、电热水壶等非 Matter 联网设备),确认异常高温的真实原因", "考虑为厨房温度传感器设置异常值告警规则:当读数为 None 或温度突变超过 3°C/30min 时自动推送通知", "烟雾报警器在该时段未触发,说明未达到烟雾/CO 阈值,但建议定期测试烟雾报警器以确保其工作正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.396970748901367, "api_error": null} {"episode_id": "SQ2_FP_A_0333", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0333.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260962, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-25T17:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或受到灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度从 24.55°C(18:30)骤升至 28.43°C,30分钟内跳升近 4°C,而同时段客厅和卧室温度仅正常下降,排除全屋环境突变。\",\n \"推理步骤2: 19:11:30 灶具开启,19:12:00 厨房温度传感器报告 MeasuredValue = None(null),说明传感器在灶具工作期间无法正常读数。19:32 灶具关闭后 19:33 再次报告 None,传感器仍未恢复。\",\n \"推理步骤3: 19:00 的 28.43°C 读数出现在灶具正式开启(19:11)之前,但此时用户已回家(18:06)且在厨房区域活动准备做饭,不排除灶具预热或其他热源影响。然而该跳变幅度异常大,更可能是传感器本身出现间歇性故障的前兆。\",\n \"推理步骤4: 20:00 传感器恢复正常读数 24.17°C,与客厅 24.14°C 基本一致,说明传感器在故障后能自行恢复,但两次 null 读数表明其工作状态不稳定。\",\n \"推理步骤5: 其余所有事件均属正常生活模式——早晨 6:17 起床、洗漱、早餐、7:19 出门上班(门锁自动锁定)、17:43 门锁输错一次密码后正确开锁回家、开空调做饭、22:35 关灯就寝,完全符合独居上班族的日常作息。\",\n \"推理步骤6: 17:43 的 LockOperationError 仅一次失败后立即用正确凭证(UserIndex=1,即户主)成功开锁,属于正常的输入失误,不构成入侵威胁。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.55°C 骤升至 28.43°C(+3.88°C/30min),同期客厅仅下降 0.3°C\",\n \"19:12:00 和 19:33:00 厨房温度传感器连续两次报告 MeasuredValue = None\",\n \"19:30 厨房温度仍为 28.40°C(灶具已关闭前),20:00 恢复至 24.17°C,波动剧烈且不连续\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰和读数异常\",\n \"如传感器位置合理,建议对其进行固件更新或更换,两次 null 读数表明硬件可能存在间歇性故障\",\n \"考虑为厨房烟雾报警器设置联动规则:当温度传感器报告 null 且灶具处于开启状态时,自动发送提醒通知,避免因传感器失效而遗漏真实火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或受到灶具高温干扰。", "reasoning": ["推理步骤1: 19:00 厨房温度从 24.55°C(18:30)骤升至 28.43°C,30分钟内跳升近 4°C,而同时段客厅和卧室温度仅正常下降,排除全屋环境突变。", "推理步骤2: 19:11:30 灶具开启,19:12:00 厨房温度传感器报告 MeasuredValue = None(null),说明传感器在灶具工作期间无法正常读数。19:32 灶具关闭后 19:33 再次报告 None,传感器仍未恢复。", "推理步骤3: 19:00 的 28.43°C 读数出现在灶具正式开启(19:11)之前,但此时用户已回家(18:06)且在厨房区域活动准备做饭,不排除灶具预热或其他热源影响。然而该跳变幅度异常大,更可能是传感器本身出现间歇性故障的前兆。", "推理步骤4: 20:00 传感器恢复正常读数 24.17°C,与客厅 24.14°C 基本一致,说明传感器在故障后能自行恢复,但两次 null 读数表明其工作状态不稳定。", "推理步骤5: 其余所有事件均属正常生活模式——早晨 6:17 起床、洗漱、早餐、7:19 出门上班(门锁自动锁定)、17:43 门锁输错一次密码后正确开锁回家、开空调做饭、22:35 关灯就寝,完全符合独居上班族的日常作息。", "推理步骤6: 17:43 的 LockOperationError 仅一次失败后立即用正确凭证(UserIndex=1,即户主)成功开锁,属于正常的输入失误,不构成入侵威胁。"], "key_evidence": ["19:00 厨房温度从 24.55°C 骤升至 28.43°C(+3.88°C/30min),同期客厅仅下降 0.3°C", "19:12:00 和 19:33:00 厨房温度传感器连续两次报告 MeasuredValue = None", "19:30 厨房温度仍为 28.40°C(灶具已关闭前),20:00 恢复至 24.17°C,波动剧烈且不连续"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰和读数异常", "如传感器位置合理,建议对其进行固件更新或更换,两次 null 读数表明硬件可能存在间歇性故障", "考虑为厨房烟雾报警器设置联动规则:当温度传感器报告 null 且灶具处于开启状态时,自动发送提醒通知,避免因传感器失效而遗漏真实火灾风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.105637073516846, "api_error": null} {"episode_id": "SQ2_FP_A_0341", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0341.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20260970, "scenario_id": "INS-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "kitchen", "injection_time": "2026-06-04T07:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次空值上报,疑似传感器故障;同时卧室窗户和厨房窗户在住户睡后仍处于打开状态,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 24.66°C 跳升至 28.38°C,涨幅近 4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中,排除全屋环境突变的可能。\",\n \"推理步骤2: 19:10 灶具才开启,但温度跳变发生在 19:00,早于灶具使用,说明这次跳变并非烹饪导致。19:30 灶具仍在使用时厨房温度报 28.33°C 与 19:00 几乎持平,缺乏灶具加热应有的持续上升趋势,进一步说明传感器读数不可靠。\",\n \"推理步骤3: 19:11 和 19:35 厨房温度传感器两次上报 MeasuredValue = None(空值),这是典型的传感器通信故障或硬件异常表现。正常传感器不应返回空值。\",\n \"推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险。灶具在 19:34 已正常关闭,烹饪流程本身无异常。\",\n \"推理步骤5: 卧室窗户传感器在 07:06 报告 StateValue=False(窗户打开),之后全天无关闭记录;厨房窗户在 19:34 打开后也未关闭。住户 22:51 已关灯入睡,两扇窗户在夜间保持开启状态,存在入侵风险和夜间安全隐患。\",\n \"推理步骤6: 入户门在 18:01 回家时开启后未立即关闭/上锁,直到 22:06 才确认门关闭并自动上锁,中间约 4 小时入户门状态不明确,但最终已上锁,当前门锁状态安全。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.66°C 异常跳升至 28.38°C,灶具尚未开启\",\n \"19:11 和 19:35 厨房温度传感器两次上报 MeasuredValue = None\",\n \"19:30 灶具运行中厨房温度仍为 28.33°C,未见合理的持续升温\",\n \"卧室窗户 07:06 打开后全天未关闭,住户已于 22:51 入睡\",\n \"厨房窗户 19:34 打开后未关闭,夜间仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除接线松动、电量不足等问题\",\n \"建议设置传感器空值告警规则:当 MeasuredValue 返回 None 时立即推送通知\",\n \"提醒住户关闭卧室窗户和厨房窗户,或设置就寝自动化场景(检测到卧室灯关闭时自动检查并提醒关窗)\",\n \"建议增加入户门未关闭超时提醒(如开门超过 5 分钟未关闭则告警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次空值上报,疑似传感器故障;同时卧室窗户和厨房窗户在住户睡后仍处于打开状态,存在安全隐患。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 24.66°C 跳升至 28.38°C,涨幅近 4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中,排除全屋环境突变的可能。", "推理步骤2: 19:10 灶具才开启,但温度跳变发生在 19:00,早于灶具使用,说明这次跳变并非烹饪导致。19:30 灶具仍在使用时厨房温度报 28.33°C 与 19:00 几乎持平,缺乏灶具加热应有的持续上升趋势,进一步说明传感器读数不可靠。", "推理步骤3: 19:11 和 19:35 厨房温度传感器两次上报 MeasuredValue = None(空值),这是典型的传感器通信故障或硬件异常表现。正常传感器不应返回空值。", "推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险。灶具在 19:34 已正常关闭,烹饪流程本身无异常。", "推理步骤5: 卧室窗户传感器在 07:06 报告 StateValue=False(窗户打开),之后全天无关闭记录;厨房窗户在 19:34 打开后也未关闭。住户 22:51 已关灯入睡,两扇窗户在夜间保持开启状态,存在入侵风险和夜间安全隐患。", "推理步骤6: 入户门在 18:01 回家时开启后未立即关闭/上锁,直到 22:06 才确认门关闭并自动上锁,中间约 4 小时入户门状态不明确,但最终已上锁,当前门锁状态安全。"], "key_evidence": ["19:00 厨房温度从 ~24.66°C 异常跳升至 28.38°C,灶具尚未开启", "19:11 和 19:35 厨房温度传感器两次上报 MeasuredValue = None", "19:30 灶具运行中厨房温度仍为 28.33°C,未见合理的持续升温", "卧室窗户 07:06 打开后全天未关闭,住户已于 22:51 入睡", "厨房窗户 19:34 打开后未关闭,夜间仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除接线松动、电量不足等问题", "建议设置传感器空值告警规则:当 MeasuredValue 返回 None 时立即推送通知", "提醒住户关闭卧室窗户和厨房窗户,或设置就寝自动化场景(检测到卧室灯关闭时自动检查并提醒关窗)", "建议增加入户门未关闭超时提醒(如开门超过 5 分钟未关闭则告警)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.89848828315735, "api_error": null} {"episode_id": "SQ2_FP_A_0342", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0342.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20260971, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-01T09:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭,需关注夜间安全。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2489(24.89°C)跳升至 2852(28.52°C),升幅约 3.6°C,而同一时刻客厅和卧室温度仅正常小幅下降。此时灶具尚未开启(18:50 才开),无合理热源解释这一跳变。\",\n \"推理步骤2: 18:30 厨房温度仍维持在 2852,但 19:00 又骤降回 2445,降幅超过 4°C,这种剧烈波动不符合自然温度变化规律,高度怀疑传感器读数异常。\",\n \"推理步骤3: 18:51(灶具刚开启1分钟)和 19:40(灶具关闭后1分钟)厨房温度传感器两次报告 MeasuredValue = None,正常传感器不应返回空值,这进一步印证传感器存在硬件故障或通信异常。\",\n \"推理步骤4: 19:39 厨房窗户传感器报告 StateValue = False(窗户打开),此后直到日志结束(23:30)未见窗户关闭事件。住户约 22:51 已入睡,厨房窗户整夜敞开存在一定安全隐患(入侵风险、雨水等)。\",\n \"推理步骤5: 其余事件均属正常生活模式——早晨 6:28 起床、7:24 出门上班并自动锁门、9:01 有一次门锁操作错误后立即成功解锁(可能是输错密码后重试,UserIndex=1 为已注册用户)、18:03 回家、晚间做饭、22:51 就寝,整体行为链合理无异常。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.89°C 骤升至 28.52°C,此时灶具未开启,客厅/卧室温度无对应变化\",\n \"18:51 和 19:40 厨房温度传感器两次报告 MeasuredValue = None(空值)\",\n \"18:00→18:30 维持 28.52°C 后 19:00 骤降回 24.45°C,波动幅度异常\",\n \"19:39 厨房窗户打开后至日志结束未见关闭事件,住户已于 22:51 入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认 Matter 通信链路是否稳定,必要时更换传感器\",\n \"在自动化规则中添加传感器返回 None 时的告警通知,避免因传感器失效导致烟雾/高温事件漏报\",\n \"提醒住户关闭厨房窗户,或设置就寝模式自动化:当卧室灯关闭且卧室运动传感器无人时,检查所有窗户状态并发送未关窗提醒\",\n \"持续观察厨房温度传感器未来几天的读数,确认异常是否复现以判断是间歇性故障还是永久性损坏\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭,需关注夜间安全。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2489(24.89°C)跳升至 2852(28.52°C),升幅约 3.6°C,而同一时刻客厅和卧室温度仅正常小幅下降。此时灶具尚未开启(18:50 才开),无合理热源解释这一跳变。", "推理步骤2: 18:30 厨房温度仍维持在 2852,但 19:00 又骤降回 2445,降幅超过 4°C,这种剧烈波动不符合自然温度变化规律,高度怀疑传感器读数异常。", "推理步骤3: 18:51(灶具刚开启1分钟)和 19:40(灶具关闭后1分钟)厨房温度传感器两次报告 MeasuredValue = None,正常传感器不应返回空值,这进一步印证传感器存在硬件故障或通信异常。", "推理步骤4: 19:39 厨房窗户传感器报告 StateValue = False(窗户打开),此后直到日志结束(23:30)未见窗户关闭事件。住户约 22:51 已入睡,厨房窗户整夜敞开存在一定安全隐患(入侵风险、雨水等)。", "推理步骤5: 其余事件均属正常生活模式——早晨 6:28 起床、7:24 出门上班并自动锁门、9:01 有一次门锁操作错误后立即成功解锁(可能是输错密码后重试,UserIndex=1 为已注册用户)、18:03 回家、晚间做饭、22:51 就寝,整体行为链合理无异常。"], "key_evidence": ["18:00 厨房温度从 ~24.89°C 骤升至 28.52°C,此时灶具未开启,客厅/卧室温度无对应变化", "18:51 和 19:40 厨房温度传感器两次报告 MeasuredValue = None(空值)", "18:00→18:30 维持 28.52°C 后 19:00 骤降回 24.45°C,波动幅度异常", "19:39 厨房窗户打开后至日志结束未见关闭事件,住户已于 22:51 入睡"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认 Matter 通信链路是否稳定,必要时更换传感器", "在自动化规则中添加传感器返回 None 时的告警通知,避免因传感器失效导致烟雾/高温事件漏报", "提醒住户关闭厨房窗户,或设置就寝模式自动化:当卧室灯关闭且卧室运动传感器无人时,检查所有窗户状态并发送未关窗提醒", "持续观察厨房温度传感器未来几天的读数,确认异常是否复现以判断是间歇性故障还是永久性损坏"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.232781648635864, "api_error": null} {"episode_id": "SQ2_FP_A_0344", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0344.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260973, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-25T08:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或线路问题\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~24.5°C 跳升至 28.45°C,涨幅约 4°C,而同一时刻客厅和卧室温度仅正常下降,排除全屋环境突变的可能\",\n \"推理步骤2: 19:01 灶具才刚开启,但 19:00 的温度跳变发生在灶具开启之前,且灶具正常使用不应在一个采样周期内导致环境温度骤升近 4°C,说明该读数不可信\",\n \"推理步骤3: 19:02 和 19:31 传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是典型的设备故障或通信中断信号\",\n \"推理步骤4: 19:30 灶具已关闭,但传感器仍报告 28.35°C 的高温,随后再次 null;直到 20:00 才恢复到 24.14°C 的合理值,整个异常窗口持续约 1 小时\",\n \"推理步骤5: 其余所有设备行为均符合正常生活模式——早起、出门、晚归、做饭、睡觉,门锁/灯光/运动传感器时序合理,无入侵或其他安全威胁迹象\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.76°C 骤升至 28.45°C,灶具尚未开启(19:01 才开)\",\n \"19:02 kitchen_temp_sensor 报告 MeasuredValue = None\",\n \"19:31 kitchen_temp_sensor 再次报告 MeasuredValue = None\",\n \"19:30 灶具已关闭但温度仍显示 28.35°C,与客厅/卧室温度趋势严重不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否过于靠近灶具热源导致读数偏高\",\n \"检查传感器供电和 Matter 网络连接状态,排查 null 读数的根因(电池电量、信号强度、固件版本)\",\n \"如传感器持续出现 null 值或异常跳变,建议更换设备或重新配对\",\n \"在传感器修复前,烹饪时应人工留意厨房状况,避免因传感器失灵而遗漏真实的高温/火灾预警\"\n ]\n}\n```\n\n补充说明几个被排除的关注点:\n\n- 08:09 卫生间漏水传感器短暂触发(2 分钟后恢复),同时有人在卫生间内(occupancy=1),大概率是洗漱溅水,属正常行为。\n- 18:10 住户回家时入户门未立即关闭/上锁,直到 22:08 才记录到门关闭并自动上锁。如果这段时间门确实一直未锁,存在轻微安全隐患,建议确认门锁自动上锁策略是否需要调整(例如进门后 N 分钟自动上锁)。但从日志整体看,这更可能是住户的日常习惯而非威胁事件。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或线路问题", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~24.5°C 跳升至 28.45°C,涨幅约 4°C,而同一时刻客厅和卧室温度仅正常下降,排除全屋环境突变的可能", "推理步骤2: 19:01 灶具才刚开启,但 19:00 的温度跳变发生在灶具开启之前,且灶具正常使用不应在一个采样周期内导致环境温度骤升近 4°C,说明该读数不可信", "推理步骤3: 19:02 和 19:31 传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是典型的设备故障或通信中断信号", "推理步骤4: 19:30 灶具已关闭,但传感器仍报告 28.35°C 的高温,随后再次 null;直到 20:00 才恢复到 24.14°C 的合理值,整个异常窗口持续约 1 小时", "推理步骤5: 其余所有设备行为均符合正常生活模式——早起、出门、晚归、做饭、睡觉,门锁/灯光/运动传感器时序合理,无入侵或其他安全威胁迹象"], "key_evidence": ["19:00 厨房温度从 ~24.76°C 骤升至 28.45°C,灶具尚未开启(19:01 才开)", "19:02 kitchen_temp_sensor 报告 MeasuredValue = None", "19:31 kitchen_temp_sensor 再次报告 MeasuredValue = None", "19:30 灶具已关闭但温度仍显示 28.35°C,与客厅/卧室温度趋势严重不一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否过于靠近灶具热源导致读数偏高", "检查传感器供电和 Matter 网络连接状态,排查 null 读数的根因(电池电量、信号强度、固件版本)", "如传感器持续出现 null 值或异常跳变,建议更换设备或重新配对", "在传感器修复前,烹饪时应人工留意厨房状况,避免因传感器失灵而遗漏真实的高温/火灾预警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.180792570114136, "api_error": null} {"episode_id": "SQ2_FP_A_0353", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0353.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20260982, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "bedroom", "injection_time": "2026-06-11T21:02:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"21:02 入户门被未知用户(UserIndex=5)远程解锁,住户已在家但未触发开门传感器,门锁操作来源异常,疑似未授权入侵或凭证泄露。\",\n \"reasoning\": [\n \"推理步骤1: 21:02 门锁事件显示 LockOperationType=1(解锁),OperationSource=3(远程/网络操作),UserIndex=5。当天其他两次门锁操作(07:30 和 18:29)均为 OperationSource=Manual(手动),且未携带 UserIndex,说明 UserIndex=5 是一个不同于户主日常使用方式的凭证。\",\n \"推理步骤2: 门锁解锁后,front_door_contact(门磁传感器)并未报告 StateValue=False(开门),说明门被远程解锁但实际上没有人推门进入。这与正常的'有人到访并进门'场景不符,更像是远程凭证被测试或误用。\",\n \"推理步骤3: 住户 18:29 已回家(手动开锁、开灯、开空调),此时人在客厅(living_room_occupancy=1)。住户本人在家的情况下,不太需要通过远程方式(OperationSource=3)解锁自家大门,且使用的是不同的 UserIndex。\",\n \"推理步骤4: 21:02 解锁后没有对应的重新上锁事件(直到 22:00:28 门才自动上锁),意味着门锁在近一小时内处于解锁状态,存在物理安全敞口。\",\n \"推理步骤5: 综合来看——远程操作来源、陌生用户索引、住户已在家、门未实际打开、长时间未重新上锁——高度指向未授权的远程解锁行为,可能是凭证泄露、共享密码被滥用或系统被攻击。\"\n ],\n \"key_evidence\": [\n \"21:02 门锁事件: LockOperationType=1, OperationSource=3, UserIndex=5 —— 远程解锁,使用非常规用户凭证\",\n \"解锁后 front_door_contact 未变化(未报告开门),说明无人实际通过该门\",\n \"住户 18:29 已通过手动方式回家,21:02 时人在客厅,无需远程开锁\",\n \"当天其他门锁操作均为 Manual 来源且无 UserIndex,此次操作模式完全不同\",\n \"门锁解锁后近 1 小时未重新上锁(直到 22:00:28 自动锁定)\"\n ],\n \"recommended_actions\": [\n \"立即检查门锁 UserIndex=5 对应的用户身份,若为未知或过期用户,立即删除该凭证\",\n \"审查门锁的远程访问权限,确认是否有未授权的第三方应用或共享链接可操控门锁\",\n \"更改门锁管理员密码及所有远程访问令牌,启用双因素认证(如门锁支持)\",\n \"检查智能家居平台(如 Matter Controller / 手机 App)的登录记录,排查账号是否被盗用\",\n \"设置自动化规则:远程解锁事件立即推送通知给户主,并在无人开门的情况下 60 秒后自动重新上锁\"\n ]\n}\n```\n\n补充说明几个次要发现(不构成主要威胁但值得关注):\n\n- 厨房温度传感器在 19:00 出现异常跳升(28.29°C)且 19:14 和 19:51 两次报告 `None`(空值),可能是传感器受灶具高温影响出现短暂故障,做饭结束后恢复正常,属于 device_fault 级别的小问题,建议确认传感器安装位置是否离灶具过近。\n- 整体温度从凌晨约 22°C 持续上升至中午 25.7°C,符合夏季白天自然升温规律,无异常。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "21:02 入户门被未知用户(UserIndex=5)远程解锁,住户已在家但未触发开门传感器,门锁操作来源异常,疑似未授权入侵或凭证泄露。", "reasoning": ["推理步骤1: 21:02 门锁事件显示 LockOperationType=1(解锁),OperationSource=3(远程/网络操作),UserIndex=5。当天其他两次门锁操作(07:30 和 18:29)均为 OperationSource=Manual(手动),且未携带 UserIndex,说明 UserIndex=5 是一个不同于户主日常使用方式的凭证。", "推理步骤2: 门锁解锁后,front_door_contact(门磁传感器)并未报告 StateValue=False(开门),说明门被远程解锁但实际上没有人推门进入。这与正常的'有人到访并进门'场景不符,更像是远程凭证被测试或误用。", "推理步骤3: 住户 18:29 已回家(手动开锁、开灯、开空调),此时人在客厅(living_room_occupancy=1)。住户本人在家的情况下,不太需要通过远程方式(OperationSource=3)解锁自家大门,且使用的是不同的 UserIndex。", "推理步骤4: 21:02 解锁后没有对应的重新上锁事件(直到 22:00:28 门才自动上锁),意味着门锁在近一小时内处于解锁状态,存在物理安全敞口。", "推理步骤5: 综合来看——远程操作来源、陌生用户索引、住户已在家、门未实际打开、长时间未重新上锁——高度指向未授权的远程解锁行为,可能是凭证泄露、共享密码被滥用或系统被攻击。"], "key_evidence": ["21:02 门锁事件: LockOperationType=1, OperationSource=3, UserIndex=5 —— 远程解锁,使用非常规用户凭证", "解锁后 front_door_contact 未变化(未报告开门),说明无人实际通过该门", "住户 18:29 已通过手动方式回家,21:02 时人在客厅,无需远程开锁", "当天其他门锁操作均为 Manual 来源且无 UserIndex,此次操作模式完全不同", "门锁解锁后近 1 小时未重新上锁(直到 22:00:28 自动锁定)"], "recommended_actions": ["立即检查门锁 UserIndex=5 对应的用户身份,若为未知或过期用户,立即删除该凭证", "审查门锁的远程访问权限,确认是否有未授权的第三方应用或共享链接可操控门锁", "更改门锁管理员密码及所有远程访问令牌,启用双因素认证(如门锁支持)", "检查智能家居平台(如 Matter Controller / 手机 App)的登录记录,排查账号是否被盗用", "设置自动化规则:远程解锁事件立即推送通知给户主,并在无人开门的情况下 60 秒后自动重新上锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.840118646621704, "api_error": null} {"episode_id": "SQ2_FP_A_0357", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0357.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260986, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-09T11:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.66°C),随后在19:00和19:32两次报告None值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 18:00厨房温度传感器突然从前一时刻的24.88°C跳升至28.66°C,而同一时刻客厅(24.67°C)和卧室(23.54°C)温度均在正常下降趋势中,三个房间温度不可能出现如此大的偏差。\",\n \"推理步骤2: 18:30厨房温度再次报告28.66°C(与18:00完全相同的数值),正常传感器在30分钟内不太可能给出完全一致的读数,这更像是传感器卡在了一个错误值上。\",\n \"推理步骤3: 此时灶具尚未开启(灶具在18:59才打开),因此28.66°C的高温不能用烹饪活动解释。\",\n \"推理步骤4: 19:00厨房温度传感器报告了一次None值(空读数),紧接着又恢复为正常的24.28°C,说明传感器出现了短暂的读取失败。\",\n \"推理步骤5: 19:32再次出现None值,此时灶具刚关闭、厨房窗户刚打开,传感器在正常工作环境下不应返回空值。两次None值进一步印证传感器硬件或通信链路存在间歇性故障。\",\n \"推理步骤6: 其余家庭活动均属正常模式——住户约06:33起床、07:15出门上班、18:16回家、21:46就寝,门锁开关、灯光、空调使用均与单人居住的一室一厅日常作息吻合,无入侵或其他安全威胁迹象。\",\n \"推理步骤7: 11:06卫生间漏水传感器短暂触发后2分钟内恢复,同时有人在卫生间(occupancy=1),大概率是正常用水溅水,非持续漏水。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从24.88°C骤升至28.66°C,而灶具直到18:59才开启,无合理热源解释\",\n \"18:30 厨房温度仍为28.66°C,与18:00读数完全相同,疑似传感器数值锁定\",\n \"19:00 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性读取失败\",\n \"同时段客厅和卧室温度传感器工作正常,排除全局网络问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态,包括电池电量、通信信号强度和安装位置是否受到干扰\",\n \"清理或重新校准厨房温度传感器,如问题持续则考虑更换设备\",\n \"在传感器修复前,可临时利用厨房烟雾报警器作为厨房安全的辅助监测手段\",\n \"建议在系统中增加传感器健康监测规则:当温度值出现None或短时间内跳变超过3°C时自动告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.66°C),随后在19:00和19:32两次报告None值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 18:00厨房温度传感器突然从前一时刻的24.88°C跳升至28.66°C,而同一时刻客厅(24.67°C)和卧室(23.54°C)温度均在正常下降趋势中,三个房间温度不可能出现如此大的偏差。", "推理步骤2: 18:30厨房温度再次报告28.66°C(与18:00完全相同的数值),正常传感器在30分钟内不太可能给出完全一致的读数,这更像是传感器卡在了一个错误值上。", "推理步骤3: 此时灶具尚未开启(灶具在18:59才打开),因此28.66°C的高温不能用烹饪活动解释。", "推理步骤4: 19:00厨房温度传感器报告了一次None值(空读数),紧接着又恢复为正常的24.28°C,说明传感器出现了短暂的读取失败。", "推理步骤5: 19:32再次出现None值,此时灶具刚关闭、厨房窗户刚打开,传感器在正常工作环境下不应返回空值。两次None值进一步印证传感器硬件或通信链路存在间歇性故障。", "推理步骤6: 其余家庭活动均属正常模式——住户约06:33起床、07:15出门上班、18:16回家、21:46就寝,门锁开关、灯光、空调使用均与单人居住的一室一厅日常作息吻合,无入侵或其他安全威胁迹象。", "推理步骤7: 11:06卫生间漏水传感器短暂触发后2分钟内恢复,同时有人在卫生间(occupancy=1),大概率是正常用水溅水,非持续漏水。"], "key_evidence": ["18:00 厨房温度从24.88°C骤升至28.66°C,而灶具直到18:59才开启,无合理热源解释", "18:30 厨房温度仍为28.66°C,与18:00读数完全相同,疑似传感器数值锁定", "19:00 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性读取失败", "同时段客厅和卧室温度传感器工作正常,排除全局网络问题"], "recommended_actions": ["检查厨房温度传感器的硬件状态,包括电池电量、通信信号强度和安装位置是否受到干扰", "清理或重新校准厨房温度传感器,如问题持续则考虑更换设备", "在传感器修复前,可临时利用厨房烟雾报警器作为厨房安全的辅助监测手段", "建议在系统中增加传感器健康监测规则:当温度值出现None或短时间内跳变超过3°C时自动告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.739688873291016, "api_error": null} {"episode_id": "SQ2_FP_A_0359", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0359.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20260988, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-30T10:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器读数从 18:30 的 2452(约24.5°C)突然跳升至 2827(约28.3°C),升幅近 3.8°C,而同一时段客厅和卧室温度仅正常小幅下降,排除全屋环境突变的可能。\",\n \"推理步骤2: 19:07 灶具开启,19:08 厨房温度传感器报告 MeasuredValue = None(空值),这是 Matter 协议中传感器无法提供有效测量值的异常状态,正常传感器即使在高温环境下也应报告数值而非 null。\",\n \"推理步骤3: 19:30 传感器恢复报告 2832(约28.3°C),但 19:40 灶具关闭后、19:41 传感器再次报告 None,说明故障并非一次性事件而是反复出现,指向传感器本身的稳定性问题。\",\n \"推理步骤4: 19:00 灶具尚未开启时温度已异常跳高至 28.3°C,说明问题不完全是灶具加热导致,传感器可能存在硬件漂移或接触不良。\",\n \"推理步骤5: 20:00 之后传感器恢复正常读数(2409 → 2381 → ...),与客厅/卧室趋势一致,说明故障具有间歇性特征,这类间歇性故障更需要关注,因为它可能导致未来真正的高温事件被漏报。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.5°C 骤升至 ~28.3°C,灶具尚未开启,客厅/卧室温度无对应变化\",\n \"19:08 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,传感器无法提供有效读数\",\n \"19:30 读数 2832 与 19:00 的 2827 几乎一致,期间灶具在运行,温度却未进一步上升,读数可疑\",\n \"20:00 后传感器恢复正常,故障呈间歇性\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰,建议安装距离灶具至少1米以上\",\n \"检查传感器电池电量或供电状态,间歇性 null 值可能与供电不稳有关\",\n \"考虑更换或重新校准厨房温度传感器,两次 null 值表明设备可靠性已受损\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常,作为厨房安全的备用保障\",\n \"建议设置自动化规则:当厨房温度传感器报告 null 时立即推送告警,避免在传感器失效期间发生火灾等事件而无法预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器读数从 18:30 的 2452(约24.5°C)突然跳升至 2827(约28.3°C),升幅近 3.8°C,而同一时段客厅和卧室温度仅正常小幅下降,排除全屋环境突变的可能。", "推理步骤2: 19:07 灶具开启,19:08 厨房温度传感器报告 MeasuredValue = None(空值),这是 Matter 协议中传感器无法提供有效测量值的异常状态,正常传感器即使在高温环境下也应报告数值而非 null。", "推理步骤3: 19:30 传感器恢复报告 2832(约28.3°C),但 19:40 灶具关闭后、19:41 传感器再次报告 None,说明故障并非一次性事件而是反复出现,指向传感器本身的稳定性问题。", "推理步骤4: 19:00 灶具尚未开启时温度已异常跳高至 28.3°C,说明问题不完全是灶具加热导致,传感器可能存在硬件漂移或接触不良。", "推理步骤5: 20:00 之后传感器恢复正常读数(2409 → 2381 → ...),与客厅/卧室趋势一致,说明故障具有间歇性特征,这类间歇性故障更需要关注,因为它可能导致未来真正的高温事件被漏报。"], "key_evidence": ["19:00 厨房温度从 ~24.5°C 骤升至 ~28.3°C,灶具尚未开启,客厅/卧室温度无对应变化", "19:08 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,传感器无法提供有效读数", "19:30 读数 2832 与 19:00 的 2827 几乎一致,期间灶具在运行,温度却未进一步上升,读数可疑", "20:00 后传感器恢复正常,故障呈间歇性"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰,建议安装距离灶具至少1米以上", "检查传感器电池电量或供电状态,间歇性 null 值可能与供电不稳有关", "考虑更换或重新校准厨房温度传感器,两次 null 值表明设备可靠性已受损", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常,作为厨房安全的备用保障", "建议设置自动化规则:当厨房温度传感器报告 null 时立即推送告警,避免在传感器失效期间发生火灾等事件而无法预警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.549643993377686, "api_error": null} {"episode_id": "SQ2_FP_A_0368", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_A_0368.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20260997, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-15T20:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和多次 null 值,同时晚间 20:44 门锁被未知用户(UserIndex=5)远程解锁但入户门传感器未记录开关动作,存在可疑访问。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从约 2451(24.51°C)跳升至 2834(28.34°C),升幅近 4°C,而此时灶具尚未开启(19:04 才开),且客厅和卧室温度同期在正常下降,说明这不是环境整体升温。\",\n \"推理步骤2: 19:05 和 19:29 厨房温度传感器连续报告 MeasuredValue = None,表示传感器读数丢失。灶具在 19:04-19:28 运行期间传感器完全无法提供有效数据,可能是传感器受热异常或硬件故障。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2835(28.35°C),与灶具已关闭、窗户已打开通风的状态不符(正常应开始降温),进一步佐证传感器数据不可靠。到 20:00 才回落至 2402,降幅过于剧烈也不自然。\",\n \"推理步骤4: 20:44 门锁事件显示 LockOperationType=1(解锁)、OperationSource=3(远程/遥控)、UserIndex=5。住户在 18:25 已手动开门回家,此时人在家中。UserIndex=5 是否为已知授权用户无法确认,且该次解锁后入户门接触传感器(front_door_contact)没有任何开关记录,说明门被远程解锁但无人实际进出,这是一个可疑信号。\",\n \"推理步骤5: 20:44 事件的日志格式也出现异常——缺少 Cluster 前缀(直接报 Occupancy = 1 和 OnOff = True 而非 OccupancySensing.Occupancy 和 OnOff.OnOff),可能是不同来源注入的事件或协议层异常。\",\n \"推理步骤6: 其余行为模式正常:住户约 06:19 起床、07:39 出门上锁、18:25 回家开灯开空调、19:04 做饭、22:14 关灯睡觉,符合单人一室一厅的日常作息。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.5°C 突跳至 28.34°C,灶具尚未开启,其他房间温度正常下降\",\n \"19:05 和 19:29 厨房温度传感器报告 MeasuredValue = None(读数丢失)\",\n \"19:30 灶具已关、窗户已开,但传感器仍报 28.35°C 高温\",\n \"20:44 门锁被 OperationSource=3(远程)以 UserIndex=5 解锁,但入户门接触传感器无开关记录\",\n \"20:44 前后的日志条目缺少标准 Cluster 前缀,格式异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,确认其安装位置是否过于靠近灶具热源\",\n \"核实门锁 UserIndex=5 对应的用户身份,如非已知授权用户应立即删除该凭证并更换门锁访问码\",\n \"审查门锁远程访问日志,确认 OperationSource=3 的来源(是否为手机 App、密码键盘或第三方集成)\",\n \"考虑为门锁远程解锁操作启用实时推送通知和二次确认机制\",\n \"排查 20:44 前后日志格式异常的原因,确认是否存在网关固件问题或未授权的第三方接入\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和多次 null 值,同时晚间 20:44 门锁被未知用户(UserIndex=5)远程解锁但入户门传感器未记录开关动作,存在可疑访问。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从约 2451(24.51°C)跳升至 2834(28.34°C),升幅近 4°C,而此时灶具尚未开启(19:04 才开),且客厅和卧室温度同期在正常下降,说明这不是环境整体升温。", "推理步骤2: 19:05 和 19:29 厨房温度传感器连续报告 MeasuredValue = None,表示传感器读数丢失。灶具在 19:04-19:28 运行期间传感器完全无法提供有效数据,可能是传感器受热异常或硬件故障。", "推理步骤3: 19:30 传感器恢复后读数为 2835(28.35°C),与灶具已关闭、窗户已打开通风的状态不符(正常应开始降温),进一步佐证传感器数据不可靠。到 20:00 才回落至 2402,降幅过于剧烈也不自然。", "推理步骤4: 20:44 门锁事件显示 LockOperationType=1(解锁)、OperationSource=3(远程/遥控)、UserIndex=5。住户在 18:25 已手动开门回家,此时人在家中。UserIndex=5 是否为已知授权用户无法确认,且该次解锁后入户门接触传感器(front_door_contact)没有任何开关记录,说明门被远程解锁但无人实际进出,这是一个可疑信号。", "推理步骤5: 20:44 事件的日志格式也出现异常——缺少 Cluster 前缀(直接报 Occupancy = 1 和 OnOff = True 而非 OccupancySensing.Occupancy 和 OnOff.OnOff),可能是不同来源注入的事件或协议层异常。", "推理步骤6: 其余行为模式正常:住户约 06:19 起床、07:39 出门上锁、18:25 回家开灯开空调、19:04 做饭、22:14 关灯睡觉,符合单人一室一厅的日常作息。"], "key_evidence": ["19:00 厨房温度从 ~24.5°C 突跳至 28.34°C,灶具尚未开启,其他房间温度正常下降", "19:05 和 19:29 厨房温度传感器报告 MeasuredValue = None(读数丢失)", "19:30 灶具已关、窗户已开,但传感器仍报 28.35°C 高温", "20:44 门锁被 OperationSource=3(远程)以 UserIndex=5 解锁,但入户门接触传感器无开关记录", "20:44 前后的日志条目缺少标准 Cluster 前缀,格式异常"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,确认其安装位置是否过于靠近灶具热源", "核实门锁 UserIndex=5 对应的用户身份,如非已知授权用户应立即删除该凭证并更换门锁访问码", "审查门锁远程访问日志,确认 OperationSource=3 的来源(是否为手机 App、密码键盘或第三方集成)", "考虑为门锁远程解锁操作启用实时推送通知和二次确认机制", "排查 20:44 前后日志格式异常的原因,确认是否存在网关固件问题或未授权的第三方接入"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.88415002822876, "api_error": null} {"episode_id": "SQ2_FP_B_0301", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0301.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260930, "scenario_id": "WD-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-20T18:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"卫生间短暂漏水检测为正常用水行为,无安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 18:40 卫生间漏水传感器触发(StateValue=True),同时卫生间运动传感器检测到有人(Occupancy=1),卫生间灯也处于开启状态,说明有住户正在使用卫生间\",\n \"推理步骤2: 漏水状态仅持续约2分钟(18:40 触发,18:42 恢复为 False),这种短暂的水检测与正常洗浴、洗手或使用水龙头时溅水到地面的场景高度吻合\",\n \"推理步骤3: 18:40 属于傍晚时段,是住户日常洗浴、清洁的常见时间,符合正常生活习惯\",\n \"推理步骤4: 全天温度数据呈现正常的昼夜变化曲线(夜间约23°C,午间峰值约25.8°C),各房间温度一致,无异常热源或设备故障迹象\",\n \"推理步骤5: 若为真实漏水(管道破裂等),漏水状态通常会持续存在且不会自行恢复,2分钟内自动消除排除了管道故障的可能性\"\n ],\n \"key_evidence\": [\n \"漏水传感器触发时卫生间有人且灯亮,说明是住户主动用水\",\n \"漏水状态仅持续2分钟即自动恢复,符合正常溅水特征而非管道泄漏\",\n \"事件发生在18:40傍晚时段,属于日常洗浴高峰期\"\n ],\n \"recommended_actions\": [\n \"无需立即处理,可继续观察卫生间漏水传感器后续是否频繁触发\",\n \"如该传感器近期频繁短暂触发,建议检查传感器安装位置是否过于靠近淋浴区或水龙头,适当调整以减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "卫生间短暂漏水检测为正常用水行为,无安全威胁", "reasoning": ["推理步骤1: 18:40 卫生间漏水传感器触发(StateValue=True),同时卫生间运动传感器检测到有人(Occupancy=1),卫生间灯也处于开启状态,说明有住户正在使用卫生间", "推理步骤2: 漏水状态仅持续约2分钟(18:40 触发,18:42 恢复为 False),这种短暂的水检测与正常洗浴、洗手或使用水龙头时溅水到地面的场景高度吻合", "推理步骤3: 18:40 属于傍晚时段,是住户日常洗浴、清洁的常见时间,符合正常生活习惯", "推理步骤4: 全天温度数据呈现正常的昼夜变化曲线(夜间约23°C,午间峰值约25.8°C),各房间温度一致,无异常热源或设备故障迹象", "推理步骤5: 若为真实漏水(管道破裂等),漏水状态通常会持续存在且不会自行恢复,2分钟内自动消除排除了管道故障的可能性"], "key_evidence": ["漏水传感器触发时卫生间有人且灯亮,说明是住户主动用水", "漏水状态仅持续2分钟即自动恢复,符合正常溅水特征而非管道泄漏", "事件发生在18:40傍晚时段,属于日常洗浴高峰期"], "recommended_actions": ["无需立即处理,可继续观察卫生间漏水传感器后续是否频繁触发", "如该传感器近期频繁短暂触发,建议检查传感器安装位置是否过于靠近淋浴区或水龙头,适当调整以减少误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.099780559539795, "api_error": null} {"episode_id": "SQ2_FP_B_0295", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0295.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20260924, "scenario_id": "INS-01", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-27T10:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.77°C),疑似传感器故障;同时 10:35 出现一组缺少 Cluster 前缀的异常格式事件,可能为设备通信异常或数据伪造。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 09:23、09:50、12:03、12:49、17:52、18:52 共 6 次报告 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值。这表明该传感器存在间歇性故障。\",\n \"推理步骤2: 在 12:00 时,厨房温度传感器报告 2977(29.77°C),而同一时刻客厅 25.83°C、主卧 25.70°C、次卧 25.80°C,厨房比其他房间高出约 4°C。12:30 再次报告 2972(29.72°C)。虽然当时灶具已开启,但灶具是 12:02 才打开的,而 12:00 的读数在灶具开启之前就已异常偏高,且上午 09:22~09:49 使用灶具期间并未出现类似高温,说明这个异常读数更可能是传感器漂移或故障,而非真实温度。\",\n \"推理步骤3: 在 10:35 出现了一组事件(living_room_occupancy、living_room_light_1、living_room_window),其属性报告格式缺少标准的 Cluster 前缀(如 'Occupancy = 1' 而非 'OccupancySensing.Occupancy = 1','OnOff = True' 而非 'OnOff.OnOff = True','StateValue = False' 而非 'BooleanState.StateValue = False')。这与日志中所有其他事件的 Matter 标准 Cluster.Attribute 格式不一致,可能是设备固件异常、通信协议降级或数据被篡改。\",\n \"推理步骤4: 10:35 这组事件的行为模式也很可疑——5 秒内运动传感器检测到有人、灯打开、窗户传感器触发、灯关闭、运动传感器归零,整个序列在 20 秒内完成,且发生在住户 10:09 已在客厅活动的期间,像是一次异常的状态抖动或重放。\",\n \"推理步骤5: 其余事件模式均属正常:凌晨无人活动、早晨起床洗漱做饭、中午和傍晚各做一次饭、晚间关灯锁门,温度随日照自然升降,空调制冷模式(SystemMode=3)符合夏季使用习惯。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器全天 6 次报告 MeasuredValue = None,其他传感器无此现象\",\n \"12:00 厨房温度 2977(29.77°C)在灶具开启前就比其他房间高约 4°C,且上午同样使用灶具时未出现类似偏差\",\n \"12:30 厨房温度 2972(29.72°C)持续异常偏高\",\n \"10:35:00~10:35:20 出现一组缺少 Cluster 前缀的非标准格式事件,与全天其他所有事件的 Matter Cluster.Attribute 格式不一致\",\n \"10:35 事件序列在 20 秒内完成从检测到人到无人的完整周期,行为模式异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除间歇性故障和读数漂移问题\",\n \"排查 10:35 异常格式事件的来源:检查客厅运动传感器、主灯和窗户传感器的固件版本,确认是否存在固件 bug 或通信异常\",\n \"审查智能家居网关日志,确认 10:35 的非标准格式事件是否为外部注入或重放攻击,必要时加强 Matter 网络的安全认证配置\",\n \"为厨房温度传感器设置 None 值告警规则,连续出现 None 时自动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.77°C),疑似传感器故障;同时 10:35 出现一组缺少 Cluster 前缀的异常格式事件,可能为设备通信异常或数据伪造。", "reasoning": ["推理步骤1: 厨房温度传感器在 09:23、09:50、12:03、12:49、17:52、18:52 共 6 次报告 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值。这表明该传感器存在间歇性故障。", "推理步骤2: 在 12:00 时,厨房温度传感器报告 2977(29.77°C),而同一时刻客厅 25.83°C、主卧 25.70°C、次卧 25.80°C,厨房比其他房间高出约 4°C。12:30 再次报告 2972(29.72°C)。虽然当时灶具已开启,但灶具是 12:02 才打开的,而 12:00 的读数在灶具开启之前就已异常偏高,且上午 09:22~09:49 使用灶具期间并未出现类似高温,说明这个异常读数更可能是传感器漂移或故障,而非真实温度。", "推理步骤3: 在 10:35 出现了一组事件(living_room_occupancy、living_room_light_1、living_room_window),其属性报告格式缺少标准的 Cluster 前缀(如 'Occupancy = 1' 而非 'OccupancySensing.Occupancy = 1','OnOff = True' 而非 'OnOff.OnOff = True','StateValue = False' 而非 'BooleanState.StateValue = False')。这与日志中所有其他事件的 Matter 标准 Cluster.Attribute 格式不一致,可能是设备固件异常、通信协议降级或数据被篡改。", "推理步骤4: 10:35 这组事件的行为模式也很可疑——5 秒内运动传感器检测到有人、灯打开、窗户传感器触发、灯关闭、运动传感器归零,整个序列在 20 秒内完成,且发生在住户 10:09 已在客厅活动的期间,像是一次异常的状态抖动或重放。", "推理步骤5: 其余事件模式均属正常:凌晨无人活动、早晨起床洗漱做饭、中午和傍晚各做一次饭、晚间关灯锁门,温度随日照自然升降,空调制冷模式(SystemMode=3)符合夏季使用习惯。"], "key_evidence": ["厨房温度传感器全天 6 次报告 MeasuredValue = None,其他传感器无此现象", "12:00 厨房温度 2977(29.77°C)在灶具开启前就比其他房间高约 4°C,且上午同样使用灶具时未出现类似偏差", "12:30 厨房温度 2972(29.72°C)持续异常偏高", "10:35:00~10:35:20 出现一组缺少 Cluster 前缀的非标准格式事件,与全天其他所有事件的 Matter Cluster.Attribute 格式不一致", "10:35 事件序列在 20 秒内完成从检测到人到无人的完整周期,行为模式异常"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除间歇性故障和读数漂移问题", "排查 10:35 异常格式事件的来源:检查客厅运动传感器、主灯和窗户传感器的固件版本,确认是否存在固件 bug 或通信异常", "审查智能家居网关日志,确认 10:35 的非标准格式事件是否为外部注入或重放攻击,必要时加强 Matter 网络的安全认证配置", "为厨房温度传感器设置 None 值告警规则,连续出现 None 时自动通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.826300382614136, "api_error": null} {"episode_id": "SQ2_FP_B_0303", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0303.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20260932, "scenario_id": "INS-02", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "second_bedroom", "injection_time": "2026-06-17T19:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.62°C),随后两次报告None值,表明传感器可能故障或受到干扰。\",\n \"reasoning\": [\n \"推理步骤1: 18:00时厨房温度传感器突然从约24.7°C跳升至28.62°C,而同一时刻其他三个房间温度均在24.5-24.7°C范围内,厨房与其他房间温差高达约4°C,此前全天各房间温差始终在1°C以内。\",\n \"推理步骤2: 18:30时厨房温度仍高达28.51°C,但此时灶具尚未开启(灶具在18:46:30才开启),排除了烹饪导致升温的可能。这说明该高温读数并非正常烹饪活动引起。\",\n \"推理步骤3: 18:47和19:51两个时间点,厨房温度传感器报告MeasuredValue=None,表明传感器读数丢失。正常传感器不应返回空值,这进一步印证传感器存在硬件故障或通信异常。\",\n \"推理步骤4: 19:00时厨房温度恢复到24.43°C(此时灶具仍在运行),与其他房间基本一致,说明之前的28.6°C高温读数大概率是传感器误报而非真实环境温度。\",\n \"推理步骤5: 另外注意到19:03有一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3,即远程/键盘输入错误),20秒后同一来源以UserIndex=1成功解锁。单次错误后快速成功解锁,符合输入密码失误后重试的正常行为,不构成入侵威胁。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器读数2862(28.62°C),较前一时刻跳升约4°C,同时其他房间温度正常\",\n \"18:30厨房温度仍为2851(28.51°C),但灶具直到18:46:30才开启,无法解释该异常升温\",\n \"18:47和19:51厨房温度传感器两次报告MeasuredValue=None(空值)\",\n \"19:00厨房温度恢复正常(2443),说明之前的高温读数为传感器异常而非真实环境变化\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器探头,排查是否有热源(如阳光直射、电器散热)影响传感器读数\",\n \"检查传感器的网络连接和供电情况,None值可能由通信中断或电量不足引起\",\n \"如传感器持续出现异常读数或空值,建议更换传感器,避免因温度数据不准确影响烟雾报警等联动安全功能\",\n \"关注厨房窗户传感器状态——19:50:30厨房窗户被打开后日志中未见关闭记录,建议睡前确认厨房窗户已关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.62°C),随后两次报告None值,表明传感器可能故障或受到干扰。", "reasoning": ["推理步骤1: 18:00时厨房温度传感器突然从约24.7°C跳升至28.62°C,而同一时刻其他三个房间温度均在24.5-24.7°C范围内,厨房与其他房间温差高达约4°C,此前全天各房间温差始终在1°C以内。", "推理步骤2: 18:30时厨房温度仍高达28.51°C,但此时灶具尚未开启(灶具在18:46:30才开启),排除了烹饪导致升温的可能。这说明该高温读数并非正常烹饪活动引起。", "推理步骤3: 18:47和19:51两个时间点,厨房温度传感器报告MeasuredValue=None,表明传感器读数丢失。正常传感器不应返回空值,这进一步印证传感器存在硬件故障或通信异常。", "推理步骤4: 19:00时厨房温度恢复到24.43°C(此时灶具仍在运行),与其他房间基本一致,说明之前的28.6°C高温读数大概率是传感器误报而非真实环境温度。", "推理步骤5: 另外注意到19:03有一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3,即远程/键盘输入错误),20秒后同一来源以UserIndex=1成功解锁。单次错误后快速成功解锁,符合输入密码失误后重试的正常行为,不构成入侵威胁。"], "key_evidence": ["18:00厨房温度传感器读数2862(28.62°C),较前一时刻跳升约4°C,同时其他房间温度正常", "18:30厨房温度仍为2851(28.51°C),但灶具直到18:46:30才开启,无法解释该异常升温", "18:47和19:51厨房温度传感器两次报告MeasuredValue=None(空值)", "19:00厨房温度恢复正常(2443),说明之前的高温读数为传感器异常而非真实环境变化"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器探头,排查是否有热源(如阳光直射、电器散热)影响传感器读数", "检查传感器的网络连接和供电情况,None值可能由通信中断或电量不足引起", "如传感器持续出现异常读数或空值,建议更换传感器,避免因温度数据不准确影响烟雾报警等联动安全功能", "关注厨房窗户传感器状态——19:50:30厨房窗户被打开后日志中未见关闭记录,建议睡前确认厨房窗户已关闭"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.23304557800293, "api_error": null} {"episode_id": "SQ2_FP_B_0304", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0304.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20260933, "scenario_id": "INS-02", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-12T17:20:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:23 入户门开锁后长时间未关门、未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:11、18:44、19:00 四次报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温超量程),但 07:11 灶具已关闭仍报 None,且 19:00 同一时刻既报了 None 又报了正常值 2442,数据自相矛盾,说明传感器工作状态不稳定。\",\n \"推理步骤2: 16:23 入户门通过手动方式解锁(LockOperationType=1)并打开(StateValue=False),但此后直到 22:45 才出现门关闭(StateValue=True)和自动上锁的记录。这意味着入户门在无人看管的情况下保持开启状态超过 6 小时。结合 17:20 出现的门锁操作错误事件(LockOperationError, OperationError=1),门锁本身可能也存在故障或异常。\",\n \"推理步骤3: 17:20 门锁先报告了一次操作错误(OperationSource=3 表示远程/键盘操作),20 秒后同一来源以 UserIndex=1 成功开锁。单次错误后成功可能是密码输错,属于低风险,但结合门长时间未关的情况需要关注。\",\n \"推理步骤4: 其余行为模式正常——06:00 主卧起床开灯、06:52 厨房做早餐、07:11 出门上锁、18:19 回家开灯开空调、18:43 做晚餐、22:45 睡前关灯锁门,符合单人上班族的日常作息。温度曲线呈现夏季典型的日间升高、夜间下降趋势,各房间温差合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:53、07:11、18:44、19:00 报告 MeasuredValue = None,其中 19:00 同时刻既报 None 又报正常值 2442,数据矛盾\",\n \"16:23 入户门解锁开启后,直到 22:45(超过 6 小时)才记录到关门上锁\",\n \"17:20 门锁报告 LockOperationError(OperationError=1, OperationSource=3),存在一次失败的开锁尝试\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清理探头或更换设备,排除硬件故障\",\n \"设置入户门长时间未关闭的告警规则(如超过 5 分钟未关门即推送提醒),防止安全疏忽\",\n \"检查门锁 17:20 操作错误的详细日志,确认是否为误操作还是未授权的开锁尝试;如有必要,更换门锁密码\",\n \"建议为厨房窗户传感器增加关闭提醒——07:10 开窗通风后全天无关窗记录,长时间开窗在无人时存在安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:23 入户门开锁后长时间未关门、未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:11、18:44、19:00 四次报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温超量程),但 07:11 灶具已关闭仍报 None,且 19:00 同一时刻既报了 None 又报了正常值 2442,数据自相矛盾,说明传感器工作状态不稳定。", "推理步骤2: 16:23 入户门通过手动方式解锁(LockOperationType=1)并打开(StateValue=False),但此后直到 22:45 才出现门关闭(StateValue=True)和自动上锁的记录。这意味着入户门在无人看管的情况下保持开启状态超过 6 小时。结合 17:20 出现的门锁操作错误事件(LockOperationError, OperationError=1),门锁本身可能也存在故障或异常。", "推理步骤3: 17:20 门锁先报告了一次操作错误(OperationSource=3 表示远程/键盘操作),20 秒后同一来源以 UserIndex=1 成功开锁。单次错误后成功可能是密码输错,属于低风险,但结合门长时间未关的情况需要关注。", "推理步骤4: 其余行为模式正常——06:00 主卧起床开灯、06:52 厨房做早餐、07:11 出门上锁、18:19 回家开灯开空调、18:43 做晚餐、22:45 睡前关灯锁门,符合单人上班族的日常作息。温度曲线呈现夏季典型的日间升高、夜间下降趋势,各房间温差合理。"], "key_evidence": ["kitchen_temp_sensor 在 06:53、07:11、18:44、19:00 报告 MeasuredValue = None,其中 19:00 同时刻既报 None 又报正常值 2442,数据矛盾", "16:23 入户门解锁开启后,直到 22:45(超过 6 小时)才记录到关门上锁", "17:20 门锁报告 LockOperationError(OperationError=1, OperationSource=3),存在一次失败的开锁尝试"], "recommended_actions": ["检查厨房温度传感器的工作状态,清理探头或更换设备,排除硬件故障", "设置入户门长时间未关闭的告警规则(如超过 5 分钟未关门即推送提醒),防止安全疏忽", "检查门锁 17:20 操作错误的详细日志,确认是否为误操作还是未授权的开锁尝试;如有必要,更换门锁密码", "建议为厨房窗户传感器增加关闭提醒——07:10 开窗通风后全天无关窗记录,长时间开窗在无人时存在安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.376079082489014, "api_error": null} {"episode_id": "SQ2_FP_B_0319", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0319.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260948, "scenario_id": "INS-02", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-09T14:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 NULL 值,疑似传感器故障或受烹饪环境干扰损坏。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.36°C,而同一时刻其他房间温度均在 24.3°C 左右,单个房间瞬间高出近 4°C 极不寻常。\",\n \"推理步骤2: 19:03 和 19:27 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在此期间无法正常采集数据,这是典型的设备故障信号。\",\n \"推理步骤3: 19:30 传感器恢复报告后读数为 28.29°C,仍显著高于其他房间的约 24.3°C。虽然 19:02 灶具开启、19:26 灶具关闭期间烹饪会导致厨房升温,但升温幅度(约 4°C 瞬间跳变)和出现 NULL 值的组合更像是传感器受高温/油烟影响出现故障。\",\n \"推理步骤4: 到 20:00 厨房温度回落至 24.12°C,与其他房间基本一致,说明厨房并未持续异常高温,烟雾报警器也未触发,排除火灾风险。\",\n \"推理步骤5: 14:17 入户门锁出现一次 LockOperationError(错误码 1,来源 3 即密码/键盘),但 20 秒后 UserIndex=1 的合法用户成功开锁进入,属于一次密码输错后重试成功的正常场景,不构成入侵威胁。\",\n \"推理步骤6: 其余事件(早起洗漱、出门上班、傍晚回家开灯开空调、做饭、洗碗机运行、睡前关灯锁门)均符合典型的单人工作日生活节奏,无异常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从约 24.6°C 瞬间跳至 28.36°C,偏离其他房间约 4°C\",\n \"19:03 和 19:27 厨房温度传感器报告 MeasuredValue = None,传感器数据中断\",\n \"19:30 恢复后读数 28.29°C 仍异常偏高,20:00 才回归正常水平\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时重新安置到远离热源和油烟的位置\",\n \"对厨房温度传感器进行功能自检或校准,确认 NULL 值是否为偶发故障还是硬件损坏的前兆\",\n \"考虑为厨房温度传感器增加防护罩或更换为耐高温型号,避免烹饪环境反复影响传感器寿命\",\n \"持续监控该传感器后续是否再次出现 NULL 值或异常跳变,若频繁发生则建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 NULL 值,疑似传感器故障或受烹饪环境干扰损坏。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.36°C,而同一时刻其他房间温度均在 24.3°C 左右,单个房间瞬间高出近 4°C 极不寻常。", "推理步骤2: 19:03 和 19:27 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在此期间无法正常采集数据,这是典型的设备故障信号。", "推理步骤3: 19:30 传感器恢复报告后读数为 28.29°C,仍显著高于其他房间的约 24.3°C。虽然 19:02 灶具开启、19:26 灶具关闭期间烹饪会导致厨房升温,但升温幅度(约 4°C 瞬间跳变)和出现 NULL 值的组合更像是传感器受高温/油烟影响出现故障。", "推理步骤4: 到 20:00 厨房温度回落至 24.12°C,与其他房间基本一致,说明厨房并未持续异常高温,烟雾报警器也未触发,排除火灾风险。", "推理步骤5: 14:17 入户门锁出现一次 LockOperationError(错误码 1,来源 3 即密码/键盘),但 20 秒后 UserIndex=1 的合法用户成功开锁进入,属于一次密码输错后重试成功的正常场景,不构成入侵威胁。", "推理步骤6: 其余事件(早起洗漱、出门上班、傍晚回家开灯开空调、做饭、洗碗机运行、睡前关灯锁门)均符合典型的单人工作日生活节奏,无异常。"], "key_evidence": ["19:00 厨房温度从约 24.6°C 瞬间跳至 28.36°C,偏离其他房间约 4°C", "19:03 和 19:27 厨房温度传感器报告 MeasuredValue = None,传感器数据中断", "19:30 恢复后读数 28.29°C 仍异常偏高,20:00 才回归正常水平"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时重新安置到远离热源和油烟的位置", "对厨房温度传感器进行功能自检或校准,确认 NULL 值是否为偶发故障还是硬件损坏的前兆", "考虑为厨房温度传感器增加防护罩或更换为耐高温型号,避免烹饪环境反复影响传感器寿命", "持续监控该传感器后续是否再次出现 NULL 值或异常跳变,若频繁发生则建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.61244773864746, "api_error": null} {"episode_id": "SQ2_FP_B_0325", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0325.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260954, "scenario_id": "WD-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-02T14:15:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次 null 值,疑似传感器故障或存在未被识别的热源风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.88°C 跳升至 28.69°C,而同一时刻其他房间温度均在 24.5°C 左右,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(灶具 18:55 才开启)。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.51°C,持续异常。直到 18:55 灶具开启后,18:56 传感器读数变为 None(null),说明传感器在高温后出现了读数丢失。\",\n \"推理步骤3: 19:00 传感器恢复正常读数 24.37°C,与其他房间一致;但 19:31 灶具关闭、19:31:30 厨房窗户打开通风后,19:32 传感器再次报出 None 值,之后 20:00 又恢复正常。两次 null 值表明传感器工作不稳定。\",\n \"推理步骤4: 18:00 的异常高温发生时,住户尚未回家(18:21 才开门进入),灶具处于关闭状态,厨房无人活动,没有合理的热源可以解释这次温度骤升。\",\n \"推理步骤5: 烟雾报警器在整个过程中未触发,排除了明火或烟雾的可能性,但不排除传感器本身故障导致虚高读数,或存在某种低温热源(如电器异常发热)未被烟雾传感器捕捉。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约 24.88°C 骤升至 28.69°C,18:30 仍为 28.51°C,而同时段其他房间温度均在 24.5-24.7°C,且灶具未开启、厨房无人\",\n \"18:56 和 19:32 厨房温度传感器两次报出 MeasuredValue = None,表明传感器读数中断/故障\",\n \"异常高温发生时住户不在家(07:25 出门,18:21 才回家),无人为操作可解释温度变化\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射区域),必要时更换传感器\",\n \"排查厨房内是否有电器在无人时异常工作或发热(如烤箱、微波炉、冰箱压缩机等)\",\n \"为厨房温度传感器设置异常阈值告警(如超过 27°C 且灶具未开启时自动推送通知),并对 null 读数设置故障告警\",\n \"考虑在厨房增加一个冗余温度传感器,以便交叉验证读数准确性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次 null 值,疑似传感器故障或存在未被识别的热源风险。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.88°C 跳升至 28.69°C,而同一时刻其他房间温度均在 24.5°C 左右,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(灶具 18:55 才开启)。", "推理步骤2: 18:30 厨房温度仍高达 28.51°C,持续异常。直到 18:55 灶具开启后,18:56 传感器读数变为 None(null),说明传感器在高温后出现了读数丢失。", "推理步骤3: 19:00 传感器恢复正常读数 24.37°C,与其他房间一致;但 19:31 灶具关闭、19:31:30 厨房窗户打开通风后,19:32 传感器再次报出 None 值,之后 20:00 又恢复正常。两次 null 值表明传感器工作不稳定。", "推理步骤4: 18:00 的异常高温发生时,住户尚未回家(18:21 才开门进入),灶具处于关闭状态,厨房无人活动,没有合理的热源可以解释这次温度骤升。", "推理步骤5: 烟雾报警器在整个过程中未触发,排除了明火或烟雾的可能性,但不排除传感器本身故障导致虚高读数,或存在某种低温热源(如电器异常发热)未被烟雾传感器捕捉。"], "key_evidence": ["18:00 厨房温度从约 24.88°C 骤升至 28.69°C,18:30 仍为 28.51°C,而同时段其他房间温度均在 24.5-24.7°C,且灶具未开启、厨房无人", "18:56 和 19:32 厨房温度传感器两次报出 MeasuredValue = None,表明传感器读数中断/故障", "异常高温发生时住户不在家(07:25 出门,18:21 才回家),无人为操作可解释温度变化"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射区域),必要时更换传感器", "排查厨房内是否有电器在无人时异常工作或发热(如烤箱、微波炉、冰箱压缩机等)", "为厨房温度传感器设置异常阈值告警(如超过 27°C 且灶具未开启时自动推送通知),并对 null 读数设置故障告警", "考虑在厨房增加一个冗余温度传感器,以便交叉验证读数准确性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.57410192489624, "api_error": null} {"episode_id": "SQ2_FP_B_0330", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0330.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260959, "scenario_id": "INS-02", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "balcony", "injection_time": "2026-06-25T20:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障,需排除火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2859(28.59°C),而同一时刻其他三个房间温度均在 24.6°C 左右,厨房出现约 4°C 的异常偏高,且此时灶具尚未开启(灶具 18:47 才打开)。\",\n \"推理步骤2: 18:30 厨房温度仍维持在 2851(28.51°C)的异常高位,进一步确认这不是瞬时噪声,而是持续性异常读数。\",\n \"推理步骤3: 18:48 和 19:53 厨房温度传感器两次报告 MeasuredValue = None(空值),说明传感器出现数据采集失败。正常传感器不应产生 None 值,这是设备故障的典型信号。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到与其他房间一致的水平(约 24.3°C),说明 18:00-18:48 期间的高温读数并非真实环境温升,更可能是传感器自身异常(如接触不良、电路过热或固件错误)。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发,排除了真实火灾的可能性,但传感器故障意味着厨房的温度监控能力受损,存在安全盲区。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数 2859(28.59°C),比同时刻其他房间高出约 4°C,且灶具尚未开启\",\n \"18:30 厨房温度仍为 2851(28.51°C),异常高温持续至少 30 分钟\",\n \"18:48 和 19:53 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失\",\n \"烟雾报警器全天未触发,排除真实火情\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的物理状态(安装位置、接线、是否靠近热源),排除硬件故障\",\n \"检查传感器固件版本,考虑重置或更新固件以解决 None 值上报问题\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"考虑增加一个备用温度传感器,避免单点故障导致厨房温度监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障,需排除火灾隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2859(28.59°C),而同一时刻其他三个房间温度均在 24.6°C 左右,厨房出现约 4°C 的异常偏高,且此时灶具尚未开启(灶具 18:47 才打开)。", "推理步骤2: 18:30 厨房温度仍维持在 2851(28.51°C)的异常高位,进一步确认这不是瞬时噪声,而是持续性异常读数。", "推理步骤3: 18:48 和 19:53 厨房温度传感器两次报告 MeasuredValue = None(空值),说明传感器出现数据采集失败。正常传感器不应产生 None 值,这是设备故障的典型信号。", "推理步骤4: 19:00 之后厨房温度恢复到与其他房间一致的水平(约 24.3°C),说明 18:00-18:48 期间的高温读数并非真实环境温升,更可能是传感器自身异常(如接触不良、电路过热或固件错误)。", "推理步骤5: 烟雾报警器在整个时段内未触发,排除了真实火灾的可能性,但传感器故障意味着厨房的温度监控能力受损,存在安全盲区。"], "key_evidence": ["18:00 厨房温度传感器读数 2859(28.59°C),比同时刻其他房间高出约 4°C,且灶具尚未开启", "18:30 厨房温度仍为 2851(28.51°C),异常高温持续至少 30 分钟", "18:48 和 19:53 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失", "烟雾报警器全天未触发,排除真实火情"], "recommended_actions": ["立即检查厨房温度传感器的物理状态(安装位置、接线、是否靠近热源),排除硬件故障", "检查传感器固件版本,考虑重置或更新固件以解决 None 值上报问题", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "考虑增加一个备用温度传感器,避免单点故障导致厨房温度监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.777556896209717, "api_error": null} {"episode_id": "SQ2_FP_B_0335", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0335.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260964, "scenario_id": "FG-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "balcony", "injection_time": "2026-06-21T13:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"灶具开启后厨房温度异常飙升,且长时间无人在厨房附近,存在无人看管的烹饪火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 13:03 厨房灶具开启(OnOff = True),同一时刻客厅运动传感器显示无人(Occupancy = 0),说明住户可能不在公共区域。\",\n \"推理步骤2: 13:08 厨房温度从约 2557(25.57°C)急升至 2700(27.00°C),仅 5 分钟上升约 1.4°C,远超正常环境温度波动。\",\n \"推理步骤3: 13:33 厨房温度进一步升至 2750(27.50°C),距灶具开启已过 30 分钟,温度仍在攀升。\",\n \"推理步骤4: 13:23 客厅运动传感器才重新检测到人(Occupancy = 1),意味着灶具至少有 20 分钟处于无人直接看管状态。\",\n \"推理步骤5: 13:30 的定时温度报告显示厨房回落至 2565,与 13:33 的 2750 存在矛盾,可能是灶具附近局部高温被传感器间歇捕获,说明热源集中且温度波动剧烈。\",\n \"推理步骤6: 日志中未出现灶具关闭事件(OnOff = False),无法确认灶具何时被关闭。\"\n ],\n \"key_evidence\": [\n \"13:03 灶具开启时客厅无人(Occupancy = 0),灶具至少 20 分钟无人看管\",\n \"厨房温度在 5 分钟内从 25.57°C 跳升至 27.00°C,30 分钟后达到 27.50°C,远超当日同时段其他房间温度\",\n \"整个日志中未记录灶具关闭事件\"\n ],\n \"recommended_actions\": [\n \"立即确认灶具当前是否仍在工作状态,若无人使用应远程关闭\",\n \"设置自动化规则:灶具开启超过一定时间且厨房无运动检测时,发送告警或自动关闭灶具\",\n \"考虑在厨房增加运动传感器,以便更准确判断是否有人在烹饪区域\",\n \"检查厨房烟雾报警器是否正常工作(本次事件中未触发任何报警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "fire_risk", "threat_description": "灶具开启后厨房温度异常飙升,且长时间无人在厨房附近,存在无人看管的烹饪火灾风险。", "reasoning": ["推理步骤1: 13:03 厨房灶具开启(OnOff = True),同一时刻客厅运动传感器显示无人(Occupancy = 0),说明住户可能不在公共区域。", "推理步骤2: 13:08 厨房温度从约 2557(25.57°C)急升至 2700(27.00°C),仅 5 分钟上升约 1.4°C,远超正常环境温度波动。", "推理步骤3: 13:33 厨房温度进一步升至 2750(27.50°C),距灶具开启已过 30 分钟,温度仍在攀升。", "推理步骤4: 13:23 客厅运动传感器才重新检测到人(Occupancy = 1),意味着灶具至少有 20 分钟处于无人直接看管状态。", "推理步骤5: 13:30 的定时温度报告显示厨房回落至 2565,与 13:33 的 2750 存在矛盾,可能是灶具附近局部高温被传感器间歇捕获,说明热源集中且温度波动剧烈。", "推理步骤6: 日志中未出现灶具关闭事件(OnOff = False),无法确认灶具何时被关闭。"], "key_evidence": ["13:03 灶具开启时客厅无人(Occupancy = 0),灶具至少 20 分钟无人看管", "厨房温度在 5 分钟内从 25.57°C 跳升至 27.00°C,30 分钟后达到 27.50°C,远超当日同时段其他房间温度", "整个日志中未记录灶具关闭事件"], "recommended_actions": ["立即确认灶具当前是否仍在工作状态,若无人使用应远程关闭", "设置自动化规则:灶具开启超过一定时间且厨房无运动检测时,发送告警或自动关闭灶具", "考虑在厨房增加运动传感器,以便更准确判断是否有人在烹饪区域", "检查厨房烟雾报警器是否正常工作(本次事件中未触发任何报警)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.354596376419067, "api_error": null} {"episode_id": "SQ2_FP_B_0343", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0343.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20260972, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-24T12:05:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2431(约24.3°C)跳升至 2831(约28.3°C),而同一时刻其他房间温度均在 ~2431 左右,厨房灶具尚未开启(19:05:30 才开),这一跳变缺乏合理热源解释。\",\n \"推理步骤2: 19:06:00 和 19:52:00 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回 null,这是设备故障或通信异常的典型信号。\",\n \"推理步骤3: 19:30 厨房温度仍为 2835(约28.4°C),但 20:00 突然恢复到 2406(约24.1°C),与其他房间一致。这种先异常高、中间 null、再突然恢复的模式更符合传感器间歇性故障而非真实温度变化。\",\n \"推理步骤4: 19:51:30 厨房窗户被打开(StateValue=False),这是做饭后通风的合理操作,但直到日志结束(23:30)都未见窗户关闭记录。住户 22:11 已关灯、关空调、锁门进入睡眠状态,厨房窗户仍然敞开存在一定安全隐患。\",\n \"推理步骤5: 12:05 入户门通过 OperationSource=3(远程/密码)由 UserIndex=5 解锁,但该用户进入后门锁日志中未记录重新上锁,直到 18:09 住户回家时才有新的门锁操作。需确认 UserIndex=5 是否为已授权用户(如家政人员),以及门锁是否在此期间处于未锁状态。\",\n \"推理步骤6: 其余事件模式正常——早晨起床、出门上锁、傍晚回家开灯开空调、晚间做饭、睡前关灯锁门,均符合单人居住的日常作息。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度异常跳升至 2831,灶具尚未开启,其他房间温度正常(~2431)\",\n \"19:06 和 19:52 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 厨房温度 2835 → 20:00 突然恢复 2406,跳变幅度约 4°C 且无渐变过程\",\n \"厨房窗户 19:51 打开后至日志结束未关闭,住户已进入睡眠状态\",\n \"12:05 UserIndex=5 远程解锁入户门,身份及后续锁定状态需确认\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和电池电量,必要时重新配对或更换传感器\",\n \"关闭厨房窗户或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户\",\n \"确认 UserIndex=5 的身份和授权状态,如为临时访客建议及时撤销凭证\",\n \"为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或出现 null 时触发告警\",\n \"建议在烟雾报警器正常的前提下,将厨房温度传感器的 null 读数作为设备健康监控指标纳入日常巡检\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2431(约24.3°C)跳升至 2831(约28.3°C),而同一时刻其他房间温度均在 ~2431 左右,厨房灶具尚未开启(19:05:30 才开),这一跳变缺乏合理热源解释。", "推理步骤2: 19:06:00 和 19:52:00 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回 null,这是设备故障或通信异常的典型信号。", "推理步骤3: 19:30 厨房温度仍为 2835(约28.4°C),但 20:00 突然恢复到 2406(约24.1°C),与其他房间一致。这种先异常高、中间 null、再突然恢复的模式更符合传感器间歇性故障而非真实温度变化。", "推理步骤4: 19:51:30 厨房窗户被打开(StateValue=False),这是做饭后通风的合理操作,但直到日志结束(23:30)都未见窗户关闭记录。住户 22:11 已关灯、关空调、锁门进入睡眠状态,厨房窗户仍然敞开存在一定安全隐患。", "推理步骤5: 12:05 入户门通过 OperationSource=3(远程/密码)由 UserIndex=5 解锁,但该用户进入后门锁日志中未记录重新上锁,直到 18:09 住户回家时才有新的门锁操作。需确认 UserIndex=5 是否为已授权用户(如家政人员),以及门锁是否在此期间处于未锁状态。", "推理步骤6: 其余事件模式正常——早晨起床、出门上锁、傍晚回家开灯开空调、晚间做饭、睡前关灯锁门,均符合单人居住的日常作息。"], "key_evidence": ["19:00 厨房温度异常跳升至 2831,灶具尚未开启,其他房间温度正常(~2431)", "19:06 和 19:52 厨房温度传感器两次报告 MeasuredValue = None", "19:30 厨房温度 2835 → 20:00 突然恢复 2406,跳变幅度约 4°C 且无渐变过程", "厨房窗户 19:51 打开后至日志结束未关闭,住户已进入睡眠状态", "12:05 UserIndex=5 远程解锁入户门,身份及后续锁定状态需确认"], "recommended_actions": ["检查厨房温度传感器的硬件状态和电池电量,必要时重新配对或更换传感器", "关闭厨房窗户或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户", "确认 UserIndex=5 的身份和授权状态,如为临时访客建议及时撤销凭证", "为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或出现 null 时触发告警", "建议在烟雾报警器正常的前提下,将厨房温度传感器的 null 读数作为设备健康监控指标纳入日常巡检"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.609614849090576, "api_error": null} {"episode_id": "SQ2_FP_B_0347", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0347.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260976, "scenario_id": "FG-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-15T06:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且灶具使用后未见关闭厨房窗户的记录;同时 16:13 入户门开锁进入后长时间未关门、未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:09、18:35、19:11 四次报告 MeasuredValue = None,说明传感器在灶具使用期间或刚关闭后反复出现读数丢失,这不是正常的传感器行为,可能是高温导致传感器故障或通信中断。\",\n \"推理步骤2: 06:51:30 和 19:10:30 厨房窗户被打开(StateValue=False 表示未闭合),但日志中始终没有对应的关闭事件(StateValue=True)。厨房窗户在住户外出期间(07:42 出门)一直处于打开状态,存在安全隐患。\",\n \"推理步骤3: 16:13 入户门被手动开锁并打开(contact=False),但直到 17:45 住户再次回家之前,日志中没有关门(contact=True)和上锁的记录。入户门在约 1.5 小时内处于开启/未锁状态,这是一个入侵风险窗口。不过 17:45 的事件序列显示住户正常进入并开始活动,因此 16:13 的开门可能是住户短暂回来取东西但忘记关门。\",\n \"推理步骤4: 06:44 灶具开启但仅 7 分钟后(06:51)就关闭,且当时客厅无人(Occupancy=0),随后 07:08 灶具再次开启,07:14 温度升至 27.5°C,但日志中没有灶具第二次关闭的记录。虽然 07:30 厨房温度回落至 24.29°C 说明灶具可能已关闭,但缺少明确的关闭事件。\",\n \"推理步骤5: 整体生活模式基本正常——凌晨无活动、06:21 起床、07:42 出门上锁、17:45 回家开灯开空调、22:12 睡前关灯锁门。温度曲线符合夏季白天升温夜间降温的自然规律。主要异常集中在厨房传感器故障和门窗状态管理上。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 MeasuredValue = None(06:52, 07:09, 18:35, 19:11),与灶具使用高度相关\",\n \"厨房窗户 06:51:30 和 19:10:30 两次打开,全天无关闭记录\",\n \"16:13 入户门开锁打开后,约 1.5 小时内无关门/上锁记录(直到 22:12:25 才确认门关闭上锁)\",\n \"07:08 灶具第二次开启后日志中无明确关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:多次 None 读数表明传感器可能因高温受损或存在通信问题,建议检查传感器位置是否离灶具过近,必要时更换\",\n \"设置厨房窗户长时间未关闭提醒:尤其在住户外出时,窗户保持打开状态存在安全和天气风险\",\n \"设置入户门未关闭/未上锁超时告警:建议门打开超过 5 分钟未关闭时自动推送提醒,防止无意中长时间敞开\",\n \"为灶具添加自动关闭规则:如灶具开启超过一定时间或住户离家时仍在运行,应自动关闭并告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且灶具使用后未见关闭厨房窗户的记录;同时 16:13 入户门开锁进入后长时间未关门、未上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:09、18:35、19:11 四次报告 MeasuredValue = None,说明传感器在灶具使用期间或刚关闭后反复出现读数丢失,这不是正常的传感器行为,可能是高温导致传感器故障或通信中断。", "推理步骤2: 06:51:30 和 19:10:30 厨房窗户被打开(StateValue=False 表示未闭合),但日志中始终没有对应的关闭事件(StateValue=True)。厨房窗户在住户外出期间(07:42 出门)一直处于打开状态,存在安全隐患。", "推理步骤3: 16:13 入户门被手动开锁并打开(contact=False),但直到 17:45 住户再次回家之前,日志中没有关门(contact=True)和上锁的记录。入户门在约 1.5 小时内处于开启/未锁状态,这是一个入侵风险窗口。不过 17:45 的事件序列显示住户正常进入并开始活动,因此 16:13 的开门可能是住户短暂回来取东西但忘记关门。", "推理步骤4: 06:44 灶具开启但仅 7 分钟后(06:51)就关闭,且当时客厅无人(Occupancy=0),随后 07:08 灶具再次开启,07:14 温度升至 27.5°C,但日志中没有灶具第二次关闭的记录。虽然 07:30 厨房温度回落至 24.29°C 说明灶具可能已关闭,但缺少明确的关闭事件。", "推理步骤5: 整体生活模式基本正常——凌晨无活动、06:21 起床、07:42 出门上锁、17:45 回家开灯开空调、22:12 睡前关灯锁门。温度曲线符合夏季白天升温夜间降温的自然规律。主要异常集中在厨房传感器故障和门窗状态管理上。"], "key_evidence": ["厨房温度传感器 4 次报告 MeasuredValue = None(06:52, 07:09, 18:35, 19:11),与灶具使用高度相关", "厨房窗户 06:51:30 和 19:10:30 两次打开,全天无关闭记录", "16:13 入户门开锁打开后,约 1.5 小时内无关门/上锁记录(直到 22:12:25 才确认门关闭上锁)", "07:08 灶具第二次开启后日志中无明确关闭事件"], "recommended_actions": ["检查厨房温度传感器:多次 None 读数表明传感器可能因高温受损或存在通信问题,建议检查传感器位置是否离灶具过近,必要时更换", "设置厨房窗户长时间未关闭提醒:尤其在住户外出时,窗户保持打开状态存在安全和天气风险", "设置入户门未关闭/未上锁超时告警:建议门打开超过 5 分钟未关闭时自动推送提醒,防止无意中长时间敞开", "为灶具添加自动关闭规则:如灶具开启超过一定时间或住户离家时仍在运行,应自动关闭并告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.818439245224, "api_error": null} {"episode_id": "SQ2_FP_B_0354", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0354.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20260983, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "second_bedroom", "injection_time": "2026-06-18T15:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数(突然飙升至28.4°C)和两次 None 值,疑似传感器故障或受灶具热辐射干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器报告 2843(28.43°C),而同一时刻其他房间温度均在 24.4°C 左右,差值接近 4°C,且灶具此时尚未开启(19:15 才开启),温度飙升缺乏合理热源解释\",\n \"推理步骤2: 19:16 和 19:44 厨房温度传感器连续两次报告 None(空值),表明传感器数据采集失败,这是典型的设备故障信号\",\n \"推理步骤3: 19:30 传感器恢复后报告 2841(28.41°C),此时灶具已开启约15分钟,高温读数可部分解释,但结合之前的 None 值和 19:00 的异常高温(灶具未开时),传感器可靠性存疑\",\n \"推理步骤4: 15:37 灶具首次开启时,15:42 和 16:07 厨房温度分别升至 2700 和 2750(27.0-27.5°C),而 19:00 灶具未开时却达到 2843,行为不一致\",\n \"推理步骤5: 其余设备行为均正常——早晨出门(07:12 手动开锁、开门、关门、自动上锁)、傍晚回家(18:13)、晚间做饭、洗碗、22:08 关灯关空调确认门锁,符合单人上班族的日常模式\"\n ],\n \"key_evidence\": [\n \"19:00 灶具未开启时厨房温度异常飙升至 2843(28.43°C),比其他房间高约4°C\",\n \"19:16 和 19:44 厨房温度传感器连续两次报告 MeasuredValue = None\",\n \"19:30 传感器报告 2841,与 19:00 的异常高温一致,但 20:00 恢复正常值 2419,波动剧烈\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热辐射干扰\",\n \"检查传感器电池电量或供电状态,None 值可能由电量不足或通信中断引起\",\n \"考虑更换或重新校准厨房温度传感器,持续观察后续是否再次出现 None 值\",\n \"虽然烟雾报警器未触发,但建议确认其工作正常,以防传感器故障掩盖真实的厨房过热风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数(突然飙升至28.4°C)和两次 None 值,疑似传感器故障或受灶具热辐射干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器报告 2843(28.43°C),而同一时刻其他房间温度均在 24.4°C 左右,差值接近 4°C,且灶具此时尚未开启(19:15 才开启),温度飙升缺乏合理热源解释", "推理步骤2: 19:16 和 19:44 厨房温度传感器连续两次报告 None(空值),表明传感器数据采集失败,这是典型的设备故障信号", "推理步骤3: 19:30 传感器恢复后报告 2841(28.41°C),此时灶具已开启约15分钟,高温读数可部分解释,但结合之前的 None 值和 19:00 的异常高温(灶具未开时),传感器可靠性存疑", "推理步骤4: 15:37 灶具首次开启时,15:42 和 16:07 厨房温度分别升至 2700 和 2750(27.0-27.5°C),而 19:00 灶具未开时却达到 2843,行为不一致", "推理步骤5: 其余设备行为均正常——早晨出门(07:12 手动开锁、开门、关门、自动上锁)、傍晚回家(18:13)、晚间做饭、洗碗、22:08 关灯关空调确认门锁,符合单人上班族的日常模式"], "key_evidence": ["19:00 灶具未开启时厨房温度异常飙升至 2843(28.43°C),比其他房间高约4°C", "19:16 和 19:44 厨房温度传感器连续两次报告 MeasuredValue = None", "19:30 传感器报告 2841,与 19:00 的异常高温一致,但 20:00 恢复正常值 2419,波动剧烈"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热辐射干扰", "检查传感器电池电量或供电状态,None 值可能由电量不足或通信中断引起", "考虑更换或重新校准厨房温度传感器,持续观察后续是否再次出现 None 值", "虽然烟雾报警器未触发,但建议确认其工作正常,以防传感器故障掩盖真实的厨房过热风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.95972228050232, "api_error": null} {"episode_id": "SQ2_FP_B_0350", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0350.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20260979, "scenario_id": "WD-01", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-03T19:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:38:05 和 07:06:00(早晨做饭期间)以及 18:31:00 和 18:52:00(晚间做饭期间)共四次报告 MeasuredValue = None,均与灶具开启/关闭时间高度吻合。\",\n \"推理步骤2: 其他三个房间的温度传感器在同一时段均正常上报数值,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 温度传感器在灶具关闭、厨房恢复常温后(如 07:30:00 报告 2427、19:00:00 报告 2440)能恢复正常读数,说明传感器并非永久损坏,而是在灶具工作产生的高温或电磁环境下出现间歇性失效。\",\n \"推理步骤4: 厨房温度传感器是烟雾报警器之外的重要辅助安全监测手段。如果传感器在灶具使用时恰好失效,一旦发生真正的厨房火灾或过热,系统将无法通过温度数据及时发出预警,存在安全盲区。\",\n \"推理步骤5: 其余事件均属正常——卫生间漏水传感器 19:33 短暂触发后 2 分钟恢复(有人在场使用卫生间,属正常用水溅水);入户门锁的开关、自动上锁序列与住户早出晚归的作息一致;16:28 的开门事件虽未关门上锁记录,但随后 17:59 有正常进门记录,可能是取快递等短暂外出。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38:05、07:06:00、18:31:00、18:52:00 四次报告 MeasuredValue = None\",\n \"None 值出现时间与 kitchen_cook_surface 开启/关闭时间完全吻合(06:37:35-07:05:00 和 18:30:30-18:51:00)\",\n \"灶具关闭后传感器恢复正常读数,其他房间传感器全程正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到高温直接影响导致超量程\",\n \"将传感器重新安装到远离灶具热源但仍能有效监测厨房整体温度的位置\",\n \"如重新定位后问题仍存在,考虑更换为耐高温型温度传感器\",\n \"在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为主要安全防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:38:05 和 07:06:00(早晨做饭期间)以及 18:31:00 和 18:52:00(晚间做饭期间)共四次报告 MeasuredValue = None,均与灶具开启/关闭时间高度吻合。", "推理步骤2: 其他三个房间的温度传感器在同一时段均正常上报数值,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。", "推理步骤3: 温度传感器在灶具关闭、厨房恢复常温后(如 07:30:00 报告 2427、19:00:00 报告 2440)能恢复正常读数,说明传感器并非永久损坏,而是在灶具工作产生的高温或电磁环境下出现间歇性失效。", "推理步骤4: 厨房温度传感器是烟雾报警器之外的重要辅助安全监测手段。如果传感器在灶具使用时恰好失效,一旦发生真正的厨房火灾或过热,系统将无法通过温度数据及时发出预警,存在安全盲区。", "推理步骤5: 其余事件均属正常——卫生间漏水传感器 19:33 短暂触发后 2 分钟恢复(有人在场使用卫生间,属正常用水溅水);入户门锁的开关、自动上锁序列与住户早出晚归的作息一致;16:28 的开门事件虽未关门上锁记录,但随后 17:59 有正常进门记录,可能是取快递等短暂外出。"], "key_evidence": ["kitchen_temp_sensor 在 06:38:05、07:06:00、18:31:00、18:52:00 四次报告 MeasuredValue = None", "None 值出现时间与 kitchen_cook_surface 开启/关闭时间完全吻合(06:37:35-07:05:00 和 18:30:30-18:51:00)", "灶具关闭后传感器恢复正常读数,其他房间传感器全程正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到高温直接影响导致超量程", "将传感器重新安装到远离灶具热源但仍能有效监测厨房整体温度的位置", "如重新定位后问题仍存在,考虑更换为耐高温型温度传感器", "在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为主要安全防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.794148921966553, "api_error": null} {"episode_id": "SQ2_FP_B_0358", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0358.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20260987, "scenario_id": "INS-02", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-03T21:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;另外入户门锁在21:08出现一次操作错误事件。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:40、07:11、18:46、19:26四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器不应返回 None,这可能是传感器受高温干扰导致读数失效,或设备本身通信故障。\",\n \"推理步骤2: 21:08 入户门锁触发了 LockOperationError(OperationError=1, OperationSource=3),来源3通常表示远程/密码操作。20秒后以 UserIndex=1 成功解锁开门,说明可能是住户输错一次密码后重试成功。单次失败不构成入侵威胁,但值得记录。\",\n \"推理步骤3: 其余行为模式正常——住户06:26起床、07:21出门上班、16:34短暂回家、17:41回家开灯开空调、18:45做饭、22:23就寝,符合典型上班族作息。温度曲线随日照自然升降,空调制冷(SystemMode=3)后温度下降合理。\",\n \"推理步骤4: 厨房窗户在灶具关闭后打开(07:10、19:25),属于做完饭通风的正常操作。洗碗机19:48启动也是晚餐后正常使用。\",\n \"推理步骤5: 综合来看,无入侵、火灾或漏水威胁,但厨房温度传感器反复报 None 属于设备异常,需要关注。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:40、07:11、18:46、19:26 四次报告 MeasuredValue = None\",\n \"21:08 front_door_lock 触发 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功解锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换位置或更换耐高温型号\",\n \"查看门锁操作错误日志,确认 OperationSource=3 对应的操作方式(如密码/远程),若频繁出现失败尝试需提高警惕\",\n \"建议为门锁设置连续失败锁定策略(如3次错误后锁定5分钟),防范暴力尝试\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;另外入户门锁在21:08出现一次操作错误事件。", "reasoning": ["推理步骤1: 厨房温度传感器在06:40、07:11、18:46、19:26四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器不应返回 None,这可能是传感器受高温干扰导致读数失效,或设备本身通信故障。", "推理步骤2: 21:08 入户门锁触发了 LockOperationError(OperationError=1, OperationSource=3),来源3通常表示远程/密码操作。20秒后以 UserIndex=1 成功解锁开门,说明可能是住户输错一次密码后重试成功。单次失败不构成入侵威胁,但值得记录。", "推理步骤3: 其余行为模式正常——住户06:26起床、07:21出门上班、16:34短暂回家、17:41回家开灯开空调、18:45做饭、22:23就寝,符合典型上班族作息。温度曲线随日照自然升降,空调制冷(SystemMode=3)后温度下降合理。", "推理步骤4: 厨房窗户在灶具关闭后打开(07:10、19:25),属于做完饭通风的正常操作。洗碗机19:48启动也是晚餐后正常使用。", "推理步骤5: 综合来看,无入侵、火灾或漏水威胁,但厨房温度传感器反复报 None 属于设备异常,需要关注。"], "key_evidence": ["kitchen_temp_sensor 在 06:40、07:11、18:46、19:26 四次报告 MeasuredValue = None", "21:08 front_door_lock 触发 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功解锁"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换位置或更换耐高温型号", "查看门锁操作错误日志,确认 OperationSource=3 对应的操作方式(如密码/远程),若频繁出现失败尝试需提高警惕", "建议为门锁设置连续失败锁定策略(如3次错误后锁定5分钟),防范暴力尝试"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.094693899154663, "api_error": null} {"episode_id": "SQ2_FP_B_0356", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0356.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260985, "scenario_id": "FG-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bathroom", "injection_time": "2026-06-19T08:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在无人在家期间灶具被开启并出现异常高温读数,存在设备故障及潜在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:17、18:42、19:23 四次报告 MeasuredValue = None,表明传感器间歇性故障,无法正常采集温度数据。这在灶具使用期间尤其危险,因为无法监测厨房实际温度。\",\n \"推理步骤2: 08:42 灶具被开启,但住户在 07:37 已经出门(关灯、开门、锁门离开),且客厅运动传感器在 08:42 显示 Occupancy=0(无人),直到 09:02 才重新检测到有人。这意味着灶具在无人在家的情况下被开启,来源不明。\",\n \"推理步骤3: 08:47 厨房温度传感器报告 2700(27.00°C),09:12 报告 2750(27.50°C),而同一时段其他房间温度约为 24.5-25.0°C。厨房温度比其他房间高出约 2-3°C,且这两条记录的属性格式缺少 Cluster 前缀(仅写 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),格式异常可能暗示数据来源或传感器状态存在问题。\",\n \"推理步骤4: 16:15 入户门被打开且有人进入,但门锁之后没有重新上锁的记录(BooleanState 未恢复为 True),入户门可能一直处于未关闭状态,直到 22:39 才关门上锁。这段时间长达约 6.5 小时,存在入侵风险。\",\n \"推理步骤5: 厨房窗户在 07:16:30 被打开后,没有关闭记录(StateValue 未恢复为 True),19:22:30 再次打开,说明厨房窗户可能长时间处于开启状态,结合温度传感器故障,安全监控存在盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None 值(06:53、07:17、18:42、19:23),传感器间歇性失效\",\n \"08:42 灶具开启时客厅运动传感器显示无人(Occupancy=0),住户 07:37 已离家,灶具在无人状态下被启动\",\n \"08:47 和 09:12 厨房温度异常升高至 2700/2750(27.0/27.5°C),且日志格式缺少 Cluster 前缀,数据可疑\",\n \"16:15 入户门开启后直到 22:39 才关闭上锁,长达约 6.5 小时门户未关\",\n \"厨房窗户 07:16:30 打开后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器,排除间歇性故障,确保灶具使用期间温度监控正常\",\n \"排查 08:42 灶具无人启动的原因:检查是否存在误触发的自动化规则、远程操控记录或设备固件异常\",\n \"设置安全规则:当所有运动传感器显示无人且入户门已锁时,禁止灶具远程或自动开启\",\n \"为入户门添加长时间未关闭告警(建议阈值 5 分钟),避免门户长时间敞开\",\n \"为厨房窗户添加长时间开启提醒,特别是在离家模式下应发出告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在无人在家期间灶具被开启并出现异常高温读数,存在设备故障及潜在火灾隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:17、18:42、19:23 四次报告 MeasuredValue = None,表明传感器间歇性故障,无法正常采集温度数据。这在灶具使用期间尤其危险,因为无法监测厨房实际温度。", "推理步骤2: 08:42 灶具被开启,但住户在 07:37 已经出门(关灯、开门、锁门离开),且客厅运动传感器在 08:42 显示 Occupancy=0(无人),直到 09:02 才重新检测到有人。这意味着灶具在无人在家的情况下被开启,来源不明。", "推理步骤3: 08:47 厨房温度传感器报告 2700(27.00°C),09:12 报告 2750(27.50°C),而同一时段其他房间温度约为 24.5-25.0°C。厨房温度比其他房间高出约 2-3°C,且这两条记录的属性格式缺少 Cluster 前缀(仅写 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),格式异常可能暗示数据来源或传感器状态存在问题。", "推理步骤4: 16:15 入户门被打开且有人进入,但门锁之后没有重新上锁的记录(BooleanState 未恢复为 True),入户门可能一直处于未关闭状态,直到 22:39 才关门上锁。这段时间长达约 6.5 小时,存在入侵风险。", "推理步骤5: 厨房窗户在 07:16:30 被打开后,没有关闭记录(StateValue 未恢复为 True),19:22:30 再次打开,说明厨房窗户可能长时间处于开启状态,结合温度传感器故障,安全监控存在盲区。"], "key_evidence": ["厨房温度传感器 4 次报告 None 值(06:53、07:17、18:42、19:23),传感器间歇性失效", "08:42 灶具开启时客厅运动传感器显示无人(Occupancy=0),住户 07:37 已离家,灶具在无人状态下被启动", "08:47 和 09:12 厨房温度异常升高至 2700/2750(27.0/27.5°C),且日志格式缺少 Cluster 前缀,数据可疑", "16:15 入户门开启后直到 22:39 才关闭上锁,长达约 6.5 小时门户未关", "厨房窗户 07:16:30 打开后无关闭记录"], "recommended_actions": ["立即检修或更换厨房温度传感器,排除间歇性故障,确保灶具使用期间温度监控正常", "排查 08:42 灶具无人启动的原因:检查是否存在误触发的自动化规则、远程操控记录或设备固件异常", "设置安全规则:当所有运动传感器显示无人且入户门已锁时,禁止灶具远程或自动开启", "为入户门添加长时间未关闭告警(建议阈值 5 分钟),避免门户长时间敞开", "为厨房窗户添加长时间开启提醒,特别是在离家模式下应发出告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.81681847572327, "api_error": null} {"episode_id": "SQ2_FP_B_0363", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0363.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20260992, "scenario_id": "INS-04", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-13T18:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在12:00出现异常高温读数(29.77°C),且多次报告None值,疑似传感器故障;同时厨房窗户在做饭后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9~23.1°C,白天随气温上升至25.8°C左右,傍晚后逐步回落至23.3°C,整体符合夏季自然温度变化规律。\",\n \"推理步骤2: 厨房温度在12:00突然跳升至2977(29.77°C),而同一时刻其他房间均在25.7~25.8°C范围内,差值超过4°C。虽然12:08灶具开启可能导致厨房升温,但灶具是在12:08才打开的,12:00时灶具尚未开启,这个异常高温缺乏合理热源解释。12:30时厨房仍报2981(29.81°C),进一步印证异常。\",\n \"推理步骤3: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(08:58、09:52、12:09、12:40、18:00、18:32),共6次。虽然可能是灶具高温导致传感器暂时超量程,但正常传感器应报告超限值而非None,频繁出现None值提示传感器可能存在通信故障或硬件问题。\",\n \"推理步骤4: 厨房窗户传感器在09:51、12:39、18:31三次记录BooleanState.StateValue=False(窗户打开),但日志中始终未见对应的StateValue=True(窗户关闭)事件。如果窗户确实一直处于打开状态,在夜间无人看管时存在一定安全隐患。\",\n \"推理步骤5: 其他设备行为均属正常——早晨做饭(08:57~09:51)、中午做饭(12:08~12:39)、晚间做饭(17:59~18:31)符合一日三餐习惯;18:32有人通过密码/指纹(OperationSource=3)开锁回家,UserIndex=5为已注册用户;23:04关灯关空调、门锁自动上锁属于正常就寝流程;洗碗机在晚饭后启动也合理。\"\n ],\n \"key_evidence\": [\n \"12:00厨房温度传感器读数2977(29.77°C),比同时刻其他房间高出约4°C,且此时灶具尚未开启\",\n \"厨房温度传感器全天6次报告MeasuredValue=None,频率异常\",\n \"厨房窗户三次被打开(09:51、12:39、18:31)但日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁探头并确认安装位置是否距灶具过近,必要时更换传感器\",\n \"确认厨房窗户当前是否处于打开状态,夜间无人时建议关闭窗户以确保安全\",\n \"考虑为厨房温度传感器设置异常值告警规则(如单次跳变超过3°C或出现None值时推送通知),以便及时发现传感器故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在12:00出现异常高温读数(29.77°C),且多次报告None值,疑似传感器故障;同时厨房窗户在做饭后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9~23.1°C,白天随气温上升至25.8°C左右,傍晚后逐步回落至23.3°C,整体符合夏季自然温度变化规律。", "推理步骤2: 厨房温度在12:00突然跳升至2977(29.77°C),而同一时刻其他房间均在25.7~25.8°C范围内,差值超过4°C。虽然12:08灶具开启可能导致厨房升温,但灶具是在12:08才打开的,12:00时灶具尚未开启,这个异常高温缺乏合理热源解释。12:30时厨房仍报2981(29.81°C),进一步印证异常。", "推理步骤3: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(08:58、09:52、12:09、12:40、18:00、18:32),共6次。虽然可能是灶具高温导致传感器暂时超量程,但正常传感器应报告超限值而非None,频繁出现None值提示传感器可能存在通信故障或硬件问题。", "推理步骤4: 厨房窗户传感器在09:51、12:39、18:31三次记录BooleanState.StateValue=False(窗户打开),但日志中始终未见对应的StateValue=True(窗户关闭)事件。如果窗户确实一直处于打开状态,在夜间无人看管时存在一定安全隐患。", "推理步骤5: 其他设备行为均属正常——早晨做饭(08:57~09:51)、中午做饭(12:08~12:39)、晚间做饭(17:59~18:31)符合一日三餐习惯;18:32有人通过密码/指纹(OperationSource=3)开锁回家,UserIndex=5为已注册用户;23:04关灯关空调、门锁自动上锁属于正常就寝流程;洗碗机在晚饭后启动也合理。"], "key_evidence": ["12:00厨房温度传感器读数2977(29.77°C),比同时刻其他房间高出约4°C,且此时灶具尚未开启", "厨房温度传感器全天6次报告MeasuredValue=None,频率异常", "厨房窗户三次被打开(09:51、12:39、18:31)但日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁探头并确认安装位置是否距灶具过近,必要时更换传感器", "确认厨房窗户当前是否处于打开状态,夜间无人时建议关闭窗户以确保安全", "考虑为厨房温度传感器设置异常值告警规则(如单次跳变超过3°C或出现None值时推送通知),以便及时发现传感器故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.429766416549683, "api_error": null} {"episode_id": "SQ2_FP_B_0367", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0367.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20260996, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "second_bedroom", "injection_time": "2026-06-08T13:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数飙升和多次 null 值,疑似传感器故障,同时厨房窗户在做饭后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器报告 2836(28.36°C),而同一时刻其他房间温度均在 24.2-24.3°C 范围内,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(19:06:30 才开启),温度飙升缺乏合理热源解释。\",\n \"推理步骤2: 13:42 灶具开启后,13:47 厨房温度升至 2700(27.0°C),14:12 升至 2750(27.5°C),但日志中没有灶具关闭记录直到 19:50。如果灶具从 13:42 一直运行到 19:50(超过 6 小时),这本身是一个安全隐患;但更可能是 13:42 的灶具使用和 19:06 的灶具使用是两次独立操作,中间的关闭事件未被记录。\",\n \"推理步骤3: 19:07 和 19:51 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这是明确的设备异常信号——正常传感器不应返回 null。19:30 又报告 2828(28.28°C),说明传感器在异常值和 null 之间波动,读数不可信。\",\n \"推理步骤4: 19:50:30 厨房窗户传感器显示 StateValue = False(窗户打开),之后直到日志结束(23:30)都没有窗户关闭的记录。做饭后开窗通风是合理行为,但整晚未关窗存在安全隐患(夜间入侵风险、雨水等)。\",\n \"推理步骤5: 其余事件均属正常——早晨起床如厕、出门上班(07:17 手动开锁出门、自动上锁)、傍晚回家(18:10 开门、开灯、开空调)、晚间关灯关空调就寝,门锁状态正常闭合,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 灶具未开启时厨房温度异常飙升至 28.36°C(其他房间约 24.3°C)\",\n \"19:07 和 19:51 厨房温度传感器两次返回 None(空值),19:30 报告 28.28°C,读数在异常高值和 null 之间波动\",\n \"13:42 灶具开启后无明确关闭记录,直到 19:50 才记录关闭,存在长时间运行或事件丢失的可能\",\n \"19:50:30 厨房窗户打开后至日志结束(23:30)未关闭\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器是否工作正常,清洁传感器或更换电池/设备,null 读数表明硬件可能故障\",\n \"检查厨房窗户是否仍处于打开状态,夜间建议关闭以确保安全\",\n \"排查灶具事件日志是否存在丢失,确认 13:42-19:50 期间灶具的实际运行状态,避免灶具长时间无人看管运行\",\n \"考虑为厨房灶具添加长时间运行自动关闭规则(如超过 2 小时无操作自动断电)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数飙升和多次 null 值,疑似传感器故障,同时厨房窗户在做饭后未关闭。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器报告 2836(28.36°C),而同一时刻其他房间温度均在 24.2-24.3°C 范围内,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(19:06:30 才开启),温度飙升缺乏合理热源解释。", "推理步骤2: 13:42 灶具开启后,13:47 厨房温度升至 2700(27.0°C),14:12 升至 2750(27.5°C),但日志中没有灶具关闭记录直到 19:50。如果灶具从 13:42 一直运行到 19:50(超过 6 小时),这本身是一个安全隐患;但更可能是 13:42 的灶具使用和 19:06 的灶具使用是两次独立操作,中间的关闭事件未被记录。", "推理步骤3: 19:07 和 19:51 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这是明确的设备异常信号——正常传感器不应返回 null。19:30 又报告 2828(28.28°C),说明传感器在异常值和 null 之间波动,读数不可信。", "推理步骤4: 19:50:30 厨房窗户传感器显示 StateValue = False(窗户打开),之后直到日志结束(23:30)都没有窗户关闭的记录。做饭后开窗通风是合理行为,但整晚未关窗存在安全隐患(夜间入侵风险、雨水等)。", "推理步骤5: 其余事件均属正常——早晨起床如厕、出门上班(07:17 手动开锁出门、自动上锁)、傍晚回家(18:10 开门、开灯、开空调)、晚间关灯关空调就寝,门锁状态正常闭合,无入侵迹象。"], "key_evidence": ["19:00 灶具未开启时厨房温度异常飙升至 28.36°C(其他房间约 24.3°C)", "19:07 和 19:51 厨房温度传感器两次返回 None(空值),19:30 报告 28.28°C,读数在异常高值和 null 之间波动", "13:42 灶具开启后无明确关闭记录,直到 19:50 才记录关闭,存在长时间运行或事件丢失的可能", "19:50:30 厨房窗户打开后至日志结束(23:30)未关闭"], "recommended_actions": ["立即检查厨房温度传感器是否工作正常,清洁传感器或更换电池/设备,null 读数表明硬件可能故障", "检查厨房窗户是否仍处于打开状态,夜间建议关闭以确保安全", "排查灶具事件日志是否存在丢失,确认 13:42-19:50 期间灶具的实际运行状态,避免灶具长时间无人看管运行", "考虑为厨房灶具添加长时间运行自动关闭规则(如超过 2 小时无操作自动断电)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.839934587478638, "api_error": null} {"episode_id": "SQ2_FP_B_0369", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0369.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20260998, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-25T13:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失,且厨房窗户在做完饭后开启至今未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2450(24.5°C)跳升至 2829(28.29°C),而此时灶具尚未开启(19:08 才开启),其他房间温度均在 24.2-24.3°C 范围内,厨房不应出现近 4°C 的独立跳变。\",\n \"推理步骤2: 19:09 和 19:53 灶具使用前后,厨房温度传感器两次报告 MeasuredValue = None,说明传感器出现了数据丢失/通信故障。正常传感器即使在高温环境下也应返回数值而非 null。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2839(28.39°C),仍然异常偏高;但 20:00 灶具关闭后迅速回落至 2409(24.09°C),降幅约 4.3°C 仅用了约 8 分钟,这种骤降不符合自然散热规律,更像是传感器故障恢复后重新校准。\",\n \"推理步骤4: 19:52:30 厨房窗户传感器报告 StateValue=False(窗户打开),之后整个日志中再无关闭记录。结合住户 21:49 已关灯、锁门离开的行为,厨房窗户在无人状态下持续敞开,存在安全隐患。\",\n \"推理步骤5: 13:54 入户门通过 UserIndex=5 远程/密码开锁,有人进入客厅开灯,但之后无出门记录,直到 18:27 住户手动开门回家——中间这段时间的访客去向不明,值得关注但证据不足以判定入侵。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度异常跳升至 2829(28.29°C),灶具尚未开启,其余房间温度正常约 24.3°C\",\n \"19:09 和 19:53 厨房温度传感器两次返回 None(数据丢失)\",\n \"19:30 读数 2839 仍异常偏高,20:00 骤降至 2409,不符合自然散热曲线\",\n \"19:52:30 厨房窗户打开后至日志结束(23:30)始终未关闭,住户 21:49 已离家\",\n \"13:54 UserIndex=5 远程开锁进入,身份和离开时间不明确\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障或受灶具热辐射干扰的可能\",\n \"立即远程关闭厨房窗户或提醒住户回家关窗,无人时窗户敞开存在入侵和天气损害风险\",\n \"确认 UserIndex=5 的身份和授权情况,核实 13:54 的开锁是否为预期访客\",\n \"为厨房温度传感器设置异常值告警阈值和 null 值检测规则,出现连续异常时自动通知住户\",\n \"建议增加离家模式自动检查:锁门时联动检测所有窗户是否关闭,未关闭则发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失,且厨房窗户在做完饭后开启至今未关闭。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2450(24.5°C)跳升至 2829(28.29°C),而此时灶具尚未开启(19:08 才开启),其他房间温度均在 24.2-24.3°C 范围内,厨房不应出现近 4°C 的独立跳变。", "推理步骤2: 19:09 和 19:53 灶具使用前后,厨房温度传感器两次报告 MeasuredValue = None,说明传感器出现了数据丢失/通信故障。正常传感器即使在高温环境下也应返回数值而非 null。", "推理步骤3: 19:30 传感器恢复后读数为 2839(28.39°C),仍然异常偏高;但 20:00 灶具关闭后迅速回落至 2409(24.09°C),降幅约 4.3°C 仅用了约 8 分钟,这种骤降不符合自然散热规律,更像是传感器故障恢复后重新校准。", "推理步骤4: 19:52:30 厨房窗户传感器报告 StateValue=False(窗户打开),之后整个日志中再无关闭记录。结合住户 21:49 已关灯、锁门离开的行为,厨房窗户在无人状态下持续敞开,存在安全隐患。", "推理步骤5: 13:54 入户门通过 UserIndex=5 远程/密码开锁,有人进入客厅开灯,但之后无出门记录,直到 18:27 住户手动开门回家——中间这段时间的访客去向不明,值得关注但证据不足以判定入侵。"], "key_evidence": ["19:00 厨房温度异常跳升至 2829(28.29°C),灶具尚未开启,其余房间温度正常约 24.3°C", "19:09 和 19:53 厨房温度传感器两次返回 None(数据丢失)", "19:30 读数 2839 仍异常偏高,20:00 骤降至 2409,不符合自然散热曲线", "19:52:30 厨房窗户打开后至日志结束(23:30)始终未关闭,住户 21:49 已离家", "13:54 UserIndex=5 远程开锁进入,身份和离开时间不明确"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障或受灶具热辐射干扰的可能", "立即远程关闭厨房窗户或提醒住户回家关窗,无人时窗户敞开存在入侵和天气损害风险", "确认 UserIndex=5 的身份和授权情况,核实 13:54 的开锁是否为预期访客", "为厨房温度传感器设置异常值告警阈值和 null 值检测规则,出现连续异常时自动通知住户", "建议增加离家模式自动检查:锁门时联动检测所有窗户是否关闭,未关闭则发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.028613328933716, "api_error": null} {"episode_id": "SQ2_FP_B_0370", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0370.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260999, "scenario_id": "INS-02", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-02T07:39:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障;同时厨房窗户在做饭后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:10、18:38、19:27 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器在灶具使用时温度应升高而非丢失读数,这说明传感器可能受热干扰或自身存在间歇性故障。\",\n \"推理步骤2: 厨房窗户传感器在 07:09:30 变为 False(打开),之后整天日志中未出现关闭事件(StateValue = True)。晚间 19:26:30 再次记录 False(打开),但仍无关闭记录。如果窗户确实一直处于打开状态,在住户外出期间(约 07:29 至 16:17)存在一定安全隐患。\",\n \"推理步骤3: 其余设备行为均属正常——住户 06:00 起床、07:29 出门(门锁手动开锁后自动上锁)、07:39 有一次开锁失败后成功用用户凭证开锁(可能是家庭成员输错密码后重试)、16:17 和 17:47 分两次回家、22:22 就寝锁门,整体生活节奏合理。\",\n \"推理步骤4: 温度趋势方面,各房间从夜间约 22.9°C 升至午间约 25.8°C 再回落,符合夏季自然温度变化曲线,无异常高温或骤变,排除火灾风险。\",\n \"推理步骤5: 07:39 的 LockOperationError(OperationError=1, OperationSource=3 即远程/键盘)仅出现一次,20秒后即通过 UserIndex=1 成功开锁,属于单次密码输入错误,不构成入侵威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:05、07:10、18:38、19:27 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:09:30 报告 StateValue = False(开启),全天未见关闭记录\",\n \"front_door_lock 在 07:39 出现一次 LockOperationError,但 20 秒后成功开锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认其在灶具使用时是否因高温导致读数丢失,必要时更换或重新定位传感器\",\n \"确认厨房窗户当前实际状态,如确实处于打开状态请及时关闭,尤其是在外出和夜间时段\",\n \"考虑为厨房窗户传感器设置长时间开启告警规则,在住户外出时自动提醒\",\n \"关注 07:39 的门锁错误事件,如后续频繁出现类似错误应排查是否有未授权的开锁尝试\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障;同时厨房窗户在做饭后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:10、18:38、19:27 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器在灶具使用时温度应升高而非丢失读数,这说明传感器可能受热干扰或自身存在间歇性故障。", "推理步骤2: 厨房窗户传感器在 07:09:30 变为 False(打开),之后整天日志中未出现关闭事件(StateValue = True)。晚间 19:26:30 再次记录 False(打开),但仍无关闭记录。如果窗户确实一直处于打开状态,在住户外出期间(约 07:29 至 16:17)存在一定安全隐患。", "推理步骤3: 其余设备行为均属正常——住户 06:00 起床、07:29 出门(门锁手动开锁后自动上锁)、07:39 有一次开锁失败后成功用用户凭证开锁(可能是家庭成员输错密码后重试)、16:17 和 17:47 分两次回家、22:22 就寝锁门,整体生活节奏合理。", "推理步骤4: 温度趋势方面,各房间从夜间约 22.9°C 升至午间约 25.8°C 再回落,符合夏季自然温度变化曲线,无异常高温或骤变,排除火灾风险。", "推理步骤5: 07:39 的 LockOperationError(OperationError=1, OperationSource=3 即远程/键盘)仅出现一次,20秒后即通过 UserIndex=1 成功开锁,属于单次密码输入错误,不构成入侵威胁。"], "key_evidence": ["kitchen_temp_sensor 在 07:05、07:10、18:38、19:27 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:09:30 报告 StateValue = False(开启),全天未见关闭记录", "front_door_lock 在 07:39 出现一次 LockOperationError,但 20 秒后成功开锁"], "recommended_actions": ["检查厨房温度传感器,确认其在灶具使用时是否因高温导致读数丢失,必要时更换或重新定位传感器", "确认厨房窗户当前实际状态,如确实处于打开状态请及时关闭,尤其是在外出和夜间时段", "考虑为厨房窗户传感器设置长时间开启告警规则,在住户外出时自动提醒", "关注 07:39 的门锁错误事件,如后续频繁出现类似错误应排查是否有未授权的开锁尝试"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.836191415786743, "api_error": null} {"episode_id": "SQ2_FP_B_0371", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0371.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261000, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-07T12:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天设备状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常开锁。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度数据——四个传感器的 MeasuredValue 从凌晨约 2290-2310(约22.9-23.1°C)逐步上升至正午峰值约 2570-2590(约25.7-25.9°C),午后逐渐回落至深夜约 2325-2340(约23.3°C)。这是典型的夏季昼夜温度曲线,各房间温度高度一致,无单一房间异常升温的情况。\",\n \"推理步骤2: 分析门锁事件——12:59 和 13:04 分别有 UserIndex=1 和 UserIndex=2 两位授权用户通过 OperationSource=3(密码/PIN)执行了 LockOperationType=1(解锁)操作。两次开锁间隔约5分钟,符合家庭成员先后到家的正常场景。\",\n \"推理步骤3: 检查是否存在异常关联——门锁解锁前后无运动传感器异常触发、无窗户/阳台门传感器状态变化、无烟雾/漏水报警、无灶具异常启动等事件。整个日志中除温度周期性上报和两次正常开锁外,无任何其他设备事件,说明家中处于平静状态。\",\n \"推理步骤4: 温度在 06:00 出现一次较明显的跳升(约从 23.0°C 升至 24.0°C),这与日出后太阳辐射导致室温快速上升一致,并非设备故障或火灾征兆——因为所有四个房间同步升温,且厨房烟雾报警器未触发。\"\n ],\n \"key_evidence\": [\n \"四个房间温度全天同步变化,呈现标准昼夜曲线(夜间约23°C,午间峰值约25.9°C),无单点异常升温\",\n \"两次门锁解锁事件均为授权用户(UserIndex 1和2),操作方式为密码/PIN(OperationSource=3),时间在下午1点左右,属于正常归家时段\",\n \"全天无烟雾报警、漏水报警、窗户/门传感器异常开启等安全相关事件\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天设备状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常开锁。", "reasoning": ["推理步骤1: 分析温度数据——四个传感器的 MeasuredValue 从凌晨约 2290-2310(约22.9-23.1°C)逐步上升至正午峰值约 2570-2590(约25.7-25.9°C),午后逐渐回落至深夜约 2325-2340(约23.3°C)。这是典型的夏季昼夜温度曲线,各房间温度高度一致,无单一房间异常升温的情况。", "推理步骤2: 分析门锁事件——12:59 和 13:04 分别有 UserIndex=1 和 UserIndex=2 两位授权用户通过 OperationSource=3(密码/PIN)执行了 LockOperationType=1(解锁)操作。两次开锁间隔约5分钟,符合家庭成员先后到家的正常场景。", "推理步骤3: 检查是否存在异常关联——门锁解锁前后无运动传感器异常触发、无窗户/阳台门传感器状态变化、无烟雾/漏水报警、无灶具异常启动等事件。整个日志中除温度周期性上报和两次正常开锁外,无任何其他设备事件,说明家中处于平静状态。", "推理步骤4: 温度在 06:00 出现一次较明显的跳升(约从 23.0°C 升至 24.0°C),这与日出后太阳辐射导致室温快速上升一致,并非设备故障或火灾征兆——因为所有四个房间同步升温,且厨房烟雾报警器未触发。"], "key_evidence": ["四个房间温度全天同步变化,呈现标准昼夜曲线(夜间约23°C,午间峰值约25.9°C),无单点异常升温", "两次门锁解锁事件均为授权用户(UserIndex 1和2),操作方式为密码/PIN(OperationSource=3),时间在下午1点左右,属于正常归家时段", "全天无烟雾报警、漏水报警、窗户/门传感器异常开启等安全相关事件"], "recommended_actions": ["无需采取任何措施,家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.315748691558838, "api_error": null} {"episode_id": "SQ2_FP_B_0372", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_B_0372.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261001, "scenario_id": "INS-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-11T16:23:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且厨房窗户在关灶后开启但日志中未见关闭记录;同时 16:10 入户门解锁开门后未见关门/上锁记录,13分钟后又出现一次异常的门锁操作。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:42、07:04、18:39、19:28 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后,传感器可能受高温或油烟干扰导致读数丢失,属于设备故障或兼容性问题。\",\n \"推理步骤2: 厨房窗户在 07:03:30 和 19:27:30 被打开(BooleanState.StateValue = False),这是关灶后通风的合理行为。但整天日志中未见厨房窗户关闭(StateValue = True)的记录。如果窗户确实一直开着,在无人在家期间(07:26~16:10)存在一定安全隐患。\",\n \"推理步骤3: 16:10 入户门被手动解锁(LockOperationType=1)并开门(front_door_contact = False),玄关检测到有人,但之后没有关门和上锁的记录。紧接着 16:23 出现了第二次门锁解锁事件(OperationSource=3, UserIndex=5),OperationSource=3 通常对应远程/键盘操作,且指定了 UserIndex=5。两次解锁间隔仅 13 分钟,且第一次开门后门似乎一直未关,这个序列值得关注。\",\n \"推理步骤4: 16:10 的开门事件中,门打开后(contact = False)没有对应的关门记录(contact = True),直到 22:28:22 才出现 front_door_contact = True 并自动上锁。这意味着入户门可能从 16:10 到 22:28 一直处于未关闭状态,持续超过 6 小时,存在安全风险。\",\n \"推理步骤5: 其余行为模式正常——早晨 06:10 起床、07:26 出门并自动上锁、17:51 回家开灯开空调、18:38 做饭、22:28 睡前关灯关空调并确认门锁。温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C),无火灾或异常升温迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 MeasuredValue = None(06:42, 07:04, 18:39, 19:28)\",\n \"厨房窗户 07:03:30 和 19:27:30 两次打开,但全天日志中无关闭记录\",\n \"16:10 入户门手动解锁开门后无关门记录,16:23 又出现 OperationSource=3/UserIndex=5 的第二次解锁\",\n \"入户门从 16:10 开门到 22:28 才关闭上锁,中间超过 6 小时处于开启或未锁状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号,排除设备故障\",\n \"确认厨房窗户当前状态,如果确实未关闭请及时关窗,并考虑设置离家自动检查窗户状态的自动化规则\",\n \"核实 UserIndex=5 对应的用户身份,确认 16:23 的远程开锁操作是否为授权行为\",\n \"建议设置入户门长时间未关闭的告警规则(如超过 10 分钟未关门则推送通知),避免门户大开的安全隐患\",\n \"检查门磁传感器(front_door_contact)是否工作正常,排除传感器漏报关门事件的可能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且厨房窗户在关灶后开启但日志中未见关闭记录;同时 16:10 入户门解锁开门后未见关门/上锁记录,13分钟后又出现一次异常的门锁操作。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:42、07:04、18:39、19:28 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后,传感器可能受高温或油烟干扰导致读数丢失,属于设备故障或兼容性问题。", "推理步骤2: 厨房窗户在 07:03:30 和 19:27:30 被打开(BooleanState.StateValue = False),这是关灶后通风的合理行为。但整天日志中未见厨房窗户关闭(StateValue = True)的记录。如果窗户确实一直开着,在无人在家期间(07:26~16:10)存在一定安全隐患。", "推理步骤3: 16:10 入户门被手动解锁(LockOperationType=1)并开门(front_door_contact = False),玄关检测到有人,但之后没有关门和上锁的记录。紧接着 16:23 出现了第二次门锁解锁事件(OperationSource=3, UserIndex=5),OperationSource=3 通常对应远程/键盘操作,且指定了 UserIndex=5。两次解锁间隔仅 13 分钟,且第一次开门后门似乎一直未关,这个序列值得关注。", "推理步骤4: 16:10 的开门事件中,门打开后(contact = False)没有对应的关门记录(contact = True),直到 22:28:22 才出现 front_door_contact = True 并自动上锁。这意味着入户门可能从 16:10 到 22:28 一直处于未关闭状态,持续超过 6 小时,存在安全风险。", "推理步骤5: 其余行为模式正常——早晨 06:10 起床、07:26 出门并自动上锁、17:51 回家开灯开空调、18:38 做饭、22:28 睡前关灯关空调并确认门锁。温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C),无火灾或异常升温迹象。"], "key_evidence": ["厨房温度传感器 4 次报告 MeasuredValue = None(06:42, 07:04, 18:39, 19:28)", "厨房窗户 07:03:30 和 19:27:30 两次打开,但全天日志中无关闭记录", "16:10 入户门手动解锁开门后无关门记录,16:23 又出现 OperationSource=3/UserIndex=5 的第二次解锁", "入户门从 16:10 开门到 22:28 才关闭上锁,中间超过 6 小时处于开启或未锁状态"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号,排除设备故障", "确认厨房窗户当前状态,如果确实未关闭请及时关窗,并考虑设置离家自动检查窗户状态的自动化规则", "核实 UserIndex=5 对应的用户身份,确认 16:23 的远程开锁操作是否为授权行为", "建议设置入户门长时间未关闭的告警规则(如超过 10 分钟未关门则推送通知),避免门户大开的安全隐患", "检查门磁传感器(front_door_contact)是否工作正常,排除传感器漏报关门事件的可能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.03588557243347, "api_error": null} {"episode_id": "SQ2_FP_C_0296", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0296.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260925, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-05T10:49:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常,可能导致厨房火灾/高温风险无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:31、07:06、18:40、19:09 共四次报告 MeasuredValue = None,而其他房间的温度传感器在同一时段均正常上报数值。这排除了系统级通信故障,问题定位在该传感器本身。\",\n \"推理步骤2: 四次 None 值中有三次紧跟在厨房灶具 (kitchen_cook_surface) 开启或关闭操作之后(06:30 灶具开→06:31 None;07:05 灶具关→07:06 None;18:39 灶具开→18:40 None),说明传感器可能受灶具工作时的高温或电磁干扰影响而失效。\",\n \"推理步骤3: 在 10:49 灶具再次开启时,厨房温度传感器在 10:54 报告了 2700(27.00°C),11:19 报告了 2750(27.50°C),相比同时段其他房间高出约 2°C,随后 11:30 恢复到 2559 的正常范围。这说明传感器并非完全失效,而是间歇性故障——时而正常、时而丢失数据。\",\n \"推理步骤4: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助预警手段。传感器在灶具使用期间反复失效,意味着恰恰在最需要温度监测的时刻丧失了监测能力,这构成了显著的安全盲区。\",\n \"推理步骤5: 其余设备行为均属正常:早晨 06:16 起床→做早餐→07:17 出门上锁的生活节奏合理;16:09 孩子放学回家、18:08 大人下班回家的时间线自然;入户门锁的开关锁操作均为 Manual/Auto 且门锁状态与门磁传感器一致;全屋温度随日照呈现白天升高、夜间降低的正常曲线。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:31、07:06、18:40、19:09 四次报告 MeasuredValue = None\",\n \"None 值均出现在 kitchen_cook_surface 开启或关闭后约 1 分钟内,存在强时间关联\",\n \"其他三个房间的温度传感器在相同时段始终正常上报,排除系统性故障\",\n \"10:49 灶具开启期间传感器虽未报 None,但读数(2700/2750)明显偏高后又骤降,行为不稳定\"\n ],\n \"recommended_actions\": [\n \"尽快检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰\",\n \"清洁传感器探头,检查是否有油污覆盖影响测量精度\",\n \"如清洁和重新定位后仍出现 None 值,建议更换该温度传感器\",\n \"在传感器修复前,烹饪时保持厨房窗户通风并确认厨房烟雾报警器 (kitchen_smoke_alarm) 工作正常,作为替代安全保障\",\n \"考虑增加自动化规则:当厨房温度传感器报告 None 且灶具处于开启状态时,触发告警通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常,可能导致厨房火灾/高温风险无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:31、07:06、18:40、19:09 共四次报告 MeasuredValue = None,而其他房间的温度传感器在同一时段均正常上报数值。这排除了系统级通信故障,问题定位在该传感器本身。", "推理步骤2: 四次 None 值中有三次紧跟在厨房灶具 (kitchen_cook_surface) 开启或关闭操作之后(06:30 灶具开→06:31 None;07:05 灶具关→07:06 None;18:39 灶具开→18:40 None),说明传感器可能受灶具工作时的高温或电磁干扰影响而失效。", "推理步骤3: 在 10:49 灶具再次开启时,厨房温度传感器在 10:54 报告了 2700(27.00°C),11:19 报告了 2750(27.50°C),相比同时段其他房间高出约 2°C,随后 11:30 恢复到 2559 的正常范围。这说明传感器并非完全失效,而是间歇性故障——时而正常、时而丢失数据。", "推理步骤4: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助预警手段。传感器在灶具使用期间反复失效,意味着恰恰在最需要温度监测的时刻丧失了监测能力,这构成了显著的安全盲区。", "推理步骤5: 其余设备行为均属正常:早晨 06:16 起床→做早餐→07:17 出门上锁的生活节奏合理;16:09 孩子放学回家、18:08 大人下班回家的时间线自然;入户门锁的开关锁操作均为 Manual/Auto 且门锁状态与门磁传感器一致;全屋温度随日照呈现白天升高、夜间降低的正常曲线。"], "key_evidence": ["kitchen_temp_sensor 在 06:31、07:06、18:40、19:09 四次报告 MeasuredValue = None", "None 值均出现在 kitchen_cook_surface 开启或关闭后约 1 分钟内,存在强时间关联", "其他三个房间的温度传感器在相同时段始终正常上报,排除系统性故障", "10:49 灶具开启期间传感器虽未报 None,但读数(2700/2750)明显偏高后又骤降,行为不稳定"], "recommended_actions": ["尽快检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰", "清洁传感器探头,检查是否有油污覆盖影响测量精度", "如清洁和重新定位后仍出现 None 值,建议更换该温度传感器", "在传感器修复前,烹饪时保持厨房窗户通风并确认厨房烟雾报警器 (kitchen_smoke_alarm) 工作正常,作为替代安全保障", "考虑增加自动化规则:当厨房温度传感器报告 None 且灶具处于开启状态时,触发告警通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.802557229995728, "api_error": null} {"episode_id": "SQ2_FP_C_0297", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0297.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260926, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-02T07:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None 的情况(07:02、07:17、18:27、18:56),而其他房间的温度传感器始终正常上报数值\",\n \"推理步骤2: None 值出现的时间点均与灶具使用相关(07:01 灶具开启后立即出现 None,18:26 灶具开启后也出现 None),可能是高温环境导致传感器暂时失效或通信中断\",\n \"推理步骤3: 虽然传感器在后续的整点/半点周期上报中恢复了正常数值(如 07:30 恢复为 2438、18:30 恢复为 2469),但反复出现的 None 值说明设备在特定条件下不稳定\",\n \"推理步骤4: 其余家庭活动模式正常——早晨起床(05:59)、出门(07:49 关灯锁门)、孩子下午回家(16:15)、大人傍晚回家(18:01)做饭、晚间就寝(22:35),均符合三口之家的日常作息\",\n \"推理步骤5: 门锁在 07:01 出现一次 LockOperationError,但随后用户立即成功解锁(UserIndex=1),属于偶发的操作失误(如密码输错一次),不构成入侵威胁\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:02、07:17、18:27、18:56 四次报告 MeasuredValue = None\",\n \"None 值均出现在 kitchen_cook_surface 开启期间或刚关闭后,其他传感器同时段正常\",\n \"front_door_lock 在 07:01 出现 LockOperationError(OperationError=1, OperationSource=3),但紧接着同一用户(UserIndex=1)成功解锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时通信异常或传感器超量程\",\n \"考虑为厨房温度传感器增加耐高温防护或将其移至远离灶具的位置\",\n \"监控该传感器后续表现,若 None 值频率增加应更换设备\",\n \"门锁操作错误为单次事件,暂无需处理,但建议关注是否后续出现连续失败尝试\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None 的情况(07:02、07:17、18:27、18:56),而其他房间的温度传感器始终正常上报数值", "推理步骤2: None 值出现的时间点均与灶具使用相关(07:01 灶具开启后立即出现 None,18:26 灶具开启后也出现 None),可能是高温环境导致传感器暂时失效或通信中断", "推理步骤3: 虽然传感器在后续的整点/半点周期上报中恢复了正常数值(如 07:30 恢复为 2438、18:30 恢复为 2469),但反复出现的 None 值说明设备在特定条件下不稳定", "推理步骤4: 其余家庭活动模式正常——早晨起床(05:59)、出门(07:49 关灯锁门)、孩子下午回家(16:15)、大人傍晚回家(18:01)做饭、晚间就寝(22:35),均符合三口之家的日常作息", "推理步骤5: 门锁在 07:01 出现一次 LockOperationError,但随后用户立即成功解锁(UserIndex=1),属于偶发的操作失误(如密码输错一次),不构成入侵威胁"], "key_evidence": ["kitchen_temp_sensor 在 07:02、07:17、18:27、18:56 四次报告 MeasuredValue = None", "None 值均出现在 kitchen_cook_surface 开启期间或刚关闭后,其他传感器同时段正常", "front_door_lock 在 07:01 出现 LockOperationError(OperationError=1, OperationSource=3),但紧接着同一用户(UserIndex=1)成功解锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时通信异常或传感器超量程", "考虑为厨房温度传感器增加耐高温防护或将其移至远离灶具的位置", "监控该传感器后续表现,若 None 值频率增加应更换设备", "门锁操作错误为单次事件,暂无需处理,但建议关注是否后续出现连续失败尝试"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.73592782020569, "api_error": null} {"episode_id": "SQ2_FP_C_0298", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0298.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20260927, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-16T21:20:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"21:20 有人通过未知操作源(OperationSource=3)和非常规用户(UserIndex=5)开锁进入,且入户门未关闭/未上锁,存在入侵风险。\",\n \"reasoning\": [\n \"推理步骤1: 21:20 的开锁事件使用了 OperationSource=3(远程/Keypad),而当天其他所有开锁操作均为 OperationSource=Manual,这是一个异常的开锁方式。\",\n \"推理步骤2: 该事件关联的 UserIndex=5 是全天唯一出现的用户索引。早晨 07:44 和下午 16:13、18:07 的手动开锁均未携带 UserIndex,说明 UserIndex=5 并非家庭常用用户,可能是未经授权的凭证。\",\n \"推理步骤3: 开锁后入户门传感器(front_door_contact)始终没有报告 BooleanState.StateValue = True(门关闭),也没有触发自动上锁(LockOperationType=0)。对比当天 07:44 和 22:12 两次出门,门都在几秒内关闭并自动上锁,而 21:20 这次门一直处于开启/未锁状态,极不正常。\",\n \"推理步骤4: 进入后的行为模式也有异常——从玄关到客厅用了约 30 秒(正常),但随后仅在 21:21 开了客厅灯,没有任何其他典型的居家行为(开空调、去厨房、去卧室等),行为模式与当天家庭成员的活动习惯不符。\",\n \"推理步骤5: 时间背景——21:20 时家中应有人在(主卧有人睡觉前的活动期),但此次开锁没有从屋内触发,而是从外部通过远程/密码方式打开,且家庭成员在 22:12 才进行了正常的锁门操作,中间近 50 分钟门处于未锁定状态。\"\n ],\n \"key_evidence\": [\n \"21:20 开锁事件 OperationSource=3, UserIndex=5,与全天其他开锁事件的 OperationSource=Manual 且无 UserIndex 完全不同\",\n \"21:20 开锁后无 front_door_contact StateValue=True(门关闭)事件,也无自动上锁事件,门持续处于开启未锁状态直到 22:12\",\n \"21:20 事件的日志格式也出现异常——Occupancy 和 OnOff 属性缺少 Cluster 前缀(如 'Occupancy = 1' 而非 'OccupancySensing.Occupancy = 1'),可能暗示该事件来源与正常设备上报路径不同\"\n ],\n \"recommended_actions\": [\n \"立即确认 UserIndex=5 对应的用户身份,如果无法识别,应立即删除该用户凭证并更换门锁密码\",\n \"检查入户门当前状态,确认门是否已关闭并上锁(22:12 的上锁记录表明已恢复,但需确认)\",\n \"查看门口摄像头(如有)21:20 前后的录像,确认进入者身份\",\n \"审查门锁所有已注册的 UserIndex 列表,清理不明用户\",\n \"考虑启用门锁的异常开锁实时告警功能,对非 Manual 方式的开锁立即推送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "21:20 有人通过未知操作源(OperationSource=3)和非常规用户(UserIndex=5)开锁进入,且入户门未关闭/未上锁,存在入侵风险。", "reasoning": ["推理步骤1: 21:20 的开锁事件使用了 OperationSource=3(远程/Keypad),而当天其他所有开锁操作均为 OperationSource=Manual,这是一个异常的开锁方式。", "推理步骤2: 该事件关联的 UserIndex=5 是全天唯一出现的用户索引。早晨 07:44 和下午 16:13、18:07 的手动开锁均未携带 UserIndex,说明 UserIndex=5 并非家庭常用用户,可能是未经授权的凭证。", "推理步骤3: 开锁后入户门传感器(front_door_contact)始终没有报告 BooleanState.StateValue = True(门关闭),也没有触发自动上锁(LockOperationType=0)。对比当天 07:44 和 22:12 两次出门,门都在几秒内关闭并自动上锁,而 21:20 这次门一直处于开启/未锁状态,极不正常。", "推理步骤4: 进入后的行为模式也有异常——从玄关到客厅用了约 30 秒(正常),但随后仅在 21:21 开了客厅灯,没有任何其他典型的居家行为(开空调、去厨房、去卧室等),行为模式与当天家庭成员的活动习惯不符。", "推理步骤5: 时间背景——21:20 时家中应有人在(主卧有人睡觉前的活动期),但此次开锁没有从屋内触发,而是从外部通过远程/密码方式打开,且家庭成员在 22:12 才进行了正常的锁门操作,中间近 50 分钟门处于未锁定状态。"], "key_evidence": ["21:20 开锁事件 OperationSource=3, UserIndex=5,与全天其他开锁事件的 OperationSource=Manual 且无 UserIndex 完全不同", "21:20 开锁后无 front_door_contact StateValue=True(门关闭)事件,也无自动上锁事件,门持续处于开启未锁状态直到 22:12", "21:20 事件的日志格式也出现异常——Occupancy 和 OnOff 属性缺少 Cluster 前缀(如 'Occupancy = 1' 而非 'OccupancySensing.Occupancy = 1'),可能暗示该事件来源与正常设备上报路径不同"], "recommended_actions": ["立即确认 UserIndex=5 对应的用户身份,如果无法识别,应立即删除该用户凭证并更换门锁密码", "检查入户门当前状态,确认门是否已关闭并上锁(22:12 的上锁记录表明已恢复,但需确认)", "查看门口摄像头(如有)21:20 前后的录像,确认进入者身份", "审查门锁所有已注册的 UserIndex 列表,清理不明用户", "考虑启用门锁的异常开锁实时告警功能,对非 Manual 方式的开锁立即推送通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.213353633880615, "api_error": null} {"episode_id": "SQ2_FP_C_0302", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0302.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20260931, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-06T11:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常开锁\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——所有房间温度从凌晨约22.9°C逐步升至正午峰值约25.8°C,随后下午至夜间逐步回落至23.3°C,这是典型的夏季昼夜温度变化曲线,各房间温度高度一致,无局部异常升温\",\n \"推理步骤2: 门锁事件分析——11:53和11:58发生两次开锁操作,LockOperationType=1表示解锁,OperationSource=3表示通过密码/PIN码操作,UserIndex分别为1和2,说明是两位已注册的授权用户先后用密码开门,时间在中午属于正常活动时段\",\n \"推理步骤3: 无其他异常信号——整个24小时内没有烟雾报警、漏水检测、窗户/门异常开启、运动传感器在异常时段触发等事件,所有传感器报告频率正常,无设备离线或故障迹象\"\n ],\n \"key_evidence\": [\n \"温度变化幅度约3°C(22.9-25.8°C),符合6月份自然昼夜温差,各房间同步变化无异常热源\",\n \"门锁两次解锁均为授权用户(UserIndex 1和2)通过PIN码(OperationSource=3)在正常时段(11:53、11:58)操作\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,系统运行正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常开锁", "reasoning": ["推理步骤1: 温度数据分析——所有房间温度从凌晨约22.9°C逐步升至正午峰值约25.8°C,随后下午至夜间逐步回落至23.3°C,这是典型的夏季昼夜温度变化曲线,各房间温度高度一致,无局部异常升温", "推理步骤2: 门锁事件分析——11:53和11:58发生两次开锁操作,LockOperationType=1表示解锁,OperationSource=3表示通过密码/PIN码操作,UserIndex分别为1和2,说明是两位已注册的授权用户先后用密码开门,时间在中午属于正常活动时段", "推理步骤3: 无其他异常信号——整个24小时内没有烟雾报警、漏水检测、窗户/门异常开启、运动传感器在异常时段触发等事件,所有传感器报告频率正常,无设备离线或故障迹象"], "key_evidence": ["温度变化幅度约3°C(22.9-25.8°C),符合6月份自然昼夜温差,各房间同步变化无异常热源", "门锁两次解锁均为授权用户(UserIndex 1和2)通过PIN码(OperationSource=3)在正常时段(11:53、11:58)操作"], "recommended_actions": ["无需采取任何措施,系统运行正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 3, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.298834085464478, "api_error": null} {"episode_id": "SQ2_FP_C_0307", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0307.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260936, "scenario_id": "FG-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "master_bedroom", "injection_time": "2026-06-21T12:21:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人明确看管的情况下开启,厨房温度短时间内异常飙升,存在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 12:21 厨房灶具开启(OnOff=True),同一时刻客厅运动传感器显示无人(Occupancy=0),说明住户可能不在客厅/餐厅等公共区域,但不排除在厨房本身。\",\n \"推理步骤2: 灶具开启后,厨房温度从常规的约25.82°C(2582)在5分钟内飙升至27.00°C(2700),30分钟内进一步升至27.50°C(2750),相比同时段其他房间温度(约25.7-25.9°C)高出约1.5-2°C,升温速率明显异常。\",\n \"推理步骤3: 12:30的定时温度采样显示厨房温度回落至25.87°C(2587),但12:26和12:51的非定时采样分别为27.00°C和27.50°C,说明灶具附近温度实际持续走高,定时采样可能未捕捉到峰值。\",\n \"推理步骤4: 12:41客厅运动传感器恢复检测到人(Occupancy=1),说明住户在灶具开启后约20分钟才回到客厅区域。在此期间灶具处于无人看管的潜在状态。\",\n \"推理步骤5: 日志中未出现灶具关闭(OnOff=False)的记录,也未出现厨房烟雾报警器触发的事件。虽然烟雾报警器未触发是好迹象,但灶具持续开启且温度持续攀升仍需关注。\",\n \"推理步骤6: 13:00之后厨房温度回落至正常水平(约25.5°C),与其他房间趋势一致,说明灶具可能在某个时间点被关闭,但关闭事件未被日志记录或遗漏。\"\n ],\n \"key_evidence\": [\n \"12:21 灶具开启,同时客厅无人(Occupancy=0)\",\n \"12:26 厨房温度飙升至27.00°C(2700),12:51进一步升至27.50°C(2750),远超同时段其他房间约25.7°C的水平\",\n \"灶具开启后约20分钟(12:41)客厅才重新检测到人\",\n \"整个日志中未记录灶具关闭事件\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前是否已关闭,若仍在开启状态应立即关闭\",\n \"检查厨房烟雾报警器是否工作正常(灶具长时间开启期间未触发可能是正常的,但需确认传感器状态)\",\n \"建议设置灶具无人看管自动提醒规则:当灶具开启超过一定时间且厨房/餐厅运动传感器无人时,发送告警通知\",\n \"考虑为灶具添加自动超时关闭功能,防止忘记关火\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人明确看管的情况下开启,厨房温度短时间内异常飙升,存在火灾隐患。", "reasoning": ["推理步骤1: 12:21 厨房灶具开启(OnOff=True),同一时刻客厅运动传感器显示无人(Occupancy=0),说明住户可能不在客厅/餐厅等公共区域,但不排除在厨房本身。", "推理步骤2: 灶具开启后,厨房温度从常规的约25.82°C(2582)在5分钟内飙升至27.00°C(2700),30分钟内进一步升至27.50°C(2750),相比同时段其他房间温度(约25.7-25.9°C)高出约1.5-2°C,升温速率明显异常。", "推理步骤3: 12:30的定时温度采样显示厨房温度回落至25.87°C(2587),但12:26和12:51的非定时采样分别为27.00°C和27.50°C,说明灶具附近温度实际持续走高,定时采样可能未捕捉到峰值。", "推理步骤4: 12:41客厅运动传感器恢复检测到人(Occupancy=1),说明住户在灶具开启后约20分钟才回到客厅区域。在此期间灶具处于无人看管的潜在状态。", "推理步骤5: 日志中未出现灶具关闭(OnOff=False)的记录,也未出现厨房烟雾报警器触发的事件。虽然烟雾报警器未触发是好迹象,但灶具持续开启且温度持续攀升仍需关注。", "推理步骤6: 13:00之后厨房温度回落至正常水平(约25.5°C),与其他房间趋势一致,说明灶具可能在某个时间点被关闭,但关闭事件未被日志记录或遗漏。"], "key_evidence": ["12:21 灶具开启,同时客厅无人(Occupancy=0)", "12:26 厨房温度飙升至27.00°C(2700),12:51进一步升至27.50°C(2750),远超同时段其他房间约25.7°C的水平", "灶具开启后约20分钟(12:41)客厅才重新检测到人", "整个日志中未记录灶具关闭事件"], "recommended_actions": ["立即确认厨房灶具当前是否已关闭,若仍在开启状态应立即关闭", "检查厨房烟雾报警器是否工作正常(灶具长时间开启期间未触发可能是正常的,但需确认传感器状态)", "建议设置灶具无人看管自动提醒规则:当灶具开启超过一定时间且厨房/餐厅运动传感器无人时,发送告警通知", "考虑为灶具添加自动超时关闭功能,防止忘记关火"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.28453040122986, "api_error": null} {"episode_id": "SQ2_FP_C_0305", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0305.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260934, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-05T10:04:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——06:00 起床、07:25 出门上班/上学、16:15 孩子放学回家、17:51 大人回家、22:44 就寝,属于典型三口之家作息。\",\n \"推理步骤2: 入户门锁在 10:04 出现一次 LockOperationError(错误码1,来源3=远程/密码),但 20 秒后通过 UserIndex=1(已注册用户)成功解锁,这更像是输错一次密码后重试成功,不构成入侵威胁。\",\n \"推理步骤3: 厨房温度传感器在两次做饭期间(06:38、06:58、18:32、18:52)连续报告 MeasuredValue = None,共出现 4 次。而其他三个温度传感器在同一时段均正常上报数值。\",\n \"推理步骤4: 灶具开启后厨房温度会快速上升,传感器可能因超出量程或受热干扰而丢失读数。但 Matter 协议下传感器应报告超限值而非 None,None 通常意味着传感器通信中断或硬件故障。\",\n \"推理步骤5: 该传感器在非烹饪时段(如 07:00、19:00 等)能正常报告数值,说明故障与灶具运行存在关联性,可能是高温环境下的间歇性失效。\",\n \"推理步骤6: 厨房烟雾报警器全天未触发,厨房窗户在做饭后打开通风(06:57:30 和 18:51:30),漏水传感器无报警,排除火灾和漏水风险。\",\n \"推理步骤7: 厨房温度传感器是灶具安全监控的关键设备,如果在烹饪高温时段持续失效,将无法及时发现异常高温或火灾隐患,存在安全盲区。\"\n ],\n \"key_evidence\": [\n \"06:38:04 和 06:58:00 厨房温度传感器报告 None(早餐灶具使用期间)\",\n \"18:32:00 和 18:52:00 厨房温度传感器再次报告 None(晚餐灶具使用期间)\",\n \"故障仅在灶具开启期间出现,非烹饪时段传感器读数正常\",\n \"10:04 门锁操作错误后 20 秒内由已注册用户(UserIndex=1)成功解锁,非入侵\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰\",\n \"查看传感器固件版本,考虑升级固件或更换耐高温型号\",\n \"在传感器修复前,可设置灶具自动关闭定时器作为备用安全措施\",\n \"关注 10:04 的门锁错误事件,检查是否为家庭成员操作失误,如近期频繁出现则需排查是否有人尝试破解密码\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常。", "reasoning": ["推理步骤1: 整体生活模式正常——06:00 起床、07:25 出门上班/上学、16:15 孩子放学回家、17:51 大人回家、22:44 就寝,属于典型三口之家作息。", "推理步骤2: 入户门锁在 10:04 出现一次 LockOperationError(错误码1,来源3=远程/密码),但 20 秒后通过 UserIndex=1(已注册用户)成功解锁,这更像是输错一次密码后重试成功,不构成入侵威胁。", "推理步骤3: 厨房温度传感器在两次做饭期间(06:38、06:58、18:32、18:52)连续报告 MeasuredValue = None,共出现 4 次。而其他三个温度传感器在同一时段均正常上报数值。", "推理步骤4: 灶具开启后厨房温度会快速上升,传感器可能因超出量程或受热干扰而丢失读数。但 Matter 协议下传感器应报告超限值而非 None,None 通常意味着传感器通信中断或硬件故障。", "推理步骤5: 该传感器在非烹饪时段(如 07:00、19:00 等)能正常报告数值,说明故障与灶具运行存在关联性,可能是高温环境下的间歇性失效。", "推理步骤6: 厨房烟雾报警器全天未触发,厨房窗户在做饭后打开通风(06:57:30 和 18:51:30),漏水传感器无报警,排除火灾和漏水风险。", "推理步骤7: 厨房温度传感器是灶具安全监控的关键设备,如果在烹饪高温时段持续失效,将无法及时发现异常高温或火灾隐患,存在安全盲区。"], "key_evidence": ["06:38:04 和 06:58:00 厨房温度传感器报告 None(早餐灶具使用期间)", "18:32:00 和 18:52:00 厨房温度传感器再次报告 None(晚餐灶具使用期间)", "故障仅在灶具开启期间出现,非烹饪时段传感器读数正常", "10:04 门锁操作错误后 20 秒内由已注册用户(UserIndex=1)成功解锁,非入侵"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰", "查看传感器固件版本,考虑升级固件或更换耐高温型号", "在传感器修复前,可设置灶具自动关闭定时器作为备用安全措施", "关注 10:04 的门锁错误事件,检查是否为家庭成员操作失误,如近期频繁出现则需排查是否有人尝试破解密码"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.098401308059692, "api_error": null} {"episode_id": "SQ2_FP_C_0314", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0314.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20260943, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-04T09:49:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且灶具使用期间出现异常高温读数(27.0°C / 27.5°C),传感器工作状态不稳定。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了 4 次 MeasuredValue = None 的情况(06:53、07:01、18:45、19:21),而其他三个温度传感器全天无任何 None 值,说明这不是系统性问题,而是该传感器自身故障。\",\n \"推理步骤2: None 值均出现在灶具开关操作前后——06:52 灶具关闭后 06:53 报 None,07:00 灶具开启后 07:01 报 None,18:44 灶具开启后 18:45 报 None,19:20 灶具关闭后 19:21 报 None。这表明传感器可能受灶具电磁干扰或热冲击影响而间歇性失效。\",\n \"推理步骤3: 在 09:49 灶具显示开启状态时,厨房温度传感器在 09:54 报出 2700(27.0°C)、10:19 报出 2750(27.5°C),而同一时段其他房间温度约为 25.2°C,厨房与其他房间温差达到 2°C 以上。虽然做饭时厨房温度偏高属正常,但结合传感器频繁报 None 的不稳定表现,这些异常高温读数的可靠性存疑。\",\n \"推理步骤4: 温度传感器是厨房安全监控链的重要一环,与烟雾报警器配合用于火灾预警。传感器间歇性失效意味着在灶具使用的关键时段可能无法提供有效的温度监测,存在安全盲区。\",\n \"推理步骤5: 其余家庭活动模式均属正常——早晨 6 点起床、7:48 出门上班/上学并自动锁门、16:08 孩子放学回家、18:10 大人下班回家、22:12 就寝锁门,生活节奏合理,入户门锁操作均为手动开锁+自动上锁,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None 值:06:53、07:01、18:45、19:21\",\n \"None 值均与灶具开关操作高度关联(时间差在 1 分钟以内)\",\n \"09:54 和 10:19 出现异常高温读数 2700/2750,显著偏离同期其他房间温度\",\n \"其他三个温度传感器全天工作正常,无任何 None 值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受热辐射或油烟影响\",\n \"检查传感器供电和通信连接是否稳定,排除电磁干扰导致的间歇性掉线\",\n \"考虑更换或重新校准该温度传感器,确保厨房安全监测链完整可靠\",\n \"在传感器修复前,灶具使用期间应加强人工关注,避免安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且灶具使用期间出现异常高温读数(27.0°C / 27.5°C),传感器工作状态不稳定。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了 4 次 MeasuredValue = None 的情况(06:53、07:01、18:45、19:21),而其他三个温度传感器全天无任何 None 值,说明这不是系统性问题,而是该传感器自身故障。", "推理步骤2: None 值均出现在灶具开关操作前后——06:52 灶具关闭后 06:53 报 None,07:00 灶具开启后 07:01 报 None,18:44 灶具开启后 18:45 报 None,19:20 灶具关闭后 19:21 报 None。这表明传感器可能受灶具电磁干扰或热冲击影响而间歇性失效。", "推理步骤3: 在 09:49 灶具显示开启状态时,厨房温度传感器在 09:54 报出 2700(27.0°C)、10:19 报出 2750(27.5°C),而同一时段其他房间温度约为 25.2°C,厨房与其他房间温差达到 2°C 以上。虽然做饭时厨房温度偏高属正常,但结合传感器频繁报 None 的不稳定表现,这些异常高温读数的可靠性存疑。", "推理步骤4: 温度传感器是厨房安全监控链的重要一环,与烟雾报警器配合用于火灾预警。传感器间歇性失效意味着在灶具使用的关键时段可能无法提供有效的温度监测,存在安全盲区。", "推理步骤5: 其余家庭活动模式均属正常——早晨 6 点起床、7:48 出门上班/上学并自动锁门、16:08 孩子放学回家、18:10 大人下班回家、22:12 就寝锁门,生活节奏合理,入户门锁操作均为手动开锁+自动上锁,无入侵迹象。"], "key_evidence": ["厨房温度传感器 4 次报告 None 值:06:53、07:01、18:45、19:21", "None 值均与灶具开关操作高度关联(时间差在 1 分钟以内)", "09:54 和 10:19 出现异常高温读数 2700/2750,显著偏离同期其他房间温度", "其他三个温度传感器全天工作正常,无任何 None 值"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受热辐射或油烟影响", "检查传感器供电和通信连接是否稳定,排除电磁干扰导致的间歇性掉线", "考虑更换或重新校准该温度传感器,确保厨房安全监测链完整可靠", "在传感器修复前,灶具使用期间应加强人工关注,避免安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.792951583862305, "api_error": null} {"episode_id": "SQ2_FP_C_0315", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0315.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20260944, "scenario_id": "INS-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "kitchen", "injection_time": "2026-06-06T11:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"中午近12点家中无人时段,客厅出现短暂人体活动并伴随窗帘关闭操作,疑似有人入侵。\",\n \"reasoning\": [\n \"推理步骤1: 整日日志以温度数据为主,全天未见入户门锁解锁、入户门传感器开启等正常归家事件,说明当天住户大概率不在家。\",\n \"推理步骤2: 11:53:00 客厅运动传感器检测到有人(Occupancy=1),3秒后客厅主灯被打开,10秒后客厅窗帘被关闭(StateValue=False),随后主灯关闭,17秒内运动传感器恢复无人(Occupancy=0)。整个活动持续仅约20秒,行为极为短促。\",\n \"推理步骤3: 关闭窗帘的动作可能是为了遮挡外部视线,这是入侵者常见的行为模式——先遮蔽窗户再进行活动。\",\n \"推理步骤4: 没有对应的入户门锁解锁记录(front_door_lock 无 LockState 变化),也没有入户门传感器开启记录,说明此人并非通过正门正常进入。\",\n \"推理步骤5: 活动前后无任何其他房间的运动传感器触发,说明此人仅在客厅短暂出现后消失,行为模式不符合住户日常活动(住户通常会在多个房间活动并持续较长时间)。\",\n \"推理步骤6: 温度数据方面,全天四个传感器呈现一致的自然昼夜温度曲线(夜间约23°C,午间峰值约25.9°C,傍晚回落),无异常温升,排除火灾风险。所有温度变化同步且平滑,属于正常的室外气温影响,同时也说明全天无空调运行,进一步印证家中无人居住。\"\n ],\n \"key_evidence\": [\n \"11:53:00 客厅运动传感器触发(Occupancy=1),全天仅此一次人体活动\",\n \"11:53:10 客厅窗帘关闭(StateValue=False),疑似遮蔽视线\",\n \"全天无入户门锁解锁记录、无入户门传感器开启记录,此人未通过正门进入\",\n \"整个活动仅持续约20秒,行为短促异常\",\n \"活动前后无其他房间运动传感器触发,不符合住户正常活动模式\"\n ],\n \"recommended_actions\": [\n \"立即查看客厅区域的监控摄像头录像(如有),确认11:53前后是否有陌生人进入\",\n \"远程确认所有门窗传感器状态,检查是否有窗户被打开或未关闭(特别是客厅窗户和阳台门)\",\n \"联系家庭成员确认是否有人在该时段回家或委托他人进入\",\n \"如确认无人应在家中,立即通知物业或报警处理\",\n \"检查客厅窗户传感器状态,排查是否有人通过窗户进入的可能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "中午近12点家中无人时段,客厅出现短暂人体活动并伴随窗帘关闭操作,疑似有人入侵。", "reasoning": ["推理步骤1: 整日日志以温度数据为主,全天未见入户门锁解锁、入户门传感器开启等正常归家事件,说明当天住户大概率不在家。", "推理步骤2: 11:53:00 客厅运动传感器检测到有人(Occupancy=1),3秒后客厅主灯被打开,10秒后客厅窗帘被关闭(StateValue=False),随后主灯关闭,17秒内运动传感器恢复无人(Occupancy=0)。整个活动持续仅约20秒,行为极为短促。", "推理步骤3: 关闭窗帘的动作可能是为了遮挡外部视线,这是入侵者常见的行为模式——先遮蔽窗户再进行活动。", "推理步骤4: 没有对应的入户门锁解锁记录(front_door_lock 无 LockState 变化),也没有入户门传感器开启记录,说明此人并非通过正门正常进入。", "推理步骤5: 活动前后无任何其他房间的运动传感器触发,说明此人仅在客厅短暂出现后消失,行为模式不符合住户日常活动(住户通常会在多个房间活动并持续较长时间)。", "推理步骤6: 温度数据方面,全天四个传感器呈现一致的自然昼夜温度曲线(夜间约23°C,午间峰值约25.9°C,傍晚回落),无异常温升,排除火灾风险。所有温度变化同步且平滑,属于正常的室外气温影响,同时也说明全天无空调运行,进一步印证家中无人居住。"], "key_evidence": ["11:53:00 客厅运动传感器触发(Occupancy=1),全天仅此一次人体活动", "11:53:10 客厅窗帘关闭(StateValue=False),疑似遮蔽视线", "全天无入户门锁解锁记录、无入户门传感器开启记录,此人未通过正门进入", "整个活动仅持续约20秒,行为短促异常", "活动前后无其他房间运动传感器触发,不符合住户正常活动模式"], "recommended_actions": ["立即查看客厅区域的监控摄像头录像(如有),确认11:53前后是否有陌生人进入", "远程确认所有门窗传感器状态,检查是否有窗户被打开或未关闭(特别是客厅窗户和阳台门)", "联系家庭成员确认是否有人在该时段回家或委托他人进入", "如确认无人应在家中,立即通知物业或报警处理", "检查客厅窗户传感器状态,排查是否有人通过窗户进入的可能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.886590719223022, "api_error": null} {"episode_id": "SQ2_FP_C_0321", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0321.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20260950, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kids_room", "injection_time": "2026-06-07T09:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天设备状态正常,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度变化呈现典型的自然昼夜曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落至23.3°C。各房间温差始终在1°C以内,无任何局部异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 入户门事件分析——09:58 门锁通过 OperationSource=3(即远程/密码/正常方式)由 UserIndex=5(已注册用户)解锁,LockOperationType=1 为正常开锁操作。随后5秒内玄关运动传感器触发,30秒后客厅运动传感器触发,人员移动路径完全符合'开门→进玄关→走到客厅'的正常入户动线。\",\n \"推理步骤3: 灯光操作分析——09:59 客厅主灯开启,与人员进入客厅的时间吻合,属于正常的居家行为。\",\n \"推理步骤4: 安全设备静默确认——全天无烟雾报警器、漏水传感器、门窗传感器的异常触发事件,所有安全类设备保持正常静默状态。\",\n \"推理步骤5: 整体模式判断——全天仅有一次入户事件,发生在上午10点左右的合理时段,由已授权用户操作,后续行为链完整且合理,不存在入侵、设备故障或环境风险的迹象。\"\n ],\n \"key_evidence\": [\n \"门锁由已注册用户(UserIndex=5)通过正常方式(OperationSource=3)解锁,操作合法\",\n \"入户后玄关→客厅的运动传感器依次触发,时间间隔合理(5秒→30秒),符合正常人员移动\",\n \"四个房间温度全天呈一致的自然昼夜变化曲线(22.9°C~25.9°C),无异常波动\",\n \"全天无烟雾、漏水、门窗异常开启等安全告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天设备状态正常,未发现安全威胁", "reasoning": ["推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度变化呈现典型的自然昼夜曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落至23.3°C。各房间温差始终在1°C以内,无任何局部异常升温,排除火灾或设备过热风险。", "推理步骤2: 入户门事件分析——09:58 门锁通过 OperationSource=3(即远程/密码/正常方式)由 UserIndex=5(已注册用户)解锁,LockOperationType=1 为正常开锁操作。随后5秒内玄关运动传感器触发,30秒后客厅运动传感器触发,人员移动路径完全符合'开门→进玄关→走到客厅'的正常入户动线。", "推理步骤3: 灯光操作分析——09:59 客厅主灯开启,与人员进入客厅的时间吻合,属于正常的居家行为。", "推理步骤4: 安全设备静默确认——全天无烟雾报警器、漏水传感器、门窗传感器的异常触发事件,所有安全类设备保持正常静默状态。", "推理步骤5: 整体模式判断——全天仅有一次入户事件,发生在上午10点左右的合理时段,由已授权用户操作,后续行为链完整且合理,不存在入侵、设备故障或环境风险的迹象。"], "key_evidence": ["门锁由已注册用户(UserIndex=5)通过正常方式(OperationSource=3)解锁,操作合法", "入户后玄关→客厅的运动传感器依次触发,时间间隔合理(5秒→30秒),符合正常人员移动", "四个房间温度全天呈一致的自然昼夜变化曲线(22.9°C~25.9°C),无异常波动", "全天无烟雾、漏水、门窗异常开启等安全告警事件"], "recommended_actions": ["无需采取任何措施,当前家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.817009210586548, "api_error": null} {"episode_id": "SQ2_FP_C_0318", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0318.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260947, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-21T17:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天温度变化符合夏季自然昼夜规律,门锁开锁为正常住户归家行为,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.90°C(正午高点),四个房间温度走势高度一致,呈现典型的夏季昼夜温度曲线:凌晨最低(~23°C),中午前后最高(~25.9°C),傍晚后逐步回落。\",\n \"推理步骤2: 温度变化速率正常——相邻时间点(30分钟间隔)温度变化幅度通常在 0.1°C~0.3°C 之间,最大单次跳变出现在 05:30→06:00(约 +0.9°C),这与日出后太阳辐射快速升温一致(6月21日为夏至前后,日出约5:00-5:30),不存在突然异常升温(如火灾)的特征。\",\n \"推理步骤3: 各房间温度无显著偏离——四个传感器在同一时刻的读数差异始终在 2°C 以内,没有某个房间出现孤立的温度飙升或骤降,排除局部火灾风险或设备故障的可能。\",\n \"推理步骤4: 门锁事件分析——17:24 和 17:29 分别有 UserIndex=1 和 UserIndex=2 通过 OperationSource=3(密码/PIN)正常开锁(LockOperationType=1 为 Unlock)。两次开锁间隔 5 分钟,时间处于傍晚下班归家的合理时段,符合家庭两位成员先后到家的场景。\",\n \"推理步骤5: 无其他异常事件——全天日志中未出现烟雾报警、漏水检测、窗户/门异常开启、运动传感器深夜触发等安全相关事件,所有记录均为温度周期性上报和正常门锁操作。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C~25.9°C,四房间走势一致,符合夏至前后自然昼夜温度曲线\",\n \"06:00 时段温度跳升约 0.9°C 与日出升温吻合,非异常热源\",\n \"17:24 和 17:29 两次门锁开锁均为已注册用户(UserIndex 1、2)通过密码方式操作,时间处于正常归家时段\",\n \"全天无烟雾报警、漏水检测、异常入侵等安全事件触发\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前家庭状态正常\",\n \"可考虑在室内温度超过 25.5°C 时自动开启空调,提升夏季居住舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天温度变化符合夏季自然昼夜规律,门锁开锁为正常住户归家行为,未发现安全威胁。", "reasoning": ["推理步骤1: 温度数据分析——Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.90°C(正午高点),四个房间温度走势高度一致,呈现典型的夏季昼夜温度曲线:凌晨最低(~23°C),中午前后最高(~25.9°C),傍晚后逐步回落。", "推理步骤2: 温度变化速率正常——相邻时间点(30分钟间隔)温度变化幅度通常在 0.1°C~0.3°C 之间,最大单次跳变出现在 05:30→06:00(约 +0.9°C),这与日出后太阳辐射快速升温一致(6月21日为夏至前后,日出约5:00-5:30),不存在突然异常升温(如火灾)的特征。", "推理步骤3: 各房间温度无显著偏离——四个传感器在同一时刻的读数差异始终在 2°C 以内,没有某个房间出现孤立的温度飙升或骤降,排除局部火灾风险或设备故障的可能。", "推理步骤4: 门锁事件分析——17:24 和 17:29 分别有 UserIndex=1 和 UserIndex=2 通过 OperationSource=3(密码/PIN)正常开锁(LockOperationType=1 为 Unlock)。两次开锁间隔 5 分钟,时间处于傍晚下班归家的合理时段,符合家庭两位成员先后到家的场景。", "推理步骤5: 无其他异常事件——全天日志中未出现烟雾报警、漏水检测、窗户/门异常开启、运动传感器深夜触发等安全相关事件,所有记录均为温度周期性上报和正常门锁操作。"], "key_evidence": ["全天温度范围 22.9°C~25.9°C,四房间走势一致,符合夏至前后自然昼夜温度曲线", "06:00 时段温度跳升约 0.9°C 与日出升温吻合,非异常热源", "17:24 和 17:29 两次门锁开锁均为已注册用户(UserIndex 1、2)通过密码方式操作,时间处于正常归家时段", "全天无烟雾报警、漏水检测、异常入侵等安全事件触发"], "recommended_actions": ["无需采取任何措施,当前家庭状态正常", "可考虑在室内温度超过 25.5°C 时自动开启空调,提升夏季居住舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.325184106826782, "api_error": null} {"episode_id": "SQ2_FP_C_0324", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0324.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20260953, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kids_room", "injection_time": "2026-06-16T20:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;同时入户门在 20:35 和 20:40 出现两次远程解锁但无对应的开门/进入记录,行为可疑。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:24、18:29、19:07 四次报告 MeasuredValue = None。前两次发生在灶具使用期间/之后,后两次同样与灶具使用相关。虽然灶具高温可能导致传感器暂时超量程,但传感器应报告极值而非 None,多次出现 None 表明传感器通信或硬件存在间歇性故障。\",\n \"推理步骤2: 20:35 和 20:40 入户门锁连续发生两次解锁事件(LockOperationType=1, OperationSource=3),分别由 UserIndex=1 和 UserIndex=2 触发。OperationSource=3 通常对应远程/网络操作。但这两次解锁后,没有任何门磁传感器(front_door_contact)状态变化,也没有玄关运动传感器触发,说明门并未实际被打开、无人进出。\",\n \"推理步骤3: 对比当天其他三次正常的开门场景(07:35 出门、16:18 回家、17:54 回家),每次解锁后都紧跟门磁状态变化和运动传感器触发。20:35/20:40 的解锁缺少这些关联事件,属于异常模式。可能是远程误操作、自动化规则误触发,也不排除账户被未授权访问的可能。\",\n \"推理步骤4: 其余家庭活动模式正常:早晨 6:23 起床洗漱做饭、7:35 出门上班/上学(门自动上锁)、16:18 孩子放学回家、17:54 大人下班回家、晚间做饭用餐、22:46 就寝锁门,符合三口之家的典型作息。\",\n \"推理步骤5: 温度趋势整体合理——夜间约 23°C,白天升至约 25.8°C 峰值后回落,符合夏季自然温度变化。客厅空调 17:54 开启制冷后温度逐步下降,22:46 关闭,均属正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:52、07:24、18:29、19:07 四次报告 MeasuredValue = None\",\n \"20:35 门锁远程解锁(OperationSource=3, UserIndex=1)后无门磁变化、无运动检测\",\n \"20:40 门锁再次远程解锁(OperationSource=3, UserIndex=2)后同样无门磁变化、无运动检测\",\n \"当天其他三次开锁均伴随门磁状态变化和运动传感器触发,形成鲜明对比\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致间歇性故障,必要时更换或重新定位传感器远离热源\",\n \"核实 20:35 和 20:40 两次远程解锁的来源——检查智能锁 App 操作记录、自动化规则日志,确认是否为家庭成员有意操作\",\n \"审查门锁远程访问权限,确认 UserIndex=1 和 UserIndex=2 对应的用户身份,排除账户被盗用的可能\",\n \"考虑为远程解锁操作启用二次确认或通知推送,防止误操作或未授权访问\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;同时入户门在 20:35 和 20:40 出现两次远程解锁但无对应的开门/进入记录,行为可疑。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:24、18:29、19:07 四次报告 MeasuredValue = None。前两次发生在灶具使用期间/之后,后两次同样与灶具使用相关。虽然灶具高温可能导致传感器暂时超量程,但传感器应报告极值而非 None,多次出现 None 表明传感器通信或硬件存在间歇性故障。", "推理步骤2: 20:35 和 20:40 入户门锁连续发生两次解锁事件(LockOperationType=1, OperationSource=3),分别由 UserIndex=1 和 UserIndex=2 触发。OperationSource=3 通常对应远程/网络操作。但这两次解锁后,没有任何门磁传感器(front_door_contact)状态变化,也没有玄关运动传感器触发,说明门并未实际被打开、无人进出。", "推理步骤3: 对比当天其他三次正常的开门场景(07:35 出门、16:18 回家、17:54 回家),每次解锁后都紧跟门磁状态变化和运动传感器触发。20:35/20:40 的解锁缺少这些关联事件,属于异常模式。可能是远程误操作、自动化规则误触发,也不排除账户被未授权访问的可能。", "推理步骤4: 其余家庭活动模式正常:早晨 6:23 起床洗漱做饭、7:35 出门上班/上学(门自动上锁)、16:18 孩子放学回家、17:54 大人下班回家、晚间做饭用餐、22:46 就寝锁门,符合三口之家的典型作息。", "推理步骤5: 温度趋势整体合理——夜间约 23°C,白天升至约 25.8°C 峰值后回落,符合夏季自然温度变化。客厅空调 17:54 开启制冷后温度逐步下降,22:46 关闭,均属正常。"], "key_evidence": ["厨房温度传感器在 06:52、07:24、18:29、19:07 四次报告 MeasuredValue = None", "20:35 门锁远程解锁(OperationSource=3, UserIndex=1)后无门磁变化、无运动检测", "20:40 门锁再次远程解锁(OperationSource=3, UserIndex=2)后同样无门磁变化、无运动检测", "当天其他三次开锁均伴随门磁状态变化和运动传感器触发,形成鲜明对比"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致间歇性故障,必要时更换或重新定位传感器远离热源", "核实 20:35 和 20:40 两次远程解锁的来源——检查智能锁 App 操作记录、自动化规则日志,确认是否为家庭成员有意操作", "审查门锁远程访问权限,确认 UserIndex=1 和 UserIndex=2 对应的用户身份,排除账户被盗用的可能", "考虑为远程解锁操作启用二次确认或通知推送,防止误操作或未授权访问"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.637267112731934, "api_error": null} {"episode_id": "SQ2_FP_C_0323", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0323.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260952, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-30T16:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁在短时间内出现两次失败的开锁尝试。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:54、07:04、18:50、19:06 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时间段均正常上报数值,说明这不是系统级通信故障,而是该传感器自身的问题。\",\n \"推理步骤2: 观察 None 值出现的时间规律——每次都紧跟在灶具开启或关闭之后(06:53 灶具关闭→06:54 None;07:03 灶具开启→07:04 None;18:49 灶具开启→18:50 None;19:05 灶具关闭→19:06 None)。这强烈暗示灶具的电磁干扰或热冲击导致传感器短暂失效。虽然传感器在下一个整点周期恢复了正常读数,但反复出现的瞬时故障意味着传感器可靠性已受损,在真正需要监测厨房温度异常(如火灾)时可能漏报。\",\n \"推理步骤3: 16:50 和 16:55 入户门锁连续记录了两次 LockOperationType=1(开锁)事件,OperationSource=3 分别对应 UserIndex=1 和 UserIndex=2。但这两次操作后没有门磁开合记录(BooleanState 未变化)、没有玄关运动传感器触发、也没有任何室内灯光或设备响应。这说明这两次开锁尝试并未成功打开门,或者是远程/密码尝试但未实际进入。结合 16:05 已有人正常进门(有完整的门磁+运动传感器+灯光链),这两次孤立的开锁事件显得异常。\",\n \"推理步骤4: 其余家庭活动模式正常——早晨 06:06 起床、07:34 出门并自动锁门、16:05 孩子放学回家、17:44 大人回家开空调、18:49 做饭、21:06 孩子睡觉、22:12 大人就寝。温度曲线符合夏季日间升温夜间降温的自然规律。灶具使用时间合理,洗碗机晚餐后启动,均属正常生活模式。\",\n \"推理步骤5: 厨房窗户传感器在 06:53 和 19:05 报告 StateValue=False(窗户打开),均发生在灶具关闭后,属于做饭后通风的正常行为,无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:54、07:04、18:50、19:06 四次报告 MeasuredValue = None,每次均紧随灶具状态切换之后\",\n \"16:50 和 16:55 入户门锁记录两次开锁操作(OperationSource=3, UserIndex 1 和 2),但无对应的门磁开合、运动传感器触发或室内设备响应\",\n \"其他三个温度传感器在相同时段均正常上报,排除系统级故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热冲击或电磁干扰,必要时重新定位或更换传感器\",\n \"审查 16:50 和 16:55 的门锁开锁记录,确认 UserIndex 1 和 2 对应的用户身份,排查是否为误操作或未授权的远程开锁尝试\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当连续或频繁出现空值时自动通知住户,避免在火灾场景下丧失监测能力\",\n \"检查入户门锁固件是否为最新版本,确认远程开锁功能的权限设置是否合理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁在短时间内出现两次失败的开锁尝试。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:54、07:04、18:50、19:06 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时间段均正常上报数值,说明这不是系统级通信故障,而是该传感器自身的问题。", "推理步骤2: 观察 None 值出现的时间规律——每次都紧跟在灶具开启或关闭之后(06:53 灶具关闭→06:54 None;07:03 灶具开启→07:04 None;18:49 灶具开启→18:50 None;19:05 灶具关闭→19:06 None)。这强烈暗示灶具的电磁干扰或热冲击导致传感器短暂失效。虽然传感器在下一个整点周期恢复了正常读数,但反复出现的瞬时故障意味着传感器可靠性已受损,在真正需要监测厨房温度异常(如火灾)时可能漏报。", "推理步骤3: 16:50 和 16:55 入户门锁连续记录了两次 LockOperationType=1(开锁)事件,OperationSource=3 分别对应 UserIndex=1 和 UserIndex=2。但这两次操作后没有门磁开合记录(BooleanState 未变化)、没有玄关运动传感器触发、也没有任何室内灯光或设备响应。这说明这两次开锁尝试并未成功打开门,或者是远程/密码尝试但未实际进入。结合 16:05 已有人正常进门(有完整的门磁+运动传感器+灯光链),这两次孤立的开锁事件显得异常。", "推理步骤4: 其余家庭活动模式正常——早晨 06:06 起床、07:34 出门并自动锁门、16:05 孩子放学回家、17:44 大人回家开空调、18:49 做饭、21:06 孩子睡觉、22:12 大人就寝。温度曲线符合夏季日间升温夜间降温的自然规律。灶具使用时间合理,洗碗机晚餐后启动,均属正常生活模式。", "推理步骤5: 厨房窗户传感器在 06:53 和 19:05 报告 StateValue=False(窗户打开),均发生在灶具关闭后,属于做饭后通风的正常行为,无异常。"], "key_evidence": ["厨房温度传感器在 06:54、07:04、18:50、19:06 四次报告 MeasuredValue = None,每次均紧随灶具状态切换之后", "16:50 和 16:55 入户门锁记录两次开锁操作(OperationSource=3, UserIndex 1 和 2),但无对应的门磁开合、运动传感器触发或室内设备响应", "其他三个温度传感器在相同时段均正常上报,排除系统级故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热冲击或电磁干扰,必要时重新定位或更换传感器", "审查 16:50 和 16:55 的门锁开锁记录,确认 UserIndex 1 和 2 对应的用户身份,排查是否为误操作或未授权的远程开锁尝试", "考虑为厨房温度传感器设置 None 值告警规则,当连续或频繁出现空值时自动通知住户,避免在火灾场景下丧失监测能力", "检查入户门锁固件是否为最新版本,确认远程开锁功能的权限设置是否合理"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.07854175567627, "api_error": null} {"episode_id": "SQ2_FP_C_0328", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0328.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260957, "scenario_id": "INS-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-20T11:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天设备状态正常,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全屋四个温度传感器在24小时内呈现一致的自然变化曲线:凌晨最低约22.9°C,午后最高约25.9°C,随后逐步回落至23.3°C。各房间温差始终在2°C以内,没有出现单个房间温度异常飙升或骤降的情况,排除火灾风险或设备故障。\",\n \"推理步骤2: 入户门事件分析——11:19:00 发生一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),20秒后同一门锁通过相同操作源(OperationSource=3,通常为密码/PIN)由 UserIndex=1(已注册的主用户)成功解锁(LockOperationType=1)。这是典型的输入密码失误后重试成功的场景。\",\n \"推理步骤3: 开门与人体感应联动验证——门锁成功解锁后2秒,入户门接触传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1)。时间序列完全吻合正常的'解锁→开门→进入'流程,且发生在上午11:19,属于合理的日间活动时段。\",\n \"推理步骤4: 综合排查——全天无烟雾报警、无漏水报警、无窗户/阳台门异常开启事件、无深夜异常活动。唯一的一次门锁错误由已注册用户在短时间内修正,不构成入侵特征(入侵通常表现为多次连续失败、未知用户、异常时段)。\"\n ],\n \"key_evidence\": [\n \"门锁操作错误后仅20秒即由已注册用户(UserIndex=1)通过正常方式(OperationSource=3)成功解锁,属于正常的密码输入失误重试\",\n \"解锁→开门→玄关检测到人的时间序列紧密衔接(11:19:00→11:19:20→11:19:22→11:19:25),符合正常进门行为\",\n \"事件发生在上午11:19,属于正常日间活动时段\",\n \"全屋温度曲线平稳一致,无任何传感器报警事件触发\"\n ],\n \"recommended_actions\": [\n \"无需立即采取措施,当前状态安全\",\n \"可关注门锁操作错误的频率,若短期内频繁出现密码错误,建议检查是否有人尝试猜测密码\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天设备状态正常,未发现安全威胁", "reasoning": ["推理步骤1: 温度数据分析——全屋四个温度传感器在24小时内呈现一致的自然变化曲线:凌晨最低约22.9°C,午后最高约25.9°C,随后逐步回落至23.3°C。各房间温差始终在2°C以内,没有出现单个房间温度异常飙升或骤降的情况,排除火灾风险或设备故障。", "推理步骤2: 入户门事件分析——11:19:00 发生一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),20秒后同一门锁通过相同操作源(OperationSource=3,通常为密码/PIN)由 UserIndex=1(已注册的主用户)成功解锁(LockOperationType=1)。这是典型的输入密码失误后重试成功的场景。", "推理步骤3: 开门与人体感应联动验证——门锁成功解锁后2秒,入户门接触传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1)。时间序列完全吻合正常的'解锁→开门→进入'流程,且发生在上午11:19,属于合理的日间活动时段。", "推理步骤4: 综合排查——全天无烟雾报警、无漏水报警、无窗户/阳台门异常开启事件、无深夜异常活动。唯一的一次门锁错误由已注册用户在短时间内修正,不构成入侵特征(入侵通常表现为多次连续失败、未知用户、异常时段)。"], "key_evidence": ["门锁操作错误后仅20秒即由已注册用户(UserIndex=1)通过正常方式(OperationSource=3)成功解锁,属于正常的密码输入失误重试", "解锁→开门→玄关检测到人的时间序列紧密衔接(11:19:00→11:19:20→11:19:22→11:19:25),符合正常进门行为", "事件发生在上午11:19,属于正常日间活动时段", "全屋温度曲线平稳一致,无任何传感器报警事件触发"], "recommended_actions": ["无需立即采取措施,当前状态安全", "可关注门锁操作错误的频率,若短期内频繁出现密码错误,建议检查是否有人尝试猜测密码"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.504835844039917, "api_error": null} {"episode_id": "SQ2_FP_C_0337", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0337.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260966, "scenario_id": "INS-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-25T13:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了三次 MeasuredValue = None 的情况(06:36、06:52、18:23、18:51),而其他三个温度传感器在相同时间段均正常上报数值。\",\n \"推理步骤2: 这些 None 值均出现在厨房灶具开启或关闭前后的时间窗口内(06:35 灶具开启 → 06:36 None;06:51 灶具关闭 → 06:52 None;18:22 灶具开启 → 18:23 None;18:50 灶具关闭 → 18:51 None),说明灶具运行可能对传感器产生了电磁干扰或热冲击,导致读数异常。\",\n \"推理步骤3: 虽然传感器在下一个整点周期(07:00、19:00)恢复了正常数值,但这种反复出现的间歇性故障模式值得关注——如果传感器在真正发生厨房高温危险时恰好处于 None 状态,将无法及时预警。\",\n \"推理步骤4: 其余家庭活动模式均属正常:早晨 ~06:00 起床、07:11 出门上锁、下午 16:35 孩子放学回家、18:20 大人回家做饭、20:49 孩子关灯睡觉、22:17 大人就寝锁门,符合典型三口之家的作息规律。\",\n \"推理步骤5: 13:33 的短暂客厅活动(运动检测→灯亮→窗户打开→灯灭→运动消失,全程仅 20 秒)在家中无人期间发生,但入户门锁未被操作,更可能是宠物触发或传感器误触,不构成入侵威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:36、06:52、18:23、18:51 四次报告 MeasuredValue = None\",\n \"None 值均与厨房灶具开关操作高度关联(灶具状态变化后约 1 分钟内出现)\",\n \"同时段其他房间温度传感器均正常上报数据,排除系统性网络故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到热辐射或电磁干扰影响\",\n \"考虑将厨房温度传感器迁移到远离灶具的位置,或加装隔热/屏蔽措施\",\n \"在传感器固件层面增加异常值重试机制,避免在关键时刻出现读数空白\",\n \"关注 13:33 无人时段客厅的短暂活动事件,如反复出现建议排查是否有宠物或传感器灵敏度过高\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了三次 MeasuredValue = None 的情况(06:36、06:52、18:23、18:51),而其他三个温度传感器在相同时间段均正常上报数值。", "推理步骤2: 这些 None 值均出现在厨房灶具开启或关闭前后的时间窗口内(06:35 灶具开启 → 06:36 None;06:51 灶具关闭 → 06:52 None;18:22 灶具开启 → 18:23 None;18:50 灶具关闭 → 18:51 None),说明灶具运行可能对传感器产生了电磁干扰或热冲击,导致读数异常。", "推理步骤3: 虽然传感器在下一个整点周期(07:00、19:00)恢复了正常数值,但这种反复出现的间歇性故障模式值得关注——如果传感器在真正发生厨房高温危险时恰好处于 None 状态,将无法及时预警。", "推理步骤4: 其余家庭活动模式均属正常:早晨 ~06:00 起床、07:11 出门上锁、下午 16:35 孩子放学回家、18:20 大人回家做饭、20:49 孩子关灯睡觉、22:17 大人就寝锁门,符合典型三口之家的作息规律。", "推理步骤5: 13:33 的短暂客厅活动(运动检测→灯亮→窗户打开→灯灭→运动消失,全程仅 20 秒)在家中无人期间发生,但入户门锁未被操作,更可能是宠物触发或传感器误触,不构成入侵威胁。"], "key_evidence": ["厨房温度传感器在 06:36、06:52、18:23、18:51 四次报告 MeasuredValue = None", "None 值均与厨房灶具开关操作高度关联(灶具状态变化后约 1 分钟内出现)", "同时段其他房间温度传感器均正常上报数据,排除系统性网络故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到热辐射或电磁干扰影响", "考虑将厨房温度传感器迁移到远离灶具的位置,或加装隔热/屏蔽措施", "在传感器固件层面增加异常值重试机制,避免在关键时刻出现读数空白", "关注 13:33 无人时段客厅的短暂活动事件,如反复出现建议排查是否有宠物或传感器灵敏度过高"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.54715657234192, "api_error": null} {"episode_id": "SQ2_FP_C_0348", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0348.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260977, "scenario_id": "INS-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-20T16:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:32 客厅出现短暂人员活动并关闭窗帘,但全天无入户门开锁/开门记录,且家中长时间无人,疑似未授权入侵。\",\n \"reasoning\": [\n \"推理步骤1: 全天日志中没有任何 front_door_lock(入户门锁)解锁事件,也没有 front_door_contact(入户门传感器)开门事件,说明全天无人通过正门进出。\",\n \"推理步骤2: 从 00:00 到 16:31,所有运动传感器均无触发记录,全屋无灯光、空调、窗帘等人为操作,表明住户长时间不在家(可能外出或度假)。\",\n \"推理步骤3: 16:32:00 客厅运动传感器突然检测到有人(Occupancy=1),3秒后客厅主灯被打开,10秒后客厅窗帘被关闭(StateValue=False),15秒后主灯又被关掉,20秒后运动传感器恢复无人(Occupancy=0)。整个过程仅持续20秒,行为极为短促。\",\n \"推理步骤4: 关闭窗帘的动作在入侵场景中是典型的'遮蔽视线'行为——入侵者进入后先拉上窗帘防止外部观察,随后关灯离开客厅转移到其他区域或撤离。\",\n \"推理步骤5: 阳台门传感器(balcony_door_contact)和各窗户传感器全天无开合记录,但这些传感器只报告状态变化,如果阳台门或窗户在日志开始前就处于未关闭状态,入侵者可能通过这些入口进入而不触发新的事件。\",\n \"推理步骤6: 16:32 之后直到 23:30,再无任何运动传感器触发或设备操作,说明这不是住户回家的正常行为模式(住户回家后通常会有持续的活动痕迹)。\"\n ],\n \"key_evidence\": [\n \"全天无入户门锁解锁和开门记录,住户不在家\",\n \"16:32 客厅运动传感器触发,仅持续20秒即恢复无人\",\n \"20秒内完成了开灯→关窗帘→关灯的操作序列,行为短促且有遮蔽意图\",\n \"事件前后(00:00-16:31 及 16:33-23:30)全屋无任何人员活动痕迹\"\n ],\n \"recommended_actions\": [\n \"立即查看客厅及阳台区域的监控摄像头录像(如有),确认16:32前后是否有人员出入\",\n \"远程确认阳台门、各窗户的当前开合状态,排查入侵入口\",\n \"联系住户确认是否有家人、保姆或维修人员在该时段进入\",\n \"如无法确认合法访问,建议立即通知物业或报警处理\",\n \"检查家中贵重物品是否有丢失,并考虑加装阳台和窗户的入侵报警装置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "16:32 客厅出现短暂人员活动并关闭窗帘,但全天无入户门开锁/开门记录,且家中长时间无人,疑似未授权入侵。", "reasoning": ["推理步骤1: 全天日志中没有任何 front_door_lock(入户门锁)解锁事件,也没有 front_door_contact(入户门传感器)开门事件,说明全天无人通过正门进出。", "推理步骤2: 从 00:00 到 16:31,所有运动传感器均无触发记录,全屋无灯光、空调、窗帘等人为操作,表明住户长时间不在家(可能外出或度假)。", "推理步骤3: 16:32:00 客厅运动传感器突然检测到有人(Occupancy=1),3秒后客厅主灯被打开,10秒后客厅窗帘被关闭(StateValue=False),15秒后主灯又被关掉,20秒后运动传感器恢复无人(Occupancy=0)。整个过程仅持续20秒,行为极为短促。", "推理步骤4: 关闭窗帘的动作在入侵场景中是典型的'遮蔽视线'行为——入侵者进入后先拉上窗帘防止外部观察,随后关灯离开客厅转移到其他区域或撤离。", "推理步骤5: 阳台门传感器(balcony_door_contact)和各窗户传感器全天无开合记录,但这些传感器只报告状态变化,如果阳台门或窗户在日志开始前就处于未关闭状态,入侵者可能通过这些入口进入而不触发新的事件。", "推理步骤6: 16:32 之后直到 23:30,再无任何运动传感器触发或设备操作,说明这不是住户回家的正常行为模式(住户回家后通常会有持续的活动痕迹)。"], "key_evidence": ["全天无入户门锁解锁和开门记录,住户不在家", "16:32 客厅运动传感器触发,仅持续20秒即恢复无人", "20秒内完成了开灯→关窗帘→关灯的操作序列,行为短促且有遮蔽意图", "事件前后(00:00-16:31 及 16:33-23:30)全屋无任何人员活动痕迹"], "recommended_actions": ["立即查看客厅及阳台区域的监控摄像头录像(如有),确认16:32前后是否有人员出入", "远程确认阳台门、各窗户的当前开合状态,排查入侵入口", "联系住户确认是否有家人、保姆或维修人员在该时段进入", "如无法确认合法访问,建议立即通知物业或报警处理", "检查家中贵重物品是否有丢失,并考虑加装阳台和窗户的入侵报警装置"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.131098747253418, "api_error": null} {"episode_id": "SQ2_FP_C_0340", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0340.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260969, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "second_bedroom", "injection_time": "2026-06-25T10:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55:02、07:25:00、18:20:00、19:11:00 共四次报告 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值。这说明该传感器存在间歇性通信或硬件故障。\",\n \"推理步骤2: 观察 None 值出现的时间规律——06:55 和 18:20 都紧跟在灶具开启之后(06:54:34 和 18:19:30),07:25 和 19:11 则在灶具关闭后不久。这暗示灶具运行可能对传感器产生干扰(热冲击、电磁干扰或蒸汽影响),但传感器不应因此返回 None,正常应返回一个升高的温度值。\",\n \"推理步骤3: 厨房窗户传感器在 07:24:30 记录了开启(StateValue=False),之后在 19:10:30 再次记录开启,但全天日志中没有任何关闭事件。如果窗户在白天家中无人时(约 07:25-16:04)一直处于开启状态,存在安全风险(入侵通道、雨水进入等)。\",\n \"推理步骤4: 10:57:00 入户门锁出现一次 LockOperationError(OperationError=1, OperationSource=3 即远程/键盘操作),20秒后通过 UserIndex=1 成功解锁。单次失败后由已注册用户成功开锁,更可能是输入错误而非入侵尝试,威胁等级低。\",\n \"推理步骤5: 其余事件模式正常——早晨起床、做早餐、出门上班/上学、下午孩子回家、傍晚大人回家做晚饭、晚间休息、锁门就寝,均符合三口之家的典型作息。温度曲线呈现夏季正常的日间升温-夜间降温趋势(约22.9°C至25.9°C)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:55:04、07:25:00、18:20:00、19:11:00 四次报告 MeasuredValue = None,均与灶具开关操作时间高度相关\",\n \"kitchen_window_contact 在 07:24:30 报告开启(StateValue=False),全天无关闭记录,家中白天约 8.5 小时无人期间窗户可能持续敞开\",\n \"front_door_lock 在 10:57:00 出现一次 LockOperationError(OperationSource=3),但 20 秒后由 UserIndex=1 成功解锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或蒸汽干扰;考虑重新校准或更换传感器\",\n \"设置自动化规则:当家中无人(所有运动传感器长时间无触发)且厨房窗户处于开启状态时,发送提醒通知\",\n \"关注入户门锁的远程操作失败记录,若后续频繁出现 LockOperationError,需排查是否有未授权的开锁尝试\",\n \"建议为厨房温度传感器的 None 值设置告警,避免在灶具使用期间丧失温度监控能力,影响火灾预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55:02、07:25:00、18:20:00、19:11:00 共四次报告 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值。这说明该传感器存在间歇性通信或硬件故障。", "推理步骤2: 观察 None 值出现的时间规律——06:55 和 18:20 都紧跟在灶具开启之后(06:54:34 和 18:19:30),07:25 和 19:11 则在灶具关闭后不久。这暗示灶具运行可能对传感器产生干扰(热冲击、电磁干扰或蒸汽影响),但传感器不应因此返回 None,正常应返回一个升高的温度值。", "推理步骤3: 厨房窗户传感器在 07:24:30 记录了开启(StateValue=False),之后在 19:10:30 再次记录开启,但全天日志中没有任何关闭事件。如果窗户在白天家中无人时(约 07:25-16:04)一直处于开启状态,存在安全风险(入侵通道、雨水进入等)。", "推理步骤4: 10:57:00 入户门锁出现一次 LockOperationError(OperationError=1, OperationSource=3 即远程/键盘操作),20秒后通过 UserIndex=1 成功解锁。单次失败后由已注册用户成功开锁,更可能是输入错误而非入侵尝试,威胁等级低。", "推理步骤5: 其余事件模式正常——早晨起床、做早餐、出门上班/上学、下午孩子回家、傍晚大人回家做晚饭、晚间休息、锁门就寝,均符合三口之家的典型作息。温度曲线呈现夏季正常的日间升温-夜间降温趋势(约22.9°C至25.9°C)。"], "key_evidence": ["kitchen_temp_sensor 在 06:55:04、07:25:00、18:20:00、19:11:00 四次报告 MeasuredValue = None,均与灶具开关操作时间高度相关", "kitchen_window_contact 在 07:24:30 报告开启(StateValue=False),全天无关闭记录,家中白天约 8.5 小时无人期间窗户可能持续敞开", "front_door_lock 在 10:57:00 出现一次 LockOperationError(OperationSource=3),但 20 秒后由 UserIndex=1 成功解锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或蒸汽干扰;考虑重新校准或更换传感器", "设置自动化规则:当家中无人(所有运动传感器长时间无触发)且厨房窗户处于开启状态时,发送提醒通知", "关注入户门锁的远程操作失败记录,若后续频繁出现 LockOperationError,需排查是否有未授权的开锁尝试", "建议为厨房温度传感器的 None 值设置告警,避免在灶具使用期间丧失温度监控能力,影响火灾预警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.78238606452942, "api_error": null} {"episode_id": "SQ2_FP_C_0352", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0352.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20260981, "scenario_id": "INS-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "balcony", "injection_time": "2026-06-17T20:48:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"深夜时段客厅窗户被打开,且无人在家的情况下出现短暂运动检测后迅速消失,疑似入侵行为。\",\n \"reasoning\": [\n \"推理步骤1: 20:45 儿童房灯关闭、窗帘关闭(100%),表明孩子已准备睡觉。22:45 客厅灯和空调关闭,主卧有人进入并关闭窗帘和灯,入户门自动上锁——全家已进入就寝状态。\",\n \"推理步骤2: 在 20:48:10,客厅窗户传感器 living_room_window_1 报告 StateValue = False(窗户被打开)。此前 20:48:00 客厅运动传感器检测到有人(Occupancy=1),20:48:03 客厅主灯被打开,但仅 12 秒后(20:48:15)灯又被关闭,20:48:20 运动传感器显示无人(Occupancy=0)。整个过程仅持续 20 秒。\",\n \"推理步骤3: 这段事件序列高度可疑——有人进入客厅、开灯、打开窗户、随即关灯并离开,整个过程极短。正常住户打开窗户通风不会在 20 秒内完成开灯-开窗-关灯-离开的全部动作。\",\n \"推理步骤4: 更关键的是,客厅窗户在之后的日志中没有关闭记录(StateValue 始终未恢复为 True)。窗户在全家就寝后仍保持打开状态,直到日志结束(23:30)。\",\n \"推理步骤5: 入户门在 22:45:33 确认为关闭且自动上锁状态,说明没有人通过正门进出。如果是家庭成员开窗通风,通常不会在如此短的时间内完成且不关窗。这更像是有人从窗户进出或为后续进入做准备。\",\n \"推理步骤6: 20:48 的事件日志格式缺少了完整的 Cluster 前缀(如 OccupancySensing.、OnOff.、BooleanState.),与其他正常日志格式不一致,这可能暗示设备被非正常方式触发或日志记录出现异常。\"\n ],\n \"key_evidence\": [\n \"20:48:10 客厅窗户传感器报告窗户打开(StateValue=False),之后无关闭记录\",\n \"20:48:00-20:48:20 客厅出现仅持续 20 秒的运动检测-开灯-关灯-无人序列,行为模式异常\",\n \"全家已进入就寝模式(儿童房 20:45 关灯,主卧 22:45 就寝),客厅窗户却保持打开直至日志结束\",\n \"入户门在 22:45 确认关闭上锁,排除正门进出的可能\"\n ],\n \"recommended_actions\": [\n \"立即通过摄像头或亲自确认客厅窗户状态,检查是否有人从窗户进入\",\n \"关闭并锁好客厅窗户,检查窗户周围是否有撬动或破坏痕迹\",\n \"检查家中是否有财物丢失或异常\",\n \"考虑在窗户上加装窗磁报警联动规则:深夜窗户打开时自动触发警报\",\n \"如确认非家庭成员操作,立即报警并保留设备日志作为证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "深夜时段客厅窗户被打开,且无人在家的情况下出现短暂运动检测后迅速消失,疑似入侵行为。", "reasoning": ["推理步骤1: 20:45 儿童房灯关闭、窗帘关闭(100%),表明孩子已准备睡觉。22:45 客厅灯和空调关闭,主卧有人进入并关闭窗帘和灯,入户门自动上锁——全家已进入就寝状态。", "推理步骤2: 在 20:48:10,客厅窗户传感器 living_room_window_1 报告 StateValue = False(窗户被打开)。此前 20:48:00 客厅运动传感器检测到有人(Occupancy=1),20:48:03 客厅主灯被打开,但仅 12 秒后(20:48:15)灯又被关闭,20:48:20 运动传感器显示无人(Occupancy=0)。整个过程仅持续 20 秒。", "推理步骤3: 这段事件序列高度可疑——有人进入客厅、开灯、打开窗户、随即关灯并离开,整个过程极短。正常住户打开窗户通风不会在 20 秒内完成开灯-开窗-关灯-离开的全部动作。", "推理步骤4: 更关键的是,客厅窗户在之后的日志中没有关闭记录(StateValue 始终未恢复为 True)。窗户在全家就寝后仍保持打开状态,直到日志结束(23:30)。", "推理步骤5: 入户门在 22:45:33 确认为关闭且自动上锁状态,说明没有人通过正门进出。如果是家庭成员开窗通风,通常不会在如此短的时间内完成且不关窗。这更像是有人从窗户进出或为后续进入做准备。", "推理步骤6: 20:48 的事件日志格式缺少了完整的 Cluster 前缀(如 OccupancySensing.、OnOff.、BooleanState.),与其他正常日志格式不一致,这可能暗示设备被非正常方式触发或日志记录出现异常。"], "key_evidence": ["20:48:10 客厅窗户传感器报告窗户打开(StateValue=False),之后无关闭记录", "20:48:00-20:48:20 客厅出现仅持续 20 秒的运动检测-开灯-关灯-无人序列,行为模式异常", "全家已进入就寝模式(儿童房 20:45 关灯,主卧 22:45 就寝),客厅窗户却保持打开直至日志结束", "入户门在 22:45 确认关闭上锁,排除正门进出的可能"], "recommended_actions": ["立即通过摄像头或亲自确认客厅窗户状态,检查是否有人从窗户进入", "关闭并锁好客厅窗户,检查窗户周围是否有撬动或破坏痕迹", "检查家中是否有财物丢失或异常", "考虑在窗户上加装窗磁报警联动规则:深夜窗户打开时自动触发警报", "如确认非家庭成员操作,立即报警并保留设备日志作为证据"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.59040093421936, "api_error": null} {"episode_id": "SQ2_FP_C_0349", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0349.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20260978, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-04T09:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时 09:19 的开锁事件缺少关门/上锁记录,存在入户门未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57、07:30、18:18、19:25 四个时间点报告 MeasuredValue = None。其中 06:57 和 18:18 均紧跟灶具开启之后,07:30 和 19:25 紧跟灶具关闭/厨房窗户打开之后。虽然灶具工作可能导致传感器读数波动,但 None 值意味着传感器未能返回有效数据,这不是正常的温度升高,而是数据缺失,指向传感器故障或通信中断。\",\n \"推理步骤2: 07:30 出现了两条 kitchen_temp_sensor 记录——先是 None,随后是 2427。这种同一时刻先报 None 再报有效值的行为进一步说明传感器存在间歇性故障或数据上报时序异常。\",\n \"推理步骤3: 09:19 的入户门事件中,门锁通过 OperationSource=3(远程/密码方式)由 UserIndex=5 解锁,但日志中没有对应的 front_door_contact 关门(StateValue=True)和重新上锁记录。直到 22:43 才出现下一次关门和自动上锁。这意味着从 09:19 到 22:43 长达约 13.5 小时,入户门可能处于未关闭或未上锁状态。\",\n \"推理步骤4: 对比 07:17 和 17:42 两次正常的出入门事件,均在几秒内完成开门-关门-上锁的完整流程,而 09:19 的事件明显缺失了关门环节,属于异常模式。\",\n \"推理步骤5: 其余设备行为基本正常——早晨 06:09 起床、06:56 做早餐、07:17 出门上锁、16:13 孩子放学回家、17:42 大人回家做晚饭、21:04 孩子睡觉、22:43 全家就寝,符合典型三口之家的作息。温度整体呈现夜间低(约 22.9°C)、午间高(约 25.8°C)的自然变化曲线,无异常。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:57、07:30、18:18、19:25 四次报告 MeasuredValue = None,表明传感器间歇性数据缺失\",\n \"09:19 front_door_lock 被 UserIndex=5 远程解锁(OperationSource=3),但之后无 front_door_contact 关门记录和重新上锁记录,直到 22:43 才出现关门上锁\",\n \"07:30 同一时刻 kitchen_temp_sensor 先报 None 后报 2427,存在数据上报时序异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和网络连接,确认是否因灶具高温干扰或传感器本身老化导致间歇性失效,必要时更换传感器或调整安装位置\",\n \"核实 UserIndex=5 的身份和 09:19 远程开锁的意图,确认是否为授权操作\",\n \"检查入户门门磁传感器是否工作正常,确认 09:19 开锁后门是否确实长时间未关闭,排除传感器漏报的可能\",\n \"建议设置门锁安全规则:若开锁后超过一定时间(如 5 分钟)未检测到关门,自动发送告警通知\",\n \"考虑为厨房温度传感器设置 None 值告警,在传感器数据缺失时及时通知住户,避免在灶具使用期间丧失温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时 09:19 的开锁事件缺少关门/上锁记录,存在入户门未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:57、07:30、18:18、19:25 四个时间点报告 MeasuredValue = None。其中 06:57 和 18:18 均紧跟灶具开启之后,07:30 和 19:25 紧跟灶具关闭/厨房窗户打开之后。虽然灶具工作可能导致传感器读数波动,但 None 值意味着传感器未能返回有效数据,这不是正常的温度升高,而是数据缺失,指向传感器故障或通信中断。", "推理步骤2: 07:30 出现了两条 kitchen_temp_sensor 记录——先是 None,随后是 2427。这种同一时刻先报 None 再报有效值的行为进一步说明传感器存在间歇性故障或数据上报时序异常。", "推理步骤3: 09:19 的入户门事件中,门锁通过 OperationSource=3(远程/密码方式)由 UserIndex=5 解锁,但日志中没有对应的 front_door_contact 关门(StateValue=True)和重新上锁记录。直到 22:43 才出现下一次关门和自动上锁。这意味着从 09:19 到 22:43 长达约 13.5 小时,入户门可能处于未关闭或未上锁状态。", "推理步骤4: 对比 07:17 和 17:42 两次正常的出入门事件,均在几秒内完成开门-关门-上锁的完整流程,而 09:19 的事件明显缺失了关门环节,属于异常模式。", "推理步骤5: 其余设备行为基本正常——早晨 06:09 起床、06:56 做早餐、07:17 出门上锁、16:13 孩子放学回家、17:42 大人回家做晚饭、21:04 孩子睡觉、22:43 全家就寝,符合典型三口之家的作息。温度整体呈现夜间低(约 22.9°C)、午间高(约 25.8°C)的自然变化曲线,无异常。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:57、07:30、18:18、19:25 四次报告 MeasuredValue = None,表明传感器间歇性数据缺失", "09:19 front_door_lock 被 UserIndex=5 远程解锁(OperationSource=3),但之后无 front_door_contact 关门记录和重新上锁记录,直到 22:43 才出现关门上锁", "07:30 同一时刻 kitchen_temp_sensor 先报 None 后报 2427,存在数据上报时序异常"], "recommended_actions": ["检查厨房温度传感器的硬件状态和网络连接,确认是否因灶具高温干扰或传感器本身老化导致间歇性失效,必要时更换传感器或调整安装位置", "核实 UserIndex=5 的身份和 09:19 远程开锁的意图,确认是否为授权操作", "检查入户门门磁传感器是否工作正常,确认 09:19 开锁后门是否确实长时间未关闭,排除传感器漏报的可能", "建议设置门锁安全规则:若开锁后超过一定时间(如 5 分钟)未检测到关门,自动发送告警通知", "考虑为厨房温度传感器设置 None 值告警,在传感器数据缺失时及时通知住户,避免在灶具使用期间丧失温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.518556356430054, "api_error": null} {"episode_id": "SQ2_FP_C_0362", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_C_0362.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20260991, "scenario_id": "WD-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "second_bathroom", "injection_time": "2026-06-27T22:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"厨房漏水传感器短暂触发,已在2分钟内自行恢复,属于一次性轻微事件,无持续安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 22:18 厨房漏水传感器触发(StateValue=True),但仅2分钟后(22:20)即恢复(StateValue=False),说明并非持续性漏水,可能是少量溅水、冷凝水滴落或传感器瞬时误触\",\n \"推理步骤2: 同一时刻(22:18)客厅检测到有人活动(Occupancy=1)且客厅主灯打开,说明住户当时在家且处于活动状态,有能力及时发现和处理厨房的情况\",\n \"推理步骤3: 厨房温度传感器在事件前后保持正常下降趋势(22:00 为 23.60°C,22:30 为 23.57°C),没有异常温升,排除因管道破裂导致热水泄漏或火灾关联的可能\",\n \"推理步骤4: 全天温度数据呈现典型的夏季日变化曲线——凌晨约 22.9-23.1°C,午间峰值约 25.8°C,晚间回落至 23.3°C,各房间温度高度一致,无异常热源\",\n \"推理步骤5: 除漏水传感器和客厅活动外,没有其他异常设备事件(无门锁异常、无烟雾报警、无入侵迹象),整体家居状态平稳\"\n ],\n \"key_evidence\": [\n \"厨房漏水传感器 22:18 触发,22:20 恢复,持续仅2分钟\",\n \"事件发生时住户在家活动(客厅运动传感器和灯光同时触发)\",\n \"厨房温度在事件前后无异常波动,排除管道爆裂等严重漏水场景\",\n \"全天无烟雾报警、门锁异常或其他安全设备告警\"\n ],\n \"recommended_actions\": [\n \"建议住户检查厨房水槽、洗碗机接口及地面是否有残留水迹,确认漏水源头\",\n \"关注后续几天漏水传感器是否再次触发,若频繁短暂触发可能是传感器灵敏度过高或位置需要调整\",\n \"如近期未使用洗碗机,可检查厨房供水管路接头是否有轻微渗漏\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "厨房漏水传感器短暂触发,已在2分钟内自行恢复,属于一次性轻微事件,无持续安全威胁", "reasoning": ["推理步骤1: 22:18 厨房漏水传感器触发(StateValue=True),但仅2分钟后(22:20)即恢复(StateValue=False),说明并非持续性漏水,可能是少量溅水、冷凝水滴落或传感器瞬时误触", "推理步骤2: 同一时刻(22:18)客厅检测到有人活动(Occupancy=1)且客厅主灯打开,说明住户当时在家且处于活动状态,有能力及时发现和处理厨房的情况", "推理步骤3: 厨房温度传感器在事件前后保持正常下降趋势(22:00 为 23.60°C,22:30 为 23.57°C),没有异常温升,排除因管道破裂导致热水泄漏或火灾关联的可能", "推理步骤4: 全天温度数据呈现典型的夏季日变化曲线——凌晨约 22.9-23.1°C,午间峰值约 25.8°C,晚间回落至 23.3°C,各房间温度高度一致,无异常热源", "推理步骤5: 除漏水传感器和客厅活动外,没有其他异常设备事件(无门锁异常、无烟雾报警、无入侵迹象),整体家居状态平稳"], "key_evidence": ["厨房漏水传感器 22:18 触发,22:20 恢复,持续仅2分钟", "事件发生时住户在家活动(客厅运动传感器和灯光同时触发)", "厨房温度在事件前后无异常波动,排除管道爆裂等严重漏水场景", "全天无烟雾报警、门锁异常或其他安全设备告警"], "recommended_actions": ["建议住户检查厨房水槽、洗碗机接口及地面是否有残留水迹,确认漏水源头", "关注后续几天漏水传感器是否再次触发,若频繁短暂触发可能是传感器灵敏度过高或位置需要调整", "如近期未使用洗碗机,可检查厨房供水管路接头是否有轻微渗漏"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.924885511398315, "api_error": null} {"episode_id": "SQ2_FP_D_0299", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0299.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260928, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-06T07:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器故障或通信异常;同时入户门在 08:40 开门后整日未关闭,直到 20:53 才自动上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(06:02、10:57、16:58),灶具关闭后约1分钟再次报告 None(06:37、11:38、17:32),三次做饭均复现此问题。正常传感器在灶具使用时应报告升高的温度值而非 None,这说明传感器可能因高温或通信问题出现故障。\",\n \"推理步骤2: 厨房温度传感器故障意味着在灶具使用期间失去了厨房温度监控能力。对于独居老人,灶具使用是火灾风险最高的场景,此时恰恰缺失温度数据,削弱了安全防护。\",\n \"推理步骤3: 08:40 老人回家时,入户门解锁(LockState=2)并开门(StateValue=False),但之后没有关门和上锁的记录。直到 20:53 才出现门关闭(StateValue=True)和自动上锁(LockState=1)的事件。这意味着入户门可能敞开了约12小时,对独居老人构成入侵风险。\",\n \"推理步骤4: 07:04 老人出门时门锁流程正常(解锁→开门→关门→自动上锁,耗时约7秒),但 08:40 回家时只有开门记录没有关门记录,两次操作模式不一致,进一步佐证门未关闭的异常。\",\n \"推理步骤5: 07:13 老人出门后,卧室出现短暂活动(进入→开灯→窗户传感器打开→关灯→离开,仅7秒),且卧室窗户传感器报告 StateValue=False(窗户打开)后无关闭记录。老人已出门,卧室窗户全天保持打开状态,结合入户门长时间未关,增加了安全风险。\",\n \"推理步骤6: 其余行为模式基本正常:老人 05:33 起床如厕、做早餐、07:04 出门、08:40 回家、午休、三餐规律、20:36 洗漱后就寝,符合独居老人的日常作息。温度曲线也呈现正常的日间升高夜间降低趋势。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器三次在灶具使用期间报告 None 值:06:02、06:37、10:57、11:38、16:58、17:32\",\n \"08:40 入户门解锁开门后无关门记录,直到 20:53(约12小时后)才记录到门关闭和上锁\",\n \"07:13 卧室窗户传感器报告打开(StateValue=False),全天无关闭记录\",\n \"07:04 出门时门锁操作完整(7秒内完成开关门+自动上锁),与 08:40 回家时的不完整操作形成对比\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认是否因灶具高温干扰导致读数异常,必要时更换传感器或调整安装位置,确保灶具使用期间温度监控不中断\",\n \"检查入户门锁及门磁传感器,确认门是否确实长时间未关闭,还是传感器漏报了关门事件;如为传感器问题需及时维修\",\n \"为入户门设置开门超时告警(如超过5分钟未关门则推送提醒),帮助老人养成随手关门的习惯\",\n \"确认卧室窗户是否有意保持打开通风,若非有意则提醒关闭;建议设置出门自动检查门窗状态的联动规则\",\n \"考虑为厨房灶具增加使用时长限制或无人看管自动关闭功能,弥补温度传感器失效期间的安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器故障或通信异常;同时入户门在 08:40 开门后整日未关闭,直到 20:53 才自动上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(06:02、10:57、16:58),灶具关闭后约1分钟再次报告 None(06:37、11:38、17:32),三次做饭均复现此问题。正常传感器在灶具使用时应报告升高的温度值而非 None,这说明传感器可能因高温或通信问题出现故障。", "推理步骤2: 厨房温度传感器故障意味着在灶具使用期间失去了厨房温度监控能力。对于独居老人,灶具使用是火灾风险最高的场景,此时恰恰缺失温度数据,削弱了安全防护。", "推理步骤3: 08:40 老人回家时,入户门解锁(LockState=2)并开门(StateValue=False),但之后没有关门和上锁的记录。直到 20:53 才出现门关闭(StateValue=True)和自动上锁(LockState=1)的事件。这意味着入户门可能敞开了约12小时,对独居老人构成入侵风险。", "推理步骤4: 07:04 老人出门时门锁流程正常(解锁→开门→关门→自动上锁,耗时约7秒),但 08:40 回家时只有开门记录没有关门记录,两次操作模式不一致,进一步佐证门未关闭的异常。", "推理步骤5: 07:13 老人出门后,卧室出现短暂活动(进入→开灯→窗户传感器打开→关灯→离开,仅7秒),且卧室窗户传感器报告 StateValue=False(窗户打开)后无关闭记录。老人已出门,卧室窗户全天保持打开状态,结合入户门长时间未关,增加了安全风险。", "推理步骤6: 其余行为模式基本正常:老人 05:33 起床如厕、做早餐、07:04 出门、08:40 回家、午休、三餐规律、20:36 洗漱后就寝,符合独居老人的日常作息。温度曲线也呈现正常的日间升高夜间降低趋势。"], "key_evidence": ["厨房温度传感器三次在灶具使用期间报告 None 值:06:02、06:37、10:57、11:38、16:58、17:32", "08:40 入户门解锁开门后无关门记录,直到 20:53(约12小时后)才记录到门关闭和上锁", "07:13 卧室窗户传感器报告打开(StateValue=False),全天无关闭记录", "07:04 出门时门锁操作完整(7秒内完成开关门+自动上锁),与 08:40 回家时的不完整操作形成对比"], "recommended_actions": ["检查厨房温度传感器,确认是否因灶具高温干扰导致读数异常,必要时更换传感器或调整安装位置,确保灶具使用期间温度监控不中断", "检查入户门锁及门磁传感器,确认门是否确实长时间未关闭,还是传感器漏报了关门事件;如为传感器问题需及时维修", "为入户门设置开门超时告警(如超过5分钟未关门则推送提醒),帮助老人养成随手关门的习惯", "确认卧室窗户是否有意保持打开通风,若非有意则提醒关闭;建议设置出门自动检查门窗状态的联动规则", "考虑为厨房灶具增加使用时长限制或无人看管自动关闭功能,弥补温度传感器失效期间的安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.093644618988037, "api_error": null} {"episode_id": "SQ2_FP_D_0300", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0300.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-17T00:00:00", "seed": 20260929, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-17T22:47:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 最近发生的事件是 22:47 卫生间漏水传感器短暂触发(2分钟内恢复),老人在场且灯已亮起,22:49 漏水状态恢复正常。这属于正常用水场景(如洗漱溅水),不构成漏水威胁。\",\n \"推理步骤2: 纵观全天日志,厨房温度传感器在灶具每次开启后约30秒都会报告 MeasuredValue = None(05:58、10:55、16:55),且在灶具关闭后约1分钟再次报告 None(06:23、11:26、17:38)。一天内出现6次 None 读数,这不是正常的传感器行为——正常传感器即使在高温环境下也应报告数值而非空值。\",\n \"推理步骤3: 该传感器在非烹饪时段工作正常,说明故障与灶具运行产生的热量或电磁干扰相关。虽然灶具本身使用模式正常(早中晚三餐,每次20-40分钟),但传感器在烹饪期间失效意味着在最需要温度监控的时刻恰恰失去了监测能力,这对独居老人的厨房安全构成隐患。\",\n \"推理步骤4: 老人全天的活动模式正常:05:32起床、06:50出门晨练、08:34回家、12:33午休、14:10起床、20:36就寝,门锁操作均为手动开锁+自动上锁,无入侵迹象。入户门在08:34开锁后直到20:36才确认关闭上锁,存在一定的门禁管理疏忽但属于老人在家的正常状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间共报告6次 None 值(05:58、06:23、10:55、11:26、16:55、17:38),均与灶具开关操作高度关联\",\n \"22:47 卫生间漏水传感器触发,但22:49即恢复,同时老人在场(occupancy=1),属于短暂溅水\",\n \"传感器在非烹饪时段读数正常(2295-2584范围),说明故障仅在灶具运行相关时段出现\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰,必要时重新定位传感器\",\n \"检测传感器硬件是否存在老化或故障,考虑更换为耐高温型号,确保烹饪期间温度监控不中断\",\n \"在传感器修复前,建议为灶具设置自动关闭定时器(如超过45分钟未手动操作则自动断气/断电),作为补偿性安全措施\",\n \"卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发则检查水管接头或地漏密封情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 最近发生的事件是 22:47 卫生间漏水传感器短暂触发(2分钟内恢复),老人在场且灯已亮起,22:49 漏水状态恢复正常。这属于正常用水场景(如洗漱溅水),不构成漏水威胁。", "推理步骤2: 纵观全天日志,厨房温度传感器在灶具每次开启后约30秒都会报告 MeasuredValue = None(05:58、10:55、16:55),且在灶具关闭后约1分钟再次报告 None(06:23、11:26、17:38)。一天内出现6次 None 读数,这不是正常的传感器行为——正常传感器即使在高温环境下也应报告数值而非空值。", "推理步骤3: 该传感器在非烹饪时段工作正常,说明故障与灶具运行产生的热量或电磁干扰相关。虽然灶具本身使用模式正常(早中晚三餐,每次20-40分钟),但传感器在烹饪期间失效意味着在最需要温度监控的时刻恰恰失去了监测能力,这对独居老人的厨房安全构成隐患。", "推理步骤4: 老人全天的活动模式正常:05:32起床、06:50出门晨练、08:34回家、12:33午休、14:10起床、20:36就寝,门锁操作均为手动开锁+自动上锁,无入侵迹象。入户门在08:34开锁后直到20:36才确认关闭上锁,存在一定的门禁管理疏忽但属于老人在家的正常状态。"], "key_evidence": ["厨房温度传感器在三次烹饪期间共报告6次 None 值(05:58、06:23、10:55、11:26、16:55、17:38),均与灶具开关操作高度关联", "22:47 卫生间漏水传感器触发,但22:49即恢复,同时老人在场(occupancy=1),属于短暂溅水", "传感器在非烹饪时段读数正常(2295-2584范围),说明故障仅在灶具运行相关时段出现"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰,必要时重新定位传感器", "检测传感器硬件是否存在老化或故障,考虑更换为耐高温型号,确保烹饪期间温度监控不中断", "在传感器修复前,建议为灶具设置自动关闭定时器(如超过45分钟未手动操作则自动断气/断电),作为补偿性安全措施", "卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发则检查水管接头或地漏密封情况"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.58034586906433, "api_error": null} {"episode_id": "SQ2_FP_D_0306", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0306.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260935, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-21T07:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在一天中出现了3次(06:04、10:52、16:59),且灶具关闭后也出现 None(06:33、11:25、17:35)。\",\n \"推理步骤2: 温度传感器报告 None 意味着测量失败。对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,则无法检测到异常高温或火灾风险。\",\n \"推理步骤3: 其余设备行为和住户活动模式正常——老人约05:34起床、06:58出门晨练、08:21回家、12:37午休、20:55就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤4: 卧室窗户传感器在07:10显示窗户打开(StateValue=False),之后未见关闭事件,但结合老人出门前开窗通风属正常行为,且无其他入侵证据。\",\n \"推理步骤5: 整体温度曲线符合夏季日间升温、夜间降温的自然规律,无异常温升提示火灾。但厨房传感器的间歇性失效削弱了安全监控能力。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内6次报告 MeasuredValue = None(06:04、06:33、10:52、11:25、16:59、17:35),均与灶具使用时段高度相关\",\n \"传感器在灶具关闭后仍报告 None,说明并非简单的量程溢出,可能是热损伤或通信故障\",\n \"下一个半小时整点读数恢复正常,表明故障为间歇性\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或热损伤\",\n \"考虑将温度传感器迁移到远离灶具但仍能监测厨房整体温度的位置\",\n \"在传感器报告 None 期间,系统应自动提升对烟雾报警器状态的关注度,作为备用火灾检测手段\",\n \"建议为独居老人设置灶具使用超时提醒(当前最长使用约36分钟,属正常范围,但应设置安全上限如60分钟)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在一天中出现了3次(06:04、10:52、16:59),且灶具关闭后也出现 None(06:33、11:25、17:35)。", "推理步骤2: 温度传感器报告 None 意味着测量失败。对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,则无法检测到异常高温或火灾风险。", "推理步骤3: 其余设备行为和住户活动模式正常——老人约05:34起床、06:58出门晨练、08:21回家、12:37午休、20:55就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤4: 卧室窗户传感器在07:10显示窗户打开(StateValue=False),之后未见关闭事件,但结合老人出门前开窗通风属正常行为,且无其他入侵证据。", "推理步骤5: 整体温度曲线符合夏季日间升温、夜间降温的自然规律,无异常温升提示火灾。但厨房传感器的间歇性失效削弱了安全监控能力。"], "key_evidence": ["厨房温度传感器在一天内6次报告 MeasuredValue = None(06:04、06:33、10:52、11:25、16:59、17:35),均与灶具使用时段高度相关", "传感器在灶具关闭后仍报告 None,说明并非简单的量程溢出,可能是热损伤或通信故障", "下一个半小时整点读数恢复正常,表明故障为间歇性"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或热损伤", "考虑将温度传感器迁移到远离灶具但仍能监测厨房整体温度的位置", "在传感器报告 None 期间,系统应自动提升对烟雾报警器状态的关注度,作为备用火灾检测手段", "建议为独居老人设置灶具使用超时提醒(当前最长使用约36分钟,属正常范围,但应设置安全上限如60分钟)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.932382106781006, "api_error": null} {"episode_id": "SQ2_FP_D_0309", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0309.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20260938, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bathroom", "injection_time": "2026-06-12T08:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且灶具在无人时开启并导致厨房温度异常飙升,对独居老人存在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:09、06:31、10:56、11:37、16:57、17:34),一天内出现 6 次空值,说明该传感器存在间歇性故障,无法在关键时刻提供可靠的温度监测。\",\n \"推理步骤2: 08:35 灶具开启时,厨房运动传感器显示 Occupancy = 0(无人),这意味着灶具在厨房无人的情况下被点燃或保持运行。直到 08:55 才重新检测到有人进入厨房,中间有 20 分钟的无人看管窗口。\",\n \"推理步骤3: 在灶具无人看管期间,厨房温度从正常的约 24.58°C(2458)急剧飙升至 27.00°C(2700,08:40)和 27.50°C(2750,09:05),升幅超过 2.5°C,远超正常烹饪引起的环境温度波动,暗示灶具可能处于高火力无人监控状态。\",\n \"推理步骤4: 温度传感器故障与灶具无人运行叠加,构成严重的安全盲区——如果灶具引发危险高温或干烧,传感器恰好处于 None 状态则无法触发任何温度报警联动。\",\n \"推理步骤5: 08:28 入户门开锁有人进入后直接去了客厅,08:35 灶具开启但厨房无人,结合独居老人场景,可能是老人远程/误操作开启了灶具,或存在灶具控制逻辑异常。\",\n \"推理步骤6: 其余生活轨迹基本正常——早晨 05:34 起床、06:50 出门、08:28 回家、12:27 午休、13:56 起床、20:36 就寝准备,符合独居老人的日常作息,入户门锁操作均为正常手动开锁/自动上锁,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(06:09、06:31、10:56、11:37、16:57、17:34),存在间歇性传感器故障\",\n \"08:35 灶具开启时 kitchen_occupancy = 0(无人),灶具无人看管运行约 20 分钟\",\n \"无人看管期间厨房温度异常飙升:08:40 达到 2700(27.0°C)、09:05 达到 2750(27.5°C),比同时段其他房间高出约 2.5°C 以上\",\n \"温度传感器故障时段与灶具运行时段存在重叠,安全监测存在盲区\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器,排除硬件故障或线路接触不良问题\",\n \"为灶具增加安全联动规则:当厨房运动传感器检测到无人超过 5 分钟时,自动关闭灶具并发送告警通知\",\n \"设置厨房温度异常阈值报警(如超过 26°C),在温度传感器正常工作时及时发现过热情况\",\n \"增加温度传感器 None 值监控规则:连续或频繁出现空值时立即通知家属或护理人员\",\n \"考虑为独居老人配置灶具最长运行时间限制(如 45 分钟自动断火),防止忘记关火\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且灶具在无人时开启并导致厨房温度异常飙升,对独居老人存在火灾隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:09、06:31、10:56、11:37、16:57、17:34),一天内出现 6 次空值,说明该传感器存在间歇性故障,无法在关键时刻提供可靠的温度监测。", "推理步骤2: 08:35 灶具开启时,厨房运动传感器显示 Occupancy = 0(无人),这意味着灶具在厨房无人的情况下被点燃或保持运行。直到 08:55 才重新检测到有人进入厨房,中间有 20 分钟的无人看管窗口。", "推理步骤3: 在灶具无人看管期间,厨房温度从正常的约 24.58°C(2458)急剧飙升至 27.00°C(2700,08:40)和 27.50°C(2750,09:05),升幅超过 2.5°C,远超正常烹饪引起的环境温度波动,暗示灶具可能处于高火力无人监控状态。", "推理步骤4: 温度传感器故障与灶具无人运行叠加,构成严重的安全盲区——如果灶具引发危险高温或干烧,传感器恰好处于 None 状态则无法触发任何温度报警联动。", "推理步骤5: 08:28 入户门开锁有人进入后直接去了客厅,08:35 灶具开启但厨房无人,结合独居老人场景,可能是老人远程/误操作开启了灶具,或存在灶具控制逻辑异常。", "推理步骤6: 其余生活轨迹基本正常——早晨 05:34 起床、06:50 出门、08:28 回家、12:27 午休、13:56 起床、20:36 就寝准备,符合独居老人的日常作息,入户门锁操作均为正常手动开锁/自动上锁,无入侵迹象。"], "key_evidence": ["厨房温度传感器一天内 6 次报告 MeasuredValue = None(06:09、06:31、10:56、11:37、16:57、17:34),存在间歇性传感器故障", "08:35 灶具开启时 kitchen_occupancy = 0(无人),灶具无人看管运行约 20 分钟", "无人看管期间厨房温度异常飙升:08:40 达到 2700(27.0°C)、09:05 达到 2750(27.5°C),比同时段其他房间高出约 2.5°C 以上", "温度传感器故障时段与灶具运行时段存在重叠,安全监测存在盲区"], "recommended_actions": ["立即检修或更换厨房温度传感器,排除硬件故障或线路接触不良问题", "为灶具增加安全联动规则:当厨房运动传感器检测到无人超过 5 分钟时,自动关闭灶具并发送告警通知", "设置厨房温度异常阈值报警(如超过 26°C),在温度传感器正常工作时及时发现过热情况", "增加温度传感器 None 值监控规则:连续或频繁出现空值时立即通知家属或护理人员", "考虑为独居老人配置灶具最长运行时间限制(如 45 分钟自动断火),防止忘记关火"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.1077561378479, "api_error": null} {"episode_id": "SQ2_FP_D_0310", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0310.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260939, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-21T07:45:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开启/关闭时反复报告 None 值,疑似传感器故障或受灶具热源干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的记录(05:52、06:41、11:07、11:31、16:55、17:36),每次都精确对应灶具开启后约30秒或关闭后约1分钟的时间点。\",\n \"推理步骤2: 正常的温度传感器不应因附近灶具工作而返回 None(空值)。None 表示传感器无法完成测量,可能是高温超出量程、传感器通信中断或硬件故障。这种与灶具操作高度关联的规律性故障模式,说明传感器受灶具热源影响严重。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间恰好失效,就无法监测到异常高温,存在安全盲区。\",\n \"推理步骤4: 除此异常外,其余日志整体正常——老人作息规律(约05:37起床、20:53就寝),三餐时间合理,门锁进出正常(06:56出门上锁、08:30回家),卫生间漏水传感器短暂触发后2分钟恢复且有人在场(可能是正常用水溅水),入户门在夜间保持锁定状态,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启后约30秒报告 MeasuredValue = None(05:51:38开灶→05:52:08报None;11:06:30开灶→11:07:00报None;16:54:30开灶→16:55:00报None)\",\n \"kitchen_temp_sensor 在灶具关闭后约1分钟同样报告 MeasuredValue = None(06:40关灶→06:41报None;11:30关灶→11:31报None;17:35关灶→17:36报None)\",\n \"一天内共出现6次None值,100%与灶具开关操作关联,非随机故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温超出传感器量程,必要时将传感器迁移到远离灶具但仍能监测厨房整体温度的位置\",\n \"检查传感器固件版本并尝试更新,排除软件层面的异常值处理问题\",\n \"如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间厨房温度监测不中断\",\n \"在传感器修复前,提醒老人注意灶具使用安全,可考虑增加灶具自动关火定时功能作为补充保护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开启/关闭时反复报告 None 值,疑似传感器故障或受灶具热源干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的记录(05:52、06:41、11:07、11:31、16:55、17:36),每次都精确对应灶具开启后约30秒或关闭后约1分钟的时间点。", "推理步骤2: 正常的温度传感器不应因附近灶具工作而返回 None(空值)。None 表示传感器无法完成测量,可能是高温超出量程、传感器通信中断或硬件故障。这种与灶具操作高度关联的规律性故障模式,说明传感器受灶具热源影响严重。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间恰好失效,就无法监测到异常高温,存在安全盲区。", "推理步骤4: 除此异常外,其余日志整体正常——老人作息规律(约05:37起床、20:53就寝),三餐时间合理,门锁进出正常(06:56出门上锁、08:30回家),卫生间漏水传感器短暂触发后2分钟恢复且有人在场(可能是正常用水溅水),入户门在夜间保持锁定状态,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启后约30秒报告 MeasuredValue = None(05:51:38开灶→05:52:08报None;11:06:30开灶→11:07:00报None;16:54:30开灶→16:55:00报None)", "kitchen_temp_sensor 在灶具关闭后约1分钟同样报告 MeasuredValue = None(06:40关灶→06:41报None;11:30关灶→11:31报None;17:35关灶→17:36报None)", "一天内共出现6次None值,100%与灶具开关操作关联,非随机故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温超出传感器量程,必要时将传感器迁移到远离灶具但仍能监测厨房整体温度的位置", "检查传感器固件版本并尝试更新,排除软件层面的异常值处理问题", "如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间厨房温度监测不中断", "在传感器修复前,提醒老人注意灶具使用安全,可考虑增加灶具自动关火定时功能作为补充保护"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.497437953948975, "api_error": null} {"episode_id": "SQ2_FP_D_0312", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0312.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260941, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-06T11:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温/火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:35起床,06:04做早餐,06:57出门晨练/买菜,08:31回家,12:38午休,14:06起床,17:06做晚餐,20:50就寝,作息规律且所有运动传感器与灯光切换逻辑自洽。\",\n \"推理步骤2: 入户门的开锁/关锁均为 Manual 或 Auto 操作,且每次开门后都有正常的关门和自动上锁记录,无异常入侵迹象。08:31回家时门未上锁(06:57出门后 front_door_contact 在08:31前一直为 True、LockState=1),回家开锁进入属正常行为。\",\n \"推理步骤3: 卫生间漏水传感器在11:33触发(StateValue=True),但11:35即恢复(StateValue=False),且当时卫生间有人(Occupancy=1、灯亮),说明是老人正常用水导致的短暂溅水,非管道泄漏。\",\n \"推理步骤4: 关键异常——厨房温度传感器在三次灶具使用期间(06:05、10:55、17:07)均报告 MeasuredValue=None,且灶具关闭后的下一次读数(如06:30的None、11:36的None、17:41的None)仍为None,直到下一个整点周期才恢复正常数值。这表明传感器在高温环境下出现读数丢失。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是防范忘关灶具、油烟起火等场景的关键安全设备。传感器在灶具工作时恰好失效,意味着如果发生灶具异常高温,系统将无法及时检测和报警,构成安全盲区。\",\n \"推理步骤6: 其余设备状态均正常——烟雾报警器未触发、各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.7°C)、窗帘/窗户状态合理、门锁状态完整。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:05、10:55、17:07三次灶具开启后均报告 MeasuredValue=None,灶具关闭后仍持续 None 直到下一周期恢复\",\n \"卫生间漏水仅持续2分钟(11:33-11:35)且当时有人在场,属正常用水\",\n \"全天三次灶具使用时长分别约25分钟、41分钟、34分钟,均在合理范围内\",\n \"所有门锁操作均有完整的开/关/上锁记录链,无异常入侵特征\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,高温导致传感器超量程或暂时失效\",\n \"对该传感器进行固件检查或更换,确保其在灶具工作温度范围内能正常报告数值\",\n \"在传感器修复前,建议为灶具使用设置定时自动关闭规则(如超过45分钟未手动关闭则自动断气/断电),作为补偿性安全措施\",\n \"考虑增加厨房烟雾报警器(kitchen_smoke_alarm)的灵敏度或增设独立的高温报警装置,弥补温度传感器失效期间的监测空白\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温/火灾隐患。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:35起床,06:04做早餐,06:57出门晨练/买菜,08:31回家,12:38午休,14:06起床,17:06做晚餐,20:50就寝,作息规律且所有运动传感器与灯光切换逻辑自洽。", "推理步骤2: 入户门的开锁/关锁均为 Manual 或 Auto 操作,且每次开门后都有正常的关门和自动上锁记录,无异常入侵迹象。08:31回家时门未上锁(06:57出门后 front_door_contact 在08:31前一直为 True、LockState=1),回家开锁进入属正常行为。", "推理步骤3: 卫生间漏水传感器在11:33触发(StateValue=True),但11:35即恢复(StateValue=False),且当时卫生间有人(Occupancy=1、灯亮),说明是老人正常用水导致的短暂溅水,非管道泄漏。", "推理步骤4: 关键异常——厨房温度传感器在三次灶具使用期间(06:05、10:55、17:07)均报告 MeasuredValue=None,且灶具关闭后的下一次读数(如06:30的None、11:36的None、17:41的None)仍为None,直到下一个整点周期才恢复正常数值。这表明传感器在高温环境下出现读数丢失。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是防范忘关灶具、油烟起火等场景的关键安全设备。传感器在灶具工作时恰好失效,意味着如果发生灶具异常高温,系统将无法及时检测和报警,构成安全盲区。", "推理步骤6: 其余设备状态均正常——烟雾报警器未触发、各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.7°C)、窗帘/窗户状态合理、门锁状态完整。"], "key_evidence": ["厨房温度传感器在06:05、10:55、17:07三次灶具开启后均报告 MeasuredValue=None,灶具关闭后仍持续 None 直到下一周期恢复", "卫生间漏水仅持续2分钟(11:33-11:35)且当时有人在场,属正常用水", "全天三次灶具使用时长分别约25分钟、41分钟、34分钟,均在合理范围内", "所有门锁操作均有完整的开/关/上锁记录链,无异常入侵特征"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,高温导致传感器超量程或暂时失效", "对该传感器进行固件检查或更换,确保其在灶具工作温度范围内能正常报告数值", "在传感器修复前,建议为灶具使用设置定时自动关闭规则(如超过45分钟未手动关闭则自动断气/断电),作为补偿性安全措施", "考虑增加厨房烟雾报警器(kitchen_smoke_alarm)的灵敏度或增设独立的高温报警装置,弥补温度传感器失效期间的监测空白"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.479492902755737, "api_error": null} {"episode_id": "SQ2_FP_D_0313", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0313.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20260942, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-23T11:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(06:05:35 开灶 → 06:06:05 报 None;11:09:30 开灶 → 11:10:00 报 None;17:10:30 开灶 → 17:11:00 报 None)均报告 MeasuredValue = None,且灶具关闭后同样报 None(06:34 关灶 → 06:35 None;11:40 关灶 → 11:41 None;17:20 关灶 → 17:21 None),一天内共出现 6 次 None 读数。\",\n \"推理步骤2: 正常温度传感器在灶具使用时应报告升高的温度值而非 None。None 值意味着传感器无法完成测量,可能是高温超出量程、传感器通信中断或硬件故障。该现象在三次烹饪中 100% 复现,具有明确的规律性。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时持续失效,一旦发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全盲区。\",\n \"推理步骤4: 其余设备行为均属正常——老人 05:38 起床、06:55 出门、08:23 回家、12:38 午休、20:50 就寝的作息规律合理;入户门锁开关和自动上锁正常;三次烹饪时长分别约 29 分钟、31 分钟、10 分钟,均在合理范围内且均正常关闭;烟雾报警器未触发;各房间温度随昼夜自然波动(夜间约 22°C,午间峰值约 25.8°C),无异常升温。\",\n \"推理步骤5: 11:11 卧室出现一次短暂活动(进入→开灯→窗户传感器打开→关灯→离开,持续约 9 秒),推测老人开窗通风,属正常行为。但该时段日志使用了简写格式(缺少 Cluster 前缀),可能是日志系统的小问题,不影响安全判断。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 MeasuredValue = None,均与灶具开关操作高度关联(开灶后约 30 秒至 1 分钟即失效)\",\n \"客厅和卧室温度传感器全天正常工作,排除系统性通信故障,问题定位于厨房温度传感器本身\",\n \"厨房温度传感器在灶具未使用的时段(如 00:00-06:05、06:30、07:00-11:09 等)能正常报告数值,说明故障仅在灶具工作环境下触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超出传感器量程,必要时重新选址安装\",\n \"检查传感器固件版本并尝试更新,确认是否存在已知的高温环境下测量失败的 bug\",\n \"如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间温度监测不中断\",\n \"在传感器修复前,建议加强厨房烟雾报警器的定期测试,确保至少有一道火灾预警防线可靠运行\",\n \"考虑为灶具增加自动关闭规则(如超过 30 分钟无人活动则关闭),弥补温度传感器失效期间的安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(06:05:35 开灶 → 06:06:05 报 None;11:09:30 开灶 → 11:10:00 报 None;17:10:30 开灶 → 17:11:00 报 None)均报告 MeasuredValue = None,且灶具关闭后同样报 None(06:34 关灶 → 06:35 None;11:40 关灶 → 11:41 None;17:20 关灶 → 17:21 None),一天内共出现 6 次 None 读数。", "推理步骤2: 正常温度传感器在灶具使用时应报告升高的温度值而非 None。None 值意味着传感器无法完成测量,可能是高温超出量程、传感器通信中断或硬件故障。该现象在三次烹饪中 100% 复现,具有明确的规律性。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时持续失效,一旦发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全盲区。", "推理步骤4: 其余设备行为均属正常——老人 05:38 起床、06:55 出门、08:23 回家、12:38 午休、20:50 就寝的作息规律合理;入户门锁开关和自动上锁正常;三次烹饪时长分别约 29 分钟、31 分钟、10 分钟,均在合理范围内且均正常关闭;烟雾报警器未触发;各房间温度随昼夜自然波动(夜间约 22°C,午间峰值约 25.8°C),无异常升温。", "推理步骤5: 11:11 卧室出现一次短暂活动(进入→开灯→窗户传感器打开→关灯→离开,持续约 9 秒),推测老人开窗通风,属正常行为。但该时段日志使用了简写格式(缺少 Cluster 前缀),可能是日志系统的小问题,不影响安全判断。"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 MeasuredValue = None,均与灶具开关操作高度关联(开灶后约 30 秒至 1 分钟即失效)", "客厅和卧室温度传感器全天正常工作,排除系统性通信故障,问题定位于厨房温度传感器本身", "厨房温度传感器在灶具未使用的时段(如 00:00-06:05、06:30、07:00-11:09 等)能正常报告数值,说明故障仅在灶具工作环境下触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超出传感器量程,必要时重新选址安装", "检查传感器固件版本并尝试更新,确认是否存在已知的高温环境下测量失败的 bug", "如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间温度监测不中断", "在传感器修复前,建议加强厨房烟雾报警器的定期测试,确保至少有一道火灾预警防线可靠运行", "考虑为灶具增加自动关闭规则(如超过 30 分钟无人活动则关闭),弥补温度传感器失效期间的安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.233067750930786, "api_error": null} {"episode_id": "SQ2_FP_D_0316", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0316.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20260945, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-15T11:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在老人外出期间(08:28回家后)长时间未关闭/未上锁,直到 20:44 才重新锁定。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次上报 MeasuredValue = None(05:53、06:31、11:06、11:33、17:03、17:29),共出现6次。虽然灶具使用时高温可能导致传感器读数异常,但 None 值意味着传感器完全无法返回有效数据,这不是正常的高温读数,而是设备故障或通信中断的表现。\",\n \"推理步骤2: 老人 07:03 手动开锁出门,门在5秒内关闭并自动上锁,这是正常的。08:28 老人回家手动开锁进门,但日志中没有记录门关闭(StateValue = True)和重新上锁的事件。直到 20:44 才出现 front_door_contact StateValue = True 和自动上锁记录,意味着入户门可能从 08:28 到 20:44 长达约12小时处于未关闭或未上锁状态。对于独居老人,这是一个安全隐患。\",\n \"推理步骤3: 11:41 出现一次门锁操作错误事件(LockOperationError, OperationError=1, OperationSource=3),随后20秒内通过 Keypad(OperationSource=3)成功解锁。单次错误可能是输入密码错误,本身不构成严重威胁,但结合门锁长时间未锁定的情况,需要关注门锁是否存在机械或电子故障。\",\n \"推理步骤4: 其余行为模式符合独居老人的正常作息——凌晨睡眠、05:31起床、三餐规律做饭、12:25午休拉窗帘、13:51起床、19:35调暗客厅灯看电视、20:30洗漱后20:44就寝。温度曲线也符合夏季昼夜变化规律(夜间22°C左右,午间25-26°C)。\",\n \"推理步骤5: 综合来看,没有入侵、火灾或漏水的迹象,但厨房温度传感器的反复 None 值故障和入户门长时间未锁定是需要关注的问题,尤其对独居老人而言。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:53、06:31、11:06、11:33、17:03、17:29 共6次上报 MeasuredValue = None\",\n \"08:28 入户门开锁开门后,直到 20:44(约12小时后)才记录到门关闭和自动上锁\",\n \"11:41 出现一次门锁操作错误事件 LockOperationError(OperationError=1, OperationSource=3)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认传感器安装位置是否离灶具过近导致高温失灵,或传感器本身存在硬件故障,必要时更换或重新定位\",\n \"检查入户门锁状态:确认门锁自动上锁功能是否正常工作,排查08:28至20:44期间门锁未上锁的原因,可能需要维修或调整自动锁定策略\",\n \"为独居老人启用门锁未关闭超时提醒:设置规则,当入户门超过一定时间(如5分钟)未关闭或未上锁时,自动发送通知给老人及其家属\",\n \"建议为门锁操作错误设置告警阈值:如短时间内多次错误尝试应立即通知家属,防范潜在入侵风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在老人外出期间(08:28回家后)长时间未关闭/未上锁,直到 20:44 才重新锁定。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次上报 MeasuredValue = None(05:53、06:31、11:06、11:33、17:03、17:29),共出现6次。虽然灶具使用时高温可能导致传感器读数异常,但 None 值意味着传感器完全无法返回有效数据,这不是正常的高温读数,而是设备故障或通信中断的表现。", "推理步骤2: 老人 07:03 手动开锁出门,门在5秒内关闭并自动上锁,这是正常的。08:28 老人回家手动开锁进门,但日志中没有记录门关闭(StateValue = True)和重新上锁的事件。直到 20:44 才出现 front_door_contact StateValue = True 和自动上锁记录,意味着入户门可能从 08:28 到 20:44 长达约12小时处于未关闭或未上锁状态。对于独居老人,这是一个安全隐患。", "推理步骤3: 11:41 出现一次门锁操作错误事件(LockOperationError, OperationError=1, OperationSource=3),随后20秒内通过 Keypad(OperationSource=3)成功解锁。单次错误可能是输入密码错误,本身不构成严重威胁,但结合门锁长时间未锁定的情况,需要关注门锁是否存在机械或电子故障。", "推理步骤4: 其余行为模式符合独居老人的正常作息——凌晨睡眠、05:31起床、三餐规律做饭、12:25午休拉窗帘、13:51起床、19:35调暗客厅灯看电视、20:30洗漱后20:44就寝。温度曲线也符合夏季昼夜变化规律(夜间22°C左右,午间25-26°C)。", "推理步骤5: 综合来看,没有入侵、火灾或漏水的迹象,但厨房温度传感器的反复 None 值故障和入户门长时间未锁定是需要关注的问题,尤其对独居老人而言。"], "key_evidence": ["厨房温度传感器在 05:53、06:31、11:06、11:33、17:03、17:29 共6次上报 MeasuredValue = None", "08:28 入户门开锁开门后,直到 20:44(约12小时后)才记录到门关闭和自动上锁", "11:41 出现一次门锁操作错误事件 LockOperationError(OperationError=1, OperationSource=3)"], "recommended_actions": ["检查厨房温度传感器:确认传感器安装位置是否离灶具过近导致高温失灵,或传感器本身存在硬件故障,必要时更换或重新定位", "检查入户门锁状态:确认门锁自动上锁功能是否正常工作,排查08:28至20:44期间门锁未上锁的原因,可能需要维修或调整自动锁定策略", "为独居老人启用门锁未关闭超时提醒:设置规则,当入户门超过一定时间(如5分钟)未关闭或未上锁时,自动发送通知给老人及其家属", "建议为门锁操作错误设置告警阈值:如短时间内多次错误尝试应立即通知家属,防范潜在入侵风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.281331300735474, "api_error": null} {"episode_id": "SQ2_FP_D_0317", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0317.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20260946, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-04T09:14:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰,影响厨房安全监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的读数(06:06、06:38、11:08、11:33、16:58、17:22),每次都精确对应灶具开启或关闭后约30秒到1分钟内。\",\n \"推理步骤2: 正常的温度传感器即使在高温环境下也应返回数值(哪怕是超量程值),而非 None。None 通常表示传感器通信失败、读数超出可测范围或硬件异常。这种与灶具操作高度关联的规律性故障,说明传感器可能受灶具热辐射或电磁干扰影响。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪(最高风险时段)期间恰好失效,将无法及时检测到异常高温,形成安全监测盲区。\",\n \"推理步骤4: 除传感器问题外,其余家居活动均属正常模式——老人 05:40 起床、06:05 做早餐、06:50 出门晨练、08:32 回家、12:22 午休、16:57 做晚餐、20:34 洗漱、20:50 就寝,作息规律且门锁操作正常。\",\n \"推理步骤5: 08:32 回家时入户门未重新上锁(日志中无 LockOperationType=0 的上锁事件,直到 20:50 才自动上锁),存在轻微安全隐患,但考虑到老人在家且为独居习惯,风险较低。\",\n \"推理步骤6: 09:14 卫生间漏水传感器短暂触发(2分钟后恢复),结合当时有人在卫生间使用,大概率是正常用水溅水所致,非真实漏水。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开关前后共 6 次报告 MeasuredValue = None(06:06、06:38、11:08、11:33、16:58、17:22),与灶具操作存在强时间关联\",\n \"每次 None 值出现在灶具 OnOff 状态变化后约 30 秒至 1 分钟内,非随机故障\",\n \"在 None 值期间之外,该传感器的半小时定时读数均正常(2400-2585 范围),说明传感器并非完全损坏\",\n \"08:32 回家后入户门长时间未上锁,直到 20:50 就寝时才自动锁定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,建议将传感器迁移至距灶具较远但仍能监测厨房整体温度的位置\",\n \"如传感器位置合理,建议更换传感器或联系厂商检查固件,排除硬件故障\",\n \"在传感器问题修复前,建议加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其电池和功能正常\",\n \"考虑为入户门锁设置回家后自动上锁或定时提醒上锁的自动化规则,避免长时间未锁门\",\n \"卫生间漏水传感器虽本次为误报概率高,但建议定期检查卫生间水管接头,预防真实漏水\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰,影响厨房安全监测能力。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的读数(06:06、06:38、11:08、11:33、16:58、17:22),每次都精确对应灶具开启或关闭后约30秒到1分钟内。", "推理步骤2: 正常的温度传感器即使在高温环境下也应返回数值(哪怕是超量程值),而非 None。None 通常表示传感器通信失败、读数超出可测范围或硬件异常。这种与灶具操作高度关联的规律性故障,说明传感器可能受灶具热辐射或电磁干扰影响。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪(最高风险时段)期间恰好失效,将无法及时检测到异常高温,形成安全监测盲区。", "推理步骤4: 除传感器问题外,其余家居活动均属正常模式——老人 05:40 起床、06:05 做早餐、06:50 出门晨练、08:32 回家、12:22 午休、16:57 做晚餐、20:34 洗漱、20:50 就寝,作息规律且门锁操作正常。", "推理步骤5: 08:32 回家时入户门未重新上锁(日志中无 LockOperationType=0 的上锁事件,直到 20:50 才自动上锁),存在轻微安全隐患,但考虑到老人在家且为独居习惯,风险较低。", "推理步骤6: 09:14 卫生间漏水传感器短暂触发(2分钟后恢复),结合当时有人在卫生间使用,大概率是正常用水溅水所致,非真实漏水。"], "key_evidence": ["厨房温度传感器在灶具开关前后共 6 次报告 MeasuredValue = None(06:06、06:38、11:08、11:33、16:58、17:22),与灶具操作存在强时间关联", "每次 None 值出现在灶具 OnOff 状态变化后约 30 秒至 1 分钟内,非随机故障", "在 None 值期间之外,该传感器的半小时定时读数均正常(2400-2585 范围),说明传感器并非完全损坏", "08:32 回家后入户门长时间未上锁,直到 20:50 就寝时才自动锁定"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,建议将传感器迁移至距灶具较远但仍能监测厨房整体温度的位置", "如传感器位置合理,建议更换传感器或联系厂商检查固件,排除硬件故障", "在传感器问题修复前,建议加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其电池和功能正常", "考虑为入户门锁设置回家后自动上锁或定时提醒上锁的自动化规则,避免长时间未锁门", "卫生间漏水传感器虽本次为误报概率高,但建议定期检查卫生间水管接头,预防真实漏水"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.400434255599976, "api_error": null} {"episode_id": "SQ2_FP_D_0326", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0326.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20260955, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bedroom", "injection_time": "2026-06-18T15:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人时被开启,且厨房温度异常飙升至27°C以上,存在火灾风险\",\n \"reasoning\": [\n \"推理步骤1: 15:59 厨房灶具开启(OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),灶具在无人状态下被启动属于严重异常\",\n \"推理步骤2: 16:04 厨房温度从约25°C(2491)急剧升至27°C(2700),16:29进一步升至27.5°C(2750),温升幅度远超正常烹饪时的变化(对比正常烹饪时温度传感器报告None,说明传感器被灶具热量干扰)\",\n \"推理步骤3: 对比当天正常烹饪行为(06:10、11:10、17:09),每次都有occupancy=1伴随灶具开启,且温度传感器报告None(正常的近距离热干扰)。而15:59这次无人在场、温度传感器仍能报数但数值异常高,说明热源可能不在正常灶具位置或存在异常燃烧\",\n \"推理步骤4: 直到16:19才检测到有人进入厨房,意味着灶具无人看管运行了约20分钟。对于独居老人,这可能是忘记关灶后离开,或灶具被远程/意外触发\",\n \"推理步骤5: 16:30的定时温度读数恢复到2504(约25°C),但日志中未见灶具关闭事件,无法确认灶具是否已被关闭\"\n ],\n \"key_evidence\": [\n \"15:59 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生,灶具无人时启动\",\n \"16:04 厨房温度飙升至2700(27°C),16:29进一步升至2750(27.5°C),相比之前2491(约24.9°C)异常升高\",\n \"正常烹饪(06:10、11:10、17:09)均伴随occupancy=1,唯独15:59这次无人在场\",\n \"灶具无人看管至少20分钟(15:59至16:19才有人进入厨房)\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,如仍在运行应远程关闭\",\n \"联系老人确认是否安全、是否忘记关灶\",\n \"检查灶具是否存在误触发或远程控制漏洞\",\n \"建议设置自动化规则:当occupancy=0超过一定时间时自动关闭灶具\",\n \"建议为灶具增加使用时长上限保护,超时自动断电\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人时被开启,且厨房温度异常飙升至27°C以上,存在火灾风险", "reasoning": ["推理步骤1: 15:59 厨房灶具开启(OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),灶具在无人状态下被启动属于严重异常", "推理步骤2: 16:04 厨房温度从约25°C(2491)急剧升至27°C(2700),16:29进一步升至27.5°C(2750),温升幅度远超正常烹饪时的变化(对比正常烹饪时温度传感器报告None,说明传感器被灶具热量干扰)", "推理步骤3: 对比当天正常烹饪行为(06:10、11:10、17:09),每次都有occupancy=1伴随灶具开启,且温度传感器报告None(正常的近距离热干扰)。而15:59这次无人在场、温度传感器仍能报数但数值异常高,说明热源可能不在正常灶具位置或存在异常燃烧", "推理步骤4: 直到16:19才检测到有人进入厨房,意味着灶具无人看管运行了约20分钟。对于独居老人,这可能是忘记关灶后离开,或灶具被远程/意外触发", "推理步骤5: 16:30的定时温度读数恢复到2504(约25°C),但日志中未见灶具关闭事件,无法确认灶具是否已被关闭"], "key_evidence": ["15:59 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生,灶具无人时启动", "16:04 厨房温度飙升至2700(27°C),16:29进一步升至2750(27.5°C),相比之前2491(约24.9°C)异常升高", "正常烹饪(06:10、11:10、17:09)均伴随occupancy=1,唯独15:59这次无人在场", "灶具无人看管至少20分钟(15:59至16:19才有人进入厨房)"], "recommended_actions": ["立即确认厨房灶具当前状态,如仍在运行应远程关闭", "联系老人确认是否安全、是否忘记关灶", "检查灶具是否存在误触发或远程控制漏洞", "建议设置自动化规则:当occupancy=0超过一定时间时自动关闭灶具", "建议为灶具增加使用时长上限保护,超时自动断电"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.664283275604248, "api_error": null} {"episode_id": "SQ2_FP_D_0331", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0331.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20260960, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-10T08:14:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出期间(08:30)未关闭、卧室窗户传感器显示窗户打开后无关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None(05:51、06:39、10:57、11:30、16:53、17:28),共出现6次。正常传感器在灶具工作时应报告升高的温度值,而非 null。这表明传感器可能存在故障或通信异常。\",\n \"推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果灶具引发高温或烟雾,温度传感器无法提供有效预警数据,削弱了火灾早期检测能力。\",\n \"推理步骤3: 08:14 卧室窗户传感器报告 StateValue = False(窗户打开),但整天日志中没有对应的关闭事件(StateValue = True)。虽然可能是老人有意通风,但对独居老人而言,窗户长时间敞开存在安全隐患(入侵风险、夜间温度下降影响健康)。\",\n \"推理步骤4: 08:30 入户门解锁并打开(StateValue = False),但日志中没有随后的关门记录(StateValue = True),直到 20:54 才出现门关闭和自动上锁的记录。这意味着入户门可能在老人外出的整个白天(约12小时)处于未关闭状态,对独居老人住宅安全构成较大风险。\",\n \"推理步骤5: 老人的日常作息模式本身是正常的——早起(05:32)、做早餐(05:50-06:38)、外出(07:04)、回家(08:30)、午餐(10:56-11:29)、午休(12:24-13:50)、晚餐(16:52-17:27)、晚间活动后就寝(20:54)。灶具每次使用时长在30-48分钟内,属于正常烹饪时间,且均有人在场。\",\n \"推理步骤6: 温度整体趋势合理——夜间约22-23°C,白天升至25-26°C,傍晚回落。卧室始终比其他房间低约1°C,符合有窗户打开通风的情况。无漏水、无烟雾报警触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:51、06:39、10:57、11:30、16:53、17:28)\",\n \"入户门 08:30:02 打开(StateValue = False)后无关闭记录,直到 20:54:18 才记录关闭(StateValue = True),中间约12.4小时无门状态变化\",\n \"卧室窗户 08:14:10 打开(StateValue = False)后全天无关闭记录\",\n \"08:14 卧室短暂有人活动(仅6秒内灯开又关、人离开),行为模式异常简短——可能只是开窗通风\"\n ],\n \"recommended_actions\": [\n \"优先检修或更换厨房温度传感器,确保灶具使用期间温度监测功能正常,这是独居老人厨房安全的关键防线\",\n \"检查入户门锁的自动关门/上锁机制是否正常工作,建议启用「门未关超时提醒」功能(如开门超过5分钟未关则推送告警)\",\n \"建议为卧室窗户设置长时间打开提醒,尤其在夜间或老人外出时自动告警\",\n \"考虑为厨房灶具增加「无人看管超时自动关闭」规则,作为温度传感器故障期间的额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出期间(08:30)未关闭、卧室窗户传感器显示窗户打开后无关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None(05:51、06:39、10:57、11:30、16:53、17:28),共出现6次。正常传感器在灶具工作时应报告升高的温度值,而非 null。这表明传感器可能存在故障或通信异常。", "推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果灶具引发高温或烟雾,温度传感器无法提供有效预警数据,削弱了火灾早期检测能力。", "推理步骤3: 08:14 卧室窗户传感器报告 StateValue = False(窗户打开),但整天日志中没有对应的关闭事件(StateValue = True)。虽然可能是老人有意通风,但对独居老人而言,窗户长时间敞开存在安全隐患(入侵风险、夜间温度下降影响健康)。", "推理步骤4: 08:30 入户门解锁并打开(StateValue = False),但日志中没有随后的关门记录(StateValue = True),直到 20:54 才出现门关闭和自动上锁的记录。这意味着入户门可能在老人外出的整个白天(约12小时)处于未关闭状态,对独居老人住宅安全构成较大风险。", "推理步骤5: 老人的日常作息模式本身是正常的——早起(05:32)、做早餐(05:50-06:38)、外出(07:04)、回家(08:30)、午餐(10:56-11:29)、午休(12:24-13:50)、晚餐(16:52-17:27)、晚间活动后就寝(20:54)。灶具每次使用时长在30-48分钟内,属于正常烹饪时间,且均有人在场。", "推理步骤6: 温度整体趋势合理——夜间约22-23°C,白天升至25-26°C,傍晚回落。卧室始终比其他房间低约1°C,符合有窗户打开通风的情况。无漏水、无烟雾报警触发。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:51、06:39、10:57、11:30、16:53、17:28)", "入户门 08:30:02 打开(StateValue = False)后无关闭记录,直到 20:54:18 才记录关闭(StateValue = True),中间约12.4小时无门状态变化", "卧室窗户 08:14:10 打开(StateValue = False)后全天无关闭记录", "08:14 卧室短暂有人活动(仅6秒内灯开又关、人离开),行为模式异常简短——可能只是开窗通风"], "recommended_actions": ["优先检修或更换厨房温度传感器,确保灶具使用期间温度监测功能正常,这是独居老人厨房安全的关键防线", "检查入户门锁的自动关门/上锁机制是否正常工作,建议启用「门未关超时提醒」功能(如开门超过5分钟未关则推送告警)", "建议为卧室窗户设置长时间打开提醒,尤其在夜间或老人外出时自动告警", "考虑为厨房灶具增加「无人看管超时自动关闭」规则,作为温度传感器故障期间的额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.259464263916016, "api_error": null} {"episode_id": "SQ2_FP_D_0334", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0334.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20260963, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bedroom", "injection_time": "2026-06-03T08:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人时被开启,且厨房温度异常飙升,存在严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 08:11 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0)。这是一个明显的异常——灶具在无人操作的情况下被启动。\",\n \"推理步骤2: 08:16 厨房温度传感器读数飙升至 2700(27.00°C),08:41 进一步升至 2750(27.50°C),而此前 08:00 的正常读数为 2453(24.53°C)。短短几分钟内温升约 2.5-3°C,远超同时段其他房间的温度变化幅度,说明灶具确实在持续加热。\",\n \"推理步骤3: 从 08:11 灶具开启到 08:31 厨房才重新检测到有人(Occupancy=1),中间有约 20 分钟灶具处于无人看管状态。对于独居老人家庭,这段无人看管的明火时间构成严重火灾风险。\",\n \"推理步骤4: 对比当天其他三次正常用灶记录(05:58、11:07、17:06),每次灶具开启时厨房运动传感器均同步显示有人(Occupancy=1),唯独 08:11 这次是无人状态下灶具被开启,模式明显异常。\",\n \"推理步骤5: 08:24 入户门被手动解锁、门被打开,有人从外面进入(前门传感器 StateValue=False 表示门开),随后客厅检测到有人。这说明老人在 06:50 出门后于 08:24 回家,而灶具在 08:11 就已开启——老人不在家时灶具却在运行,可能是出门前忘记关灶,也可能是设备故障自行启动。\",\n \"推理步骤6: 日志中未记录灶具关闭事件(08:11 开启后没有对应的 OnOff=False),说明灶具可能一直持续运行。虽然 08:31 有人回到厨房,但无法确认灶具是否已被关闭。\"\n ],\n \"key_evidence\": [\n \"08:11 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生——灶具在无人时开启\",\n \"08:16 厨房温度骤升至 2700(27.00°C),08:41 升至 2750(27.50°C),较 08:00 的 2453(24.53°C)异常偏高\",\n \"06:50 老人出门(前门解锁、开门、关门、自动上锁),08:24 才回家,08:11-08:24 期间家中无人但灶具在运行\",\n \"当天其他三次用灶(05:58、11:07、17:06)均伴随厨房 Occupancy=1,唯独 08:11 这次为 Occupancy=0\",\n \"05:59 和 06:37 厨房温度传感器曾报告 None 值,该传感器可能存在间歇性故障,降低了温度监控的可靠性\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,如仍在运行应远程关闭或通知老人/紧急联系人\",\n \"排查灶具无人时自动开启的原因:检查是否存在误触的定时任务、自动化规则,或灶具硬件故障\",\n \"为厨房灶具增加安全联动规则:当 kitchen_occupancy=0 超过一定时间时自动关闭灶具\",\n \"检修厨房温度传感器——多次报告 None 值表明传感器可能存在故障,影响火灾预警能力\",\n \"考虑为独居老人安装灶具自动熄火装置或燃气自动切断阀,作为物理层面的安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人时被开启,且厨房温度异常飙升,存在严重火灾隐患。", "reasoning": ["推理步骤1: 08:11 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0)。这是一个明显的异常——灶具在无人操作的情况下被启动。", "推理步骤2: 08:16 厨房温度传感器读数飙升至 2700(27.00°C),08:41 进一步升至 2750(27.50°C),而此前 08:00 的正常读数为 2453(24.53°C)。短短几分钟内温升约 2.5-3°C,远超同时段其他房间的温度变化幅度,说明灶具确实在持续加热。", "推理步骤3: 从 08:11 灶具开启到 08:31 厨房才重新检测到有人(Occupancy=1),中间有约 20 分钟灶具处于无人看管状态。对于独居老人家庭,这段无人看管的明火时间构成严重火灾风险。", "推理步骤4: 对比当天其他三次正常用灶记录(05:58、11:07、17:06),每次灶具开启时厨房运动传感器均同步显示有人(Occupancy=1),唯独 08:11 这次是无人状态下灶具被开启,模式明显异常。", "推理步骤5: 08:24 入户门被手动解锁、门被打开,有人从外面进入(前门传感器 StateValue=False 表示门开),随后客厅检测到有人。这说明老人在 06:50 出门后于 08:24 回家,而灶具在 08:11 就已开启——老人不在家时灶具却在运行,可能是出门前忘记关灶,也可能是设备故障自行启动。", "推理步骤6: 日志中未记录灶具关闭事件(08:11 开启后没有对应的 OnOff=False),说明灶具可能一直持续运行。虽然 08:31 有人回到厨房,但无法确认灶具是否已被关闭。"], "key_evidence": ["08:11 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生——灶具在无人时开启", "08:16 厨房温度骤升至 2700(27.00°C),08:41 升至 2750(27.50°C),较 08:00 的 2453(24.53°C)异常偏高", "06:50 老人出门(前门解锁、开门、关门、自动上锁),08:24 才回家,08:11-08:24 期间家中无人但灶具在运行", "当天其他三次用灶(05:58、11:07、17:06)均伴随厨房 Occupancy=1,唯独 08:11 这次为 Occupancy=0", "05:59 和 06:37 厨房温度传感器曾报告 None 值,该传感器可能存在间歇性故障,降低了温度监控的可靠性"], "recommended_actions": ["立即确认厨房灶具当前状态,如仍在运行应远程关闭或通知老人/紧急联系人", "排查灶具无人时自动开启的原因:检查是否存在误触的定时任务、自动化规则,或灶具硬件故障", "为厨房灶具增加安全联动规则:当 kitchen_occupancy=0 超过一定时间时自动关闭灶具", "检修厨房温度传感器——多次报告 None 值表明传感器可能存在故障,影响火灾预警能力", "考虑为独居老人安装灶具自动熄火装置或燃气自动切断阀,作为物理层面的安全兜底"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.430927515029907, "api_error": null} {"episode_id": "SQ2_FP_D_0336", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0336.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260965, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-06T16:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温或火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 纵观全天日志,厨房温度传感器共出现 4 次 MeasuredValue = None(05:55、06:34、10:54、11:23、16:52、17:39),每次都紧跟在灶具开启或关闭的时间点附近。\",\n \"推理步骤2: 正常的温度传感器不应因附近灶具工作而丢失读数。这种规律性的 None 值表明传感器可能受灶具热量或电磁干扰影响而出现故障,或者传感器本身存在量程溢出/通信异常。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,就无法在温度异常升高时发出预警,形成安全监控盲区。\",\n \"推理步骤4: 其余行为模式均属正常——老人 05:37 起床、洗漱、做早餐、06:54 出门晨练/买菜、08:31 回家、12:29 午休、13:51 起床、16:10 卫生间短暂用水(2 分钟内漏水传感器恢复)、做晚餐、20:30 洗漱、20:53 就寝,作息规律合理。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;08:31 回家时门未重新上锁(BooleanState 未回 True),但 20:53 就寝前系统确认门已关闭并自动上锁,整体安防状态正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:55:08、06:34:00、10:54:00、11:23:00、16:52:00、17:39:00 共 6 次报告 MeasuredValue = None\",\n \"每次 None 值都与灶具 OnOff 状态变化高度关联(灶具开启后约 30 秒或关闭后约 1 分钟出现)\",\n \"同时段客厅和卧室温度传感器均正常上报数值,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热量或油烟干扰,必要时重新选址安装\",\n \"检查该传感器的固件版本并更新,排查是否存在量程溢出或通信超时的已知问题\",\n \"在传感器修复前,考虑设置灶具使用时长自动提醒(如超过 45 分钟未关闭则告警),作为补偿性安全措施\",\n \"16:10 卫生间漏水传感器虽在 2 分钟内恢复,但建议定期检查卫生间水管接头,防止慢性渗漏\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温或火灾隐患。", "reasoning": ["推理步骤1: 纵观全天日志,厨房温度传感器共出现 4 次 MeasuredValue = None(05:55、06:34、10:54、11:23、16:52、17:39),每次都紧跟在灶具开启或关闭的时间点附近。", "推理步骤2: 正常的温度传感器不应因附近灶具工作而丢失读数。这种规律性的 None 值表明传感器可能受灶具热量或电磁干扰影响而出现故障,或者传感器本身存在量程溢出/通信异常。", "推理步骤3: 对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,就无法在温度异常升高时发出预警,形成安全监控盲区。", "推理步骤4: 其余行为模式均属正常——老人 05:37 起床、洗漱、做早餐、06:54 出门晨练/买菜、08:31 回家、12:29 午休、13:51 起床、16:10 卫生间短暂用水(2 分钟内漏水传感器恢复)、做晚餐、20:30 洗漱、20:53 就寝,作息规律合理。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;08:31 回家时门未重新上锁(BooleanState 未回 True),但 20:53 就寝前系统确认门已关闭并自动上锁,整体安防状态正常。"], "key_evidence": ["厨房温度传感器在 05:55:08、06:34:00、10:54:00、11:23:00、16:52:00、17:39:00 共 6 次报告 MeasuredValue = None", "每次 None 值都与灶具 OnOff 状态变化高度关联(灶具开启后约 30 秒或关闭后约 1 分钟出现)", "同时段客厅和卧室温度传感器均正常上报数值,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热量或油烟干扰,必要时重新选址安装", "检查该传感器的固件版本并更新,排查是否存在量程溢出或通信超时的已知问题", "在传感器修复前,考虑设置灶具使用时长自动提醒(如超过 45 分钟未关闭则告警),作为补偿性安全措施", "16:10 卫生间漏水传感器虽在 2 分钟内恢复,但建议定期检查卫生间水管接头,防止慢性渗漏"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.825478076934814, "api_error": null} {"episode_id": "SQ2_FP_D_0338", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0338.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20260967, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-20T08:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,可能导致火灾/高温预警失灵。\",\n \"reasoning\": [\n \"推理步骤1: 日志中厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:59:07、10:51:00、17:10:00),且在灶具关闭后约1分钟也报告 None(06:32:00、11:22:00、17:39:00),共出现6次。这不是正常的温度读数,说明传感器在灶具工作前后持续出现测量失败。\",\n \"推理步骤2: 对比其他两个温度传感器(客厅、卧室),它们在整个24小时内从未出现 None 值,始终正常上报数据。这排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房温度传感器的核心职责之一是配合烟雾报警器监测烹饪时的异常高温。恰恰在灶具使用(最需要温度监控)的时段传感器失效,意味着如果发生灶具过热或火灾前兆,系统将无法通过温度数据及时发出预警,形成安全监控盲区。\",\n \"推理步骤4: 其余设备行为均属正常——老人05:33起床、06:57出门、08:25回家、12:33午休、14:06起床、20:52就寝,作息规律;08:11卫生间短暂漏水2分钟后自行消失(可能是溅水误触);入户门锁开关、自动上锁均正常;三次烹饪时长合理(约30分钟),烟雾报警器未触发。\",\n \"推理步骤5: 置信度定为 medium 而非 high,因为部分灶具型号的温度传感器在高温环境下暂时报 None 可能是设计行为(超量程保护),但连关火后也报 None 则不正常,需要进一步确认。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用周期中共6次报告 MeasuredValue = None(05:59:07、06:32:00、10:51:00、11:22:00、17:10:00、17:39:00),而灶具关闭后的下一个整点读数恢复正常\",\n \"客厅和卧室温度传感器全天48个采样点均正常上报,排除系统性通信故障\",\n \"None 值出现的时间窗口恰好覆盖灶具从开启到关闭后约1分钟,即厨房最需要温度监控的高风险时段\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程或热损伤,必要时重新选址安装\",\n \"对厨房温度传感器进行固件检查和校准测试,确认 None 值是传感器硬件故障还是软件异常\",\n \"在传感器修复前,建议增加烹饪时段的烟雾报警器灵敏度或设置灶具自动关闭定时器(如超过40分钟未手动关闭则自动断气/断电),弥补温度监控盲区\",\n \"考虑为独居老人增设厨房第二温度传感器作为冗余,确保单点故障不会导致完全失去温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,可能导致火灾/高温预警失灵。", "reasoning": ["推理步骤1: 日志中厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:59:07、10:51:00、17:10:00),且在灶具关闭后约1分钟也报告 None(06:32:00、11:22:00、17:39:00),共出现6次。这不是正常的温度读数,说明传感器在灶具工作前后持续出现测量失败。", "推理步骤2: 对比其他两个温度传感器(客厅、卧室),它们在整个24小时内从未出现 None 值,始终正常上报数据。这排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房温度传感器的核心职责之一是配合烟雾报警器监测烹饪时的异常高温。恰恰在灶具使用(最需要温度监控)的时段传感器失效,意味着如果发生灶具过热或火灾前兆,系统将无法通过温度数据及时发出预警,形成安全监控盲区。", "推理步骤4: 其余设备行为均属正常——老人05:33起床、06:57出门、08:25回家、12:33午休、14:06起床、20:52就寝,作息规律;08:11卫生间短暂漏水2分钟后自行消失(可能是溅水误触);入户门锁开关、自动上锁均正常;三次烹饪时长合理(约30分钟),烟雾报警器未触发。", "推理步骤5: 置信度定为 medium 而非 high,因为部分灶具型号的温度传感器在高温环境下暂时报 None 可能是设计行为(超量程保护),但连关火后也报 None 则不正常,需要进一步确认。"], "key_evidence": ["厨房温度传感器在三次灶具使用周期中共6次报告 MeasuredValue = None(05:59:07、06:32:00、10:51:00、11:22:00、17:10:00、17:39:00),而灶具关闭后的下一个整点读数恢复正常", "客厅和卧室温度传感器全天48个采样点均正常上报,排除系统性通信故障", "None 值出现的时间窗口恰好覆盖灶具从开启到关闭后约1分钟,即厨房最需要温度监控的高风险时段"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程或热损伤,必要时重新选址安装", "对厨房温度传感器进行固件检查和校准测试,确认 None 值是传感器硬件故障还是软件异常", "在传感器修复前,建议增加烹饪时段的烟雾报警器灵敏度或设置灶具自动关闭定时器(如超过40分钟未手动关闭则自动断气/断电),弥补温度监控盲区", "考虑为独居老人增设厨房第二温度传感器作为冗余,确保单点故障不会导致完全失去温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.473468542099, "api_error": null} {"episode_id": "SQ2_FP_D_0345", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0345.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20260974, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-26T19:26:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:26 入户门出现一次开锁失败后成功远程开锁,老人当时在客厅内,且门锁在约75分钟后才关闭,存在非授权人员进入的可能。\",\n \"reasoning\": [\n \"推理步骤1: 19:26 门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/Keypad方式,说明有人尝试开锁但失败了。\",\n \"推理步骤2: 仅20秒后(19:26:20),门锁被成功解锁(LockOperationType=1, OperationSource=3, UserIndex=1),门被打开(contact=False),玄关检测到有人进入。\",\n \"推理步骤3: 老人在19:22已在客厅活动(调暗灯光),说明老人本人并不在门口操作门锁,开锁来源是远程/密码方式而非手动。\",\n \"推理步骤4: 门在19:26:22被打开后,直到20:41:08才关闭并自动上锁,门开启状态持续了约75分钟,这对于独居老人来说异常偏长。\",\n \"推理步骤5: 虽然UserIndex=1可能是授权用户(如家属远程开门),但结合之前的开锁失败事件,不排除密码被试探后成功的可能性。整体模式需要确认是否为已知访客。\"\n ],\n \"key_evidence\": [\n \"19:26:00 门锁开锁失败事件 LockOperationError(OperationError=1, OperationSource=3)\",\n \"19:26:20 门锁被远程/密码方式成功解锁(OperationSource=3, UserIndex=1),老人当时在客厅而非门口\",\n \"门从19:26打开到20:41才关闭,持续约75分钟未锁门\"\n ],\n \"recommended_actions\": [\n \"立即联系老人或其紧急联系人,确认19:26的访客是否为已知授权人员\",\n \"检查门锁UserIndex=1对应的用户身份,确认是否为家属或护工\",\n \"如无法确认访客身份,建议查看门口摄像头录像(如有)\",\n \"考虑为门锁启用开锁失败多次告警和长时间未关门提醒\",\n \"建议更换或更新门锁密码,防止密码泄露风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:26 入户门出现一次开锁失败后成功远程开锁,老人当时在客厅内,且门锁在约75分钟后才关闭,存在非授权人员进入的可能。", "reasoning": ["推理步骤1: 19:26 门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/Keypad方式,说明有人尝试开锁但失败了。", "推理步骤2: 仅20秒后(19:26:20),门锁被成功解锁(LockOperationType=1, OperationSource=3, UserIndex=1),门被打开(contact=False),玄关检测到有人进入。", "推理步骤3: 老人在19:22已在客厅活动(调暗灯光),说明老人本人并不在门口操作门锁,开锁来源是远程/密码方式而非手动。", "推理步骤4: 门在19:26:22被打开后,直到20:41:08才关闭并自动上锁,门开启状态持续了约75分钟,这对于独居老人来说异常偏长。", "推理步骤5: 虽然UserIndex=1可能是授权用户(如家属远程开门),但结合之前的开锁失败事件,不排除密码被试探后成功的可能性。整体模式需要确认是否为已知访客。"], "key_evidence": ["19:26:00 门锁开锁失败事件 LockOperationError(OperationError=1, OperationSource=3)", "19:26:20 门锁被远程/密码方式成功解锁(OperationSource=3, UserIndex=1),老人当时在客厅而非门口", "门从19:26打开到20:41才关闭,持续约75分钟未锁门"], "recommended_actions": ["立即联系老人或其紧急联系人,确认19:26的访客是否为已知授权人员", "检查门锁UserIndex=1对应的用户身份,确认是否为家属或护工", "如无法确认访客身份,建议查看门口摄像头录像(如有)", "考虑为门锁启用开锁失败多次告警和长时间未关门提醒", "建议更换或更新门锁密码,防止密码泄露风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.7778160572052, "api_error": null} {"episode_id": "SQ2_FP_D_0339", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0339.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20260968, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-18T18:02:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人就寝流程中出现未经开门动作的锁门事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内三次灶具开启/关闭期间报告 MeasuredValue = None(05:53、06:26、11:02、11:35、17:11、17:23),共计6条 None 记录。正常传感器即使在高温环境下也应报告数值而非 None,这说明传感器可能因高温导致读数溢出、通信中断或硬件故障。\",\n \"推理步骤2: 该传感器在非烹饪时段(每半小时的定期上报)均能正常报告数值,仅在灶具开启后约30秒至1分钟内以及关闭后约1分钟内出现 None,模式高度一致,指向灶具工作时的热辐射或电磁干扰导致传感器暂时失效。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用(最需要监测的时段)时恰好失效,将无法及时检测到异常高温,存在安全盲区。\",\n \"推理步骤4: 20:35:06 入户门传感器报告 StateValue = True(门关闭),随后 20:35:07 门锁自动上锁(LockState = 1),但之前没有对应的开锁和开门记录。老人 08:25 回家后入户门状态一直未再变化,此处突然出现关门+上锁事件,可能是门未完全关好后延迟触发,也可能是传感器状态漂移。\",\n \"推理步骤5: 其余行为模式正常——老人 05:40 起床、05:42 如厕、05:52 做早餐、06:52 出门、08:25 回家、11:01 做午餐、12:34 午休、14:09 起床、17:10 做晚餐、18:02 短暂用水(漏水传感器2分钟内恢复正常属于正常用水溅水)、20:32 洗漱、20:35 就寝,符合独居老人的典型日常作息。\",\n \"推理步骤6: 室内温度整体呈现夏季正常日变化曲线(夜间约22-23°C,午间峰值约25.8°C),卧室因窗帘遮挡始终略低于客厅和厨房,无异常温升。烟雾报警器全天无触发,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间共产生6条 MeasuredValue = None 记录(05:53、06:26、11:02、11:35、17:11、17:23),而非烹饪时段均正常上报\",\n \"20:35:06 入户门传感器报告关闭、20:35:07 自动上锁,但缺少对应的开锁/开门前序事件\",\n \"卫生间漏水传感器 18:02 触发后 18:04 即恢复(2分钟),与老人在场用水时间吻合\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时重新定位或更换耐高温型号\",\n \"在传感器维修前,考虑增加厨房烟雾报警器作为灶具使用期间的备用安全监测手段(当前已有 kitchen_smoke_alarm,确认其工作正常)\",\n \"排查入户门锁及门磁传感器状态,确认是否存在门未关严或传感器松动的情况,避免安防状态误判\",\n \"鉴于独居老人场景,建议对厨房温度传感器的 None 值设置告警规则:若灶具开启期间传感器持续无有效读数超过一定时长,自动发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人就寝流程中出现未经开门动作的锁门事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内三次灶具开启/关闭期间报告 MeasuredValue = None(05:53、06:26、11:02、11:35、17:11、17:23),共计6条 None 记录。正常传感器即使在高温环境下也应报告数值而非 None,这说明传感器可能因高温导致读数溢出、通信中断或硬件故障。", "推理步骤2: 该传感器在非烹饪时段(每半小时的定期上报)均能正常报告数值,仅在灶具开启后约30秒至1分钟内以及关闭后约1分钟内出现 None,模式高度一致,指向灶具工作时的热辐射或电磁干扰导致传感器暂时失效。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用(最需要监测的时段)时恰好失效,将无法及时检测到异常高温,存在安全盲区。", "推理步骤4: 20:35:06 入户门传感器报告 StateValue = True(门关闭),随后 20:35:07 门锁自动上锁(LockState = 1),但之前没有对应的开锁和开门记录。老人 08:25 回家后入户门状态一直未再变化,此处突然出现关门+上锁事件,可能是门未完全关好后延迟触发,也可能是传感器状态漂移。", "推理步骤5: 其余行为模式正常——老人 05:40 起床、05:42 如厕、05:52 做早餐、06:52 出门、08:25 回家、11:01 做午餐、12:34 午休、14:09 起床、17:10 做晚餐、18:02 短暂用水(漏水传感器2分钟内恢复正常属于正常用水溅水)、20:32 洗漱、20:35 就寝,符合独居老人的典型日常作息。", "推理步骤6: 室内温度整体呈现夏季正常日变化曲线(夜间约22-23°C,午间峰值约25.8°C),卧室因窗帘遮挡始终略低于客厅和厨房,无异常温升。烟雾报警器全天无触发,无入侵迹象。"], "key_evidence": ["厨房温度传感器在三次烹饪期间共产生6条 MeasuredValue = None 记录(05:53、06:26、11:02、11:35、17:11、17:23),而非烹饪时段均正常上报", "20:35:06 入户门传感器报告关闭、20:35:07 自动上锁,但缺少对应的开锁/开门前序事件", "卫生间漏水传感器 18:02 触发后 18:04 即恢复(2分钟),与老人在场用水时间吻合"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时重新定位或更换耐高温型号", "在传感器维修前,考虑增加厨房烟雾报警器作为灶具使用期间的备用安全监测手段(当前已有 kitchen_smoke_alarm,确认其工作正常)", "排查入户门锁及门磁传感器状态,确认是否存在门未关严或传感器松动的情况,避免安防状态误判", "鉴于独居老人场景,建议对厨房温度传感器的 None 值设置告警规则:若灶具开启期间传感器持续无有效读数超过一定时长,自动发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.050373554229736, "api_error": null} {"episode_id": "SQ2_FP_D_0351", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0351.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20260980, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bedroom", "injection_time": "2026-06-19T16:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人时被开启,且厨房温度传感器出现异常读数,存在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 16:22 厨房灶具开启(OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,说明厨房内无人。独居老人可能忘记关灶后离开,或远程误触发。\",\n \"推理步骤2: 16:27 厨房温度传感器报告 MeasuredValue = 2700(即 27.00°C),相比 16:00 的 2494(24.94°C)出现了约 2°C 的突然跳升,且该读数使用了非标准的简写格式(缺少 TemperatureMeasurement 前缀),可能是传感器异常或被篡改的数据。\",\n \"推理步骤3: 16:42 厨房运动传感器才检测到有人进入(Occupancy = 1),意味着灶具在无人状态下运行了至少 20 分钟。\",\n \"推理步骤4: 16:51 灶具再次被正式开启,16:52 温度传感器同时报告了 None 和 MeasuredValue = 2750(27.50°C)两个矛盾的值,说明传感器工作状态不稳定,无法可靠监测厨房温度。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告 None 值(05:51、06:36、10:56、16:52、17:24),这是一个反复出现的故障模式,意味着在最需要温度监控的时候传感器恰恰失效。\",\n \"推理步骤6: 综合来看,独居老人 + 无人时灶具开启 + 温度传感器反复故障,构成了严重的火灾风险组合。入户门在 08:40 开门后一直未关闭(直到 20:41 才确认关门上锁),老人外出期间灶具若被误触发,后果不堪设想。\"\n ],\n \"key_evidence\": [\n \"16:22 灶具开启时 kitchen_occupancy = 0,厨房无人\",\n \"灶具无人运行约 20 分钟(16:22 至 16:42 才有人进入厨房)\",\n \"16:27 和 16:52 出现非标准格式的异常温度读数(2700、2750),与正常上报格式不一致\",\n \"厨房温度传感器在灶具使用期间反复报告 None 值(全天共 5 次),监控能力不可靠\",\n \"16:52 同一时刻传感器同时报告 None 和 2750 两个矛盾值,存在设备故障\",\n \"08:40 入户门开锁后长时间未确认关闭,直到 20:41 才重新上锁\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具,确认 16:22 无人开启的原因,排查是否存在误触发或设备故障\",\n \"紧急检修厨房温度传感器,解决反复报告 None 值和非标准数据格式的问题,确保灶具使用时温度监控可靠\",\n \"为灶具添加安全联动规则:当 kitchen_occupancy = 0 超过一定时间时自动关闭灶具并发送告警\",\n \"为独居老人配置灶具使用时长上限告警(如超过 45 分钟未关闭则提醒)\",\n \"检查入户门锁的自动上锁策略,08:40 开门后应在合理时间内自动上锁,避免长时间门户大开\",\n \"建议在厨房增加备用温度监测设备,形成冗余监控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人时被开启,且厨房温度传感器出现异常读数,存在火灾隐患。", "reasoning": ["推理步骤1: 16:22 厨房灶具开启(OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,说明厨房内无人。独居老人可能忘记关灶后离开,或远程误触发。", "推理步骤2: 16:27 厨房温度传感器报告 MeasuredValue = 2700(即 27.00°C),相比 16:00 的 2494(24.94°C)出现了约 2°C 的突然跳升,且该读数使用了非标准的简写格式(缺少 TemperatureMeasurement 前缀),可能是传感器异常或被篡改的数据。", "推理步骤3: 16:42 厨房运动传感器才检测到有人进入(Occupancy = 1),意味着灶具在无人状态下运行了至少 20 分钟。", "推理步骤4: 16:51 灶具再次被正式开启,16:52 温度传感器同时报告了 None 和 MeasuredValue = 2750(27.50°C)两个矛盾的值,说明传感器工作状态不稳定,无法可靠监测厨房温度。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告 None 值(05:51、06:36、10:56、16:52、17:24),这是一个反复出现的故障模式,意味着在最需要温度监控的时候传感器恰恰失效。", "推理步骤6: 综合来看,独居老人 + 无人时灶具开启 + 温度传感器反复故障,构成了严重的火灾风险组合。入户门在 08:40 开门后一直未关闭(直到 20:41 才确认关门上锁),老人外出期间灶具若被误触发,后果不堪设想。"], "key_evidence": ["16:22 灶具开启时 kitchen_occupancy = 0,厨房无人", "灶具无人运行约 20 分钟(16:22 至 16:42 才有人进入厨房)", "16:27 和 16:52 出现非标准格式的异常温度读数(2700、2750),与正常上报格式不一致", "厨房温度传感器在灶具使用期间反复报告 None 值(全天共 5 次),监控能力不可靠", "16:52 同一时刻传感器同时报告 None 和 2750 两个矛盾值,存在设备故障", "08:40 入户门开锁后长时间未确认关闭,直到 20:41 才重新上锁"], "recommended_actions": ["立即检查厨房灶具,确认 16:22 无人开启的原因,排查是否存在误触发或设备故障", "紧急检修厨房温度传感器,解决反复报告 None 值和非标准数据格式的问题,确保灶具使用时温度监控可靠", "为灶具添加安全联动规则:当 kitchen_occupancy = 0 超过一定时间时自动关闭灶具并发送告警", "为独居老人配置灶具使用时长上限告警(如超过 45 分钟未关闭则提醒)", "检查入户门锁的自动上锁策略,08:40 开门后应在合理时间内自动上锁,避免长时间门户大开", "建议在厨房增加备用温度监测设备,形成冗余监控"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.573007822036743, "api_error": null} {"episode_id": "SQ2_FP_D_0346", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0346.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260975, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-21T18:44:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"独居老人在入户门未关闭的情况下快速进入卧室关灯就寝,且卧室窗户从傍晚起一直处于打开状态,存在安全隐患和健康关注点。\",\n \"reasoning\": [\n \"推理步骤1: 18:44 老人进入卧室,开灯后立即打开卧室窗户(bedroom_window_contact StateValue=False),随后5秒内关灯、10秒内运动传感器归零。整个过程仅持续20秒,行为极为短暂,不像正常的卧室活动。\",\n \"推理步骤2: 20:51 老人从卫生间出来进入卧室准备就寝,关闭窗帘(100%)、关灯。但卧室窗户传感器自18:44打开后,整晚再无关闭记录(无 StateValue=True 事件),说明窗户一直敞开。对独居老人而言,夜间窗户敞开存在入侵风险。\",\n \"推理步骤3: 20:51:09 入户门传感器报告 StateValue=True(门关闭)并自动上锁,但此前没有对应的开门记录(上一次门的状态是 08:24 回家时打开后未见关闭记录)。这意味着入户门从早上 08:24 到晚上 20:51 可能一直处于未关闭状态,长达约12.5小时。\",\n \"推理步骤4: 老人 07:06 出门时门锁有完整的开锁-开门-关门-上锁序列,但 08:24 回家后只有开锁-开门记录,没有关门和上锁记录,直到 20:51 才自动关门上锁。独居老人白天长时间门户大开是安全隐患。\",\n \"推理步骤5: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None(05:57、06:41、11:06、11:33、17:07、17:32),共出现6次。虽然可能与灶具热量干扰有关,但传感器读数为空值意味着在烹饪期间无法监测厨房温度异常,对独居老人的火灾预警能力构成隐患。\",\n \"推理步骤6: 12:33 至 13:56 老人在卧室午休约1.5小时,这属于正常行为。但结合全天活动模式来看,老人的日常作息基本正常(早起、做饭、外出、午休、晚间活动、就寝),主要关注点集中在门窗安全和设备可靠性上。\"\n ],\n \"key_evidence\": [\n \"入户门从 08:24 开门回家后直到 20:51 才关闭上锁,长达约12.5小时门户未关\",\n \"卧室窗户 18:44 打开后整晚无关闭记录,老人就寝时窗户敞开\",\n \"18:44 卧室活动仅持续20秒(进入-开灯-开窗-关灯-离开),行为异常短促\",\n \"厨房温度传感器在灶具使用前后共6次报告 None 值,烹饪期间温度监控失效\"\n ],\n \"recommended_actions\": [\n \"立即通知家属或紧急联系人,确认老人身体状况是否正常,特别关注18:44的短暂异常行为\",\n \"建议设置入户门长时间未关闭的自动提醒(如超过30分钟未关门则推送告警)\",\n \"建议设置就寝时间窗户未关闭的安全提醒,夜间窗户敞开对独居老人存在入侵风险\",\n \"排查厨房温度传感器故障,传感器在灶具使用期间反复报告空值,需要维修或更换以确保火灾预警能力\",\n \"考虑为独居老人增加夜间定时巡检机制(如卧室运动传感器长时间无活动则触发关怀提醒)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "health_concern", "threat_description": "独居老人在入户门未关闭的情况下快速进入卧室关灯就寝,且卧室窗户从傍晚起一直处于打开状态,存在安全隐患和健康关注点。", "reasoning": ["推理步骤1: 18:44 老人进入卧室,开灯后立即打开卧室窗户(bedroom_window_contact StateValue=False),随后5秒内关灯、10秒内运动传感器归零。整个过程仅持续20秒,行为极为短暂,不像正常的卧室活动。", "推理步骤2: 20:51 老人从卫生间出来进入卧室准备就寝,关闭窗帘(100%)、关灯。但卧室窗户传感器自18:44打开后,整晚再无关闭记录(无 StateValue=True 事件),说明窗户一直敞开。对独居老人而言,夜间窗户敞开存在入侵风险。", "推理步骤3: 20:51:09 入户门传感器报告 StateValue=True(门关闭)并自动上锁,但此前没有对应的开门记录(上一次门的状态是 08:24 回家时打开后未见关闭记录)。这意味着入户门从早上 08:24 到晚上 20:51 可能一直处于未关闭状态,长达约12.5小时。", "推理步骤4: 老人 07:06 出门时门锁有完整的开锁-开门-关门-上锁序列,但 08:24 回家后只有开锁-开门记录,没有关门和上锁记录,直到 20:51 才自动关门上锁。独居老人白天长时间门户大开是安全隐患。", "推理步骤5: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None(05:57、06:41、11:06、11:33、17:07、17:32),共出现6次。虽然可能与灶具热量干扰有关,但传感器读数为空值意味着在烹饪期间无法监测厨房温度异常,对独居老人的火灾预警能力构成隐患。", "推理步骤6: 12:33 至 13:56 老人在卧室午休约1.5小时,这属于正常行为。但结合全天活动模式来看,老人的日常作息基本正常(早起、做饭、外出、午休、晚间活动、就寝),主要关注点集中在门窗安全和设备可靠性上。"], "key_evidence": ["入户门从 08:24 开门回家后直到 20:51 才关闭上锁,长达约12.5小时门户未关", "卧室窗户 18:44 打开后整晚无关闭记录,老人就寝时窗户敞开", "18:44 卧室活动仅持续20秒(进入-开灯-开窗-关灯-离开),行为异常短促", "厨房温度传感器在灶具使用前后共6次报告 None 值,烹饪期间温度监控失效"], "recommended_actions": ["立即通知家属或紧急联系人,确认老人身体状况是否正常,特别关注18:44的短暂异常行为", "建议设置入户门长时间未关闭的自动提醒(如超过30分钟未关门则推送告警)", "建议设置就寝时间窗户未关闭的安全提醒,夜间窗户敞开对独居老人存在入侵风险", "排查厨房温度传感器故障,传感器在灶具使用期间反复报告空值,需要维修或更换以确保火灾预警能力", "考虑为独居老人增加夜间定时巡检机制(如卧室运动传感器长时间无活动则触发关怀提醒)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.401177406311035, "api_error": null} {"episode_id": "SQ2_FP_D_0355", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0355.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20260984, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bedroom", "injection_time": "2026-06-10T15:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,且厨房温度出现异常飙升,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 在 15:50 厨房灶具开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy = 0),这意味着灶具在无人看管的情况下运行。\",\n \"推理步骤2: 灶具开启后,厨房温度在 15:55 飙升至 2700(27.00°C),16:20 进一步升至 2750(27.50°C),而同时段客厅和卧室温度分别为 25.02°C 和 23.93°C,厨房温度比其他房间高出约 2-3.5°C,且上升速度异常快。\",\n \"推理步骤3: 对比当天其他三次正常烹饪(06:05、10:59、17:09),每次灶具开启时厨房运动传感器均显示有人(Occupancy = 1),且厨房温度传感器会短暂报告 None(可能是灶具近距离热辐射导致),而 15:50 这次灶具开启后温度传感器并未报告 None,反而报告了异常高温数值,说明热源扩散范围更广。\",\n \"推理步骤4: 直到 16:10 才检测到有人进入厨房(Occupancy = 1),意味着灶具在无人看管状态下运行了约 20 分钟。对于独居老人家庭,这是严重的安全隐患。\",\n \"推理步骤5: 日志中未记录灶具在 16:10 之后被关闭的事件,下一次灶具相关记录是 17:09 重新开启,中间缺少明确的关闭记录,存在灶具长时间运行的可能性。\",\n \"推理步骤6: 15:50 的事件日志格式也与其他正常事件不同(缺少完整的 Cluster 前缀),可能暗示该操作来源异常(如远程误触发或设备故障自启动),而非老人手动操作。\"\n ],\n \"key_evidence\": [\n \"15:50 灶具开启时 kitchen_occupancy = 0(无人),与当天其他三次烹饪时 occupancy = 1 形成鲜明对比\",\n \"灶具无人看管运行约 20 分钟(15:50 至 16:10 才有人进入厨房)\",\n \"厨房温度在 15:55 和 16:20 分别飙升至 27.00°C 和 27.50°C,显著高于同时段其他房间及 16:00 定时采集的 24.99°C,温升异常\",\n \"灶具开启后缺少明确的关闭记录,下一条灶具记录为 17:09 重新开启\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,如仍在运行应远程关闭\",\n \"联系老人确认是否本人操作,排除设备故障自启动的可能\",\n \"检查灶具设备是否存在固件异常或误触发问题,必要时进行维修或更换\",\n \"建议为灶具配置安全规则:当厨房无人超过 5 分钟时自动关闭灶具并发送告警\",\n \"建议为灶具设置最长连续运行时间限制(如 60 分钟),超时自动断电\",\n \"检查厨房烟雾报警器(kitchen_smoke_alarm)是否工作正常,整个过程中未见其触发任何事件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,且厨房温度出现异常飙升,存在火灾风险。", "reasoning": ["推理步骤1: 在 15:50 厨房灶具开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy = 0),这意味着灶具在无人看管的情况下运行。", "推理步骤2: 灶具开启后,厨房温度在 15:55 飙升至 2700(27.00°C),16:20 进一步升至 2750(27.50°C),而同时段客厅和卧室温度分别为 25.02°C 和 23.93°C,厨房温度比其他房间高出约 2-3.5°C,且上升速度异常快。", "推理步骤3: 对比当天其他三次正常烹饪(06:05、10:59、17:09),每次灶具开启时厨房运动传感器均显示有人(Occupancy = 1),且厨房温度传感器会短暂报告 None(可能是灶具近距离热辐射导致),而 15:50 这次灶具开启后温度传感器并未报告 None,反而报告了异常高温数值,说明热源扩散范围更广。", "推理步骤4: 直到 16:10 才检测到有人进入厨房(Occupancy = 1),意味着灶具在无人看管状态下运行了约 20 分钟。对于独居老人家庭,这是严重的安全隐患。", "推理步骤5: 日志中未记录灶具在 16:10 之后被关闭的事件,下一次灶具相关记录是 17:09 重新开启,中间缺少明确的关闭记录,存在灶具长时间运行的可能性。", "推理步骤6: 15:50 的事件日志格式也与其他正常事件不同(缺少完整的 Cluster 前缀),可能暗示该操作来源异常(如远程误触发或设备故障自启动),而非老人手动操作。"], "key_evidence": ["15:50 灶具开启时 kitchen_occupancy = 0(无人),与当天其他三次烹饪时 occupancy = 1 形成鲜明对比", "灶具无人看管运行约 20 分钟(15:50 至 16:10 才有人进入厨房)", "厨房温度在 15:55 和 16:20 分别飙升至 27.00°C 和 27.50°C,显著高于同时段其他房间及 16:00 定时采集的 24.99°C,温升异常", "灶具开启后缺少明确的关闭记录,下一条灶具记录为 17:09 重新开启"], "recommended_actions": ["立即确认厨房灶具当前状态,如仍在运行应远程关闭", "联系老人确认是否本人操作,排除设备故障自启动的可能", "检查灶具设备是否存在固件异常或误触发问题,必要时进行维修或更换", "建议为灶具配置安全规则:当厨房无人超过 5 分钟时自动关闭灶具并发送告警", "建议为灶具设置最长连续运行时间限制(如 60 分钟),超时自动断电", "检查厨房烟雾报警器(kitchen_smoke_alarm)是否工作正常,整个过程中未见其触发任何事件"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.582378387451172, "api_error": null} {"episode_id": "SQ2_FP_D_0360", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0360.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20260989, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-16T21:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 在整天的日志中,kitchen_temp_sensor 共出现 4 次 MeasuredValue = None(05:53、06:34、10:54、11:28、17:09、17:30),均发生在灶具开启或关闭前后。正常温度传感器不应因附近设备工作而丢失读数。\",\n \"推理步骤2: 对比 living_room_temp_sensor 和 bedroom_temp_sensor,它们全天每半小时稳定上报数值,从未出现 None 值,说明这不是系统级通信问题,而是 kitchen_temp_sensor 的个体问题。\",\n \"推理步骤3: 厨房温度传感器在灶具使用期间失去读数,可能原因包括:传感器受高温影响导致暂时失灵、传感器与灶具存在电磁干扰、或传感器本身硬件老化。对于独居老人家庭,厨房温度监控是防火安全的关键环节,传感器不可靠会削弱火灾预警能力。\",\n \"推理步骤4: 其余行为模式均属正常——老人 05:33 起床、洗漱、做早餐,07:01 手动开锁外出并自动上锁,08:26 回家,12:35 午休拉窗帘、13:53 起床,17:08 做晚餐,20:42 就寝关灯拉窗帘,作息规律合理。\",\n \"推理步骤5: 21:17 卫生间漏水传感器短暂触发(2 分钟后恢复),同时有人在卫生间且灯亮着,推测是老人夜间如厕时少量溅水触发,属于短暂误触或轻微溅水,已自行恢复,暂不构成严重威胁,但值得关注。\",\n \"推理步骤6: 入户门在 08:26 开锁进入后,直到 20:42 才记录到上锁事件,中间长达约 12 小时门锁状态未明确记录为已锁。虽然可能是日志未记录中间状态,但对独居老人而言,长时间门锁状态不明是一个安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间多次报告 MeasuredValue = None(05:53、06:34、10:54、11:28、17:09、17:30),共 6 次异常读数\",\n \"同期 living_room_temp_sensor 和 bedroom_temp_sensor 始终正常上报,排除系统性故障\",\n \"21:17 卫生间漏水传感器短暂触发 2 分钟后自动恢复\",\n \"08:26 入户门开锁后至 20:42 期间无门锁关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数\",\n \"对厨房温度传感器进行硬件检测或固件更新,必要时更换设备,确保厨房火灾预警能力不受影响\",\n \"检查卫生间漏水传感器的安装位置,确认是否容易被正常用水溅到导致误报;同时排查卫生间管道是否有轻微渗漏\",\n \"确认入户门锁在老人回家后是否正常上锁,建议设置「进门后自动上锁」或「长时间未锁门提醒」功能,保障独居老人安全\",\n \"考虑为厨房增加冗余温度监测手段(如额外的烟雾报警器灵敏度校验),避免单点传感器故障导致安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 在整天的日志中,kitchen_temp_sensor 共出现 4 次 MeasuredValue = None(05:53、06:34、10:54、11:28、17:09、17:30),均发生在灶具开启或关闭前后。正常温度传感器不应因附近设备工作而丢失读数。", "推理步骤2: 对比 living_room_temp_sensor 和 bedroom_temp_sensor,它们全天每半小时稳定上报数值,从未出现 None 值,说明这不是系统级通信问题,而是 kitchen_temp_sensor 的个体问题。", "推理步骤3: 厨房温度传感器在灶具使用期间失去读数,可能原因包括:传感器受高温影响导致暂时失灵、传感器与灶具存在电磁干扰、或传感器本身硬件老化。对于独居老人家庭,厨房温度监控是防火安全的关键环节,传感器不可靠会削弱火灾预警能力。", "推理步骤4: 其余行为模式均属正常——老人 05:33 起床、洗漱、做早餐,07:01 手动开锁外出并自动上锁,08:26 回家,12:35 午休拉窗帘、13:53 起床,17:08 做晚餐,20:42 就寝关灯拉窗帘,作息规律合理。", "推理步骤5: 21:17 卫生间漏水传感器短暂触发(2 分钟后恢复),同时有人在卫生间且灯亮着,推测是老人夜间如厕时少量溅水触发,属于短暂误触或轻微溅水,已自行恢复,暂不构成严重威胁,但值得关注。", "推理步骤6: 入户门在 08:26 开锁进入后,直到 20:42 才记录到上锁事件,中间长达约 12 小时门锁状态未明确记录为已锁。虽然可能是日志未记录中间状态,但对独居老人而言,长时间门锁状态不明是一个安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间多次报告 MeasuredValue = None(05:53、06:34、10:54、11:28、17:09、17:30),共 6 次异常读数", "同期 living_room_temp_sensor 和 bedroom_temp_sensor 始终正常上报,排除系统性故障", "21:17 卫生间漏水传感器短暂触发 2 分钟后自动恢复", "08:26 入户门开锁后至 20:42 期间无门锁关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数", "对厨房温度传感器进行硬件检测或固件更新,必要时更换设备,确保厨房火灾预警能力不受影响", "检查卫生间漏水传感器的安装位置,确认是否容易被正常用水溅到导致误报;同时排查卫生间管道是否有轻微渗漏", "确认入户门锁在老人回家后是否正常上锁,建议设置「进门后自动上锁」或「长时间未锁门提醒」功能,保障独居老人安全", "考虑为厨房增加冗余温度监测手段(如额外的烟雾报警器灵敏度校验),避免单点传感器故障导致安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.802939653396606, "api_error": null} {"episode_id": "SQ2_FP_D_0361", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0361.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20260990, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-29T07:15:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约 05:31 起床,05:56 做早餐,07:03 出门,08:32 回家,12:34 午休,16:58 做晚餐,20:36 就寝,符合独居老人的典型日常模式。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后约 30 秒内均报告 MeasuredValue = None(05:57、11:08、16:59),灶具关闭后约 1 分钟也报告 None(06:38、11:37、17:26)。这一现象在当天三次烹饪中 100% 复现,说明并非偶发通信丢包,而是传感器在灶具工作前后的系统性故障。\",\n \"推理步骤3: 厨房温度传感器是灶具安全监控的关键设备。如果传感器在灶具运行期间无法提供有效温度读数,系统将无法检测到厨房异常高温或干烧等危险情况。对于独居老人来说,这意味着火灾预警链条存在盲区。\",\n \"推理步骤4: 卫生间漏水传感器在 07:15 短暂触发(2 分钟后恢复),当时卫生间有人且灯亮,推断为正常用水溅水,非持续性漏水,不构成威胁。\",\n \"推理步骤5: 入户门在 08:32 解锁开门后未观察到重新上锁记录,而 20:37 的上锁事件是自动锁(Auto)触发。08:32 回家后门锁状态需确认,但考虑到老人在家且无入侵迹象(运动传感器轨迹连贯),风险较低。\",\n \"推理步骤6: 室内温度全天在 21.9°C~25.9°C 之间波动,属于夏季正常范围,未发现异常温升。烟雾报警器全天无触发,说明目前尚未发生实际火灾事件。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值:05:57:06、06:38:00、11:08:00、11:37:00、16:59:00、17:26:00\",\n \"故障模式高度一致:灶具开启后约 30 秒报 None,关闭后约 1 分钟报 None,三次烹饪全部复现\",\n \"厨房温度传感器在非烹饪时段读数正常(每 30 分钟正常上报),说明故障与灶具运行状态相关(可能是电磁干扰或热冲击导致)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰使传感器暂时失效\",\n \"对厨房温度传感器进行固件检查或更换,确保其在灶具运行期间能持续提供有效读数\",\n \"在传感器修复前,建议为灶具设置自动关闭定时器(如 30 分钟无操作自动断气/断电),作为补偿性安全措施\",\n \"确认 08:32 回家后入户门锁是否正常上锁,建议启用门锁未锁定超时提醒功能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约 05:31 起床,05:56 做早餐,07:03 出门,08:32 回家,12:34 午休,16:58 做晚餐,20:36 就寝,符合独居老人的典型日常模式。", "推理步骤2: 厨房温度传感器在灶具开启后约 30 秒内均报告 MeasuredValue = None(05:57、11:08、16:59),灶具关闭后约 1 分钟也报告 None(06:38、11:37、17:26)。这一现象在当天三次烹饪中 100% 复现,说明并非偶发通信丢包,而是传感器在灶具工作前后的系统性故障。", "推理步骤3: 厨房温度传感器是灶具安全监控的关键设备。如果传感器在灶具运行期间无法提供有效温度读数,系统将无法检测到厨房异常高温或干烧等危险情况。对于独居老人来说,这意味着火灾预警链条存在盲区。", "推理步骤4: 卫生间漏水传感器在 07:15 短暂触发(2 分钟后恢复),当时卫生间有人且灯亮,推断为正常用水溅水,非持续性漏水,不构成威胁。", "推理步骤5: 入户门在 08:32 解锁开门后未观察到重新上锁记录,而 20:37 的上锁事件是自动锁(Auto)触发。08:32 回家后门锁状态需确认,但考虑到老人在家且无入侵迹象(运动传感器轨迹连贯),风险较低。", "推理步骤6: 室内温度全天在 21.9°C~25.9°C 之间波动,属于夏季正常范围,未发现异常温升。烟雾报警器全天无触发,说明目前尚未发生实际火灾事件。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值:05:57:06、06:38:00、11:08:00、11:37:00、16:59:00、17:26:00", "故障模式高度一致:灶具开启后约 30 秒报 None,关闭后约 1 分钟报 None,三次烹饪全部复现", "厨房温度传感器在非烹饪时段读数正常(每 30 分钟正常上报),说明故障与灶具运行状态相关(可能是电磁干扰或热冲击导致)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰使传感器暂时失效", "对厨房温度传感器进行固件检查或更换,确保其在灶具运行期间能持续提供有效读数", "在传感器修复前,建议为灶具设置自动关闭定时器(如 30 分钟无操作自动断气/断电),作为补偿性安全措施", "确认 08:32 回家后入户门锁是否正常上锁,建议启用门锁未锁定超时提醒功能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.60190987586975, "api_error": null} {"episode_id": "SQ2_FP_D_0364", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0364.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260993, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-22T14:29:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,且厨房温度异常飙升至27°C以上,存在火灾隐患;同时厨房温度传感器多次报告None值,疑似设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 14:29 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy=0)。这是独居老人家庭,灶具在无人时被开启极为异常,可能是误触、远程误操作或设备故障。\",\n \"推理步骤2: 灶具开启后厨房温度快速攀升——14:34时厨房温度达到2700(27.00°C),14:59时进一步升至2750(27.50°C),相比14:00的2532(25.32°C)在30分钟内上升了约2.2°C,显著高于当日其他时段的自然温度波动。\",\n \"推理步骤3: 直到14:49(灶具开启20分钟后)厨房才检测到有人(Occupancy=1),意味着灶具在无人看管的情况下持续运行了至少20分钟。对于独居老人,这是严重的火灾风险场景。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:00:06、06:27、11:01、11:35、17:11、17:33),这种周期性的空值异常可能表明传感器在高温环境下出现故障或通信中断,削弱了火灾预警能力。\",\n \"推理步骤5: 对比当天其他三次正常烹饪(05:59-06:26、11:00-11:34、17:10-17:32),每次都有厨房运动传感器先检测到有人,然后灶具才开启,唯独14:29这次是灶具先开、人后到,模式明显异常。\",\n \"推理步骤6: 08:28老人回家时入户门解锁但日志中未见重新上锁记录(直到20:43才自动上锁),入户门在白天长时间处于未锁状态,虽非直接火灾风险,但对独居老人的整体安全防护不利。\"\n ],\n \"key_evidence\": [\n \"14:29 厨房灶具开启时 kitchen_occupancy=0(无人),灶具在无人状态下运行约20分钟\",\n \"14:34 厨房温度飙升至2700(27.00°C),14:59 进一步升至2750(27.50°C),远超同时段其他房间温度\",\n \"厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,传感器可能存在故障\",\n \"当天其他三次烹饪均为「先检测到人→再开灶具」,唯独14:29这次顺序相反\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具状态,确认是否仍在运行或存在残余高温,排除火灾隐患\",\n \"检修厨房温度传感器,排查多次报告None值的原因(可能是传感器过热保护、通信故障或硬件老化)\",\n \"为灶具设置安全联动规则:当厨房无人超过5分钟时自动关闭灶具,并向紧急联系人发送告警\",\n \"建议为独居老人安装灶具自动断气/断电保护装置,防止无人看管时的火灾风险\",\n \"检查入户门锁的自动上锁策略,建议设置离家后一定时间内自动上锁,避免长时间未锁定\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,且厨房温度异常飙升至27°C以上,存在火灾隐患;同时厨房温度传感器多次报告None值,疑似设备故障。", "reasoning": ["推理步骤1: 14:29 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy=0)。这是独居老人家庭,灶具在无人时被开启极为异常,可能是误触、远程误操作或设备故障。", "推理步骤2: 灶具开启后厨房温度快速攀升——14:34时厨房温度达到2700(27.00°C),14:59时进一步升至2750(27.50°C),相比14:00的2532(25.32°C)在30分钟内上升了约2.2°C,显著高于当日其他时段的自然温度波动。", "推理步骤3: 直到14:49(灶具开启20分钟后)厨房才检测到有人(Occupancy=1),意味着灶具在无人看管的情况下持续运行了至少20分钟。对于独居老人,这是严重的火灾风险场景。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:00:06、06:27、11:01、11:35、17:11、17:33),这种周期性的空值异常可能表明传感器在高温环境下出现故障或通信中断,削弱了火灾预警能力。", "推理步骤5: 对比当天其他三次正常烹饪(05:59-06:26、11:00-11:34、17:10-17:32),每次都有厨房运动传感器先检测到有人,然后灶具才开启,唯独14:29这次是灶具先开、人后到,模式明显异常。", "推理步骤6: 08:28老人回家时入户门解锁但日志中未见重新上锁记录(直到20:43才自动上锁),入户门在白天长时间处于未锁状态,虽非直接火灾风险,但对独居老人的整体安全防护不利。"], "key_evidence": ["14:29 厨房灶具开启时 kitchen_occupancy=0(无人),灶具在无人状态下运行约20分钟", "14:34 厨房温度飙升至2700(27.00°C),14:59 进一步升至2750(27.50°C),远超同时段其他房间温度", "厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,传感器可能存在故障", "当天其他三次烹饪均为「先检测到人→再开灶具」,唯独14:29这次顺序相反"], "recommended_actions": ["立即检查厨房灶具状态,确认是否仍在运行或存在残余高温,排除火灾隐患", "检修厨房温度传感器,排查多次报告None值的原因(可能是传感器过热保护、通信故障或硬件老化)", "为灶具设置安全联动规则:当厨房无人超过5分钟时自动关闭灶具,并向紧急联系人发送告警", "建议为独居老人安装灶具自动断气/断电保护装置,防止无人看管时的火灾风险", "检查入户门锁的自动上锁策略,建议设置离家后一定时间内自动上锁,避免长时间未锁定"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.984728813171387, "api_error": null} {"episode_id": "SQ2_FP_D_0365", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0365.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20260994, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-30T06:12:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致无法及时发现厨房高温/火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约 05:23 起床,05:30 如厕,06:04 进厨房做早餐,07:00 出门,08:27 回家,12:30 午休,13:52 起床,16:58 做晚餐,20:32 洗漱后约 20:37 就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入户门安全方面,06:12 出现一次 LockOperationError(OperationError=1, OperationSource=3 表示远程/密码操作失败),但 20 秒后同一用户(UserIndex=1)成功解锁,这更像是老人输错一次密码后重试成功,属于正常使用误操作,不构成入侵威胁。\",\n \"推理步骤3: 厨房温度传感器在三次灶具使用期间(06:05、10:55、16:59)以及灶具关闭后约 1 分钟(06:24、11:36、17:37)均报告 MeasuredValue = None。这意味着每次灶具开启时传感器就失效,灶具关闭后仍然报 None,直到下一个整点周期才恢复正常读数。\",\n \"推理步骤4: 温度传感器在灶具工作时正是最需要监测的时刻——如果发生干烧或油温过高,传感器无法提供有效数据,烟雾报警器虽然仍在工作,但缺少温度数据会削弱多传感器联动判断的能力。\",\n \"推理步骤5: 该故障模式高度可重复(3 次灶具使用,3 次传感器失效),排除偶发通信丢包的可能,更可能是传感器受灶具电磁干扰、高温影响导致读数溢出报 None,或固件存在 bug。\",\n \"推理步骤6: 温度数据整体趋势正常——夜间各房间约 22-23°C,白天峰值约 25.8°C,卧室始终比客厅低约 1°C,均在夏季合理范围内,无异常高温。\",\n \"推理步骤7: 门锁在 07:00 手动开锁出门后自动上锁,20:37 确认门已关闭并自动上锁,安防状态正常。窗户传感器全天无异常开启事件。漏水传感器和烟雾报警器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间 3 次报告 MeasuredValue = None(06:05、10:55、16:59),灶具关闭后仍报 None(06:24、11:36、17:37),直到下一个 30 分钟周期才恢复\",\n \"06:12 门锁出现一次 LockOperationError,但 20 秒后同一用户成功解锁,属于正常误操作而非入侵\",\n \"故障模式 100% 可重复:3 次灶具使用 = 3 次传感器失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数\",\n \"检查传感器固件版本,确认是否存在已知的数值溢出或通信超时 bug,必要时升级固件\",\n \"在传感器修复前,考虑增加厨房灶具自动关闭规则(如灶具开启超过 45 分钟且无人活动则自动关闭),弥补温度监测缺失的安全缺口\",\n \"建议将烟雾报警器的灵敏度适当提高,作为温度传感器失效期间的补偿措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致无法及时发现厨房高温/火灾风险。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约 05:23 起床,05:30 如厕,06:04 进厨房做早餐,07:00 出门,08:27 回家,12:30 午休,13:52 起床,16:58 做晚餐,20:32 洗漱后约 20:37 就寝,符合独居老人的典型日常规律。", "推理步骤2: 入户门安全方面,06:12 出现一次 LockOperationError(OperationError=1, OperationSource=3 表示远程/密码操作失败),但 20 秒后同一用户(UserIndex=1)成功解锁,这更像是老人输错一次密码后重试成功,属于正常使用误操作,不构成入侵威胁。", "推理步骤3: 厨房温度传感器在三次灶具使用期间(06:05、10:55、16:59)以及灶具关闭后约 1 分钟(06:24、11:36、17:37)均报告 MeasuredValue = None。这意味着每次灶具开启时传感器就失效,灶具关闭后仍然报 None,直到下一个整点周期才恢复正常读数。", "推理步骤4: 温度传感器在灶具工作时正是最需要监测的时刻——如果发生干烧或油温过高,传感器无法提供有效数据,烟雾报警器虽然仍在工作,但缺少温度数据会削弱多传感器联动判断的能力。", "推理步骤5: 该故障模式高度可重复(3 次灶具使用,3 次传感器失效),排除偶发通信丢包的可能,更可能是传感器受灶具电磁干扰、高温影响导致读数溢出报 None,或固件存在 bug。", "推理步骤6: 温度数据整体趋势正常——夜间各房间约 22-23°C,白天峰值约 25.8°C,卧室始终比客厅低约 1°C,均在夏季合理范围内,无异常高温。", "推理步骤7: 门锁在 07:00 手动开锁出门后自动上锁,20:37 确认门已关闭并自动上锁,安防状态正常。窗户传感器全天无异常开启事件。漏水传感器和烟雾报警器全天无告警。"], "key_evidence": ["厨房温度传感器在灶具开启期间 3 次报告 MeasuredValue = None(06:05、10:55、16:59),灶具关闭后仍报 None(06:24、11:36、17:37),直到下一个 30 分钟周期才恢复", "06:12 门锁出现一次 LockOperationError,但 20 秒后同一用户成功解锁,属于正常误操作而非入侵", "故障模式 100% 可重复:3 次灶具使用 = 3 次传感器失效"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数", "检查传感器固件版本,确认是否存在已知的数值溢出或通信超时 bug,必要时升级固件", "在传感器修复前,考虑增加厨房灶具自动关闭规则(如灶具开启超过 45 分钟且无人活动则自动关闭),弥补温度监测缺失的安全缺口", "建议将烟雾报警器的灵敏度适当提高,作为温度传感器失效期间的补偿措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.768739938735962, "api_error": null} {"episode_id": "SQ2_FP_D_0366", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0366.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20260995, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-10T15:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开关前后多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 4 次 MeasuredValue = None 的情况,分别发生在 05:54、06:40、11:02/11:39、17:10/17:36,每次都紧跟在灶具开启或关闭的时间点前后。\",\n \"推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(哪怕是超量程值),而非返回 None。None 值意味着传感器无法完成测量,可能是传感器受灶具热辐射影响导致暂时失效,或传感器本身存在硬件/通信故障。\",\n \"推理步骤3: 该传感器在灶具未使用的时段(如凌晨到清晨、下午)能正常报告温度值,说明故障与灶具使用存在强关联,但传感器不应因正常烹饪就丢失读数。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪期间恰好失效,将无法通过温度异常升高来提前发现忘关火等危险情况,形成监控盲区。\",\n \"推理步骤5: 其余设备行为均属正常——老人的作息规律合理(约 05:20 起床、06:56 出门、08:30 回家、12:36 午休、20:44 就寝),门锁开关操作正常,无入侵迹象,无漏水报警,烟雾报警器未触发,各房间温度随昼夜自然波动。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 05:54:07、06:40:00、11:02:00、11:39:00、17:10:00、17:36:00 共 6 次报告 MeasuredValue = None\",\n \"每次 None 值均出现在 kitchen_cook_surface 开启后约 30 秒至 1 分钟,或关闭后约 1 分钟内\",\n \"灶具未使用时段传感器读数正常,说明故障与灶具使用高度关联\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热辐射干扰,必要时重新选址安装\",\n \"对该温度传感器进行硬件检测或固件更新,排除设备本身的故障\",\n \"在传感器修复前,提醒老人烹饪时格外注意关火,或设置灶具使用超时自动断气/断电的安全规则\",\n \"考虑增加一个备用温度传感器或将烟雾报警器灵敏度适当提高,弥补烹饪期间的监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开关前后多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 4 次 MeasuredValue = None 的情况,分别发生在 05:54、06:40、11:02/11:39、17:10/17:36,每次都紧跟在灶具开启或关闭的时间点前后。", "推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(哪怕是超量程值),而非返回 None。None 值意味着传感器无法完成测量,可能是传感器受灶具热辐射影响导致暂时失效,或传感器本身存在硬件/通信故障。", "推理步骤3: 该传感器在灶具未使用的时段(如凌晨到清晨、下午)能正常报告温度值,说明故障与灶具使用存在强关联,但传感器不应因正常烹饪就丢失读数。", "推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪期间恰好失效,将无法通过温度异常升高来提前发现忘关火等危险情况,形成监控盲区。", "推理步骤5: 其余设备行为均属正常——老人的作息规律合理(约 05:20 起床、06:56 出门、08:30 回家、12:36 午休、20:44 就寝),门锁开关操作正常,无入侵迹象,无漏水报警,烟雾报警器未触发,各房间温度随昼夜自然波动。"], "key_evidence": ["kitchen_temp_sensor 在 05:54:07、06:40:00、11:02:00、11:39:00、17:10:00、17:36:00 共 6 次报告 MeasuredValue = None", "每次 None 值均出现在 kitchen_cook_surface 开启后约 30 秒至 1 分钟,或关闭后约 1 分钟内", "灶具未使用时段传感器读数正常,说明故障与灶具使用高度关联"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热辐射干扰,必要时重新选址安装", "对该温度传感器进行硬件检测或固件更新,排除设备本身的故障", "在传感器修复前,提醒老人烹饪时格外注意关火,或设置灶具使用超时自动断气/断电的安全规则", "考虑增加一个备用温度传感器或将烟雾报警器灵敏度适当提高,弥补烹饪期间的监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.58396291732788, "api_error": null} {"episode_id": "SQ2_FP_D_0373", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0373.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261002, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bedroom", "injection_time": "2026-06-19T10:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"午间厨房灶具在无人看管状态下持续运行约20分钟,且厨房温度出现异常飙升,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 10:52:30 厨房灶具开启,10:55:00 厨房运动传感器显示 Occupancy=0,说明老人在灶具开启仅2.5分钟后就离开了厨房。\",\n \"推理步骤2: 灶具从10:55无人看管一直持续到11:40才关闭,无人看管时长约45分钟。期间11:15老人短暂回到厨房(Occupancy=1),但灶具直到11:40才关闭。\",\n \"推理步骤3: 厨房温度在11:00出现两条读数——常规读数2545(约25.45°C)和一条异常读数2700(约27.0°C),11:25进一步升至2750(约27.5°C)。相比同时段客厅温度2542,厨房温度高出约2°C,且短时间内跳升明显,说明灶具周围热量持续积聚。\",\n \"推理步骤4: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None,表明传感器可能受高温干扰或存在故障,无法可靠监测厨房温度,这进一步增加了火灾风险的不可控性。\",\n \"推理步骤5: 该住户为独居老人,灶具无人看管是极高风险场景。老人可能因遗忘而离开厨房,这符合老年人常见的安全隐患模式。\"\n ],\n \"key_evidence\": [\n \"10:52:30 灶具开启 → 10:55:00 厨房 Occupancy=0,老人离开厨房但灶具仍在运行\",\n \"灶具无人看管持续约45分钟(10:55~11:40),远超安全阈值\",\n \"11:00 厨房温度异常读数2700,11:25升至2750,明显高于其他房间同期温度\",\n \"厨房温度传感器多次报告 None 值(05:53、06:29、10:53、11:41),传感器可靠性存疑\",\n \"住户为独居老人,无他人可协助监控灶具安全\"\n ],\n \"recommended_actions\": [\n \"设置自动化规则:当厨房灶具开启且运动传感器超过5分钟无人时,发送提醒通知给老人及紧急联系人\",\n \"设置灶具自动关闭策略:无人状态超过10分钟自动切断灶具电源\",\n \"检修厨房温度传感器,排查多次报告 None 值的原因,确保温度监测可靠\",\n \"考虑为厨房增加燃气泄漏传感器,与烟雾报警器形成多重安全防护\",\n \"建议紧急联系人关注老人日常用火习惯,评估是否需要更换为更安全的电磁灶等设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "午间厨房灶具在无人看管状态下持续运行约20分钟,且厨房温度出现异常飙升,存在火灾风险。", "reasoning": ["推理步骤1: 10:52:30 厨房灶具开启,10:55:00 厨房运动传感器显示 Occupancy=0,说明老人在灶具开启仅2.5分钟后就离开了厨房。", "推理步骤2: 灶具从10:55无人看管一直持续到11:40才关闭,无人看管时长约45分钟。期间11:15老人短暂回到厨房(Occupancy=1),但灶具直到11:40才关闭。", "推理步骤3: 厨房温度在11:00出现两条读数——常规读数2545(约25.45°C)和一条异常读数2700(约27.0°C),11:25进一步升至2750(约27.5°C)。相比同时段客厅温度2542,厨房温度高出约2°C,且短时间内跳升明显,说明灶具周围热量持续积聚。", "推理步骤4: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None,表明传感器可能受高温干扰或存在故障,无法可靠监测厨房温度,这进一步增加了火灾风险的不可控性。", "推理步骤5: 该住户为独居老人,灶具无人看管是极高风险场景。老人可能因遗忘而离开厨房,这符合老年人常见的安全隐患模式。"], "key_evidence": ["10:52:30 灶具开启 → 10:55:00 厨房 Occupancy=0,老人离开厨房但灶具仍在运行", "灶具无人看管持续约45分钟(10:55~11:40),远超安全阈值", "11:00 厨房温度异常读数2700,11:25升至2750,明显高于其他房间同期温度", "厨房温度传感器多次报告 None 值(05:53、06:29、10:53、11:41),传感器可靠性存疑", "住户为独居老人,无他人可协助监控灶具安全"], "recommended_actions": ["设置自动化规则:当厨房灶具开启且运动传感器超过5分钟无人时,发送提醒通知给老人及紧急联系人", "设置灶具自动关闭策略:无人状态超过10分钟自动切断灶具电源", "检修厨房温度传感器,排查多次报告 None 值的原因,确保温度监测可靠", "考虑为厨房增加燃气泄漏传感器,与烟雾报警器形成多重安全防护", "建议紧急联系人关注老人日常用火习惯,评估是否需要更换为更安全的电磁灶等设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.47248387336731, "api_error": null} {"episode_id": "SQ2_FP_D_0374", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_FP_D_0374.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20261003, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-20T06:21:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None,这一现象在当天三次烹饪期间(06:07、10:58、17:01)均重复出现,且灶具关闭后也会再次报告 None(06:30第一条、11:36、17:32),说明这不是偶发故障而是系统性问题。\",\n \"推理步骤2: 灶具运行期间恰恰是厨房最需要温度监控的时段——高温可能引发火灾。传感器在此关键时段失效意味着即使厨房温度异常升高,系统也无法检测和报警。对于独居老人家庭,这一安全盲区尤其危险。\",\n \"推理步骤3: 从 None 值出现的时间规律来看,可能是灶具工作时产生的热辐射、电磁干扰或温度超出传感器量程导致传感器读数异常返回空值。传感器本身可能存在硬件老化或安装位置不当的问题。\",\n \"推理步骤4: 除传感器问题外,其余日志中老人的生活轨迹基本正常——05:20起床、05:45洗漱、06:06做早餐、06:50出门晨练、08:40回家、12:27午休、13:51起床、17:00做晚餐、20:29洗漱、20:39就寝,作息规律合理。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤5: 另外注意到 06:21 卧室有一组快速事件(运动检测→灯开→窗户传感器 StateValue=False 即窗户打开→灯关→运动消失),结合老人已在厨房做饭,这可能是老人短暂回卧室开窗通风,属正常行为。但卧室窗户在老人出门期间(06:50-08:40)保持打开状态,存在轻微安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:07、10:58、17:01)及灶具关闭后(06:30、11:36、17:32)共6次报告 MeasuredValue = None\",\n \"每次 None 值均在灶具 OnOff 状态变化后约30秒内出现,呈现高度规律性的关联模式\",\n \"烟雾报警器(kitchen_smoke_alarm)全天未触发任何事件,说明当天未发生实际火灾,但传感器故障使得未来风险不可监测\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射超出量程或电磁干扰,必要时重新定位安装\",\n \"对厨房温度传感器进行硬件诊断或更换,确保其在高温环境下仍能正常报告数值而非返回 None\",\n \"在传感器修复前,建议为灶具设置自动关闭定时器(如30-40分钟无操作自动断气/断电),作为独居老人的额外安全保障\",\n \"考虑提醒老人出门前关闭卧室窗户,或设置离家模式自动检查窗户状态并发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None,这一现象在当天三次烹饪期间(06:07、10:58、17:01)均重复出现,且灶具关闭后也会再次报告 None(06:30第一条、11:36、17:32),说明这不是偶发故障而是系统性问题。", "推理步骤2: 灶具运行期间恰恰是厨房最需要温度监控的时段——高温可能引发火灾。传感器在此关键时段失效意味着即使厨房温度异常升高,系统也无法检测和报警。对于独居老人家庭,这一安全盲区尤其危险。", "推理步骤3: 从 None 值出现的时间规律来看,可能是灶具工作时产生的热辐射、电磁干扰或温度超出传感器量程导致传感器读数异常返回空值。传感器本身可能存在硬件老化或安装位置不当的问题。", "推理步骤4: 除传感器问题外,其余日志中老人的生活轨迹基本正常——05:20起床、05:45洗漱、06:06做早餐、06:50出门晨练、08:40回家、12:27午休、13:51起床、17:00做晚餐、20:29洗漱、20:39就寝,作息规律合理。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤5: 另外注意到 06:21 卧室有一组快速事件(运动检测→灯开→窗户传感器 StateValue=False 即窗户打开→灯关→运动消失),结合老人已在厨房做饭,这可能是老人短暂回卧室开窗通风,属正常行为。但卧室窗户在老人出门期间(06:50-08:40)保持打开状态,存在轻微安全隐患。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:07、10:58、17:01)及灶具关闭后(06:30、11:36、17:32)共6次报告 MeasuredValue = None", "每次 None 值均在灶具 OnOff 状态变化后约30秒内出现,呈现高度规律性的关联模式", "烟雾报警器(kitchen_smoke_alarm)全天未触发任何事件,说明当天未发生实际火灾,但传感器故障使得未来风险不可监测"], "recommended_actions": ["立即检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射超出量程或电磁干扰,必要时重新定位安装", "对厨房温度传感器进行硬件诊断或更换,确保其在高温环境下仍能正常报告数值而非返回 None", "在传感器修复前,建议为灶具设置自动关闭定时器(如30-40分钟无操作自动断气/断电),作为独居老人的额外安全保障", "考虑提醒老人出门前关闭卧室窗户,或设置离家模式自动检查窗户状态并发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.626779556274414, "api_error": null} {"episode_id": "SQ2_TN_A_0379", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0379.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261008, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度从 18:30 的 2470(24.70°C)突然跳升至 2831(28.31°C),升幅约 3.6°C,而此时灶具尚未开启(19:11 才开),且客厅和卧室温度同期在正常下降,排除环境整体升温的可能。\",\n \"推理步骤2: 19:12 和 19:47 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这在 Matter 协议中表示传感器无法提供有效测量值,属于设备异常状态。整天其他传感器从未出现过 null 读数。\",\n \"推理步骤3: 19:30 温度仍为 2835(28.35°C),与 19:00 的异常高值一致,进一步印证传感器在该时段读数不可靠。直到 20:00 温度恢复为 2408(24.08°C),与客厅温度基本一致,说明传感器可能短暂恢复正常。\",\n \"推理步骤4: 灶具在 19:11-19:46 期间运行,烹饪确实会使厨房升温,但异常高温出现在灶具开启之前(19:00),且 null 值出现在灶具运行期间,说明这不是单纯的烹饪升温,而是传感器本身存在问题。\",\n \"推理步骤5: 其余家庭行为模式完全正常——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作合规,无入侵迹象。烟雾报警器未触发,排除火灾风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.70°C 异常跳升至 28.31°C,灶具尚未开启,其他房间温度正常下降\",\n \"19:12 和 19:47 厨房温度传感器两次报告 MeasuredValue = None,全天唯一出现空值的传感器\",\n \"19:30 厨房温度仍为 28.35°C 的异常高值,20:00 恢复至 24.08°C 与其他房间一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和接线,确认是否受到灶具热辐射直接影响或存在松动\",\n \"查看传感器固件版本,考虑重置或更新固件以排除软件故障\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其正常工作,避免因温度传感器失效而遗漏火灾预警\",\n \"持续监控该传感器后续是否再次出现 null 值或异常跳变,若反复出现建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题", "reasoning": ["推理步骤1: 19:00 厨房温度从 18:30 的 2470(24.70°C)突然跳升至 2831(28.31°C),升幅约 3.6°C,而此时灶具尚未开启(19:11 才开),且客厅和卧室温度同期在正常下降,排除环境整体升温的可能。", "推理步骤2: 19:12 和 19:47 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这在 Matter 协议中表示传感器无法提供有效测量值,属于设备异常状态。整天其他传感器从未出现过 null 读数。", "推理步骤3: 19:30 温度仍为 2835(28.35°C),与 19:00 的异常高值一致,进一步印证传感器在该时段读数不可靠。直到 20:00 温度恢复为 2408(24.08°C),与客厅温度基本一致,说明传感器可能短暂恢复正常。", "推理步骤4: 灶具在 19:11-19:46 期间运行,烹饪确实会使厨房升温,但异常高温出现在灶具开启之前(19:00),且 null 值出现在灶具运行期间,说明这不是单纯的烹饪升温,而是传感器本身存在问题。", "推理步骤5: 其余家庭行为模式完全正常——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作合规,无入侵迹象。烟雾报警器未触发,排除火灾风险。"], "key_evidence": ["19:00 厨房温度从 24.70°C 异常跳升至 28.31°C,灶具尚未开启,其他房间温度正常下降", "19:12 和 19:47 厨房温度传感器两次报告 MeasuredValue = None,全天唯一出现空值的传感器", "19:30 厨房温度仍为 28.35°C 的异常高值,20:00 恢复至 24.08°C 与其他房间一致"], "recommended_actions": ["检查厨房温度传感器的安装位置和接线,确认是否受到灶具热辐射直接影响或存在松动", "查看传感器固件版本,考虑重置或更新固件以排除软件故障", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其正常工作,避免因温度传感器失效而遗漏火灾预警", "持续监控该传感器后续是否再次出现 null 值或异常跳变,若反复出现建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.71122431755066, "api_error": null} {"episode_id": "SQ2_TN_A_0378", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0378.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261007, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现两次异常:18:00 时在无人使用灶具的情况下温度骤升至 28.65°C(疑似故障或异常热源),且在 18:57 和 19:54 两次报告 None 值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 从 00:00 到 17:30,厨房温度传感器读数在 22.91°C ~ 25.59°C 之间平稳波动,符合夏季室内自然温度变化规律。\",\n \"推理步骤2: 18:00 时厨房温度突然跳升至 28.65°C,较 17:30 的 24.81°C 骤升近 3.8°C。此时灶具(kitchen_cook_surface)尚未开启(灶具在 18:56:30 才开启),住户也尚未回家(18:30 才开门),厨房内无任何活动能解释这一异常升温。\",\n \"推理步骤3: 18:30 时厨房温度仍为 28.62°C,维持异常高位。但到 19:00 灶具已开启数分钟后,温度反而回落至 24.36°C,这与灶具使用时温度应上升的预期相矛盾,进一步说明 18:00-18:30 的高温读数是传感器异常而非真实温度。\",\n \"推理步骤4: 18:57 和 19:54 两个时间点,厨房温度传感器报告 MeasuredValue = None,表示传感器未能返回有效测量值。两次 None 出现间隔约 1 小时,说明传感器存在间歇性故障。\",\n \"推理步骤5: 排除火灾风险——厨房烟雾报警器(kitchen_smoke_alarm)全天无任何触发事件,且异常温度出现时厨房无人、无设备运行,19:00 之后温度恢复正常范围,不支持真实火灾或异常热源的判断。\",\n \"推理步骤6: 其余所有设备行为均正常——住户早晨 6:22 起床、7:36 出门上锁、18:30 回家开门,作息规律;门锁操作均为合法方式(Manual 开锁 + Auto 自动上锁);空调、灯光、窗帘操作与人员活动一致;洗碗机正常启动;卫生间漏水传感器无报警。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度骤升至 2865(28.65°C),较前一读数 2481(24.81°C)异常上升约 3.84°C,此时厨房无人且无设备运行\",\n \"18:57 和 19:54 厨房温度传感器两次报告 MeasuredValue = None,表明传感器间歇性失效\",\n \"18:30 温度仍为 2862(28.62°C),但 19:00 灶具开启后温度反而降至 2436(24.36°C),与物理规律矛盾\",\n \"全天烟雾报警器无触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到阳光直射或其他热源干扰\",\n \"观察未来几天该传感器是否继续出现 None 值或异常跳变,若持续出现建议更换传感器\",\n \"在传感器修复前,可适当降低基于厨房温度的自动化规则灵敏度,避免误触发或漏触发告警\",\n \"确认厨房窗户(19:53 打开)是否已关闭,夜间开窗可能带来安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现两次异常:18:00 时在无人使用灶具的情况下温度骤升至 28.65°C(疑似故障或异常热源),且在 18:57 和 19:54 两次报告 None 值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 从 00:00 到 17:30,厨房温度传感器读数在 22.91°C ~ 25.59°C 之间平稳波动,符合夏季室内自然温度变化规律。", "推理步骤2: 18:00 时厨房温度突然跳升至 28.65°C,较 17:30 的 24.81°C 骤升近 3.8°C。此时灶具(kitchen_cook_surface)尚未开启(灶具在 18:56:30 才开启),住户也尚未回家(18:30 才开门),厨房内无任何活动能解释这一异常升温。", "推理步骤3: 18:30 时厨房温度仍为 28.62°C,维持异常高位。但到 19:00 灶具已开启数分钟后,温度反而回落至 24.36°C,这与灶具使用时温度应上升的预期相矛盾,进一步说明 18:00-18:30 的高温读数是传感器异常而非真实温度。", "推理步骤4: 18:57 和 19:54 两个时间点,厨房温度传感器报告 MeasuredValue = None,表示传感器未能返回有效测量值。两次 None 出现间隔约 1 小时,说明传感器存在间歇性故障。", "推理步骤5: 排除火灾风险——厨房烟雾报警器(kitchen_smoke_alarm)全天无任何触发事件,且异常温度出现时厨房无人、无设备运行,19:00 之后温度恢复正常范围,不支持真实火灾或异常热源的判断。", "推理步骤6: 其余所有设备行为均正常——住户早晨 6:22 起床、7:36 出门上锁、18:30 回家开门,作息规律;门锁操作均为合法方式(Manual 开锁 + Auto 自动上锁);空调、灯光、窗帘操作与人员活动一致;洗碗机正常启动;卫生间漏水传感器无报警。"], "key_evidence": ["18:00 厨房温度骤升至 2865(28.65°C),较前一读数 2481(24.81°C)异常上升约 3.84°C,此时厨房无人且无设备运行", "18:57 和 19:54 厨房温度传感器两次报告 MeasuredValue = None,表明传感器间歇性失效", "18:30 温度仍为 2862(28.62°C),但 19:00 灶具开启后温度反而降至 2436(24.36°C),与物理规律矛盾", "全天烟雾报警器无触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到阳光直射或其他热源干扰", "观察未来几天该传感器是否继续出现 None 值或异常跳变,若持续出现建议更换传感器", "在传感器修复前,可适当降低基于厨房温度的自动化规则灵敏度,避免误触发或漏触发告警", "确认厨房窗户(19:53 打开)是否已关闭,夜间开窗可能带来安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.860540628433228, "api_error": null} {"episode_id": "SQ2_TN_A_0382", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0382.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261011, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次 None 空值,疑似传感器故障;同时入户门在住户回家时未关闭长达近4小时。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~2490(约24.9°C)跳升至 2865(约28.65°C),升幅近4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度仍为 2864,但此时灶具尚未开启(灶具 18:45 才打开),说明这个高温读数并非烹饪导致,更像是传感器异常。\",\n \"推理步骤3: 18:46 和 19:34 厨房温度传感器两次报告 MeasuredValue = None(空值),表明传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回 None。\",\n \"推理步骤4: 19:00 温度恢复为 2435 后传感器又在 19:34 报 None,随后 20:00 恢复正常,这种间歇性故障模式进一步指向硬件或连接问题。\",\n \"推理步骤5: 入户门方面——住户 18:07 开锁进门(front_door_contact = False 表示门开),但直到 21:54:38 门才关闭(StateValue = True)并自动上锁。门开状态持续了近 3 小时 47 分钟,这对于一室一厅的住户来说异常偏长,存在安全隐患。\",\n \"推理步骤6: 其余行为模式正常——住户 06:30 起床、07:40 出门、18:07 回家、做饭、看电视、22:40 就寝,符合单人上班族的典型作息,不存在入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~2490 骤升至 2865(+3.75°C),灶具当时未开启,客厅/卧室温度正常下降\",\n \"18:46 和 19:34 厨房温度传感器两次报告 MeasuredValue = None\",\n \"18:07 入户门打开后直到 21:54 才关闭,门处于未关状态近 3 小时 47 分钟\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和无线连接质量,清洁探头或考虑更换传感器\",\n \"设置入户门长时间未关闭的告警规则(建议阈值 5-10 分钟),及时提醒住户关门\",\n \"持续监控厨房温度传感器未来几天的读数,确认 None 值是否反复出现以判断是否需要更换\",\n \"考虑为入户门添加自动关门器或设置未锁门提醒,避免长时间敞开带来的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次 None 空值,疑似传感器故障;同时入户门在住户回家时未关闭长达近4小时。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~2490(约24.9°C)跳升至 2865(约28.65°C),升幅近4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度仍为 2864,但此时灶具尚未开启(灶具 18:45 才打开),说明这个高温读数并非烹饪导致,更像是传感器异常。", "推理步骤3: 18:46 和 19:34 厨房温度传感器两次报告 MeasuredValue = None(空值),表明传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回 None。", "推理步骤4: 19:00 温度恢复为 2435 后传感器又在 19:34 报 None,随后 20:00 恢复正常,这种间歇性故障模式进一步指向硬件或连接问题。", "推理步骤5: 入户门方面——住户 18:07 开锁进门(front_door_contact = False 表示门开),但直到 21:54:38 门才关闭(StateValue = True)并自动上锁。门开状态持续了近 3 小时 47 分钟,这对于一室一厅的住户来说异常偏长,存在安全隐患。", "推理步骤6: 其余行为模式正常——住户 06:30 起床、07:40 出门、18:07 回家、做饭、看电视、22:40 就寝,符合单人上班族的典型作息,不存在入侵迹象。"], "key_evidence": ["18:00 厨房温度从 ~2490 骤升至 2865(+3.75°C),灶具当时未开启,客厅/卧室温度正常下降", "18:46 和 19:34 厨房温度传感器两次报告 MeasuredValue = None", "18:07 入户门打开后直到 21:54 才关闭,门处于未关状态近 3 小时 47 分钟"], "recommended_actions": ["检查厨房温度传感器的硬件状态和无线连接质量,清洁探头或考虑更换传感器", "设置入户门长时间未关闭的告警规则(建议阈值 5-10 分钟),及时提醒住户关门", "持续监控厨房温度传感器未来几天的读数,确认 None 值是否反复出现以判断是否需要更换", "考虑为入户门添加自动关门器或设置未锁门提醒,避免长时间敞开带来的安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.676645040512085, "api_error": null} {"episode_id": "SQ2_TN_A_0385", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0385.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261014, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:38 起床,07:35 出门上班并自动锁门,18:13 回家开灯开空调,19:10 做饭,22:15 转入卧室就寝,22:38 关灯睡觉。入侵、漏水、火灾等威胁均无迹象。\",\n \"推理步骤2: 厨房温度传感器在 19:00 突然从 ~24.5°C 跳升至 28.27°C,19:30 进一步升至 28.45°C。虽然 19:10 灶具开启可以解释一定程度的升温,但在灶具尚未开启的 19:00 就已出现近 4°C 的瞬间跳变,幅度异常偏大。\",\n \"推理步骤3: 更关键的是,厨房温度传感器在 19:11 和 19:36 两次报告 MeasuredValue = None(空值)。Matter 协议下温度传感器返回 null 通常表示测量失败或传感器通信异常,这在全天其他时段从未出现过。\",\n \"推理步骤4: 烟雾报警器全天未触发任何事件,排除了真实火灾风险。灶具在 19:35 正常关闭,住户随后开窗通风(厨房窗户传感器 19:35:30 打开),行为合理。\",\n \"推理步骤5: 综合判断:厨房温度传感器可能因安装位置过于靠近灶具,在高温烹饪时受热干扰导致读数跳变和测量失败。虽不构成即时安全威胁,但传感器故障会导致未来无法可靠监测厨房温度异常(如真实火灾),属于需要关注的设备健康问题。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.5°C 瞬间跳至 28.27°C(灶具 19:10 才开启,跳变发生在灶具开启之前)\",\n \"19:11 和 19:36 厨房温度传感器两次报告 MeasuredValue = None,全天仅此两次\",\n \"烟雾报警器全天无告警,排除真实火灾\",\n \"其他所有设备行为和住户活动模式均正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰\",\n \"对厨房温度传感器进行诊断或校准,确认 null 值是否为硬件故障的前兆\",\n \"如传感器持续出现 null 读数,建议更换传感器或调整安装位置,确保厨房温度监测的可靠性\",\n \"可考虑设置自动化规则:当厨房温度传感器报告 null 时发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:38 起床,07:35 出门上班并自动锁门,18:13 回家开灯开空调,19:10 做饭,22:15 转入卧室就寝,22:38 关灯睡觉。入侵、漏水、火灾等威胁均无迹象。", "推理步骤2: 厨房温度传感器在 19:00 突然从 ~24.5°C 跳升至 28.27°C,19:30 进一步升至 28.45°C。虽然 19:10 灶具开启可以解释一定程度的升温,但在灶具尚未开启的 19:00 就已出现近 4°C 的瞬间跳变,幅度异常偏大。", "推理步骤3: 更关键的是,厨房温度传感器在 19:11 和 19:36 两次报告 MeasuredValue = None(空值)。Matter 协议下温度传感器返回 null 通常表示测量失败或传感器通信异常,这在全天其他时段从未出现过。", "推理步骤4: 烟雾报警器全天未触发任何事件,排除了真实火灾风险。灶具在 19:35 正常关闭,住户随后开窗通风(厨房窗户传感器 19:35:30 打开),行为合理。", "推理步骤5: 综合判断:厨房温度传感器可能因安装位置过于靠近灶具,在高温烹饪时受热干扰导致读数跳变和测量失败。虽不构成即时安全威胁,但传感器故障会导致未来无法可靠监测厨房温度异常(如真实火灾),属于需要关注的设备健康问题。"], "key_evidence": ["19:00 厨房温度从 ~24.5°C 瞬间跳至 28.27°C(灶具 19:10 才开启,跳变发生在灶具开启之前)", "19:11 和 19:36 厨房温度传感器两次报告 MeasuredValue = None,全天仅此两次", "烟雾报警器全天无告警,排除真实火灾", "其他所有设备行为和住户活动模式均正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰", "对厨房温度传感器进行诊断或校准,确认 null 值是否为硬件故障的前兆", "如传感器持续出现 null 读数,建议更换传感器或调整安装位置,确保厨房温度监测的可靠性", "可考虑设置自动化规则:当厨房温度传感器报告 null 时发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.763967037200928, "api_error": null} {"episode_id": "SQ2_TN_A_0400", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0400.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261029, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 29.88°C,疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内共 4 次报告 MeasuredValue = None(09:01、09:54、12:15、12:54、17:54、18:55),均发生在灶具开启或关闭前后。传感器不应因灶具工作而丢失读数,这表明传感器可能存在故障或安装位置不当,受灶具热辐射影响导致超量程。\",\n \"推理步骤2: 12:00 厨房温度传感器读数为 2988(即 29.88°C),而同一时刻客厅为 25.85°C、卧室为 24.77°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 12:14 才开启)。这一异常高温读数无法用正常烹饪解释,可能是传感器漂移或受残余热量影响。\",\n \"推理步骤3: 12:30 厨房温度仍为 29.87°C(灶具刚开启约 16 分钟),而 13:00 灶具关闭后温度骤降至 25.51°C,降幅达 4.36°C,这种剧烈波动不符合正常物理降温曲线,进一步佐证传感器读数不可靠。\",\n \"推理步骤4: 其余家庭活动均属正常模式——住户约 08:32 起床、三餐规律做饭、22:47 就寝并自动锁门,运动传感器、门锁、灯光等设备行为与单人居住的日常作息完全吻合,不存在入侵或其他安全威胁迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(09:01、09:54、12:15、12:54、17:54、18:55),共计 6 次丢失读数\",\n \"12:00 厨房温度异常飙升至 29.88°C,此时灶具尚未开启,比客厅高出约 4°C\",\n \"12:30 至 13:00 期间温度从 29.87°C 骤降至 25.51°C,降幅异常剧烈\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确保其远离灶具热源,避免热辐射直接影响读数\",\n \"对厨房温度传感器进行校准或更换,排除硬件故障导致的 None 值和异常读数\",\n \"考虑为厨房温度传感器设置合理的告警阈值,当读数为 None 或超出正常范围时及时通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 29.88°C,疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内共 4 次报告 MeasuredValue = None(09:01、09:54、12:15、12:54、17:54、18:55),均发生在灶具开启或关闭前后。传感器不应因灶具工作而丢失读数,这表明传感器可能存在故障或安装位置不当,受灶具热辐射影响导致超量程。", "推理步骤2: 12:00 厨房温度传感器读数为 2988(即 29.88°C),而同一时刻客厅为 25.85°C、卧室为 24.77°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 12:14 才开启)。这一异常高温读数无法用正常烹饪解释,可能是传感器漂移或受残余热量影响。", "推理步骤3: 12:30 厨房温度仍为 29.87°C(灶具刚开启约 16 分钟),而 13:00 灶具关闭后温度骤降至 25.51°C,降幅达 4.36°C,这种剧烈波动不符合正常物理降温曲线,进一步佐证传感器读数不可靠。", "推理步骤4: 其余家庭活动均属正常模式——住户约 08:32 起床、三餐规律做饭、22:47 就寝并自动锁门,运动传感器、门锁、灯光等设备行为与单人居住的日常作息完全吻合,不存在入侵或其他安全威胁迹象。"], "key_evidence": ["厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(09:01、09:54、12:15、12:54、17:54、18:55),共计 6 次丢失读数", "12:00 厨房温度异常飙升至 29.88°C,此时灶具尚未开启,比客厅高出约 4°C", "12:30 至 13:00 期间温度从 29.87°C 骤降至 25.51°C,降幅异常剧烈"], "recommended_actions": ["检查厨房温度传感器的安装位置,确保其远离灶具热源,避免热辐射直接影响读数", "对厨房温度传感器进行校准或更换,排除硬件故障导致的 None 值和异常读数", "考虑为厨房温度传感器设置合理的告警阈值,当读数为 None 或超出正常范围时及时通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.553146362304688, "api_error": null} {"episode_id": "SQ2_TN_A_0397", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0397.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261026, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数跳变及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭后开启但日志中未见关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在18:30为24.63°C,到19:00突然跳升至28.32°C,30分钟内上升约3.7°C,而同时段客厅和卧室温度仅正常小幅下降。这一跳变幅度远超正常环境波动。\",\n \"推理步骤2: 然而灶具(cook_surface)直到19:09:30才开启,19:00时灶具尚未使用,因此28.32°C的高温读数无法用烹饪解释。这表明传感器可能在19:00前后已出现异常。\",\n \"推理步骤3: 在19:10和19:39,厨房温度传感器连续两次报告MeasuredValue = None(空值),说明传感器数据采集中断或传感器本身发生故障。正常传感器不应返回None。\",\n \"推理步骤4: 19:30时厨房温度仍为28.31°C(灶具已开启约20分钟,此时高温可部分解释),但到20:00灶具关闭后温度迅速回落至24.05°C,回落速度合理。结合19:00的异常跳变和两次None值,传感器可靠性存疑。\",\n \"推理步骤5: 厨房窗户在19:38:30被打开(StateValue=False),但在整个日志周期内未见关闭事件。住户23:00已入睡,厨房窗户整夜敞开存在安全隐患(入侵风险、雨水等)。\",\n \"推理步骤6: 其余行为模式正常——住户06:18起床、07:16出门上班、18:30回家、23:00入睡,门锁开关、灯光、空调使用均符合单人一室一厅的日常作息。\"\n ],\n \"key_evidence\": [\n \"厨房温度在19:00异常跳升至2832(28.32°C),此时灶具尚未开启(19:09才开),无法用烹饪解释\",\n \"厨房温度传感器在19:10和19:39两次报告MeasuredValue = None,表明传感器数据采集异常\",\n \"厨房窗户19:38打开后整晚未关闭,住户已于23:00入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除故障原因\",\n \"设置温度传感器返回None值时的即时告警规则,以便及时发现传感器离线或故障\",\n \"添加自动化规则:当住户进入睡眠模式(卧室灯关闭)时,检查厨房窗户是否仍处于打开状态并发送提醒\",\n \"考虑为厨房窗户增加定时自动关闭或未关闭告警机制,避免夜间安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数跳变及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭后开启但日志中未见关闭,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度在18:30为24.63°C,到19:00突然跳升至28.32°C,30分钟内上升约3.7°C,而同时段客厅和卧室温度仅正常小幅下降。这一跳变幅度远超正常环境波动。", "推理步骤2: 然而灶具(cook_surface)直到19:09:30才开启,19:00时灶具尚未使用,因此28.32°C的高温读数无法用烹饪解释。这表明传感器可能在19:00前后已出现异常。", "推理步骤3: 在19:10和19:39,厨房温度传感器连续两次报告MeasuredValue = None(空值),说明传感器数据采集中断或传感器本身发生故障。正常传感器不应返回None。", "推理步骤4: 19:30时厨房温度仍为28.31°C(灶具已开启约20分钟,此时高温可部分解释),但到20:00灶具关闭后温度迅速回落至24.05°C,回落速度合理。结合19:00的异常跳变和两次None值,传感器可靠性存疑。", "推理步骤5: 厨房窗户在19:38:30被打开(StateValue=False),但在整个日志周期内未见关闭事件。住户23:00已入睡,厨房窗户整夜敞开存在安全隐患(入侵风险、雨水等)。", "推理步骤6: 其余行为模式正常——住户06:18起床、07:16出门上班、18:30回家、23:00入睡,门锁开关、灯光、空调使用均符合单人一室一厅的日常作息。"], "key_evidence": ["厨房温度在19:00异常跳升至2832(28.32°C),此时灶具尚未开启(19:09才开),无法用烹饪解释", "厨房温度传感器在19:10和19:39两次报告MeasuredValue = None,表明传感器数据采集异常", "厨房窗户19:38打开后整晚未关闭,住户已于23:00入睡"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除故障原因", "设置温度传感器返回None值时的即时告警规则,以便及时发现传感器离线或故障", "添加自动化规则:当住户进入睡眠模式(卧室灯关闭)时,检查厨房窗户是否仍处于打开状态并发送提醒", "考虑为厨房窗户增加定时自动关闭或未关闭告警机制,避免夜间安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.432767629623413, "api_error": null} {"episode_id": "SQ2_TN_A_0410", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0410.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261039, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00出现异常高温读数(29.47°C→29.60°C),且传感器多次报告None值,疑似传感器故障或厨房存在异常热源。\",\n \"reasoning\": [\n \"推理步骤1: 在11:00和11:30,厨房温度传感器读数突然从约25°C跳升至29.47°C和29.60°C,而同时段客厅仅为25.53°C,卧室为24.43°C,厨房与其他房间温差达到约4°C,远超正常范围。\",\n \"推理步骤2: 此时灶具处于关闭状态(09:40关闭,11:58才再次开启),没有明显的热源可以解释这一异常升温。如果是阳光直射或其他外部因素,客厅温度应有类似变化,但客厅温度变化平稳。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(09:09、09:41、11:59、12:51、17:55、18:34),这表明传感器可能存在故障——在高温环境下读数溢出或通信异常。\",\n \"推理步骤4: 综合来看,11:00的异常高温读数最可能是传感器故障导致的错误数据。但也不能完全排除厨房存在未被检测到的异常热源(如电器短路发热),需要人工确认。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度突升至2947(29.47°C),11:30达到2960(29.60°C),而灶具在09:40已关闭、11:58才重新开启\",\n \"厨房温度传感器在一天内6次报告MeasuredValue=None,均发生在灶具开启前后,表明传感器工作不稳定\",\n \"同时段客厅和卧室温度变化平稳,未出现类似跳升,排除全屋性环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置不当(如靠近烤箱排气口或阳光直射处),必要时重新校准或更换传感器\",\n \"排查厨房是否有电器在11:00前后异常发热(如烤箱、微波炉等是否被意外开启)\",\n \"针对传感器频繁报告None值的问题,检查其供电和通信链路是否稳定,考虑固件升级或更换设备\",\n \"建议增加厨房烟雾报警器的灵敏度监控,作为温度传感器异常时的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00出现异常高温读数(29.47°C→29.60°C),且传感器多次报告None值,疑似传感器故障或厨房存在异常热源。", "reasoning": ["推理步骤1: 在11:00和11:30,厨房温度传感器读数突然从约25°C跳升至29.47°C和29.60°C,而同时段客厅仅为25.53°C,卧室为24.43°C,厨房与其他房间温差达到约4°C,远超正常范围。", "推理步骤2: 此时灶具处于关闭状态(09:40关闭,11:58才再次开启),没有明显的热源可以解释这一异常升温。如果是阳光直射或其他外部因素,客厅温度应有类似变化,但客厅温度变化平稳。", "推理步骤3: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(09:09、09:41、11:59、12:51、17:55、18:34),这表明传感器可能存在故障——在高温环境下读数溢出或通信异常。", "推理步骤4: 综合来看,11:00的异常高温读数最可能是传感器故障导致的错误数据。但也不能完全排除厨房存在未被检测到的异常热源(如电器短路发热),需要人工确认。"], "key_evidence": ["11:00厨房温度突升至2947(29.47°C),11:30达到2960(29.60°C),而灶具在09:40已关闭、11:58才重新开启", "厨房温度传感器在一天内6次报告MeasuredValue=None,均发生在灶具开启前后,表明传感器工作不稳定", "同时段客厅和卧室温度变化平稳,未出现类似跳升,排除全屋性环境因素"], "recommended_actions": ["检查厨房温度传感器是否安装位置不当(如靠近烤箱排气口或阳光直射处),必要时重新校准或更换传感器", "排查厨房是否有电器在11:00前后异常发热(如烤箱、微波炉等是否被意外开启)", "针对传感器频繁报告None值的问题,检查其供电和通信链路是否稳定,考虑固件升级或更换设备", "建议增加厨房烟雾报警器的灵敏度监控,作为温度传感器异常时的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.261553049087524, "api_error": null} {"episode_id": "SQ2_TN_A_0406", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0406.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261035, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从 ~2459(24.59°C)跳升至 2836(28.36°C),升幅约 3.8°C,远超正常半小时波动幅度,且此时灶具尚未开启(19:14 才开启),说明该跳变并非烹饪导致。\",\n \"推理步骤2: 19:15 和 19:54 两个时间点,厨房温度传感器报告 MeasuredValue = None,表示传感器未能返回有效读数。正常传感器不应出现空值,这是设备故障或通信异常的典型表现。\",\n \"推理步骤3: 19:30 温度仍为 2835,与 19:00 的异常值几乎一致,进一步印证传感器可能卡在错误值上。直到 20:00 才恢复到 2405 的合理范围,说明传感器经历了约 1 小时的异常期。\",\n \"推理步骤4: 厨房窗户传感器在 19:53 报告 StateValue=False(窗户打开),但在后续日志中始终未见关闭事件。考虑到住户 22:10 已进入卧室准备就寝,厨房窗户可能整夜处于开启状态,存在安全隐患。\",\n \"推理步骤5: 排除火灾风险——烟雾报警器全天无触发,灶具在 19:53 已正常关闭,温度在 20:00 后持续回落,不符合火灾特征。\",\n \"推理步骤6: 其余设备行为均正常:住户 06:26 起床、07:38 出门上锁、18:22 回家开灯开空调、22:53 关灯就寝,门锁开关与人员活动吻合,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2459 异常跳升至 2836,灶具尚未开启\",\n \"19:15 和 19:54 厨房温度传感器报告 MeasuredValue = None(空值)\",\n \"19:30 温度仍锁定在 2835 异常值,20:00 才恢复正常\",\n \"19:53 厨房窗户打开(StateValue=False)后全天日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,必要时重启或更换传感器\",\n \"确认厨房窗户当前是否仍处于开启状态,夜间建议关闭以保障安全\",\n \"为厨房温度传感器设置异常值告警规则(如读数为 None 或半小时内波动超过 3°C 时立即通知)\",\n \"检查传感器固件版本,考虑升级以修复可能的数据上报 bug\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从 ~2459(24.59°C)跳升至 2836(28.36°C),升幅约 3.8°C,远超正常半小时波动幅度,且此时灶具尚未开启(19:14 才开启),说明该跳变并非烹饪导致。", "推理步骤2: 19:15 和 19:54 两个时间点,厨房温度传感器报告 MeasuredValue = None,表示传感器未能返回有效读数。正常传感器不应出现空值,这是设备故障或通信异常的典型表现。", "推理步骤3: 19:30 温度仍为 2835,与 19:00 的异常值几乎一致,进一步印证传感器可能卡在错误值上。直到 20:00 才恢复到 2405 的合理范围,说明传感器经历了约 1 小时的异常期。", "推理步骤4: 厨房窗户传感器在 19:53 报告 StateValue=False(窗户打开),但在后续日志中始终未见关闭事件。考虑到住户 22:10 已进入卧室准备就寝,厨房窗户可能整夜处于开启状态,存在安全隐患。", "推理步骤5: 排除火灾风险——烟雾报警器全天无触发,灶具在 19:53 已正常关闭,温度在 20:00 后持续回落,不符合火灾特征。", "推理步骤6: 其余设备行为均正常:住户 06:26 起床、07:38 出门上锁、18:22 回家开灯开空调、22:53 关灯就寝,门锁开关与人员活动吻合,无入侵迹象。"], "key_evidence": ["19:00 厨房温度从 2459 异常跳升至 2836,灶具尚未开启", "19:15 和 19:54 厨房温度传感器报告 MeasuredValue = None(空值)", "19:30 温度仍锁定在 2835 异常值,20:00 才恢复正常", "19:53 厨房窗户打开(StateValue=False)后全天日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,必要时重启或更换传感器", "确认厨房窗户当前是否仍处于开启状态,夜间建议关闭以保障安全", "为厨房温度传感器设置异常值告警规则(如读数为 None 或半小时内波动超过 3°C 时立即通知)", "检查传感器固件版本,考虑升级以修复可能的数据上报 bug"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.73659873008728, "api_error": null} {"episode_id": "SQ2_TN_A_0411", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0411.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261040, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间出现异常高温读数及两次 None 值,疑似传感器故障或过热损坏。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器读数从 18:30 的 24.58°C 突然跳升至 28.25°C,而同一时段客厅和卧室温度仅正常小幅下降,说明这不是全屋环境变化,而是厨房局部异常。\",\n \"推理步骤2: 19:13 灶具开启后,19:14 厨房温度传感器报告 MeasuredValue = None(空值),这是 Matter 协议中传感器无法提供有效测量值的信号,通常意味着传感器超出量程或发生故障。\",\n \"推理步骤3: 19:30 传感器短暂恢复,报告 28.43°C(仍然异常偏高),但 19:34 灶具关闭后 19:35 再次报告 None,说明传感器并非因灶具高温瞬时干扰,而是存在持续性故障。\",\n \"推理步骤4: 20:00 之后传感器恢复正常读数(24.18°C),与客厅温度基本一致,后续读数也趋于正常。这表明传感器可能在高温环境下间歇性失灵,冷却后恢复。\",\n \"推理步骤5: 住户的整体行为模式正常——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作均为手动开锁+自动上锁,无入侵迹象。但厨房传感器的异常意味着在灶具使用期间,烟雾/温度监控存在盲区,构成安全隐患。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.58°C 骤升至 28.25°C,30 分钟内升幅 3.67°C,同期客厅仅下降 0.25°C\",\n \"19:14 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"19:30 厨房温度读数 28.43°C,远高于同期客厅 24.45°C 和卧室 23.28°C\",\n \"20:00 灶具关闭且厨房窗户打开通风后,传感器恢复正常读数 24.18°C\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,导致高温时超出工作范围\",\n \"对厨房温度传感器进行功能测试或校准,确认其在高温环境下的可靠性\",\n \"如传感器确认存在故障,建议更换为耐高温型号或调整安装位置,确保烹饪期间温度监控不中断\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)在此期间工作正常,因为温度传感器失灵期间它是唯一的厨房安全监控手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间出现异常高温读数及两次 None 值,疑似传感器故障或过热损坏。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器读数从 18:30 的 24.58°C 突然跳升至 28.25°C,而同一时段客厅和卧室温度仅正常小幅下降,说明这不是全屋环境变化,而是厨房局部异常。", "推理步骤2: 19:13 灶具开启后,19:14 厨房温度传感器报告 MeasuredValue = None(空值),这是 Matter 协议中传感器无法提供有效测量值的信号,通常意味着传感器超出量程或发生故障。", "推理步骤3: 19:30 传感器短暂恢复,报告 28.43°C(仍然异常偏高),但 19:34 灶具关闭后 19:35 再次报告 None,说明传感器并非因灶具高温瞬时干扰,而是存在持续性故障。", "推理步骤4: 20:00 之后传感器恢复正常读数(24.18°C),与客厅温度基本一致,后续读数也趋于正常。这表明传感器可能在高温环境下间歇性失灵,冷却后恢复。", "推理步骤5: 住户的整体行为模式正常——早晨起床、出门上班、傍晚回家、做饭、睡觉,门锁操作均为手动开锁+自动上锁,无入侵迹象。但厨房传感器的异常意味着在灶具使用期间,烟雾/温度监控存在盲区,构成安全隐患。"], "key_evidence": ["19:00 厨房温度从 24.58°C 骤升至 28.25°C,30 分钟内升幅 3.67°C,同期客厅仅下降 0.25°C", "19:14 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,均发生在灶具使用前后", "19:30 厨房温度读数 28.43°C,远高于同期客厅 24.45°C 和卧室 23.28°C", "20:00 灶具关闭且厨房窗户打开通风后,传感器恢复正常读数 24.18°C"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,导致高温时超出工作范围", "对厨房温度传感器进行功能测试或校准,确认其在高温环境下的可靠性", "如传感器确认存在故障,建议更换为耐高温型号或调整安装位置,确保烹饪期间温度监控不中断", "确认厨房烟雾报警器(kitchen_smoke_alarm)在此期间工作正常,因为温度传感器失灵期间它是唯一的厨房安全监控手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.126330137252808, "api_error": null} {"episode_id": "SQ2_TN_A_0414", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_A_0414.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261043, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在住户睡后仍处于开启状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:30 报告 2460(24.60°C),但 19:00 突然跳升至 2827(28.27°C),30 分钟内上升约 3.67°C,远超当日任何时段的自然变化幅度(通常 ≤0.3°C/30min)。\",\n \"推理步骤2: 灶具在 19:14 才开启,但温度在 19:00 就已异常升高,时间线不匹配——如果是灶具加热导致,温度应在 19:14 之后才上升。这说明 19:00 的 2827 读数很可能是传感器误报。\",\n \"推理步骤3: 19:15 和 19:36 传感器连续两次报告 MeasuredValue = None(空值),表明传感器在这段时间内无法正常采集数据,进一步印证传感器存在故障或通信异常。\",\n \"推理步骤4: 19:30 传感器恢复后报告 2836(28.36°C),与之前的异常值 2827 接近,但灶具已在 19:35 关闭,而 20:00 温度骤降回 2409(24.09°C),30 分钟内下降 4.27°C。如果 28°C+ 是真实温度,自然散热不可能这么快降回来,再次说明高温读数不可靠。\",\n \"推理步骤5: 厨房窗户在 19:35 被打开(BooleanState = False),之后日志中没有关闭记录。住户 22:08 进入卧室准备睡觉,22:44 关灯入睡,但厨房窗户始终未关闭。虽然这可能是通风意图,但在夜间无人看管的情况下存在安全隐患。\",\n \"推理步骤6: 除上述问题外,其余设备行为均正常:住户早晨 6:33 起床、7:27 出门上锁、18:13 回家开灯开空调、做饭、洗碗、22:44 入睡,符合典型的单人一室一厅生活模式。入户门锁状态正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度 18:30→19:00 从 2460 跳至 2827(+3.67°C/30min),灶具 19:14 才开启,时间线矛盾\",\n \"19:15 和 19:36 厨房温度传感器连续两次报告 MeasuredValue = None\",\n \"19:30 报告 2836,但 20:00 骤降至 2409(-4.27°C/30min),不符合物理散热规律\",\n \"厨房窗户 19:35 打开后至日志结束(23:30)未关闭,住户已入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,清理探头或更换传感器\",\n \"在自动化规则中添加传感器 None 值监测,连续出现空值时推送告警\",\n \"设置就寝模式自动化:当住户入睡(卧室灯关闭)时,检查并提醒关闭厨房窗户\",\n \"关注后续几天厨房温度传感器数据,确认异常是否持续出现以判断是否需要更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时厨房窗户在住户睡后仍处于开启状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:30 报告 2460(24.60°C),但 19:00 突然跳升至 2827(28.27°C),30 分钟内上升约 3.67°C,远超当日任何时段的自然变化幅度(通常 ≤0.3°C/30min)。", "推理步骤2: 灶具在 19:14 才开启,但温度在 19:00 就已异常升高,时间线不匹配——如果是灶具加热导致,温度应在 19:14 之后才上升。这说明 19:00 的 2827 读数很可能是传感器误报。", "推理步骤3: 19:15 和 19:36 传感器连续两次报告 MeasuredValue = None(空值),表明传感器在这段时间内无法正常采集数据,进一步印证传感器存在故障或通信异常。", "推理步骤4: 19:30 传感器恢复后报告 2836(28.36°C),与之前的异常值 2827 接近,但灶具已在 19:35 关闭,而 20:00 温度骤降回 2409(24.09°C),30 分钟内下降 4.27°C。如果 28°C+ 是真实温度,自然散热不可能这么快降回来,再次说明高温读数不可靠。", "推理步骤5: 厨房窗户在 19:35 被打开(BooleanState = False),之后日志中没有关闭记录。住户 22:08 进入卧室准备睡觉,22:44 关灯入睡,但厨房窗户始终未关闭。虽然这可能是通风意图,但在夜间无人看管的情况下存在安全隐患。", "推理步骤6: 除上述问题外,其余设备行为均正常:住户早晨 6:33 起床、7:27 出门上锁、18:13 回家开灯开空调、做饭、洗碗、22:44 入睡,符合典型的单人一室一厅生活模式。入户门锁状态正常,无入侵迹象。"], "key_evidence": ["厨房温度 18:30→19:00 从 2460 跳至 2827(+3.67°C/30min),灶具 19:14 才开启,时间线矛盾", "19:15 和 19:36 厨房温度传感器连续两次报告 MeasuredValue = None", "19:30 报告 2836,但 20:00 骤降至 2409(-4.27°C/30min),不符合物理散热规律", "厨房窗户 19:35 打开后至日志结束(23:30)未关闭,住户已入睡"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,清理探头或更换传感器", "在自动化规则中添加传感器 None 值监测,连续出现空值时推送告警", "设置就寝模式自动化:当住户入睡(卧室灯关闭)时,检查并提醒关闭厨房窗户", "关注后续几天厨房温度传感器数据,确认异常是否持续出现以判断是否需要更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.22334933280945, "api_error": null} {"episode_id": "SQ2_TN_B_0377", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0377.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261006, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房灶具在住户外出期间处于开启状态近10小时未关闭,存在安全隐患;同时厨房温度传感器多次报告 None 值,可能存在传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 07:04:32 厨房灶具开启(kitchen_cook_surface OnOff=True),但住户在 07:26:29 通过前门离开并锁门,灶具未被关闭。\",\n \"推理步骤2: 住户直到 16:05:00 才有人回来开门(前门解锁),期间灶具从 07:04 到 16:05 持续开启状态,无人在家约9小时。但日志显示 06:50:00 灶具曾关闭,07:04:32 再次开启,住户 07:26 离开后灶具仍处于开启状态。\",\n \"推理步骤3: 16:05 有人进门但未触发灶具关闭事件,直到 17:48 住户回家后在 18:16:30 再次操作灶具,说明灶具可能从 07:04 一直开到 18:54 才关闭——但中间无烟雾报警触发,也可能是灶具处于待机/低功率状态。\",\n \"推理步骤4: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:51、07:05、18:17、18:55),这不是正常行为,表明传感器可能受高温影响出现故障或通信异常。\",\n \"推理步骤5: 16:05 前门被解锁开门但之后未见关门(front_door_contact 未恢复为 True)和重新上锁事件,直到 22:12:26 才确认门关闭并自动上锁,期间门可能处于未关状态约6小时,存在入侵风险。\"\n ],\n \"key_evidence\": [\n \"07:04:32 灶具开启,07:26:29 住户出门锁门,灶具未关闭\",\n \"厨房温度传感器多次报告 None 值(06:51、07:05、18:17、18:55)\",\n \"16:05:02 前门打开后无关门/上锁记录,直到 22:12:26 才关门上锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房灶具是否支持离家自动关闭功能,建议设置无人在家时自动断电规则\",\n \"检修厨房温度传感器,排查报告 None 值的原因(可能是高温导致传感器异常或通信故障)\",\n \"设置前门长时间未关闭的告警提醒,避免门户大开无人知晓\",\n \"考虑添加离家模式自动化:检测到所有人离开后自动关闭灶具、检查门窗状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房灶具在住户外出期间处于开启状态近10小时未关闭,存在安全隐患;同时厨房温度传感器多次报告 None 值,可能存在传感器故障。", "reasoning": ["推理步骤1: 07:04:32 厨房灶具开启(kitchen_cook_surface OnOff=True),但住户在 07:26:29 通过前门离开并锁门,灶具未被关闭。", "推理步骤2: 住户直到 16:05:00 才有人回来开门(前门解锁),期间灶具从 07:04 到 16:05 持续开启状态,无人在家约9小时。但日志显示 06:50:00 灶具曾关闭,07:04:32 再次开启,住户 07:26 离开后灶具仍处于开启状态。", "推理步骤3: 16:05 有人进门但未触发灶具关闭事件,直到 17:48 住户回家后在 18:16:30 再次操作灶具,说明灶具可能从 07:04 一直开到 18:54 才关闭——但中间无烟雾报警触发,也可能是灶具处于待机/低功率状态。", "推理步骤4: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:51、07:05、18:17、18:55),这不是正常行为,表明传感器可能受高温影响出现故障或通信异常。", "推理步骤5: 16:05 前门被解锁开门但之后未见关门(front_door_contact 未恢复为 True)和重新上锁事件,直到 22:12:26 才确认门关闭并自动上锁,期间门可能处于未关状态约6小时,存在入侵风险。"], "key_evidence": ["07:04:32 灶具开启,07:26:29 住户出门锁门,灶具未关闭", "厨房温度传感器多次报告 None 值(06:51、07:05、18:17、18:55)", "16:05:02 前门打开后无关门/上锁记录,直到 22:12:26 才关门上锁"], "recommended_actions": ["检查厨房灶具是否支持离家自动关闭功能,建议设置无人在家时自动断电规则", "检修厨房温度传感器,排查报告 None 值的原因(可能是高温导致传感器异常或通信故障)", "设置前门长时间未关闭的告警提醒,避免门户大开无人知晓", "考虑添加离家模式自动化:检测到所有人离开后自动关闭灶具、检查门窗状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.492891788482666, "api_error": null} {"episode_id": "SQ2_TN_B_0380", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0380.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261009, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:22 入户门开锁后未关门记录,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、07:10、18:23、19:17 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后约30秒,说明灶具操作可能干扰传感器,或传感器本身在高温/状态切换时出现故障。\",\n \"推理步骤2: 对比其他三个温度传感器,全天均正常上报数值(22.9°C~25.9°C 范围内平稳波动),唯独厨房传感器出现 None,进一步确认是该传感器的局部问题而非系统性通信故障。\",\n \"推理步骤3: 16:22 入户门锁解锁(LockOperationType=1, Manual)、门打开(StateValue=False)、玄关检测到人,但之后没有关门(StateValue=True)和上锁的记录,直到 22:36 才出现关门上锁。这意味着入户门从 16:22 到 22:36 长达约 6 小时处于未关闭状态,存在安全隐患。\",\n \"推理步骤4: 18:01 又有一次开锁进门记录,结合 16:22 门未关的情况,推测 16:22 可能是住户短暂外出未关门,18:01 正式回家。但无论如何,门长时间未关闭是不正常的。\",\n \"推理步骤5: 其余行为模式正常——早晨 06:07 起床开灯、06:46 做早餐、07:40 出门并自动上锁、18:01 回家开灯开空调(制冷模式)、18:22 做晚餐、19:54 开洗碗机、22:36 睡前关灯关空调关窗帘锁门,符合单人居住的日常作息。\",\n \"推理步骤6: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约23分钟、晚餐约54分钟),不存在火灾或水灾风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:10、18:23、19:17 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联\",\n \"16:22 入户门解锁并打开后,直到 22:36 才有关门(StateValue=True)和上锁记录,门可能长时间未关闭\",\n \"其他三个房间温度传感器全天数据正常,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;考虑更换传感器或调整安装位置\",\n \"设置入户门未关闭超时告警(建议阈值 5~10 分钟),避免长时间门户大开的安全风险\",\n \"检查厨房温度传感器固件版本,必要时升级固件以修复 None 值上报的问题\",\n \"建议为 16:22 这类短暂外出场景配置自动化规则:若门打开超过一定时间未关闭,推送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:22 入户门开锁后未关门记录,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、07:10、18:23、19:17 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后约30秒,说明灶具操作可能干扰传感器,或传感器本身在高温/状态切换时出现故障。", "推理步骤2: 对比其他三个温度传感器,全天均正常上报数值(22.9°C~25.9°C 范围内平稳波动),唯独厨房传感器出现 None,进一步确认是该传感器的局部问题而非系统性通信故障。", "推理步骤3: 16:22 入户门锁解锁(LockOperationType=1, Manual)、门打开(StateValue=False)、玄关检测到人,但之后没有关门(StateValue=True)和上锁的记录,直到 22:36 才出现关门上锁。这意味着入户门从 16:22 到 22:36 长达约 6 小时处于未关闭状态,存在安全隐患。", "推理步骤4: 18:01 又有一次开锁进门记录,结合 16:22 门未关的情况,推测 16:22 可能是住户短暂外出未关门,18:01 正式回家。但无论如何,门长时间未关闭是不正常的。", "推理步骤5: 其余行为模式正常——早晨 06:07 起床开灯、06:46 做早餐、07:40 出门并自动上锁、18:01 回家开灯开空调(制冷模式)、18:22 做晚餐、19:54 开洗碗机、22:36 睡前关灯关空调关窗帘锁门,符合单人居住的日常作息。", "推理步骤6: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约23分钟、晚餐约54分钟),不存在火灾或水灾风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:10、18:23、19:17 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联", "16:22 入户门解锁并打开后,直到 22:36 才有关门(StateValue=True)和上锁记录,门可能长时间未关闭", "其他三个房间温度传感器全天数据正常,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;考虑更换传感器或调整安装位置", "设置入户门未关闭超时告警(建议阈值 5~10 分钟),避免长时间门户大开的安全风险", "检查厨房温度传感器固件版本,必要时升级固件以修复 None 值上报的问题", "建议为 16:22 这类短暂外出场景配置自动化规则:若门打开超过一定时间未关闭,推送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.571921825408936, "api_error": null} {"episode_id": "SQ2_TN_B_0384", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0384.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261013, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:32 入户门开锁后未关门/未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:32、06:57、18:38、19:16 四次报告 MeasuredValue = None。前两次与早晨灶具使用时段吻合,后两次与晚间灶具使用时段吻合,说明每次灶具开启后传感器就丢失读数。这可能是高温干扰导致传感器异常,也可能是传感器本身存在故障。\",\n \"推理步骤2: 16:32 入户门通过手动方式解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),玄关检测到有人。但此后日志中没有关门(StateValue=True)和上锁记录,直到 22:14:32 门才关闭并自动上锁。这意味着入户门在 16:32 至 22:14 之间约 5 小时 42 分钟处于未关闭状态。\",\n \"推理步骤3: 18:01 又有一次开锁/进门记录,说明住户回家,但 16:32 那次开门的人身份不明——有可能是住户本人短暂外出未关好门,也可能是其他人进入。期间家中无人活动(直到 18:01 才有客厅运动传感器触发),门却一直敞开,存在入侵风险。\",\n \"推理步骤4: 其余设备行为均属正常:早晨起床做饭、出门上班、傍晚回家做饭、晚间关灯就寝,温度曲线符合夏季白天升温夜间降温的自然规律,空调制冷模式(SystemMode=3)合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间 4 次报告 MeasuredValue = None,传感器读数异常\",\n \"16:32 入户门解锁并打开,但直到 22:14:32(约 5 小时 42 分钟后)才有关门和上锁记录,期间门处于敞开/未锁状态\",\n \"16:32 至 18:01 期间室内无任何运动传感器触发,说明该时段家中可能无人,但门未关闭\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数丢失;如排除位置问题,建议更换传感器\",\n \"设置入户门长时间未关闭的告警规则(如超过 5 分钟未检测到关门事件则推送通知)\",\n \"确认 16:32 开门事件是否为住户本人操作,排除未授权人员进入的可能\",\n \"考虑为入户门锁启用自动上锁超时功能,防止门长时间处于未锁定状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:32 入户门开锁后未关门/未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:32、06:57、18:38、19:16 四次报告 MeasuredValue = None。前两次与早晨灶具使用时段吻合,后两次与晚间灶具使用时段吻合,说明每次灶具开启后传感器就丢失读数。这可能是高温干扰导致传感器异常,也可能是传感器本身存在故障。", "推理步骤2: 16:32 入户门通过手动方式解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),玄关检测到有人。但此后日志中没有关门(StateValue=True)和上锁记录,直到 22:14:32 门才关闭并自动上锁。这意味着入户门在 16:32 至 22:14 之间约 5 小时 42 分钟处于未关闭状态。", "推理步骤3: 18:01 又有一次开锁/进门记录,说明住户回家,但 16:32 那次开门的人身份不明——有可能是住户本人短暂外出未关好门,也可能是其他人进入。期间家中无人活动(直到 18:01 才有客厅运动传感器触发),门却一直敞开,存在入侵风险。", "推理步骤4: 其余设备行为均属正常:早晨起床做饭、出门上班、傍晚回家做饭、晚间关灯就寝,温度曲线符合夏季白天升温夜间降温的自然规律,空调制冷模式(SystemMode=3)合理。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间 4 次报告 MeasuredValue = None,传感器读数异常", "16:32 入户门解锁并打开,但直到 22:14:32(约 5 小时 42 分钟后)才有关门和上锁记录,期间门处于敞开/未锁状态", "16:32 至 18:01 期间室内无任何运动传感器触发,说明该时段家中可能无人,但门未关闭"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数丢失;如排除位置问题,建议更换传感器", "设置入户门长时间未关闭的告警规则(如超过 5 分钟未检测到关门事件则推送通知)", "确认 16:32 开门事件是否为住户本人操作,排除未授权人员进入的可能", "考虑为入户门锁启用自动上锁超时功能,防止门长时间处于未锁定状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.67058491706848, "api_error": null} {"episode_id": "SQ2_TN_B_0387", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0387.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261016, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2434(约24.3°C)跳升至 2828(约28.3°C),而同一时刻其他房间温度均在 2430-2439 范围内,厨房单独飙升约 4°C,幅度异常。\",\n \"推理步骤2: 19:05 灶具开启,19:06 厨房温度传感器报告 MeasuredValue = None(null),19:37 再次报告 None。传感器在灶具使用前后两次丢失读数,说明传感器工作状态不稳定。\",\n \"推理步骤3: 关键矛盾——19:00 的 2828 读数出现在灶具 19:05 开启之前,说明这次温度飙升并非由烹饪引起,更可能是传感器自身故障(如读数漂移或通信错误)。\",\n \"推理步骤4: 19:30 传感器恢复后读数为 2832,灶具 19:36 关闭后,20:00 读数回落至 2403,与其他房间一致。烹饪期间的高温可以解释,但 19:00 灶具未开时的异常跳变和两次 null 值共同指向传感器可靠性问题。\",\n \"推理步骤5: 烟雾报警器全天无触发,排除火灾风险。其余设备行为(起床、出门、回家、做饭、关灯就寝)均符合单人住户的正常作息模式,无入侵或其他安全威胁迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 灶具尚未开启时,厨房温度传感器从 ~2434 骤升至 2828,与其他房间温度趋势严重偏离\",\n \"19:06 和 19:37 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新安置\",\n \"对厨房温度传感器进行校准或固件更新,排查两次 null 读数的原因\",\n \"如传感器持续出现异常读数或 null 值,建议更换设备以确保厨房温度监控的可靠性\",\n \"短期内可加强对烟雾报警器状态的关注,弥补温度传感器不可靠期间的安全监控缺口\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2434(约24.3°C)跳升至 2828(约28.3°C),而同一时刻其他房间温度均在 2430-2439 范围内,厨房单独飙升约 4°C,幅度异常。", "推理步骤2: 19:05 灶具开启,19:06 厨房温度传感器报告 MeasuredValue = None(null),19:37 再次报告 None。传感器在灶具使用前后两次丢失读数,说明传感器工作状态不稳定。", "推理步骤3: 关键矛盾——19:00 的 2828 读数出现在灶具 19:05 开启之前,说明这次温度飙升并非由烹饪引起,更可能是传感器自身故障(如读数漂移或通信错误)。", "推理步骤4: 19:30 传感器恢复后读数为 2832,灶具 19:36 关闭后,20:00 读数回落至 2403,与其他房间一致。烹饪期间的高温可以解释,但 19:00 灶具未开时的异常跳变和两次 null 值共同指向传感器可靠性问题。", "推理步骤5: 烟雾报警器全天无触发,排除火灾风险。其余设备行为(起床、出门、回家、做饭、关灯就寝)均符合单人住户的正常作息模式,无入侵或其他安全威胁迹象。"], "key_evidence": ["19:00 灶具尚未开启时,厨房温度传感器从 ~2434 骤升至 2828,与其他房间温度趋势严重偏离", "19:06 和 19:37 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新安置", "对厨房温度传感器进行校准或固件更新,排查两次 null 读数的原因", "如传感器持续出现异常读数或 null 值,建议更换设备以确保厨房温度监控的可靠性", "短期内可加强对烟雾报警器状态的关注,弥补温度传感器不可靠期间的安全监控缺口"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.268610954284668, "api_error": null} {"episode_id": "SQ2_TN_B_0388", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0388.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261017, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.6°C),且在18:56和19:50两次报告null值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 18:00时厨房温度传感器突然从约24.8°C跳升至28.6°C(MeasuredValue从2483→2863),而同一时刻其他三个房间温度均在24.5°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具在18:55才打开),无合理热源解释这一跳变。\",\n \"推理步骤2: 18:30时厨房温度仍维持在28.6°C(2860),持续异常高位。但到19:00时突然恢复正常(2431),与其他房间一致。这种先异常跳高、再突然恢复的模式更像传感器间歇性故障,而非真实环境温度变化。\",\n \"推理步骤3: 18:56(灶具刚开启后1分钟)和19:50(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None(空值),说明传感器在这两个时间点未能正常采集数据。正常传感器不应返回null。\",\n \"推理步骤4: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,且异常高温出现在灶具使用之前,不符合烹饪导致升温的时序逻辑。18:00时住户刚到家(18:12开门),厨房无人操作。\",\n \"推理步骤5: 其余设备行为均正常——住户早晨7:40出门、傍晚18:12回家的作息合理;门锁开关、灯光、空调使用模式正常;厨房窗户在做完饭后打开通风属正常行为。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数2863(28.6°C),较前一读数2483(24.8°C)异常跳升约4°C,同时刻其他房间温度均在24.5°C左右\",\n \"18:30 厨房温度仍为2860(28.6°C),持续异常,但19:00突然恢复至2431(24.3°C)\",\n \"18:56 和 19:50 厨房温度传感器两次报告 MeasuredValue = None,传感器数据采集失败\",\n \"异常高温出现时灶具尚未开启(灶具18:55才启动),无合理热源\",\n \"全天厨房烟雾报警器未触发,排除真实火情\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到热源干扰(如靠近冰箱散热口或阳光直射)\",\n \"观察未来几天厨房温度传感器是否继续出现异常跳变或null值,若持续出现建议更换传感器\",\n \"检查传感器固件版本,尝试重置或升级固件以排除软件层面的间歇性故障\",\n \"在传感器修复前,可临时加强厨房烟雾报警器的灵敏度配置,作为温度监测的补充安全手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.6°C),且在18:56和19:50两次报告null值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 18:00时厨房温度传感器突然从约24.8°C跳升至28.6°C(MeasuredValue从2483→2863),而同一时刻其他三个房间温度均在24.5°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具在18:55才打开),无合理热源解释这一跳变。", "推理步骤2: 18:30时厨房温度仍维持在28.6°C(2860),持续异常高位。但到19:00时突然恢复正常(2431),与其他房间一致。这种先异常跳高、再突然恢复的模式更像传感器间歇性故障,而非真实环境温度变化。", "推理步骤3: 18:56(灶具刚开启后1分钟)和19:50(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None(空值),说明传感器在这两个时间点未能正常采集数据。正常传感器不应返回null。", "推理步骤4: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,且异常高温出现在灶具使用之前,不符合烹饪导致升温的时序逻辑。18:00时住户刚到家(18:12开门),厨房无人操作。", "推理步骤5: 其余设备行为均正常——住户早晨7:40出门、傍晚18:12回家的作息合理;门锁开关、灯光、空调使用模式正常;厨房窗户在做完饭后打开通风属正常行为。"], "key_evidence": ["18:00 厨房温度传感器读数2863(28.6°C),较前一读数2483(24.8°C)异常跳升约4°C,同时刻其他房间温度均在24.5°C左右", "18:30 厨房温度仍为2860(28.6°C),持续异常,但19:00突然恢复至2431(24.3°C)", "18:56 和 19:50 厨房温度传感器两次报告 MeasuredValue = None,传感器数据采集失败", "异常高温出现时灶具尚未开启(灶具18:55才启动),无合理热源", "全天厨房烟雾报警器未触发,排除真实火情"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到热源干扰(如靠近冰箱散热口或阳光直射)", "观察未来几天厨房温度传感器是否继续出现异常跳变或null值,若持续出现建议更换传感器", "检查传感器固件版本,尝试重置或升级固件以排除软件层面的间歇性故障", "在传感器修复前,可临时加强厨房烟雾报警器的灵敏度配置,作为温度监测的补充安全手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.4916512966156, "api_error": null} {"episode_id": "SQ2_TN_B_0391", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0391.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261020, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:02 入户门开锁后未关门,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:44、07:18、18:24、19:28 四次报告 MeasuredValue = None。虽然其中两次与灶具开启/关闭时间接近,可能受高温干扰,但正常传感器不应返回 None,而应返回实际温度值。这表明传感器可能存在故障或兼容性问题。\",\n \"推理步骤2: 16:02 入户门锁手动解锁(LockState=2),门传感器显示门打开(StateValue=False),但在后续日志中直到 22:46:16 门才关闭(StateValue=True)并自动上锁。这意味着入户门在住户不在家期间(07:50 出门)保持了约 6 小时 44 分钟的未关闭状态。\",\n \"推理步骤3: 16:02 的开门事件有玄关运动传感器触发(entrance_occupancy=1),但之后没有任何室内灯光或设备操作,直到 17:57 才有人进入客厅并开灯开空调。这段近 2 小时的空白期间,有人进入了家中但没有任何活动痕迹,行为模式不太寻常。\",\n \"推理步骤4: 17:57 的第二次进门事件则完全正常——开锁、进门、开灯、开空调、做饭,符合下班回家的典型模式。\",\n \"推理步骤5: 厨房窗户在做完饭后打开通风(07:17:30 和 19:27:30),但日志中没有关闭记录。如果窗户在夜间持续开着,结合入户门曾长时间未关的情况,存在一定的入侵风险。\",\n \"推理步骤6: 整体温度变化趋势正常——夜间约 22.9°C,白天升至约 25.9°C 峰值,晚间回落至约 23.3°C,各房间温差在合理范围内,无火灾或异常热源迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:44、07:18、18:24、19:28 四次返回 MeasuredValue = None\",\n \"16:02 入户门手动解锁并打开,但直到 22:46:16 才关闭,中间长达约 6 小时 44 分钟\",\n \"16:02 进门后近 2 小时内无任何室内设备操作,行为模式异常\",\n \"厨房窗户两次打开后均无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认是否因灶具高温导致读数异常或传感器本身存在硬件故障,必要时更换\",\n \"排查 16:02 的入户门开锁事件——确认是否为家庭成员操作,如非本人操作需立即更换门锁密码并检查安全记录\",\n \"建议设置入户门未关闭超时告警(如超过 5 分钟未关门则推送通知)\",\n \"确认厨房窗户当前状态,夜间建议关闭窗户并锁好\",\n \"考虑为入户门增加自动关门器或设置离家模式下的门窗状态监控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:02 入户门开锁后未关门,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:44、07:18、18:24、19:28 四次报告 MeasuredValue = None。虽然其中两次与灶具开启/关闭时间接近,可能受高温干扰,但正常传感器不应返回 None,而应返回实际温度值。这表明传感器可能存在故障或兼容性问题。", "推理步骤2: 16:02 入户门锁手动解锁(LockState=2),门传感器显示门打开(StateValue=False),但在后续日志中直到 22:46:16 门才关闭(StateValue=True)并自动上锁。这意味着入户门在住户不在家期间(07:50 出门)保持了约 6 小时 44 分钟的未关闭状态。", "推理步骤3: 16:02 的开门事件有玄关运动传感器触发(entrance_occupancy=1),但之后没有任何室内灯光或设备操作,直到 17:57 才有人进入客厅并开灯开空调。这段近 2 小时的空白期间,有人进入了家中但没有任何活动痕迹,行为模式不太寻常。", "推理步骤4: 17:57 的第二次进门事件则完全正常——开锁、进门、开灯、开空调、做饭,符合下班回家的典型模式。", "推理步骤5: 厨房窗户在做完饭后打开通风(07:17:30 和 19:27:30),但日志中没有关闭记录。如果窗户在夜间持续开着,结合入户门曾长时间未关的情况,存在一定的入侵风险。", "推理步骤6: 整体温度变化趋势正常——夜间约 22.9°C,白天升至约 25.9°C 峰值,晚间回落至约 23.3°C,各房间温差在合理范围内,无火灾或异常热源迹象。"], "key_evidence": ["厨房温度传感器在 06:44、07:18、18:24、19:28 四次返回 MeasuredValue = None", "16:02 入户门手动解锁并打开,但直到 22:46:16 才关闭,中间长达约 6 小时 44 分钟", "16:02 进门后近 2 小时内无任何室内设备操作,行为模式异常", "厨房窗户两次打开后均无关闭记录"], "recommended_actions": ["检查厨房温度传感器,确认是否因灶具高温导致读数异常或传感器本身存在硬件故障,必要时更换", "排查 16:02 的入户门开锁事件——确认是否为家庭成员操作,如非本人操作需立即更换门锁密码并检查安全记录", "建议设置入户门未关闭超时告警(如超过 5 分钟未关门则推送通知)", "确认厨房窗户当前状态,夜间建议关闭窗户并锁好", "考虑为入户门增加自动关门器或设置离家模式下的门窗状态监控"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.98439621925354, "api_error": null} {"episode_id": "SQ2_TN_B_0403", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0403.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261032, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天各房间温度变化符合自然昼夜温度规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器每30分钟一次的温度上报,无门锁、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C,因此数值 2290~2587 对应实际温度 22.90°C~25.87°C,属于夏季室内正常温度范围。\",\n \"推理步骤3: 温度变化趋势呈现典型的昼夜周期——凌晨 00:00~05:30 维持在约 22.9~23.1°C 的低温区间,06:00 起随日出逐步升温,12:00~12:30 达到峰值约 25.8°C,午后缓慢回落,至 23:30 降回约 23.3°C。这与 6 月下旬夏季的自然气温曲线完全吻合。\",\n \"推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度高度一致,同一时刻各传感器读数差异通常在 0.2°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或设备故障。\",\n \"推理步骤5: 全天最高温度约 25.87°C,最低约 22.90°C,温差约 3°C,未出现任何突变(如短时间内骤升 5°C 以上),排除火灾、灶具异常等热源风险。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.90°C~25.87°C,属于夏季室内正常范围\",\n \"四个房间温度走势高度同步,呈现标准昼夜升降曲线,无异常突变\",\n \"日志中无烟雾报警、漏水检测、门锁异常、运动传感器等安全事件触发\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前家庭环境状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天各房间温度变化符合自然昼夜温度规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器每30分钟一次的温度上报,无门锁、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C,因此数值 2290~2587 对应实际温度 22.90°C~25.87°C,属于夏季室内正常温度范围。", "推理步骤3: 温度变化趋势呈现典型的昼夜周期——凌晨 00:00~05:30 维持在约 22.9~23.1°C 的低温区间,06:00 起随日出逐步升温,12:00~12:30 达到峰值约 25.8°C,午后缓慢回落,至 23:30 降回约 23.3°C。这与 6 月下旬夏季的自然气温曲线完全吻合。", "推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度高度一致,同一时刻各传感器读数差异通常在 0.2°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或设备故障。", "推理步骤5: 全天最高温度约 25.87°C,最低约 22.90°C,温差约 3°C,未出现任何突变(如短时间内骤升 5°C 以上),排除火灾、灶具异常等热源风险。"], "key_evidence": ["全天温度范围 22.90°C~25.87°C,属于夏季室内正常范围", "四个房间温度走势高度同步,呈现标准昼夜升降曲线,无异常突变", "日志中无烟雾报警、漏水检测、门锁异常、运动传感器等安全事件触发"], "recommended_actions": ["无需采取任何措施,当前家庭环境状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.797370433807373, "api_error": null} {"episode_id": "SQ2_TN_B_0404", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0404.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261033, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2458(24.58°C)跳升至 2830(28.30°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差接近 4°C,远超正常室间差异。\",\n \"推理步骤2: 19:04 和 19:33 厨房温度传感器连续两次报告 MeasuredValue = None(空值),正常传感器不应返回 null,这是设备通信异常或硬件故障的典型表现。\",\n \"推理步骤3: 19:03 灶具开启、19:32 灶具关闭,烹饪活动确实会导致厨房升温,但 28.3°C 的读数出现在灶具开启之前(19:00),说明温度跳变并非由烹饪引起,更可能是传感器自身异常。\",\n \"推理步骤4: 19:30 传感器再次报告 2832,与 19:00 的 2830 几乎一致,像是传感器卡在某个错误值上;而 20:00 突然恢复到 2414,与其他房间一致,进一步印证间歇性故障。\",\n \"推理步骤5: 其余设备行为均属正常——早晨出门、傍晚回家、开灯开空调、做饭、洗碗、睡前关灯锁门,生活模式无异常,排除入侵或火灾等威胁。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.6°C 骤升至 28.3°C,而灶具尚未开启(19:03 才开启),其他房间温度正常\",\n \"19:04 和 19:33 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 传感器仍报告 2832 的异常高值,20:00 又突然恢复正常(2414),呈间歇性故障特征\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源或受到灶具辐射热干扰\",\n \"查看传感器电池电量或供电状态,低电量可能导致间歇性读数异常和 null 值\",\n \"对传感器进行重置或固件更新,若问题持续则更换传感器\",\n \"在传感器修复前,可临时依赖厨房烟雾报警器作为厨房安全的主要监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2458(24.58°C)跳升至 2830(28.30°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差接近 4°C,远超正常室间差异。", "推理步骤2: 19:04 和 19:33 厨房温度传感器连续两次报告 MeasuredValue = None(空值),正常传感器不应返回 null,这是设备通信异常或硬件故障的典型表现。", "推理步骤3: 19:03 灶具开启、19:32 灶具关闭,烹饪活动确实会导致厨房升温,但 28.3°C 的读数出现在灶具开启之前(19:00),说明温度跳变并非由烹饪引起,更可能是传感器自身异常。", "推理步骤4: 19:30 传感器再次报告 2832,与 19:00 的 2830 几乎一致,像是传感器卡在某个错误值上;而 20:00 突然恢复到 2414,与其他房间一致,进一步印证间歇性故障。", "推理步骤5: 其余设备行为均属正常——早晨出门、傍晚回家、开灯开空调、做饭、洗碗、睡前关灯锁门,生活模式无异常,排除入侵或火灾等威胁。"], "key_evidence": ["19:00 厨房温度从 ~24.6°C 骤升至 28.3°C,而灶具尚未开启(19:03 才开启),其他房间温度正常", "19:04 和 19:33 厨房温度传感器两次报告 MeasuredValue = None", "19:30 传感器仍报告 2832 的异常高值,20:00 又突然恢复正常(2414),呈间歇性故障特征"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源或受到灶具辐射热干扰", "查看传感器电池电量或供电状态,低电量可能导致间歇性读数异常和 null 值", "对传感器进行重置或固件更新,若问题持续则更换传感器", "在传感器修复前,可临时依赖厨房烟雾报警器作为厨房安全的主要监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.712085962295532, "api_error": null} {"episode_id": "SQ2_TN_B_0412", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0412.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261041, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2452(24.52°C)跳升至 2829(28.29°C),而同一时刻其他房间温度仅在 24.2-24.4°C 范围,灶具尚未开启(19:08 才开),说明该跳变缺乏合理热源解释\",\n \"推理步骤2: 19:09 和 19:40 传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失,这是典型的设备故障或通信异常信号\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2838(28.38°C),此时灶具已运行约 20 分钟,虽然灶具加热可部分解释温度升高,但在灶具开启前就已出现异常跳变,且 None 值表明传感器工作状态不稳定\",\n \"推理步骤4: 其余家庭活动均属正常模式——早晨 7:14 出门上班、18:27 回家开灯开空调、19:08 做饭、21:47 关灯锁门就寝,入侵/火灾/漏水等威胁均无证据支持\"\n ],\n \"key_evidence\": [\n \"19:00 灶具未开启时厨房温度从 24.52°C 异常跳升至 28.29°C,与其他房间温度趋势不一致\",\n \"19:09 和 19:40 厨房温度传感器报告 MeasuredValue = None(读数丢失)\",\n \"20:00 传感器恢复正常读数 24.16°C,与其他房间温度重新一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰\",\n \"检查传感器电池电量或供电状态,排除低电量导致的间歇性故障\",\n \"若问题反复出现,建议更换传感器或调整安装位置远离热源\",\n \"关注厨房烟雾报警器状态,本次未触发报警,排除火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2452(24.52°C)跳升至 2829(28.29°C),而同一时刻其他房间温度仅在 24.2-24.4°C 范围,灶具尚未开启(19:08 才开),说明该跳变缺乏合理热源解释", "推理步骤2: 19:09 和 19:40 传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失,这是典型的设备故障或通信异常信号", "推理步骤3: 19:30 传感器恢复后读数为 2838(28.38°C),此时灶具已运行约 20 分钟,虽然灶具加热可部分解释温度升高,但在灶具开启前就已出现异常跳变,且 None 值表明传感器工作状态不稳定", "推理步骤4: 其余家庭活动均属正常模式——早晨 7:14 出门上班、18:27 回家开灯开空调、19:08 做饭、21:47 关灯锁门就寝,入侵/火灾/漏水等威胁均无证据支持"], "key_evidence": ["19:00 灶具未开启时厨房温度从 24.52°C 异常跳升至 28.29°C,与其他房间温度趋势不一致", "19:09 和 19:40 厨房温度传感器报告 MeasuredValue = None(读数丢失)", "20:00 传感器恢复正常读数 24.16°C,与其他房间温度重新一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰", "检查传感器电池电量或供电状态,排除低电量导致的间歇性故障", "若问题反复出现,建议更换传感器或调整安装位置远离热源", "关注厨房烟雾报警器状态,本次未触发报警,排除火灾风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.698309421539307, "api_error": null} {"episode_id": "SQ2_TN_B_0422", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0422.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261051, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭结束后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2471(24.71°C)跳升至 2850(28.50°C),而同一时刻其他三个房间温度均在 24.5°C 左右,厨房尚未开灶(灶具 18:58 才开启),这一跳变缺乏合理的物理解释。\",\n \"推理步骤2: 18:30 厨房温度传感器仍报告 2850,持续 30 分钟的恒定异常高值更像是传感器卡死/故障,而非真实温度变化(真实温度应有波动)。\",\n \"推理步骤3: 18:59 灶具刚开启 30 秒后,厨房温度传感器报告 None(空值);19:41 灶具关闭后再次报告 None。两次出现 None 表明传感器通信中断或内部故障。\",\n \"推理步骤4: 19:00 传感器恢复后读数回到 2433(24.33°C),与其他房间一致,说明 18:00-18:59 期间的 2850 并非真实环境温度,进一步印证传感器故障。\",\n \"推理步骤5: 厨房窗户传感器在 19:40:30 报告 StateValue=False(窗户打开),但整个日志中未见其关闭记录,结合住户 22:00 后已进入睡眠准备阶段,窗户可能被遗忘在开启状态。\",\n \"推理步骤6: 其余行为模式均正常——早晨 06:26 起床如厕、07:03 厨房早餐、07:40 出门上锁、18:00 回家开门开灯开空调、18:58 做饭、21:59 关灯锁门就寝,符合单人上班族的典型作息。\"\n ],\n \"key_evidence\": [\n \"18:00 和 18:30 厨房温度传感器读数为 2850(28.5°C),比同时刻其他房间高约 4°C,且灶具尚未开启\",\n \"18:30 连续两个周期报告完全相同的 2850 值,不符合自然温度波动特征\",\n \"18:59 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集中断\",\n \"19:00 恢复后读数回归正常(2433),证实此前高温非真实环境温度\",\n \"19:40:30 厨房窗户打开后全天日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到灶具辐射热干扰,必要时更换传感器\",\n \"排查传感器与 Matter 网关之间的通信链路,确认两次 None 值是否由无线信号不稳定或固件 bug 导致\",\n \"确认厨房窗户是否仍处于打开状态,夜间开窗存在安全隐患(入侵风险)和蚊虫进入问题,建议关闭或设置自动提醒规则\",\n \"为厨房温度传感器设置异常值告警规则:当读数突变超过 2°C/30min 或出现 None 值时立即通知用户\",\n \"考虑将厨房温度传感器与烟雾报警器联动,避免传感器故障时遗漏真实的火灾高温预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭结束后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2471(24.71°C)跳升至 2850(28.50°C),而同一时刻其他三个房间温度均在 24.5°C 左右,厨房尚未开灶(灶具 18:58 才开启),这一跳变缺乏合理的物理解释。", "推理步骤2: 18:30 厨房温度传感器仍报告 2850,持续 30 分钟的恒定异常高值更像是传感器卡死/故障,而非真实温度变化(真实温度应有波动)。", "推理步骤3: 18:59 灶具刚开启 30 秒后,厨房温度传感器报告 None(空值);19:41 灶具关闭后再次报告 None。两次出现 None 表明传感器通信中断或内部故障。", "推理步骤4: 19:00 传感器恢复后读数回到 2433(24.33°C),与其他房间一致,说明 18:00-18:59 期间的 2850 并非真实环境温度,进一步印证传感器故障。", "推理步骤5: 厨房窗户传感器在 19:40:30 报告 StateValue=False(窗户打开),但整个日志中未见其关闭记录,结合住户 22:00 后已进入睡眠准备阶段,窗户可能被遗忘在开启状态。", "推理步骤6: 其余行为模式均正常——早晨 06:26 起床如厕、07:03 厨房早餐、07:40 出门上锁、18:00 回家开门开灯开空调、18:58 做饭、21:59 关灯锁门就寝,符合单人上班族的典型作息。"], "key_evidence": ["18:00 和 18:30 厨房温度传感器读数为 2850(28.5°C),比同时刻其他房间高约 4°C,且灶具尚未开启", "18:30 连续两个周期报告完全相同的 2850 值,不符合自然温度波动特征", "18:59 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集中断", "19:00 恢复后读数回归正常(2433),证实此前高温非真实环境温度", "19:40:30 厨房窗户打开后全天日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到灶具辐射热干扰,必要时更换传感器", "排查传感器与 Matter 网关之间的通信链路,确认两次 None 值是否由无线信号不稳定或固件 bug 导致", "确认厨房窗户是否仍处于打开状态,夜间开窗存在安全隐患(入侵风险)和蚊虫进入问题,建议关闭或设置自动提醒规则", "为厨房温度传感器设置异常值告警规则:当读数突变超过 2°C/30min 或出现 None 值时立即通知用户", "考虑将厨房温度传感器与烟雾报警器联动,避免传感器故障时遗漏真实的火灾高温预警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.308826446533203, "api_error": null} {"episode_id": "SQ2_TN_B_0423", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0423.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261052, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在异常:多次报告 None 值,且在 11:00-11:30 出现约 29.47°C 的异常高温读数,与其他房间温度(约 25.4-25.5°C)偏差近 4°C,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:21、09:40、11:53、12:34、17:54、18:44),每次都发生在灶具开启或关闭后不久。正常的温度传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能受灶具热量干扰导致读数溢出或通信故障。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告 2947(即 29.47°C),而同一时刻客厅约 25.4°C、主卧约 25.5°C、次卧约 25.5°C。厨房比其他房间高出近 4°C,但此时灶具并未处于开启状态(09:39 已关闭,11:52 才再次开启)。灶具关闭超过 1 小时后厨房不应仍有如此大的温差,这更像是传感器残留故障或读数漂移。\",\n \"推理步骤3: 其余家居行为均属正常模式——住户约 08:33 起床(卫生间活动),三餐时间合理(09:20 早餐、11:52 午餐、17:53 晚餐),10:02 开启客厅空调和灯光,23:00 关灯关空调并锁门就寝。入户门锁在 23:00:16 自动上锁且门传感器闭合,无入侵迹象。\",\n \"推理步骤4: 厨房烟雾报警器全天未触发,排除火灾风险。但传感器频繁报 None 意味着在真正发生危险高温时可能无法提供有效预警,这是一个安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:21、09:40、11:53、12:34、17:54、18:44 共 6 次报告 MeasuredValue = None\",\n \"11:00 和 11:30 厨房温度读数 2947(29.47°C),灶具已于 09:39 关闭,与其他房间偏差约 4°C,属异常读数\",\n \"每次 None 值均紧随灶具操作(开启或关闭)后出现,表明传感器受灶具热源干扰\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将传感器迁移至远离热源的位置\",\n \"对厨房温度传感器进行校准或固件更新,排查频繁报告 None 的根本原因\",\n \"如传感器持续异常,建议更换设备,确保厨房高温预警功能可靠运作\",\n \"在传感器修复前,烹饪时注意人工关注厨房安全,避免因传感器失效错过真实高温报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在异常:多次报告 None 值,且在 11:00-11:30 出现约 29.47°C 的异常高温读数,与其他房间温度(约 25.4-25.5°C)偏差近 4°C,疑似传感器故障。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:21、09:40、11:53、12:34、17:54、18:44),每次都发生在灶具开启或关闭后不久。正常的温度传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能受灶具热量干扰导致读数溢出或通信故障。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告 2947(即 29.47°C),而同一时刻客厅约 25.4°C、主卧约 25.5°C、次卧约 25.5°C。厨房比其他房间高出近 4°C,但此时灶具并未处于开启状态(09:39 已关闭,11:52 才再次开启)。灶具关闭超过 1 小时后厨房不应仍有如此大的温差,这更像是传感器残留故障或读数漂移。", "推理步骤3: 其余家居行为均属正常模式——住户约 08:33 起床(卫生间活动),三餐时间合理(09:20 早餐、11:52 午餐、17:53 晚餐),10:02 开启客厅空调和灯光,23:00 关灯关空调并锁门就寝。入户门锁在 23:00:16 自动上锁且门传感器闭合,无入侵迹象。", "推理步骤4: 厨房烟雾报警器全天未触发,排除火灾风险。但传感器频繁报 None 意味着在真正发生危险高温时可能无法提供有效预警,这是一个安全隐患。"], "key_evidence": ["厨房温度传感器在 09:21、09:40、11:53、12:34、17:54、18:44 共 6 次报告 MeasuredValue = None", "11:00 和 11:30 厨房温度读数 2947(29.47°C),灶具已于 09:39 关闭,与其他房间偏差约 4°C,属异常读数", "每次 None 值均紧随灶具操作(开启或关闭)后出现,表明传感器受灶具热源干扰"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将传感器迁移至远离热源的位置", "对厨房温度传感器进行校准或固件更新,排查频繁报告 None 的根本原因", "如传感器持续异常,建议更换设备,确保厨房高温预警功能可靠运作", "在传感器修复前,烹饪时注意人工关注厨房安全,避免因传感器失效错过真实高温报警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.540191173553467, "api_error": null} {"episode_id": "SQ2_TN_B_0424", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0424.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261053, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及多次 null 值,疑似传感器故障,同时存在做饭后厨房窗户未关闭的安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2482(24.82°C)跳升至 2867(28.67°C),而同一时刻其他三个房间温度均在 24.5°C 左右,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(18:49 才开启),排除烹饪导致的正常升温。\",\n \"推理步骤2: 18:30 厨房温度仍高达 2861(28.61°C),持续异常。但 18:50 和 19:33 两个时间点传感器报告 MeasuredValue = None,说明传感器出现了读数丢失/故障。\",\n \"推理步骤3: 19:00 厨房温度突然恢复到 2438(24.38°C),与其他房间温度一致,说明之前 28.6°C 的读数大概率是传感器故障产生的虚假高温,而非真实环境温度。如果是真实高温,不可能在短时间内自然降回正常值。\",\n \"推理步骤4: 传感器在 18:50(灶具刚开启时)和 19:33(灶具关闭后)两次报告 None 值,进一步印证传感器工作状态不稳定,可能存在硬件故障或连接问题。\",\n \"推理步骤5: 19:32 厨房窗户被打开(BooleanState = False),之后直到日志结束(23:30)未见关闭记录。住户 21:46 已关灯、关空调并锁门(疑似就寝或离开客厅),但厨房窗户仍处于开启状态,存在夜间安全隐患。\"\n ],\n \"key_evidence\": [\n \"18:00 和 18:30 厨房温度传感器读数异常飙升至 2867/2861(28.67/28.61°C),而灶具 18:49 才开启,其他房间温度正常\",\n \"18:50 和 19:33 厨房温度传感器报告 MeasuredValue = None,出现两次读数丢失\",\n \"19:00 温度突然从 28.6°C 恢复至 24.38°C,不符合自然降温规律,指向传感器故障\",\n \"19:32 厨房窗户打开后至日志结束(23:30)未见关闭记录,住户已进入休息状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认供电和无线连接是否稳定,必要时更换传感器\",\n \"关闭厨房窗户,或设置自动化规则:当住户就寝/离开时自动检查并提醒关闭所有窗户\",\n \"在厨房温度传感器不可靠期间,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常作为安全兜底\",\n \"建议为温度传感器设置合理性校验规则:当单个传感器读数与其他房间偏差超过阈值、或出现 None 值时,及时告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及多次 null 值,疑似传感器故障,同时存在做饭后厨房窗户未关闭的安全隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2482(24.82°C)跳升至 2867(28.67°C),而同一时刻其他三个房间温度均在 24.5°C 左右,厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(18:49 才开启),排除烹饪导致的正常升温。", "推理步骤2: 18:30 厨房温度仍高达 2861(28.61°C),持续异常。但 18:50 和 19:33 两个时间点传感器报告 MeasuredValue = None,说明传感器出现了读数丢失/故障。", "推理步骤3: 19:00 厨房温度突然恢复到 2438(24.38°C),与其他房间温度一致,说明之前 28.6°C 的读数大概率是传感器故障产生的虚假高温,而非真实环境温度。如果是真实高温,不可能在短时间内自然降回正常值。", "推理步骤4: 传感器在 18:50(灶具刚开启时)和 19:33(灶具关闭后)两次报告 None 值,进一步印证传感器工作状态不稳定,可能存在硬件故障或连接问题。", "推理步骤5: 19:32 厨房窗户被打开(BooleanState = False),之后直到日志结束(23:30)未见关闭记录。住户 21:46 已关灯、关空调并锁门(疑似就寝或离开客厅),但厨房窗户仍处于开启状态,存在夜间安全隐患。"], "key_evidence": ["18:00 和 18:30 厨房温度传感器读数异常飙升至 2867/2861(28.67/28.61°C),而灶具 18:49 才开启,其他房间温度正常", "18:50 和 19:33 厨房温度传感器报告 MeasuredValue = None,出现两次读数丢失", "19:00 温度突然从 28.6°C 恢复至 24.38°C,不符合自然降温规律,指向传感器故障", "19:32 厨房窗户打开后至日志结束(23:30)未见关闭记录,住户已进入休息状态"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认供电和无线连接是否稳定,必要时更换传感器", "关闭厨房窗户,或设置自动化规则:当住户就寝/离开时自动检查并提醒关闭所有窗户", "在厨房温度传感器不可靠期间,加强对厨房烟雾报警器的依赖,确保 kitchen_smoke_alarm 工作正常作为安全兜底", "建议为温度传感器设置合理性校验规则:当单个传感器读数与其他房间偏差超过阈值、或出现 None 值时,及时告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.995033979415894, "api_error": null} {"episode_id": "SQ2_TN_B_0426", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_B_0426.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261055, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,疑似传感器故障或受高温干扰;同时 16:02 入户门开锁进入后未关门且无后续锁门记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57 和 07:05(早晨做饭期间)以及 18:13 和 18:58(晚间做饭期间)共出现 4 次 MeasuredValue = None,均发生在灶具开启后约 30 秒内。传感器应能正常测量温度,报告 None 说明传感器可能因高温超量程、通信中断或硬件故障而无法返回有效读数。\",\n \"推理步骤2: 虽然灶具附近温度升高可以理解,但正常传感器应返回一个较高的数值而非 None。两次做饭均复现此问题,说明这是一个可重复的故障模式,而非偶发通信丢包。\",\n \"推理步骤3: 16:02 入户门通过手动方式解锁(LockOperationType=1)并开门(StateValue=False),玄关检测到有人进入,但日志中没有随后的关门(StateValue=True)和锁门记录。直到 17:56 再次有开门事件,说明门在 16:02 至 17:56 之间可能一直处于未关/未锁状态,持续约 2 小时。\",\n \"推理步骤4: 整体生活模式正常——住户约 06:27 起床、07:28 出门、17:56 回家、22:31 就寝,门锁和灯光操作与单人居住习惯一致。16:02 的进入事件可能是住户短暂回家或快递/访客,但未关门的状态值得关注。\",\n \"推理步骤5: 厨房窗户在两次做饭结束后都被打开(07:04:30 和 18:57:30),属于正常通风行为,但日志中未见关闭记录,窗户可能一直处于开启状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启后多次报告 MeasuredValue = None(06:57、07:05、18:13、18:58),共 4 次\",\n \"16:02 入户门解锁开门后,日志中无对应的关门(StateValue=True)和锁门记录,直到 22:31 才出现关门锁门事件\",\n \"厨房窗户两次被打开(07:04:30 和 18:57:30)后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器量程不足以覆盖烹饪温度,考虑更换耐高温型号或调整安装位置\",\n \"设置入户门未关闭/未锁定超时告警(建议阈值 5-10 分钟),避免长时间门户洞开\",\n \"确认 16:02 的入门事件是否为住户本人操作,排除未授权进入的可能\",\n \"建议为厨房窗户设置长时间未关闭提醒,尤其是在无人在家时段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,疑似传感器故障或受高温干扰;同时 16:02 入户门开锁进入后未关门且无后续锁门记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:57 和 07:05(早晨做饭期间)以及 18:13 和 18:58(晚间做饭期间)共出现 4 次 MeasuredValue = None,均发生在灶具开启后约 30 秒内。传感器应能正常测量温度,报告 None 说明传感器可能因高温超量程、通信中断或硬件故障而无法返回有效读数。", "推理步骤2: 虽然灶具附近温度升高可以理解,但正常传感器应返回一个较高的数值而非 None。两次做饭均复现此问题,说明这是一个可重复的故障模式,而非偶发通信丢包。", "推理步骤3: 16:02 入户门通过手动方式解锁(LockOperationType=1)并开门(StateValue=False),玄关检测到有人进入,但日志中没有随后的关门(StateValue=True)和锁门记录。直到 17:56 再次有开门事件,说明门在 16:02 至 17:56 之间可能一直处于未关/未锁状态,持续约 2 小时。", "推理步骤4: 整体生活模式正常——住户约 06:27 起床、07:28 出门、17:56 回家、22:31 就寝,门锁和灯光操作与单人居住习惯一致。16:02 的进入事件可能是住户短暂回家或快递/访客,但未关门的状态值得关注。", "推理步骤5: 厨房窗户在两次做饭结束后都被打开(07:04:30 和 18:57:30),属于正常通风行为,但日志中未见关闭记录,窗户可能一直处于开启状态。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启后多次报告 MeasuredValue = None(06:57、07:05、18:13、18:58),共 4 次", "16:02 入户门解锁开门后,日志中无对应的关门(StateValue=True)和锁门记录,直到 22:31 才出现关门锁门事件", "厨房窗户两次被打开(07:04:30 和 18:57:30)后无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器量程不足以覆盖烹饪温度,考虑更换耐高温型号或调整安装位置", "设置入户门未关闭/未锁定超时告警(建议阈值 5-10 分钟),避免长时间门户洞开", "确认 16:02 的入门事件是否为住户本人操作,排除未授权进入的可能", "建议为厨房窗户设置长时间未关闭提醒,尤其是在无人在家时段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.547871828079224, "api_error": null} {"episode_id": "SQ2_TN_C_0383", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0383.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261012, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:41、07:05、18:32/19:09),而其他房间的温度传感器始终正常上报数值。\",\n \"推理步骤2: 这些 None 值均出现在灶具开启期间或刚关闭后,可能是高温环境导致传感器暂时失灵,也可能是传感器本身硬件老化、通信链路不稳定。\",\n \"推理步骤3: 虽然 None 值之后传感器都恢复了正常上报(如 07:00、07:30、19:00、19:30 均有正常读数),说明并非永久性故障,但间歇性失效意味着在关键时刻(如灶具使用时)可能无法提供准确的温度监测,存在安全盲区。\",\n \"推理步骤4: 其余设备行为均属正常——早晨起床、出门上锁、下午/傍晚回家、做饭、晚间就寝的生活节奏合理;入户门锁解锁后均有自动上锁;烟雾报警器和漏水传感器未触发任何告警;厨房窗户在做饭后打开通风属正常操作。\"\n ],\n \"key_evidence\": [\n \"06:41:10 kitchen_temp_sensor MeasuredValue = None(灶具 06:40 开启后约1分钟)\",\n \"07:05:00 kitchen_temp_sensor MeasuredValue = None(灶具 07:04 关闭后约1分钟)\",\n \"18:32:00 kitchen_temp_sensor MeasuredValue = None(灶具 18:31 开启后约1分钟)\",\n \"19:09:00 kitchen_temp_sensor MeasuredValue = None(灶具 19:08 关闭后约1分钟)\",\n \"其他三个温度传感器全天无任何 None 值,始终正常上报\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰\",\n \"检查该传感器的固件版本并尝试更新,排除软件层面的间歇性故障\",\n \"如问题持续出现,建议更换传感器或增加一个备用温度传感器,确保灶具使用期间厨房温度监测不中断\",\n \"在传感器修复前,可考虑将厨房烟雾报警器的灵敏度适当提高,弥补温度监测的盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:41、07:05、18:32/19:09),而其他房间的温度传感器始终正常上报数值。", "推理步骤2: 这些 None 值均出现在灶具开启期间或刚关闭后,可能是高温环境导致传感器暂时失灵,也可能是传感器本身硬件老化、通信链路不稳定。", "推理步骤3: 虽然 None 值之后传感器都恢复了正常上报(如 07:00、07:30、19:00、19:30 均有正常读数),说明并非永久性故障,但间歇性失效意味着在关键时刻(如灶具使用时)可能无法提供准确的温度监测,存在安全盲区。", "推理步骤4: 其余设备行为均属正常——早晨起床、出门上锁、下午/傍晚回家、做饭、晚间就寝的生活节奏合理;入户门锁解锁后均有自动上锁;烟雾报警器和漏水传感器未触发任何告警;厨房窗户在做饭后打开通风属正常操作。"], "key_evidence": ["06:41:10 kitchen_temp_sensor MeasuredValue = None(灶具 06:40 开启后约1分钟)", "07:05:00 kitchen_temp_sensor MeasuredValue = None(灶具 07:04 关闭后约1分钟)", "18:32:00 kitchen_temp_sensor MeasuredValue = None(灶具 18:31 开启后约1分钟)", "19:09:00 kitchen_temp_sensor MeasuredValue = None(灶具 19:08 关闭后约1分钟)", "其他三个温度传感器全天无任何 None 值,始终正常上报"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰", "检查该传感器的固件版本并尝试更新,排除软件层面的间歇性故障", "如问题持续出现,建议更换传感器或增加一个备用温度传感器,确保灶具使用期间厨房温度监测不中断", "在传感器修复前,可考虑将厨房烟雾报警器的灵敏度适当提高,弥补温度监测的盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.805751085281372, "api_error": null} {"episode_id": "SQ2_TN_C_0381", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0381.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261010, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时次卫灯开启后整天未关闭且无对应运动传感器事件,存在设备或使用异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:41、07:27、18:35、19:16 共四次报告 MeasuredValue = None。其中 06:41 和 18:35 发生在灶具开启后不久,07:27 和 19:16 发生在灶具关闭、厨房窗户打开后不久。这种在热源变化时反复出现 None 的模式,说明传感器在温度快速变化时无法正常采样,属于设备故障或性能缺陷。\",\n \"推理步骤2: 虽然每次 None 之后传感器在下一个 30 分钟周期恢复了正常数值,但间歇性失效意味着在关键时刻(如灶具使用期间)可能无法提供有效的温度监测,削弱了厨房的安全保障能力。\",\n \"推理步骤3: 次卫灯在 07:05 开启后,直到日志结束(23:30)都未关闭,且全天没有次卫运动传感器的任何事件记录。这可能是灯被遗忘开启,也可能是运动传感器离线未上报。\",\n \"推理步骤4: 其余事件均属正常家庭作息——早晨 06:17 起床、07:38 出门上锁、16:00 孩子放学回家、18:00 大人回家做饭、21:18 孩子就寝、22:45 大人就寝并锁门。入户门的开锁/上锁、门磁开合时序完全吻合,无入侵迹象。\",\n \"推理步骤5: 温度整体走势合理:夜间约 23°C,午间峰值约 25.8°C,傍晚逐步回落。各房间温差在正常范围内,无异常热源指示。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:41、07:27、18:35、19:16 四次报告 MeasuredValue = None,均与灶具开关或厨房窗户开启时间高度关联\",\n \"second_bathroom_light 在 07:05 开启后全天未关闭,且 second_bathroom 无任何运动传感器事件上报\",\n \"入户门在 16:00 和 18:00 的两次开锁均为 Manual 操作,且 18:00 回家后 22:45 确认门磁关闭并自动上锁,时序正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致温度骤变时采样失败;如问题持续,建议更换传感器或升级固件\",\n \"检查次卫运动传感器是否在线工作正常,确认是否存在离线或电量不足的情况\",\n \"为次卫灯配置无人自动关闭策略(如运动传感器 15 分钟无感应则关灯),避免长时间空耗\",\n \"考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知住户,防止灶具使用期间失去温度监控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时次卫灯开启后整天未关闭且无对应运动传感器事件,存在设备或使用异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:41、07:27、18:35、19:16 共四次报告 MeasuredValue = None。其中 06:41 和 18:35 发生在灶具开启后不久,07:27 和 19:16 发生在灶具关闭、厨房窗户打开后不久。这种在热源变化时反复出现 None 的模式,说明传感器在温度快速变化时无法正常采样,属于设备故障或性能缺陷。", "推理步骤2: 虽然每次 None 之后传感器在下一个 30 分钟周期恢复了正常数值,但间歇性失效意味着在关键时刻(如灶具使用期间)可能无法提供有效的温度监测,削弱了厨房的安全保障能力。", "推理步骤3: 次卫灯在 07:05 开启后,直到日志结束(23:30)都未关闭,且全天没有次卫运动传感器的任何事件记录。这可能是灯被遗忘开启,也可能是运动传感器离线未上报。", "推理步骤4: 其余事件均属正常家庭作息——早晨 06:17 起床、07:38 出门上锁、16:00 孩子放学回家、18:00 大人回家做饭、21:18 孩子就寝、22:45 大人就寝并锁门。入户门的开锁/上锁、门磁开合时序完全吻合,无入侵迹象。", "推理步骤5: 温度整体走势合理:夜间约 23°C,午间峰值约 25.8°C,傍晚逐步回落。各房间温差在正常范围内,无异常热源指示。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:41、07:27、18:35、19:16 四次报告 MeasuredValue = None,均与灶具开关或厨房窗户开启时间高度关联", "second_bathroom_light 在 07:05 开启后全天未关闭,且 second_bathroom 无任何运动传感器事件上报", "入户门在 16:00 和 18:00 的两次开锁均为 Manual 操作,且 18:00 回家后 22:45 确认门磁关闭并自动上锁,时序正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致温度骤变时采样失败;如问题持续,建议更换传感器或升级固件", "检查次卫运动传感器是否在线工作正常,确认是否存在离线或电量不足的情况", "为次卫灯配置无人自动关闭策略(如运动传感器 15 分钟无感应则关灯),避免长时间空耗", "考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知住户,防止灶具使用期间失去温度监控"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.82071542739868, "api_error": null} {"episode_id": "SQ2_TN_C_0389", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0389.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261018, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None(06:47、07:23、18:51 及 19:27),而其他房间的温度传感器在同一时段均正常上报数值。\",\n \"推理步骤2: 这3次 null 值均紧跟在厨房灶具 (kitchen_cook_surface) 开启或关闭的时间窗口内——06:46 灶具开启后1分钟出现 null,07:22 灶具关闭后1分钟出现 null,18:50 灶具开启后1分钟出现 null,19:26 灶具关闭后1分钟出现 null。这表明灶具运行状态变化与传感器异常高度相关。\",\n \"推理步骤3: 虽然 null 值之后传感器在下一个30分钟整点周期恢复了正常读数,说明传感器并未永久失效,但间歇性丢失数据仍然是一个隐患——如果灶具使用期间发生真正的厨房高温异常或火灾前兆,温度传感器恰好处于 null 状态将无法提供预警。\",\n \"推理步骤4: 除此异常外,整体日志模式正常:凌晨全家休息、06:07 起床、07:50 出门上锁、15:59 孩子放学回家、17:44 大人回家、21:16 孩子就寝、22:39 大人就寝并锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。温度整体呈现夏季日间升高、夜间降低的正常曲线。厨房窗户在做完饭后打开通风属于正常行为。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:23、18:51、19:27 四次报告 MeasuredValue = None\",\n \"每次 null 值均出现在 kitchen_cook_surface 开启或关闭后约1分钟内,其他房间传感器同期正常\",\n \"传感器在后续整点周期恢复正常读数,说明是间歇性故障而非永久损坏\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰,建议将其移至远离灶具的位置\",\n \"检查传感器固件版本,考虑更新固件或更换设备以解决间歇性 null 上报问题\",\n \"在传感器修复前,确保厨房烟雾报警器 (kitchen_smoke_alarm) 工作正常,作为灶具使用期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None(06:47、07:23、18:51 及 19:27),而其他房间的温度传感器在同一时段均正常上报数值。", "推理步骤2: 这3次 null 值均紧跟在厨房灶具 (kitchen_cook_surface) 开启或关闭的时间窗口内——06:46 灶具开启后1分钟出现 null,07:22 灶具关闭后1分钟出现 null,18:50 灶具开启后1分钟出现 null,19:26 灶具关闭后1分钟出现 null。这表明灶具运行状态变化与传感器异常高度相关。", "推理步骤3: 虽然 null 值之后传感器在下一个30分钟整点周期恢复了正常读数,说明传感器并未永久失效,但间歇性丢失数据仍然是一个隐患——如果灶具使用期间发生真正的厨房高温异常或火灾前兆,温度传感器恰好处于 null 状态将无法提供预警。", "推理步骤4: 除此异常外,整体日志模式正常:凌晨全家休息、06:07 起床、07:50 出门上锁、15:59 孩子放学回家、17:44 大人回家、21:16 孩子就寝、22:39 大人就寝并锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。温度整体呈现夏季日间升高、夜间降低的正常曲线。厨房窗户在做完饭后打开通风属于正常行为。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:23、18:51、19:27 四次报告 MeasuredValue = None", "每次 null 值均出现在 kitchen_cook_surface 开启或关闭后约1分钟内,其他房间传感器同期正常", "传感器在后续整点周期恢复正常读数,说明是间歇性故障而非永久损坏"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰,建议将其移至远离灶具的位置", "检查传感器固件版本,考虑更新固件或更换设备以解决间歇性 null 上报问题", "在传感器修复前,确保厨房烟雾报警器 (kitchen_smoke_alarm) 工作正常,作为灶具使用期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.708327054977417, "api_error": null} {"episode_id": "SQ2_TN_C_0390", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0390.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261019, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后开启但日志中未见关闭事件。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后不久(06:31:06 和 18:50:00)以及灶具关闭后(07:08:00 和 19:28:00)共出现 4 次 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值,说明这不是系统级问题,而是该传感器自身异常。\",\n \"推理步骤2: None 值与灶具使用高度相关——每次做饭期间和刚结束时各出现一次,可能是灶具高温导致传感器超量程或通信中断。但传感器在下一个整点周期又恢复了正常数值,说明并非永久性硬件损坏,更像是间歇性故障。\",\n \"推理步骤3: 厨房窗户传感器在 07:07:30 报告 StateValue=False(窗户打开),之后整天日志中未见对应的 True(关闭)事件。19:27:30 再次报告 False(仍然是打开状态)。虽然做饭后开窗通风是合理行为,但全天未关窗在无人在家期间(07:15~16:20)存在一定安全隐患。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 06:23 儿童起床、06:30 做早餐、07:15 全家出门并自动锁门、16:20 孩子放学回家、18:01 大人回家开空调、18:49 做晚餐、21:14 孩子就寝、22:26 大人就寝并锁门。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程操作。\",\n \"推理步骤5: 全天温度曲线呈现正常的日间升温(凌晨约 22.9°C → 正午约 25.8°C)、午后降温的自然变化,空调开启后客厅温度从 24.6°C 逐步降至 23.7°C 也符合预期,无异常温升或火灾迹象。烟雾报警器全天无触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:31:06、07:08:00、18:50:00、19:28:00 四次报告 MeasuredValue = None,均与灶具使用时段强相关\",\n \"kitchen_window_contact 在 07:07:30 报告窗户打开后,全天日志中无关闭记录,家中无人时段(07:15~16:20)窗户持续敞开\",\n \"其他所有传感器全天工作正常,无 None 值或异常读数\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程;考虑将其移至远离热源的位置\",\n \"如传感器位置合理,建议对其进行固件更新或更换,排除间歇性硬件故障\",\n \"设置自动化规则:当全家离家(门锁上锁)时检测厨房窗户是否仍处于打开状态,若是则发送提醒通知\",\n \"考虑为厨房窗户加装电动开合装置,以便在离家模式下自动关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后开启但日志中未见关闭事件。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后不久(06:31:06 和 18:50:00)以及灶具关闭后(07:08:00 和 19:28:00)共出现 4 次 MeasuredValue = None,而其他三个温度传感器全天从未出现 None 值,说明这不是系统级问题,而是该传感器自身异常。", "推理步骤2: None 值与灶具使用高度相关——每次做饭期间和刚结束时各出现一次,可能是灶具高温导致传感器超量程或通信中断。但传感器在下一个整点周期又恢复了正常数值,说明并非永久性硬件损坏,更像是间歇性故障。", "推理步骤3: 厨房窗户传感器在 07:07:30 报告 StateValue=False(窗户打开),之后整天日志中未见对应的 True(关闭)事件。19:27:30 再次报告 False(仍然是打开状态)。虽然做饭后开窗通风是合理行为,但全天未关窗在无人在家期间(07:15~16:20)存在一定安全隐患。", "推理步骤4: 其余行为模式均属正常——早晨 06:23 儿童起床、06:30 做早餐、07:15 全家出门并自动锁门、16:20 孩子放学回家、18:01 大人回家开空调、18:49 做晚餐、21:14 孩子就寝、22:26 大人就寝并锁门。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程操作。", "推理步骤5: 全天温度曲线呈现正常的日间升温(凌晨约 22.9°C → 正午约 25.8°C)、午后降温的自然变化,空调开启后客厅温度从 24.6°C 逐步降至 23.7°C 也符合预期,无异常温升或火灾迹象。烟雾报警器全天无触发。"], "key_evidence": ["kitchen_temp_sensor 在 06:31:06、07:08:00、18:50:00、19:28:00 四次报告 MeasuredValue = None,均与灶具使用时段强相关", "kitchen_window_contact 在 07:07:30 报告窗户打开后,全天日志中无关闭记录,家中无人时段(07:15~16:20)窗户持续敞开", "其他所有传感器全天工作正常,无 None 值或异常读数"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程;考虑将其移至远离热源的位置", "如传感器位置合理,建议对其进行固件更新或更换,排除间歇性硬件故障", "设置自动化规则:当全家离家(门锁上锁)时检测厨房窗户是否仍处于打开状态,若是则发送提醒通知", "考虑为厨房窗户加装电动开合装置,以便在离家模式下自动关闭"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.896869659423828, "api_error": null} {"episode_id": "SQ2_TN_C_0392", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0392.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261021, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None 的情况(06:45:02、06:58:00、18:28:00 和 18:57:00),而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: 这些 None 值均出现在灶具使用前后(06:44:32 灶具开启 → 06:45:02 传感器报 None;18:27:30 灶具开启 → 18:28:00 传感器报 None;18:56:00 灶具关闭 → 18:57:00 传感器报 None),说明传感器可能受灶具高温或电磁干扰影响而暂时失效。\",\n \"推理步骤3: 传感器在 None 之后的下一个整点周期(07:00、19:00)又恢复了正常读数,且数值与其他房间传感器一致,排除了持续性硬件损坏,但间歇性失效仍构成安全隐患——厨房是火灾高风险区域,温度传感器在灶具使用时恰好失效意味着最需要监测的时刻反而没有数据。\",\n \"推理步骤4: 其余设备行为均属正常:早晨 06:29 起床、07:16 出门上锁、15:58 孩子放学回家、17:50 大人回家开空调做饭、22:16 睡前关灯锁门,符合典型三口之家的作息规律。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程操作。\",\n \"推理步骤5: 厨房窗户传感器在做饭后打开(06:57:30、18:56:30)属于通风行为,但日志中未见关闭事件,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:45:02、06:58:00、18:28:00、18:57:00 四次报告 MeasuredValue = None\",\n \"None 值均与 kitchen_cook_surface 的开启/关闭时间高度关联,其他传感器同期正常\",\n \"厨房窗户传感器两次报告 StateValue = False(打开),但日志中无对应的关闭(True)事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,必要时重新定位传感器\",\n \"对厨房温度传感器进行固件更新或硬件检测,排查间歇性通信故障的根因\",\n \"在传感器修复前,考虑增加一个备用温度传感器或将厨房烟雾报警器作为灶具使用期间的主要安全监测手段\",\n \"确认厨房窗户当前状态,如已入夜且无人在厨房,建议关闭窗户以保障夜间安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None 的情况(06:45:02、06:58:00、18:28:00 和 18:57:00),而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: 这些 None 值均出现在灶具使用前后(06:44:32 灶具开启 → 06:45:02 传感器报 None;18:27:30 灶具开启 → 18:28:00 传感器报 None;18:56:00 灶具关闭 → 18:57:00 传感器报 None),说明传感器可能受灶具高温或电磁干扰影响而暂时失效。", "推理步骤3: 传感器在 None 之后的下一个整点周期(07:00、19:00)又恢复了正常读数,且数值与其他房间传感器一致,排除了持续性硬件损坏,但间歇性失效仍构成安全隐患——厨房是火灾高风险区域,温度传感器在灶具使用时恰好失效意味着最需要监测的时刻反而没有数据。", "推理步骤4: 其余设备行为均属正常:早晨 06:29 起床、07:16 出门上锁、15:58 孩子放学回家、17:50 大人回家开空调做饭、22:16 睡前关灯锁门,符合典型三口之家的作息规律。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程操作。", "推理步骤5: 厨房窗户传感器在做饭后打开(06:57:30、18:56:30)属于通风行为,但日志中未见关闭事件,需确认窗户是否仍处于打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:45:02、06:58:00、18:28:00、18:57:00 四次报告 MeasuredValue = None", "None 值均与 kitchen_cook_surface 的开启/关闭时间高度关联,其他传感器同期正常", "厨房窗户传感器两次报告 StateValue = False(打开),但日志中无对应的关闭(True)事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,必要时重新定位传感器", "对厨房温度传感器进行固件更新或硬件检测,排查间歇性通信故障的根因", "在传感器修复前,考虑增加一个备用温度传感器或将厨房烟雾报警器作为灶具使用期间的主要安全监测手段", "确认厨房窗户当前状态,如已入夜且无人在厨房,建议关闭窗户以保障夜间安全"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.72793459892273, "api_error": null} {"episode_id": "SQ2_TN_C_0395", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0395.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261024, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,表明设备可能存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:03、07:16、18:19、18:56 四次报告 MeasuredValue = None,而同一时段其他三个温度传感器均正常上报数值。这说明问题出在该传感器本身,而非系统性通信故障。\",\n \"推理步骤2: None 值出现的时间点与灶具使用高度相关——07:02 灶具开启后 07:03 出现 None,18:18 灶具开启后 18:19 出现 None。可能是灶具工作时的高温或电磁干扰导致传感器读数异常,也可能是传感器本身在高温环境下出现间歇性故障。\",\n \"推理步骤3: 厨房窗户传感器在 07:15 和 18:55 两次记录开窗(StateValue=False),但整天日志中没有对应的关窗记录(StateValue=True)。考虑到家中有儿童,且 07:40 全家出门后窗户仍处于开启状态,这存在安全风险(入侵通道、雨水进入等)。\",\n \"推理步骤4: 其余设备行为均符合正常家庭作息模式——凌晨安静、06:18 起床、07:40 出门上班/上学、16:13 孩子放学回家、17:43 大人下班回家、21:09 孩子就寝、22:35 大人就寝,门锁开关、灯光、空调使用均合理。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、暴力),不存在入侵迹象。烟雾报警器和漏水传感器全天无告警,无火灾或水患风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:03、07:16、18:19、18:56 四次报告 MeasuredValue = None,且均与灶具使用时间高度关联\",\n \"kitchen_window_contact 在 07:15:30 和 18:55:30 两次记录开窗(StateValue=False),但全天无关窗记录,意味着窗户可能一直处于开启状态\",\n \"07:40 全家出门后厨房窗户仍为开启状态,直到 17:43 大人回家期间家中无人但窗户未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰;如有必要,更换传感器或调整安装位置\",\n \"设置自动化规则:当门锁上锁且全屋无人时,检查所有窗户传感器状态,若有窗户未关闭则发送提醒通知\",\n \"确认厨房窗户传感器工作是否正常——如果窗户实际已关闭但传感器未报告关闭事件,则传感器可能也存在故障\",\n \"考虑为厨房温度传感器设置 null 值告警,以便及时发现传感器离线或故障情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,表明设备可能存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:03、07:16、18:19、18:56 四次报告 MeasuredValue = None,而同一时段其他三个温度传感器均正常上报数值。这说明问题出在该传感器本身,而非系统性通信故障。", "推理步骤2: None 值出现的时间点与灶具使用高度相关——07:02 灶具开启后 07:03 出现 None,18:18 灶具开启后 18:19 出现 None。可能是灶具工作时的高温或电磁干扰导致传感器读数异常,也可能是传感器本身在高温环境下出现间歇性故障。", "推理步骤3: 厨房窗户传感器在 07:15 和 18:55 两次记录开窗(StateValue=False),但整天日志中没有对应的关窗记录(StateValue=True)。考虑到家中有儿童,且 07:40 全家出门后窗户仍处于开启状态,这存在安全风险(入侵通道、雨水进入等)。", "推理步骤4: 其余设备行为均符合正常家庭作息模式——凌晨安静、06:18 起床、07:40 出门上班/上学、16:13 孩子放学回家、17:43 大人下班回家、21:09 孩子就寝、22:35 大人就寝,门锁开关、灯光、空调使用均合理。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、暴力),不存在入侵迹象。烟雾报警器和漏水传感器全天无告警,无火灾或水患风险。"], "key_evidence": ["kitchen_temp_sensor 在 07:03、07:16、18:19、18:56 四次报告 MeasuredValue = None,且均与灶具使用时间高度关联", "kitchen_window_contact 在 07:15:30 和 18:55:30 两次记录开窗(StateValue=False),但全天无关窗记录,意味着窗户可能一直处于开启状态", "07:40 全家出门后厨房窗户仍为开启状态,直到 17:43 大人回家期间家中无人但窗户未关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰;如有必要,更换传感器或调整安装位置", "设置自动化规则:当门锁上锁且全屋无人时,检查所有窗户传感器状态,若有窗户未关闭则发送提醒通知", "确认厨房窗户传感器工作是否正常——如果窗户实际已关闭但传感器未报告关闭事件,则传感器可能也存在故障", "考虑为厨房温度传感器设置 null 值告警,以便及时发现传感器离线或故障情况"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.57665753364563, "api_error": null} {"episode_id": "SQ2_TN_C_0396", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0396.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261025, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:52、07:13、18:28、19:05),而其他三个温度传感器始终正常上报数值,说明问题局限于该设备。\",\n \"推理步骤2: 这些 None 值均出现在灶具开启或刚关闭后不久(06:51 灶具开启 → 06:52 None;07:12 灶具关闭 → 07:13 None;18:27 灶具开启 → 18:28 None;19:04 灶具关闭 → 19:05 None),说明传感器可能受灶具热源或电磁干扰影响而出现读数丢失。\",\n \"推理步骤3: 虽然传感器在后续的整点/半点采样中恢复了正常数值,但反复出现 None 值意味着该传感器在关键时刻(烹饪期间)无法提供可靠的温度监测,这会削弱厨房火灾预警能力。\",\n \"推理步骤4: 其余家庭活动均属正常模式——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关与人员活动时间线吻合,无入侵迹象。\",\n \"推理步骤5: 16:08 入户门开锁后未再上锁,直到 22:20 才由自动锁定关闭。虽然家中有人在,不构成即时入侵威胁,但长时间未锁门是一个安全隐患,值得关注。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:52、07:13、18:28、19:05 四次报告 MeasuredValue = None\",\n \"每次 None 值均与 kitchen_cook_surface 的开启或关闭操作在时间上高度关联\",\n \"其他三个温度传感器(客厅、主卧、儿童房)全天无任何异常读数\",\n \"16:08 入户门开锁后直到 22:20 才重新锁定,期间约6小时门锁处于未锁状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数\",\n \"对厨房温度传感器进行固件更新或硬件检测,排除设备本身故障\",\n \"考虑将传感器迁移到远离灶具但仍能有效监测厨房温度的位置\",\n \"设置自动化规则:当厨房温度传感器报告 None 且灶具处于开启状态时,立即发送告警通知\",\n \"建议配置入户门锁在无人操作一定时间后自动上锁,或在门锁长时间未锁定时推送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:52、07:13、18:28、19:05),而其他三个温度传感器始终正常上报数值,说明问题局限于该设备。", "推理步骤2: 这些 None 值均出现在灶具开启或刚关闭后不久(06:51 灶具开启 → 06:52 None;07:12 灶具关闭 → 07:13 None;18:27 灶具开启 → 18:28 None;19:04 灶具关闭 → 19:05 None),说明传感器可能受灶具热源或电磁干扰影响而出现读数丢失。", "推理步骤3: 虽然传感器在后续的整点/半点采样中恢复了正常数值,但反复出现 None 值意味着该传感器在关键时刻(烹饪期间)无法提供可靠的温度监测,这会削弱厨房火灾预警能力。", "推理步骤4: 其余家庭活动均属正常模式——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关与人员活动时间线吻合,无入侵迹象。", "推理步骤5: 16:08 入户门开锁后未再上锁,直到 22:20 才由自动锁定关闭。虽然家中有人在,不构成即时入侵威胁,但长时间未锁门是一个安全隐患,值得关注。"], "key_evidence": ["kitchen_temp_sensor 在 06:52、07:13、18:28、19:05 四次报告 MeasuredValue = None", "每次 None 值均与 kitchen_cook_surface 的开启或关闭操作在时间上高度关联", "其他三个温度传感器(客厅、主卧、儿童房)全天无任何异常读数", "16:08 入户门开锁后直到 22:20 才重新锁定,期间约6小时门锁处于未锁状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数", "对厨房温度传感器进行固件更新或硬件检测,排除设备本身故障", "考虑将传感器迁移到远离灶具但仍能有效监测厨房温度的位置", "设置自动化规则:当厨房温度传感器报告 None 且灶具处于开启状态时,立即发送告警通知", "建议配置入户门锁在无人操作一定时间后自动上锁,或在门锁长时间未锁定时推送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.811426877975464, "api_error": null} {"episode_id": "SQ2_TN_C_0398", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0398.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261027, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具在无人居家期间(07:23离家后)未确认关闭状态,且厨房窗户开关状态缺少闭合记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、06:57、18:28、19:27 四次报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器存在间歇性故障或通信中断。\",\n \"推理步骤2: 观察 None 值出现的时间点,均与灶具开启(06:56:40 开启、18:27:30 开启)高度相关。灶具工作时传感器失效,可能是高温干扰、蒸汽影响传感器,或传感器本身耐受性不足。这意味着在最需要温度监控的时刻(烹饪时),恰恰失去了监控能力。\",\n \"推理步骤3: 厨房窗户传感器在 06:55:30 报告 StateValue=False(窗户打开),但整个日志中没有对应的 StateValue=True(窗户关闭)记录。19:26:30 再次报告 False(打开),同样无闭合记录。虽然可能是日志截断,但也可能窗户一直处于开启状态。\",\n \"推理步骤4: 早晨 06:55:00 灶具先报告 OnOff=False,随后 06:56:40 又报告 OnOff=True,这个短暂的关-开序列略显异常,可能是误触或设备状态抖动。\",\n \"推理步骤5: 除上述问题外,整体生活模式正常——早晨6点起床、7:23出门上班/上学并自动锁门、16:21孩子先回家、18:00大人回家做饭、21:13孩子睡觉、22:47大人就寝。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:56、06:57、18:28、19:27 四次报告 MeasuredValue = None,且均与灶具开启时间高度吻合\",\n \"kitchen_window_contact 在 06:55:30 和 19:26:30 两次报告 StateValue=False(开启),但日志中无对应的关闭记录\",\n \"灶具在 06:55:00 报告 Off 后仅 1 分 40 秒又报告 On,存在状态抖动\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰,必要时重新定位或更换耐高温型号\",\n \"排查厨房温度传感器的通信链路(电池电量、信号强度),确认 None 值是传感器硬件故障还是网络丢包\",\n \"确认厨房窗户当前实际状态,检查窗户传感器是否正常工作(磁铁是否移位)\",\n \"考虑为灶具添加自动化规则:离家模式下若灶具仍处于开启状态则发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具在无人居家期间(07:23离家后)未确认关闭状态,且厨房窗户开关状态缺少闭合记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、06:57、18:28、19:27 四次报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器存在间歇性故障或通信中断。", "推理步骤2: 观察 None 值出现的时间点,均与灶具开启(06:56:40 开启、18:27:30 开启)高度相关。灶具工作时传感器失效,可能是高温干扰、蒸汽影响传感器,或传感器本身耐受性不足。这意味着在最需要温度监控的时刻(烹饪时),恰恰失去了监控能力。", "推理步骤3: 厨房窗户传感器在 06:55:30 报告 StateValue=False(窗户打开),但整个日志中没有对应的 StateValue=True(窗户关闭)记录。19:26:30 再次报告 False(打开),同样无闭合记录。虽然可能是日志截断,但也可能窗户一直处于开启状态。", "推理步骤4: 早晨 06:55:00 灶具先报告 OnOff=False,随后 06:56:40 又报告 OnOff=True,这个短暂的关-开序列略显异常,可能是误触或设备状态抖动。", "推理步骤5: 除上述问题外,整体生活模式正常——早晨6点起床、7:23出门上班/上学并自动锁门、16:21孩子先回家、18:00大人回家做饭、21:13孩子睡觉、22:47大人就寝。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。"], "key_evidence": ["kitchen_temp_sensor 在 06:56、06:57、18:28、19:27 四次报告 MeasuredValue = None,且均与灶具开启时间高度吻合", "kitchen_window_contact 在 06:55:30 和 19:26:30 两次报告 StateValue=False(开启),但日志中无对应的关闭记录", "灶具在 06:55:00 报告 Off 后仅 1 分 40 秒又报告 On,存在状态抖动"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰,必要时重新定位或更换耐高温型号", "排查厨房温度传感器的通信链路(电池电量、信号强度),确认 None 值是传感器硬件故障还是网络丢包", "确认厨房窗户当前实际状态,检查窗户传感器是否正常工作(磁铁是否移位)", "考虑为灶具添加自动化规则:离家模式下若灶具仍处于开启状态则发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.02136754989624, "api_error": null} {"episode_id": "SQ2_TN_C_0401", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0401.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261030, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:38、07:00、18:30、19:26 四个时间点报告了 MeasuredValue = None,而其他房间的温度传感器始终正常上报数值\",\n \"推理步骤2: None 值出现的时间点与灶具使用相关(06:37 灶具开启后 06:38 出现 None,18:29 灶具开启后 18:30 出现 None,19:25 灶具关闭后 19:26 出现 None),可能是灶具产生的热量或蒸汽干扰了传感器\",\n \"推理步骤3: 虽然传感器在 None 之后能恢复正常读数(如 07:00 同时报告了 None 和 2420),但反复出现读数丢失说明传感器在高温/蒸汽环境下工作不稳定,存在设备可靠性问题\",\n \"推理步骤4: 其余家庭活动模式正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁操作均为手动开锁且自动回锁,无入侵迹象\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38、07:00、18:30、19:26 报告 MeasuredValue = None\",\n \"None 值均出现在灶具开启或刚关闭的时间窗口内,其他传感器同期工作正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受热或蒸汽影响\",\n \"考虑将传感器迁移到远离灶具的位置,或加装防护罩\",\n \"如问题持续,更换传感器或检查其无线通信链路是否受厨房电磁干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常", "reasoning": ["推理步骤1: 厨房温度传感器在 06:38、07:00、18:30、19:26 四个时间点报告了 MeasuredValue = None,而其他房间的温度传感器始终正常上报数值", "推理步骤2: None 值出现的时间点与灶具使用相关(06:37 灶具开启后 06:38 出现 None,18:29 灶具开启后 18:30 出现 None,19:25 灶具关闭后 19:26 出现 None),可能是灶具产生的热量或蒸汽干扰了传感器", "推理步骤3: 虽然传感器在 None 之后能恢复正常读数(如 07:00 同时报告了 None 和 2420),但反复出现读数丢失说明传感器在高温/蒸汽环境下工作不稳定,存在设备可靠性问题", "推理步骤4: 其余家庭活动模式正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁操作均为手动开锁且自动回锁,无入侵迹象"], "key_evidence": ["kitchen_temp_sensor 在 06:38、07:00、18:30、19:26 报告 MeasuredValue = None", "None 值均出现在灶具开启或刚关闭的时间窗口内,其他传感器同期工作正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受热或蒸汽影响", "考虑将传感器迁移到远离灶具的位置,或加装防护罩", "如问题持续,更换传感器或检查其无线通信链路是否受厨房电磁干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 14.71901798248291, "api_error": null} {"episode_id": "SQ2_TN_C_0405", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0405.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261034, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:43、07:28、18:41、19:30 四次报告 MeasuredValue = None。前两次发生在早餐做饭期间,后两次发生在晚餐做饭期间,说明灶具开启时传感器反复失效,这不是正常行为。\",\n \"推理步骤2: 温度传感器在灶具工作期间失效尤其值得关注——这恰恰是最需要温度监测的时段(火灾风险最高时)。可能原因包括:传感器受高温干扰、通信故障、或传感器本身硬件问题。\",\n \"推理步骤3: 厨房窗户在 07:27:30 开启(BooleanState.StateValue = False),整个日志中未见关闭事件。晚间 19:29:30 又一次开启事件,同样未见关闭。家人 07:29 已全部出门且全天无人在家,厨房窗户长时间敞开存在安全隐患。\",\n \"推理步骤4: 其余行为模式正常——06:00 主卧起床、06:24 儿童房起床、07:29 全家出门并自动锁门、16:11 孩子放学回家、17:57 大人回家开空调、21:01 孩子就寝、22:26 大人就寝并锁门,均符合三口之家的典型作息。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁尝试,不存在入侵迹象。温度整体走势(夜间 23°C → 午间 25-26°C → 夜间回落)符合夏季自然变化,无火灾特征。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:43、07:28、18:41、19:30 四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"kitchen_window_contact 在 07:27:30 报告开启(StateValue=False),全天未见关闭事件,家人 07:29 已出门\",\n \"19:29:30 厨房窗户再次出现开启事件,同样未见后续关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"对厨房温度传感器进行固件检查和通信诊断,排除硬件故障\",\n \"确认厨房窗户当前实际状态,如确实未关闭请及时关闭,避免夜间安全隐患\",\n \"考虑设置离家自动化规则:出门时检查所有窗户传感器状态,如有未关闭窗户则发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:43、07:28、18:41、19:30 四次报告 MeasuredValue = None。前两次发生在早餐做饭期间,后两次发生在晚餐做饭期间,说明灶具开启时传感器反复失效,这不是正常行为。", "推理步骤2: 温度传感器在灶具工作期间失效尤其值得关注——这恰恰是最需要温度监测的时段(火灾风险最高时)。可能原因包括:传感器受高温干扰、通信故障、或传感器本身硬件问题。", "推理步骤3: 厨房窗户在 07:27:30 开启(BooleanState.StateValue = False),整个日志中未见关闭事件。晚间 19:29:30 又一次开启事件,同样未见关闭。家人 07:29 已全部出门且全天无人在家,厨房窗户长时间敞开存在安全隐患。", "推理步骤4: 其余行为模式正常——06:00 主卧起床、06:24 儿童房起床、07:29 全家出门并自动锁门、16:11 孩子放学回家、17:57 大人回家开空调、21:01 孩子就寝、22:26 大人就寝并锁门,均符合三口之家的典型作息。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁尝试,不存在入侵迹象。温度整体走势(夜间 23°C → 午间 25-26°C → 夜间回落)符合夏季自然变化,无火灾特征。"], "key_evidence": ["kitchen_temp_sensor 在 06:43、07:28、18:41、19:30 四次报告 MeasuredValue = None,均发生在灶具使用前后", "kitchen_window_contact 在 07:27:30 报告开启(StateValue=False),全天未见关闭事件,家人 07:29 已出门", "19:29:30 厨房窗户再次出现开启事件,同样未见后续关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "对厨房温度传感器进行固件检查和通信诊断,排除硬件故障", "确认厨房窗户当前实际状态,如确实未关闭请及时关闭,避免夜间安全隐患", "考虑设置离家自动化规则:出门时检查所有窗户传感器状态,如有未关闭窗户则发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.266113996505737, "api_error": null} {"episode_id": "SQ2_TN_C_0402", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0402.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261031, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障;同时厨房窗户在做饭后开启但日志中未见关闭,且入户门在16:05开锁进入后未及时上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:37、07:05、18:36、18:58 四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统性通信故障,而是该传感器自身的问题。\",\n \"推理步骤2: None 值均出现在灶具开启期间或刚关闭后(06:36 灶具开→06:37 None、07:05 None;18:35 灶具开→18:36 None、18:58 None)。推测灶具工作时的高温或油烟可能导致传感器读数异常或暂时失效。厨房温度传感器是烟雾报警器的重要辅助判断依据,如果它在烹饪高温时段反复失效,会削弱火灾预警能力。\",\n \"推理步骤3: 厨房窗户传感器在 07:04:30 报告 StateValue=False(窗户打开),之后在 18:57:30 再次报告 StateValue=False(仍为打开)。整个日志中未见该窗户关闭(StateValue=True)的记录。家中 07:21 全员出门且门锁自动上锁,厨房窗户在无人期间保持开启约11小时,存在一定的入侵风险。\",\n \"推理步骤4: 16:05 入户门解锁、有人进入(儿童房检测到人),但日志中未见该次开门后的关门(front_door_contact StateValue=True)和上锁记录,直到 22:49 才确认门关闭并自动上锁。期间约6小时45分钟入户门可能处于未锁状态。\",\n \"推理步骤5: 其余行为模式正常——早晨6:14起床、7:21出门上锁、16:05有人回家(可能是孩子放学)、18:01大人回家做饭、晚间正常作息22:49就寝锁门。温度曲线符合夏季白天升温夜间降温的自然规律(约22.9°C~25.9°C)。无烟雾报警、无漏水报警、无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37、07:05、18:36、18:58 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"kitchen_window_contact 在 07:04:30 报告窗户打开后,全天日志中未见关闭记录,无人时段窗户持续敞开约11小时\",\n \"16:05 入户门解锁后至 22:49 期间未见明确的关门上锁记录,入户门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置\",\n \"设置自动化规则:当全员离家(门锁上锁)时,若厨房窗户仍处于打开状态,发送提醒通知\",\n \"设置自动化规则:入户门解锁后若超过一定时间未关闭或未上锁,触发提醒通知\",\n \"考虑为厨房温度传感器设置 null 值告警,当传感器连续报告无效值时及时通知用户,避免在火灾场景中丧失预警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障;同时厨房窗户在做饭后开启但日志中未见关闭,且入户门在16:05开锁进入后未及时上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:37、07:05、18:36、18:58 四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统性通信故障,而是该传感器自身的问题。", "推理步骤2: None 值均出现在灶具开启期间或刚关闭后(06:36 灶具开→06:37 None、07:05 None;18:35 灶具开→18:36 None、18:58 None)。推测灶具工作时的高温或油烟可能导致传感器读数异常或暂时失效。厨房温度传感器是烟雾报警器的重要辅助判断依据,如果它在烹饪高温时段反复失效,会削弱火灾预警能力。", "推理步骤3: 厨房窗户传感器在 07:04:30 报告 StateValue=False(窗户打开),之后在 18:57:30 再次报告 StateValue=False(仍为打开)。整个日志中未见该窗户关闭(StateValue=True)的记录。家中 07:21 全员出门且门锁自动上锁,厨房窗户在无人期间保持开启约11小时,存在一定的入侵风险。", "推理步骤4: 16:05 入户门解锁、有人进入(儿童房检测到人),但日志中未见该次开门后的关门(front_door_contact StateValue=True)和上锁记录,直到 22:49 才确认门关闭并自动上锁。期间约6小时45分钟入户门可能处于未锁状态。", "推理步骤5: 其余行为模式正常——早晨6:14起床、7:21出门上锁、16:05有人回家(可能是孩子放学)、18:01大人回家做饭、晚间正常作息22:49就寝锁门。温度曲线符合夏季白天升温夜间降温的自然规律(约22.9°C~25.9°C)。无烟雾报警、无漏水报警、无异常入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:37、07:05、18:36、18:58 四次报告 MeasuredValue = None,均与灶具使用时段重合", "kitchen_window_contact 在 07:04:30 报告窗户打开后,全天日志中未见关闭记录,无人时段窗户持续敞开约11小时", "16:05 入户门解锁后至 22:49 期间未见明确的关门上锁记录,入户门可能长时间未锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置", "设置自动化规则:当全员离家(门锁上锁)时,若厨房窗户仍处于打开状态,发送提醒通知", "设置自动化规则:入户门解锁后若超过一定时间未关闭或未上锁,触发提醒通知", "考虑为厨房温度传感器设置 null 值告警,当传感器连续报告无效值时及时通知用户,避免在火灾场景中丧失预警能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.061591148376465, "api_error": null} {"episode_id": "SQ2_TN_C_0413", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0413.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261042, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天温度变化符合夏季自然昼夜温差规律,无异常。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。\",\n \"推理步骤2: 凌晨 00:00–05:30 各房间温度稳定在 22.9–23.1°C 左右,属于夏季夜间正常室温。\",\n \"推理步骤3: 06:00 起温度开始上升,至 12:00–12:30 达到全天峰值约 25.7–25.9°C,随后逐步回落,到 23:30 降回约 23.3°C。这条抛物线式的温度曲线完全吻合夏季(6月28日)日照驱动的自然昼夜温差模式。\",\n \"推理步骤4: 四个传感器(客厅、主卧、儿童房、厨房)在同一时刻的读数高度一致,偏差通常在 0.1–0.2°C 以内,说明不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障。\",\n \"推理步骤5: 全天最高温约 25.9°C、最低约 22.9°C,温差约 3°C,处于正常居住环境范围内,未触及任何安全阈值。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9–25.9°C,处于正常夏季室温区间\",\n \"四个房间温度高度同步,呈现一致的日出升温、午后降温曲线,无单点异常\",\n \"日志中无任何烟雾、漏水、门窗开合、入侵等安全类事件\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前状态正常\",\n \"如夏季午间室温偏高(接近 26°C),可考虑设置空调自动开启规则以提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天温度变化符合夏季自然昼夜温差规律,无异常。", "reasoning": ["推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。", "推理步骤2: 凌晨 00:00–05:30 各房间温度稳定在 22.9–23.1°C 左右,属于夏季夜间正常室温。", "推理步骤3: 06:00 起温度开始上升,至 12:00–12:30 达到全天峰值约 25.7–25.9°C,随后逐步回落,到 23:30 降回约 23.3°C。这条抛物线式的温度曲线完全吻合夏季(6月28日)日照驱动的自然昼夜温差模式。", "推理步骤4: 四个传感器(客厅、主卧、儿童房、厨房)在同一时刻的读数高度一致,偏差通常在 0.1–0.2°C 以内,说明不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障。", "推理步骤5: 全天最高温约 25.9°C、最低约 22.9°C,温差约 3°C,处于正常居住环境范围内,未触及任何安全阈值。"], "key_evidence": ["全天温度范围 22.9–25.9°C,处于正常夏季室温区间", "四个房间温度高度同步,呈现一致的日出升温、午后降温曲线,无单点异常", "日志中无任何烟雾、漏水、门窗开合、入侵等安全类事件"], "recommended_actions": ["无需采取任何措施,当前状态正常", "如夏季午间室温偏高(接近 26°C),可考虑设置空调自动开启规则以提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.300509929656982, "api_error": null} {"episode_id": "SQ2_TN_C_0409", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0409.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261038, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的读数(06:37:09、07:12:00、18:26:00 和 19:07:00 共4次),而其他三个温度传感器全天均正常上报数值,说明问题局限于该设备。\",\n \"推理步骤2: 观察 None 值出现的时间规律——每次都发生在灶具开启或关闭后不久(06:36:39 灶具开启 → 06:37:09 None;07:11:00 灶具关闭 → 07:12:00 None;18:25:30 灶具开启 → 18:26:00 None;19:06:00 灶具关闭 → 19:07:00 None)。这表明灶具操作可能对温度传感器造成电磁干扰或热冲击,导致读数丢失。\",\n \"推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全监测手段。传感器在灶具使用期间恰好失效,意味着最需要温度监控的时刻反而缺失了数据,这会削弱厨房的整体安全防护能力。\",\n \"推理步骤4: 除传感器异常外,其余家庭活动均属正常模式——早晨起床做饭出门、下午孩子放学回家、傍晚大人回家做饭、晚间就寝锁门,入户门锁开关和自动上锁行为正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37:09、07:12:00、18:26:00、19:07:00 四次报告 MeasuredValue = None\",\n \"每次 None 值均紧随 kitchen_cook_surface 的开启或关闭事件(间隔约30秒到1分钟)\",\n \"其他三个房间的温度传感器全天48个读数均正常,排除系统性网络故障\",\n \"厨房烟雾报警器未触发,说明尚未造成实际安全事故,但监控盲区已存在\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰\",\n \"检查该传感器的固件版本并更新,排除软件缺陷导致的间歇性读数丢失\",\n \"如问题持续,考虑更换传感器或调整安装位置,确保灶具使用期间温度监控不中断\",\n \"在传感器修复前,烹饪时可额外留意厨房烟雾报警器状态,作为替代安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的读数(06:37:09、07:12:00、18:26:00 和 19:07:00 共4次),而其他三个温度传感器全天均正常上报数值,说明问题局限于该设备。", "推理步骤2: 观察 None 值出现的时间规律——每次都发生在灶具开启或关闭后不久(06:36:39 灶具开启 → 06:37:09 None;07:11:00 灶具关闭 → 07:12:00 None;18:25:30 灶具开启 → 18:26:00 None;19:06:00 灶具关闭 → 19:07:00 None)。这表明灶具操作可能对温度传感器造成电磁干扰或热冲击,导致读数丢失。", "推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全监测手段。传感器在灶具使用期间恰好失效,意味着最需要温度监控的时刻反而缺失了数据,这会削弱厨房的整体安全防护能力。", "推理步骤4: 除传感器异常外,其余家庭活动均属正常模式——早晨起床做饭出门、下午孩子放学回家、傍晚大人回家做饭、晚间就寝锁门,入户门锁开关和自动上锁行为正常,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:37:09、07:12:00、18:26:00、19:07:00 四次报告 MeasuredValue = None", "每次 None 值均紧随 kitchen_cook_surface 的开启或关闭事件(间隔约30秒到1分钟)", "其他三个房间的温度传感器全天48个读数均正常,排除系统性网络故障", "厨房烟雾报警器未触发,说明尚未造成实际安全事故,但监控盲区已存在"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰", "检查该传感器的固件版本并更新,排除软件缺陷导致的间歇性读数丢失", "如问题持续,考虑更换传感器或调整安装位置,确保灶具使用期间温度监控不中断", "在传感器修复前,烹饪时可额外留意厨房烟雾报警器状态,作为替代安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.525896310806274, "api_error": null} {"episode_id": "SQ2_TN_C_0415", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0415.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261044, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,无安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。凌晨 00:00~05:30 各房间温度在 22.9~23.1°C 之间小幅波动,属于夜间低温平稳期。\",\n \"推理步骤3: 06:00 起温度开始上升(约 23.9°C),随日照增强持续攀升,12:00~12:30 达到全天峰值约 25.7~25.9°C,之后逐步回落,至 23:30 降回约 23.3°C。整体呈现典型的夏季昼夜温度曲线。\",\n \"推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 0.5°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部热源(如火灾隐患)或设备故障的可能。\",\n \"推理步骤5: 全天温度范围 22.9~25.9°C,处于正常室内舒适区间,未触及任何高温或低温告警阈值,也未出现突变(最大半小时变化约 1°C,发生在清晨升温段,属正常)。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9~25.9°C,处于正常室内温度区间\",\n \"温度曲线呈现标准夏季昼夜变化:夜间低(~23°C)、午间高(~25.8°C)、傍晚回落\",\n \"四个房间温度走势高度同步,无单一房间异常偏离\",\n \"无烟雾报警、门窗开合、运动检测等安全类事件触发\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前状态正常\",\n \"如午间室温偏高影响舒适度,可考虑在温度超过 25°C 时自动开启空调的联动规则\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,无安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。凌晨 00:00~05:30 各房间温度在 22.9~23.1°C 之间小幅波动,属于夜间低温平稳期。", "推理步骤3: 06:00 起温度开始上升(约 23.9°C),随日照增强持续攀升,12:00~12:30 达到全天峰值约 25.7~25.9°C,之后逐步回落,至 23:30 降回约 23.3°C。整体呈现典型的夏季昼夜温度曲线。", "推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 0.5°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部热源(如火灾隐患)或设备故障的可能。", "推理步骤5: 全天温度范围 22.9~25.9°C,处于正常室内舒适区间,未触及任何高温或低温告警阈值,也未出现突变(最大半小时变化约 1°C,发生在清晨升温段,属正常)。"], "key_evidence": ["全天温度范围 22.9~25.9°C,处于正常室内温度区间", "温度曲线呈现标准夏季昼夜变化:夜间低(~23°C)、午间高(~25.8°C)、傍晚回落", "四个房间温度走势高度同步,无单一房间异常偏离", "无烟雾报警、门窗开合、运动检测等安全类事件触发"], "recommended_actions": ["无需采取任何措施,当前状态正常", "如午间室温偏高影响舒适度,可考虑在温度超过 25°C 时自动开启空调的联动规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.436280965805054, "api_error": null} {"episode_id": "SQ2_TN_C_0416", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0416.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261045, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:02开锁后未及时关闭/上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55、07:03、18:41、19:12 共4次报告 MeasuredValue = None,而其他时间段均正常上报数值。这些 None 值均出现在灶具使用前后,可能是高温干扰或传感器本身故障。\",\n \"推理步骤2: 16:02 入户门通过手动方式开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),之后有人进入儿童房,但日志中未记录该次开门后的关门(StateValue=True)和上锁事件。直到 22:25 才出现 front_door_contact StateValue=True 和自动上锁记录,意味着入户门可能敞开了约6小时。\",\n \"推理步骤3: 其余行为模式正常——早晨6:15起床、7:49全家出门并自动锁门、16:02孩子放学回家、17:58大人下班回家做饭、21:06孩子睡觉、22:25大人就寝锁门,符合典型三口之家的作息规律。\",\n \"推理步骤4: 温度趋势整体合理:夜间约23°C,白天逐步升至25-26°C,午后回落,17:58开启客厅空调(制冷模式 SystemMode=3)后温度持续下降,无异常温升。\",\n \"推理步骤5: 厨房窗户在做饭后打开(07:02:30 和 19:11:30)属于通风的正常操作,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:55、07:03、18:41、19:12 四次报告 MeasuredValue = None\",\n \"16:02 入户门开锁开门后,直到 22:25 才记录到关门上锁,中间约6小时无关门记录\",\n \"厨房窗户两次打开(07:02:30、19:11:30)后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,确认是否因灶具高温导致读数异常或传感器硬件故障,必要时更换或重新校准\",\n \"为入户门设置长时间未关闭/未上锁的告警规则(如超过5分钟未关门即推送提醒),避免门户长时间敞开\",\n \"确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;如仍打开则及时关闭,夜间开窗存在安全隐患\",\n \"考虑为入户门添加自动关门器或设置自动化规则:若门打开超过一定时间自动发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:02开锁后未及时关闭/上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55、07:03、18:41、19:12 共4次报告 MeasuredValue = None,而其他时间段均正常上报数值。这些 None 值均出现在灶具使用前后,可能是高温干扰或传感器本身故障。", "推理步骤2: 16:02 入户门通过手动方式开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),之后有人进入儿童房,但日志中未记录该次开门后的关门(StateValue=True)和上锁事件。直到 22:25 才出现 front_door_contact StateValue=True 和自动上锁记录,意味着入户门可能敞开了约6小时。", "推理步骤3: 其余行为模式正常——早晨6:15起床、7:49全家出门并自动锁门、16:02孩子放学回家、17:58大人下班回家做饭、21:06孩子睡觉、22:25大人就寝锁门,符合典型三口之家的作息规律。", "推理步骤4: 温度趋势整体合理:夜间约23°C,白天逐步升至25-26°C,午后回落,17:58开启客厅空调(制冷模式 SystemMode=3)后温度持续下降,无异常温升。", "推理步骤5: 厨房窗户在做饭后打开(07:02:30 和 19:11:30)属于通风的正常操作,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:55、07:03、18:41、19:12 四次报告 MeasuredValue = None", "16:02 入户门开锁开门后,直到 22:25 才记录到关门上锁,中间约6小时无关门记录", "厨房窗户两次打开(07:02:30、19:11:30)后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的工作状态,确认是否因灶具高温导致读数异常或传感器硬件故障,必要时更换或重新校准", "为入户门设置长时间未关闭/未上锁的告警规则(如超过5分钟未关门即推送提醒),避免门户长时间敞开", "确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;如仍打开则及时关闭,夜间开窗存在安全隐患", "考虑为入户门添加自动关门器或设置自动化规则:若门打开超过一定时间自动发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.69215989112854, "api_error": null} {"episode_id": "SQ2_TN_C_0417", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0417.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261046, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障,可能影响厨房安全监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了4次 MeasuredValue = None 的读数(06:44、07:10、18:13、19:29),而其他三个温度传感器全天均正常上报数值,排除系统性通信问题。\",\n \"推理步骤2: 这4次 None 值均出现在灶具使用前后——06:43 灶具开启后1分钟出现 None,07:09 灶具关闭后1分钟出现 None,18:12 灶具开启后1分钟出现 None,19:28 灶具关闭后1分钟出现 None。这种强关联性暗示灶具的开关操作可能对温度传感器造成电磁干扰或供电波动,导致读数丢失。\",\n \"推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全监测手段。传感器在灶具工作期间恰好失效,意味着在最需要温度监测的时刻反而丧失了监测能力,这是一个安全盲区。\",\n \"推理步骤4: 除传感器故障外,其余家庭活动均属正常模式——早晨6点起床、7:32出门上班/上学、16:20孩子放学回家、18:12大人下班回家做饭、22:12就寝,门锁开关和自动上锁行为正常,无入侵迹象。\",\n \"推理步骤5: 全天温度变化呈现合理的日间升温(夜间约23°C → 正午约25.8°C → 夜间回落至23.3°C)曲线,无异常温升,排除当前火灾风险。但传感器故障问题需要修复以保障持续监测。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:44、07:10、18:13、19:29 四次报告 MeasuredValue = None\",\n \"四次 None 值均与 kitchen_cook_surface 的开/关操作在时间上高度关联(间隔约1分钟)\",\n \"同一时段其他房间的温度传感器均正常上报数据,排除网络或系统级故障\",\n \"厨房烟雾报警器全天未触发,当前无即时火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到热冲击或电磁干扰\",\n \"检查厨房温度传感器的供电线路是否与灶具共用回路,必要时分离供电以消除电气干扰\",\n \"对厨房温度传感器进行固件更新或硬件检测,排除设备本身的故障\",\n \"在传感器修复前,考虑加强厨房烟雾报警器的灵敏度设置,或增加备用温度监测手段\",\n \"持续观察后续几天的日志,确认该故障模式是否稳定复现\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障,可能影响厨房安全监测能力。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了4次 MeasuredValue = None 的读数(06:44、07:10、18:13、19:29),而其他三个温度传感器全天均正常上报数值,排除系统性通信问题。", "推理步骤2: 这4次 None 值均出现在灶具使用前后——06:43 灶具开启后1分钟出现 None,07:09 灶具关闭后1分钟出现 None,18:12 灶具开启后1分钟出现 None,19:28 灶具关闭后1分钟出现 None。这种强关联性暗示灶具的开关操作可能对温度传感器造成电磁干扰或供电波动,导致读数丢失。", "推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全监测手段。传感器在灶具工作期间恰好失效,意味着在最需要温度监测的时刻反而丧失了监测能力,这是一个安全盲区。", "推理步骤4: 除传感器故障外,其余家庭活动均属正常模式——早晨6点起床、7:32出门上班/上学、16:20孩子放学回家、18:12大人下班回家做饭、22:12就寝,门锁开关和自动上锁行为正常,无入侵迹象。", "推理步骤5: 全天温度变化呈现合理的日间升温(夜间约23°C → 正午约25.8°C → 夜间回落至23.3°C)曲线,无异常温升,排除当前火灾风险。但传感器故障问题需要修复以保障持续监测。"], "key_evidence": ["kitchen_temp_sensor 在 06:44、07:10、18:13、19:29 四次报告 MeasuredValue = None", "四次 None 值均与 kitchen_cook_surface 的开/关操作在时间上高度关联(间隔约1分钟)", "同一时段其他房间的温度传感器均正常上报数据,排除网络或系统级故障", "厨房烟雾报警器全天未触发,当前无即时火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,受到热冲击或电磁干扰", "检查厨房温度传感器的供电线路是否与灶具共用回路,必要时分离供电以消除电气干扰", "对厨房温度传感器进行固件更新或硬件检测,排除设备本身的故障", "在传感器修复前,考虑加强厨房烟雾报警器的灵敏度设置,或增加备用温度监测手段", "持续观察后续几天的日志,确认该故障模式是否稳定复现"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.024906873703003, "api_error": null} {"episode_id": "SQ2_TN_C_0418", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0418.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261047, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:33、07:07、18:30前、19:14),而其他三个温度传感器在相同时间点均正常上报数值。这排除了系统级通信中断的可能。\",\n \"推理步骤2: None 值出现的时间点与厨房灶具的使用高度相关——06:33(灶具 06:32 开启后1分钟)、07:07(灶具 07:06 关闭后1分钟)、19:14(灶具 19:13 关闭后1分钟)。这暗示灶具开关操作可能对温度传感器造成电磁干扰或供电波动。\",\n \"推理步骤3: 虽然传感器每次在下一个正常采样周期都恢复了数值上报,说明故障是间歇性的,但厨房是火灾高风险区域,温度传感器的可靠性直接关系到火灾预警能力。间歇性失效可能导致关键时刻无法检测到异常高温。\",\n \"推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关和运动传感器的时序逻辑一致,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:33、07:07、18:30(灶具开启期间)、19:14 共出现多次 MeasuredValue = None\",\n \"None 值出现时间与 kitchen_cook_surface 开关操作高度关联(开启后约1分钟或关闭后约1分钟)\",\n \"同一时段其他房间温度传感器(客厅、主卧、儿童房)均正常上报数据\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器与灶具之间的物理距离和电磁环境,排除灶具开关时的电磁干扰影响\",\n \"检查厨房温度传感器的供电状态(电池电量或电源线路),确认是否存在供电不稳\",\n \"考虑将厨房温度传感器重新定位或更换,确保在灶具使用期间仍能可靠监测温度\",\n \"在传感器修复前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其处于正常工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None 的情况(06:33、07:07、18:30前、19:14),而其他三个温度传感器在相同时间点均正常上报数值。这排除了系统级通信中断的可能。", "推理步骤2: None 值出现的时间点与厨房灶具的使用高度相关——06:33(灶具 06:32 开启后1分钟)、07:07(灶具 07:06 关闭后1分钟)、19:14(灶具 19:13 关闭后1分钟)。这暗示灶具开关操作可能对温度传感器造成电磁干扰或供电波动。", "推理步骤3: 虽然传感器每次在下一个正常采样周期都恢复了数值上报,说明故障是间歇性的,但厨房是火灾高风险区域,温度传感器的可靠性直接关系到火灾预警能力。间歇性失效可能导致关键时刻无法检测到异常高温。", "推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关和运动传感器的时序逻辑一致,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:33、07:07、18:30(灶具开启期间)、19:14 共出现多次 MeasuredValue = None", "None 值出现时间与 kitchen_cook_surface 开关操作高度关联(开启后约1分钟或关闭后约1分钟)", "同一时段其他房间温度传感器(客厅、主卧、儿童房)均正常上报数据"], "recommended_actions": ["检查厨房温度传感器与灶具之间的物理距离和电磁环境,排除灶具开关时的电磁干扰影响", "检查厨房温度传感器的供电状态(电池电量或电源线路),确认是否存在供电不稳", "考虑将厨房温度传感器重新定位或更换,确保在灶具使用期间仍能可靠监测温度", "在传感器修复前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其处于正常工作状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.60073494911194, "api_error": null} {"episode_id": "SQ2_TN_C_0420", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0420.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261049, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天各房间温度变化符合自然昼夜温度曲线,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,每30分钟上报一次,无其他设备事件(门锁、运动传感器、烟雾报警器等均无触发)\",\n \"推理步骤2: 温度值范围为 2290~2586(即 22.9°C~25.86°C),属于夏季室内正常温度范围,没有出现突变或异常高温\",\n \"推理步骤3: 温度变化呈现典型的昼夜规律——凌晨 00:00~05:30 维持在约 22.9~23.1°C 的低位,06:00 起随日出逐步升温,12:00~13:30 达到峰值约 25.7~25.8°C,之后缓慢回落,至 23:30 降回约 23.3°C\",\n \"推理步骤4: 四个房间的温度走势高度一致,不存在某个房间温度异常偏离其他房间的情况,排除了局部热源异常(如火灾隐患)或传感器故障的可能\",\n \"推理步骤5: 厨房温度未出现独立于其他房间的急剧升高,说明没有灶具异常使用或火灾风险信号\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C~25.86°C,属于正常室内温度\",\n \"温度曲线呈平滑的昼夜正弦波形,凌晨低、午后高、傍晚回落,无突变跳跃\",\n \"四个房间温度高度同步,无单点异常偏离\",\n \"无任何非温度类设备事件(门锁、运动、烟雾、漏水等均未触发)\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前状态正常\",\n \"可考虑在午后高温时段(12:00~14:00)自动开启空调以提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天各房间温度变化符合自然昼夜温度曲线,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,每30分钟上报一次,无其他设备事件(门锁、运动传感器、烟雾报警器等均无触发)", "推理步骤2: 温度值范围为 2290~2586(即 22.9°C~25.86°C),属于夏季室内正常温度范围,没有出现突变或异常高温", "推理步骤3: 温度变化呈现典型的昼夜规律——凌晨 00:00~05:30 维持在约 22.9~23.1°C 的低位,06:00 起随日出逐步升温,12:00~13:30 达到峰值约 25.7~25.8°C,之后缓慢回落,至 23:30 降回约 23.3°C", "推理步骤4: 四个房间的温度走势高度一致,不存在某个房间温度异常偏离其他房间的情况,排除了局部热源异常(如火灾隐患)或传感器故障的可能", "推理步骤5: 厨房温度未出现独立于其他房间的急剧升高,说明没有灶具异常使用或火灾风险信号"], "key_evidence": ["全天温度范围 22.9°C~25.86°C,属于正常室内温度", "温度曲线呈平滑的昼夜正弦波形,凌晨低、午后高、傍晚回落,无突变跳跃", "四个房间温度高度同步,无单点异常偏离", "无任何非温度类设备事件(门锁、运动、烟雾、漏水等均未触发)"], "recommended_actions": ["无需采取任何措施,当前状态正常", "可考虑在午后高温时段(12:00~14:00)自动开启空调以提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.478851079940796, "api_error": null} {"episode_id": "SQ2_TN_C_0427", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0427.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261056, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:05开锁进入后未及时关门/上锁,直到22:24才重新确认关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:54、07:06、18:36、18:51四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的异常。\",\n \"推理步骤2: None 值出现的时间点恰好在灶具开启后不久(06:53开灶→06:54 None;18:35开灶→18:36 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常,也可能是传感器本身硬件老化。\",\n \"推理步骤3: 16:05入户门解锁开门(StateValue=False),有人进入后门传感器未报告关门(无 StateValue=True 事件),直到22:24才出现 front_door_contact StateValue=True 并自动上锁。这意味着入户门可能敞开了超过6小时,存在安全隐患。\",\n \"推理步骤4: 其余行为模式正常——早晨起床、做早餐、出门上班(07:47)、下午孩子回家(16:05)、傍晚大人回家(18:12)做晚饭、晚间就寝(22:24),符合三口之家的典型作息。\",\n \"推理步骤5: 所有温度数据(除厨房 None 值外)呈现合理的日间升温、夜间降温曲线(约23°C~26°C),无火灾或异常高温迹象。烟雾报警器、漏水传感器均未触发,排除火灾和水患风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:54、07:06、18:36、18:51 四次报告 MeasuredValue = None,而同时段其他传感器正常\",\n \"front_door_contact 在 16:05:02 报告 StateValue=False(开门),之后无关门记录,直到 22:24:27 才报告 StateValue=True(关门),入户门疑似敞开约6小时19分钟\",\n \"None 值均出现在灶具开启后的短时间内,提示可能与灶具工作环境有关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;清洁传感器并测试,必要时更换\",\n \"确认入户门传感器是否存在漏报问题——如果门确实敞开了6小时,建议设置「入户门长时间未关闭」的自动告警规则(如超过5分钟未关门即推送通知)\",\n \"考虑为入户门锁添加自动上锁策略(如开门后N分钟无操作自动锁定),避免长时间门户大开的安全风险\",\n \"持续观察厨房温度传感器在非烹饪时段是否也出现 None 值,以区分是环境因素还是设备本身故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:05开锁进入后未及时关门/上锁,直到22:24才重新确认关门上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在06:54、07:06、18:36、18:51四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的异常。", "推理步骤2: None 值出现的时间点恰好在灶具开启后不久(06:53开灶→06:54 None;18:35开灶→18:36 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常,也可能是传感器本身硬件老化。", "推理步骤3: 16:05入户门解锁开门(StateValue=False),有人进入后门传感器未报告关门(无 StateValue=True 事件),直到22:24才出现 front_door_contact StateValue=True 并自动上锁。这意味着入户门可能敞开了超过6小时,存在安全隐患。", "推理步骤4: 其余行为模式正常——早晨起床、做早餐、出门上班(07:47)、下午孩子回家(16:05)、傍晚大人回家(18:12)做晚饭、晚间就寝(22:24),符合三口之家的典型作息。", "推理步骤5: 所有温度数据(除厨房 None 值外)呈现合理的日间升温、夜间降温曲线(约23°C~26°C),无火灾或异常高温迹象。烟雾报警器、漏水传感器均未触发,排除火灾和水患风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:54、07:06、18:36、18:51 四次报告 MeasuredValue = None,而同时段其他传感器正常", "front_door_contact 在 16:05:02 报告 StateValue=False(开门),之后无关门记录,直到 22:24:27 才报告 StateValue=True(关门),入户门疑似敞开约6小时19分钟", "None 值均出现在灶具开启后的短时间内,提示可能与灶具工作环境有关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;清洁传感器并测试,必要时更换", "确认入户门传感器是否存在漏报问题——如果门确实敞开了6小时,建议设置「入户门长时间未关闭」的自动告警规则(如超过5分钟未关门即推送通知)", "考虑为入户门锁添加自动上锁策略(如开门后N分钟无操作自动锁定),避免长时间门户大开的安全风险", "持续观察厨房温度传感器在非烹饪时段是否也出现 None 值,以区分是环境因素还是设备本身故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.865285873413086, "api_error": null} {"episode_id": "SQ2_TN_C_0429", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_C_0429.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261058, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次出现读数为 None 的故障,且入户门在16:20开锁进入后未关门/未上锁,直到22:25才确认关闭上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在07:02和07:20(早餐做饭期间)连续报告 MeasuredValue = None,在18:47和18:52(晚餐做饭期间)再次连续报告 None。两次故障都发生在灶具开启后不久,说明传感器可能受高温影响出现间歇性故障。\",\n \"推理步骤2: 该传感器在非烹饪时段读数正常(如07:30恢复到2439、19:00恢复到2441),表明这不是永久性硬件损坏,而是在灶具工作时的间歇性失效,这恰恰是最需要温度监测的时刻。\",\n \"推理步骤3: 16:20入户门开锁(Manual),有人进入后门传感器未报告关门(StateValue=True),直到22:25才记录到关门和自动上锁。中间近6小时入户门处于未确认关闭状态。不过结合16:20有儿童房活动(孩子放学回家)、18:03又有一次开门进入(家长回家),这段时间内门可能被反复使用但日志未完整记录每次关门事件,也可能确实长时间未关。\",\n \"推理步骤4: 其余行为模式正常——早晨起床、做早餐、出门上锁、下午孩子回家、傍晚家长回家做晚饭、晚间休息的生活节奏合理。所有温度变化(夜间22-23°C,午间25-26°C)符合夏季自然波动。厨房窗户在做饭后打开通风属正常操作。\",\n \"推理步骤5: 综合来看,主要风险点是厨房温度传感器在烹饪时失效——这意味着如果灶具引发火灾或过热,温度传感器无法提供预警数据,削弱了厨房的安全监测能力。\"\n ],\n \"key_evidence\": [\n \"07:02:10 和 07:20:00 厨房温度传感器报告 MeasuredValue = None(灶具07:01:40开启,07:19关闭)\",\n \"18:47:00 和 18:52:00 厨房温度传感器再次报告 MeasuredValue = None(灶具18:46:30开启,18:51关闭)\",\n \"两次故障均在灶具使用期间发生,呈现可复现的关联模式\",\n \"16:20:02 入户门打开后,直到22:25:19才记录到关门状态(约6小时无关门记录)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"在传感器修复前,考虑将厨房烟雾报警器的灵敏度适当提高,作为烹饪期间的补偿监测手段\",\n \"检查入户门传感器是否存在漏报问题,确认门磁安装间距是否合适,必要时校准或更换\",\n \"建议设置入户门超时未关提醒规则(如开门超过5分钟未关闭则推送通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次出现读数为 None 的故障,且入户门在16:20开锁进入后未关门/未上锁,直到22:25才确认关闭上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在07:02和07:20(早餐做饭期间)连续报告 MeasuredValue = None,在18:47和18:52(晚餐做饭期间)再次连续报告 None。两次故障都发生在灶具开启后不久,说明传感器可能受高温影响出现间歇性故障。", "推理步骤2: 该传感器在非烹饪时段读数正常(如07:30恢复到2439、19:00恢复到2441),表明这不是永久性硬件损坏,而是在灶具工作时的间歇性失效,这恰恰是最需要温度监测的时刻。", "推理步骤3: 16:20入户门开锁(Manual),有人进入后门传感器未报告关门(StateValue=True),直到22:25才记录到关门和自动上锁。中间近6小时入户门处于未确认关闭状态。不过结合16:20有儿童房活动(孩子放学回家)、18:03又有一次开门进入(家长回家),这段时间内门可能被反复使用但日志未完整记录每次关门事件,也可能确实长时间未关。", "推理步骤4: 其余行为模式正常——早晨起床、做早餐、出门上锁、下午孩子回家、傍晚家长回家做晚饭、晚间休息的生活节奏合理。所有温度变化(夜间22-23°C,午间25-26°C)符合夏季自然波动。厨房窗户在做饭后打开通风属正常操作。", "推理步骤5: 综合来看,主要风险点是厨房温度传感器在烹饪时失效——这意味着如果灶具引发火灾或过热,温度传感器无法提供预警数据,削弱了厨房的安全监测能力。"], "key_evidence": ["07:02:10 和 07:20:00 厨房温度传感器报告 MeasuredValue = None(灶具07:01:40开启,07:19关闭)", "18:47:00 和 18:52:00 厨房温度传感器再次报告 MeasuredValue = None(灶具18:46:30开启,18:51关闭)", "两次故障均在灶具使用期间发生,呈现可复现的关联模式", "16:20:02 入户门打开后,直到22:25:19才记录到关门状态(约6小时无关门记录)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "在传感器修复前,考虑将厨房烟雾报警器的灵敏度适当提高,作为烹饪期间的补偿监测手段", "检查入户门传感器是否存在漏报问题,确认门磁安装间距是否合适,必要时校准或更换", "建议设置入户门超时未关提醒规则(如开门超过5分钟未关闭则推送通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.958148956298828, "api_error": null} {"episode_id": "SQ2_TN_D_0375", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0375.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261004, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 全天厨房灶具共使用三次(05:56-06:24、11:02-11:26、16:57-17:32),每次使用时长约24-35分钟,属于正常烹饪时长。\",\n \"推理步骤2: 每次灶具开启后约30秒至1分钟,kitchen_temp_sensor 就报告 MeasuredValue = None,且在灶具关闭后仍有一次 None 读数,说明传感器在灶具工作期间持续无法正常测量温度。三次烹饪共产生6次 None 读数,100%复现。\",\n \"推理步骤3: 厨房温度传感器在非烹饪时段工作正常(如凌晨稳定在22.9-23.1°C,白天随气温正常升降),说明传感器本身并非完全损坏,而是在灶具产生的高温或电磁环境下失效。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪(最需要监测的时段)恰好失效,将无法及时发现灶具异常过热或忘关灶具导致的温度飙升,存在安全隐患。\",\n \"推理步骤5: 其余行为模式均属正常——老人05:25起床、05:38洗漱、05:56做早餐、07:09出门(门锁手动开锁后自动上锁)、08:23回家、12:40午休(关窗帘)、14:03起床、20:53就寝(关窗帘、关灯、确认门锁),生活作息规律,入户门在外出期间保持上锁状态,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间共报告6次 MeasuredValue = None(05:57、06:25、11:03、11:27、16:58、17:33),与灶具开关时间高度关联\",\n \"非烹饪时段该传感器读数完全正常,排除传感器彻底损坏的可能\",\n \"08:23回家时入户门未上锁(LockState从1变为2为解锁),但老人07:09出门时门已自动上锁,说明是老人自己用钥匙开门回家,属正常行为\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,建议将传感器移至距灶具较远但仍能有效监测厨房整体温度的位置\",\n \"考虑更换为耐高温型温度传感器,或增加一个备用传感器以确保烹饪期间的温度监测不中断\",\n \"在传感器修复前,建议为灶具设置自动关闭定时器(如超过40分钟未手动操作则自动断气/断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,确保在温度传感器失效期间仍有烟雾检测作为安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 全天厨房灶具共使用三次(05:56-06:24、11:02-11:26、16:57-17:32),每次使用时长约24-35分钟,属于正常烹饪时长。", "推理步骤2: 每次灶具开启后约30秒至1分钟,kitchen_temp_sensor 就报告 MeasuredValue = None,且在灶具关闭后仍有一次 None 读数,说明传感器在灶具工作期间持续无法正常测量温度。三次烹饪共产生6次 None 读数,100%复现。", "推理步骤3: 厨房温度传感器在非烹饪时段工作正常(如凌晨稳定在22.9-23.1°C,白天随气温正常升降),说明传感器本身并非完全损坏,而是在灶具产生的高温或电磁环境下失效。", "推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪(最需要监测的时段)恰好失效,将无法及时发现灶具异常过热或忘关灶具导致的温度飙升,存在安全隐患。", "推理步骤5: 其余行为模式均属正常——老人05:25起床、05:38洗漱、05:56做早餐、07:09出门(门锁手动开锁后自动上锁)、08:23回家、12:40午休(关窗帘)、14:03起床、20:53就寝(关窗帘、关灯、确认门锁),生活作息规律,入户门在外出期间保持上锁状态,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间共报告6次 MeasuredValue = None(05:57、06:25、11:03、11:27、16:58、17:33),与灶具开关时间高度关联", "非烹饪时段该传感器读数完全正常,排除传感器彻底损坏的可能", "08:23回家时入户门未上锁(LockState从1变为2为解锁),但老人07:09出门时门已自动上锁,说明是老人自己用钥匙开门回家,属正常行为"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,建议将传感器移至距灶具较远但仍能有效监测厨房整体温度的位置", "考虑更换为耐高温型温度传感器,或增加一个备用传感器以确保烹饪期间的温度监测不中断", "在传感器修复前,建议为灶具设置自动关闭定时器(如超过40分钟未手动操作则自动断气/断电),作为补偿性安全措施", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,确保在温度传感器失效期间仍有烟雾检测作为安全兜底"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.14531111717224, "api_error": null} {"episode_id": "SQ2_TN_D_0376", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0376.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261005, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中三次灶具开启期间(06:08、10:55、17:00)以及灶具关闭后短时间内(06:24、11:33、17:36)报告 MeasuredValue = None,共计6次空值读数。\",\n \"推理步骤2: 正常的温度传感器即使在灶具工作时也应返回数值(可能偏高),而非 None。None 值意味着传感器无法完成测量,可能是高温超出量程、传感器连接不稳定或硬件故障。\",\n \"推理步骤3: 该问题每次使用灶具时都会复现,具有明确的规律性,排除偶发通信丢包的可能,更倾向于传感器本身在高温环境下存在系统性缺陷。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,将无法在温度异常升高时及时报警,存在安全盲区。\",\n \"推理步骤5: 除传感器问题外,老人的整体生活作息正常——05:28起床、06:07做早餐、07:07外出、08:38回家、12:29午休、16:59做晚餐、20:39洗漱就寝,门锁开关和运动轨迹均合理,无入侵或健康异常迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启期间三次报告 MeasuredValue = None(06:08、10:55、17:00)\",\n \"灶具关闭后传感器仍短暂报告 None(06:24、11:33、17:36),随后在下一个整点恢复正常数值\",\n \"问题在一天内100%复现(3次使用灶具,3次均出现),具有系统性\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超出传感器量程,必要时重新选址安装\",\n \"检查传感器固件版本,确认是否有已知的高温环境下测量失败的 bug,如有则升级固件\",\n \"如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间温度监测不中断\",\n \"在传感器修复前,可设置自动化规则:当灶具开启超过一定时长(如30分钟)且温度传感器无有效读数时,触发提醒通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中三次灶具开启期间(06:08、10:55、17:00)以及灶具关闭后短时间内(06:24、11:33、17:36)报告 MeasuredValue = None,共计6次空值读数。", "推理步骤2: 正常的温度传感器即使在灶具工作时也应返回数值(可能偏高),而非 None。None 值意味着传感器无法完成测量,可能是高温超出量程、传感器连接不稳定或硬件故障。", "推理步骤3: 该问题每次使用灶具时都会复现,具有明确的规律性,排除偶发通信丢包的可能,更倾向于传感器本身在高温环境下存在系统性缺陷。", "推理步骤4: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,将无法在温度异常升高时及时报警,存在安全盲区。", "推理步骤5: 除传感器问题外,老人的整体生活作息正常——05:28起床、06:07做早餐、07:07外出、08:38回家、12:29午休、16:59做晚餐、20:39洗漱就寝,门锁开关和运动轨迹均合理,无入侵或健康异常迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启期间三次报告 MeasuredValue = None(06:08、10:55、17:00)", "灶具关闭后传感器仍短暂报告 None(06:24、11:33、17:36),随后在下一个整点恢复正常数值", "问题在一天内100%复现(3次使用灶具,3次均出现),具有系统性"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超出传感器量程,必要时重新选址安装", "检查传感器固件版本,确认是否有已知的高温环境下测量失败的 bug,如有则升级固件", "如传感器硬件老化或损坏,建议更换为耐高温型号,确保灶具使用期间温度监测不中断", "在传感器修复前,可设置自动化规则:当灶具开启超过一定时长(如30分钟)且温度传感器无有效读数时,触发提醒通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.145262479782104, "api_error": null} {"episode_id": "SQ2_TN_D_0386", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0386.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261015, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开启/关闭前后多次报告 None 值,表明传感器可能存在故障或受灶具热源干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的记录,分别发生在 05:51、06:34、10:52、11:23、17:04、17:21,而客厅和卧室传感器全天均正常上报数值。\",\n \"推理步骤2: 这 6 次 None 值全部紧跟在灶具 OnOff 状态变化(开启或关闭)之后约 30-60 秒内出现,呈现高度规律性的关联模式——每次使用灶具都会触发传感器读数丢失。\",\n \"推理步骤3: 在 None 值出现的间隙,传感器在整点/半点的定时上报中又能恢复正常数值(如 06:00 报 2404、11:00 报 2556),说明传感器并非完全损坏,而是在灶具状态切换的瞬间出现间歇性故障。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间无法可靠读数,一旦发生干烧或过热,系统将无法及时通过温度异常发出预警,存在安全隐患。\",\n \"推理步骤5: 其余行为模式均属正常——老人 05:26 起床、三餐规律用灶、12:27 午休拉窗帘并于 13:50 起床、07:08 出门并 08:21 回家、20:49 就寝锁门关窗帘,入户门锁开关和自动上锁均正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开/关后 30-60 秒内共出现 6 次 MeasuredValue = None(05:51、06:34、10:52、11:23、17:04、17:21),而其他传感器全天无异常\",\n \"None 值与灶具 OnOff 状态变化存在一一对应的时间关联,每次灶具操作后必现\",\n \"传感器在定时上报周期中可恢复正常读数,表现为间歇性故障而非永久失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热源或电磁干扰影响,必要时重新选址安装\",\n \"对该传感器进行固件检查或更换,排除硬件老化导致的间歇性读数丢失\",\n \"在传感器修复前,建议加强烟雾报警器的灵敏度设置,作为灶具使用期间的替代安全保障\",\n \"考虑为独居老人增设灶具使用超时自动断气/断电的安全联动规则,降低因传感器失效带来的火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开启/关闭前后多次报告 None 值,表明传感器可能存在故障或受灶具热源干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 6 次 MeasuredValue = None 的记录,分别发生在 05:51、06:34、10:52、11:23、17:04、17:21,而客厅和卧室传感器全天均正常上报数值。", "推理步骤2: 这 6 次 None 值全部紧跟在灶具 OnOff 状态变化(开启或关闭)之后约 30-60 秒内出现,呈现高度规律性的关联模式——每次使用灶具都会触发传感器读数丢失。", "推理步骤3: 在 None 值出现的间隙,传感器在整点/半点的定时上报中又能恢复正常数值(如 06:00 报 2404、11:00 报 2556),说明传感器并非完全损坏,而是在灶具状态切换的瞬间出现间歇性故障。", "推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用期间无法可靠读数,一旦发生干烧或过热,系统将无法及时通过温度异常发出预警,存在安全隐患。", "推理步骤5: 其余行为模式均属正常——老人 05:26 起床、三餐规律用灶、12:27 午休拉窗帘并于 13:50 起床、07:08 出门并 08:21 回家、20:49 就寝锁门关窗帘,入户门锁开关和自动上锁均正常,无入侵迹象。"], "key_evidence": ["厨房温度传感器在灶具开/关后 30-60 秒内共出现 6 次 MeasuredValue = None(05:51、06:34、10:52、11:23、17:04、17:21),而其他传感器全天无异常", "None 值与灶具 OnOff 状态变化存在一一对应的时间关联,每次灶具操作后必现", "传感器在定时上报周期中可恢复正常读数,表现为间歇性故障而非永久失效"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热源或电磁干扰影响,必要时重新选址安装", "对该传感器进行固件检查或更换,排除硬件老化导致的间歇性读数丢失", "在传感器修复前,建议加强烟雾报警器的灵敏度设置,作为灶具使用期间的替代安全保障", "考虑为独居老人增设灶具使用超时自动断气/断电的安全联动规则,降低因传感器失效带来的火灾风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.056817293167114, "api_error": null} {"episode_id": "SQ2_TN_D_0394", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0394.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261023, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整日共有三次使用厨房灶具的记录(06:08-06:22、11:08-11:20、17:01-17:21),每次灶具开启后约30秒至1分钟内,kitchen_temp_sensor 的 MeasuredValue 均变为 None。\",\n \"推理步骤2: 灶具关闭后,温度传感器并未立即恢复,而是在下一次关闭后仍报告 None(如 06:23、11:21、17:22),直到下一个整点半点的定时采样周期才恢复正常数值。这说明传感器在灶具运行期间持续处于无法读数的状态。\",\n \"推理步骤3: 同一时段客厅和卧室的温度传感器均正常上报数值,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。\",\n \"推理步骤4: 温度传感器返回 None 而非异常高值,可能意味着传感器超出量程后进入保护模式,或者传感器硬件存在间歇性故障。对于独居老人家庭,厨房温度监测是火灾预警的重要环节,传感器失效会导致安全盲区。\",\n \"推理步骤5: 其余行为模式均属正常——老人 05:28 起床、06:56 出门晨练/买菜、08:38 回家、12:34 午休、20:45 就寝,作息规律;门锁开关、灯光使用、窗帘操作均与独居老人的日常习惯一致;入户门在外出和就寝时均已上锁;无烟雾报警、无漏水报警触发。\"\n ],\n \"key_evidence\": [\n \"06:09、06:23、11:09、11:21、17:02、17:22 共6次 kitchen_temp_sensor 报告 MeasuredValue = None,均与灶具使用时段高度吻合\",\n \"同时段 living_room_temp_sensor 和 bedroom_temp_sensor 均正常上报数值,排除系统性故障\",\n \"传感器在灶具关闭后的下一个定时采样周期恢复正常读数,呈现可复现的间歇性失效模式\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近导致高温超量程,必要时将传感器迁移至远离热源的位置\",\n \"对厨房温度传感器进行硬件诊断或固件更新,确认是否存在元器件老化或软件缺陷\",\n \"在传感器修复前,考虑增加厨房烟雾报警器的灵敏度或增设额外的温度监测手段,避免灶具使用期间出现安全监测盲区\",\n \"建议为独居老人设置灶具使用超时自动提醒功能(如超过30分钟未关闭灶具则发出警报),作为温度传感器失效期间的补充安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 整日共有三次使用厨房灶具的记录(06:08-06:22、11:08-11:20、17:01-17:21),每次灶具开启后约30秒至1分钟内,kitchen_temp_sensor 的 MeasuredValue 均变为 None。", "推理步骤2: 灶具关闭后,温度传感器并未立即恢复,而是在下一次关闭后仍报告 None(如 06:23、11:21、17:22),直到下一个整点半点的定时采样周期才恢复正常数值。这说明传感器在灶具运行期间持续处于无法读数的状态。", "推理步骤3: 同一时段客厅和卧室的温度传感器均正常上报数值,排除了系统级通信故障的可能性,问题定位在厨房温度传感器本身。", "推理步骤4: 温度传感器返回 None 而非异常高值,可能意味着传感器超出量程后进入保护模式,或者传感器硬件存在间歇性故障。对于独居老人家庭,厨房温度监测是火灾预警的重要环节,传感器失效会导致安全盲区。", "推理步骤5: 其余行为模式均属正常——老人 05:28 起床、06:56 出门晨练/买菜、08:38 回家、12:34 午休、20:45 就寝,作息规律;门锁开关、灯光使用、窗帘操作均与独居老人的日常习惯一致;入户门在外出和就寝时均已上锁;无烟雾报警、无漏水报警触发。"], "key_evidence": ["06:09、06:23、11:09、11:21、17:02、17:22 共6次 kitchen_temp_sensor 报告 MeasuredValue = None,均与灶具使用时段高度吻合", "同时段 living_room_temp_sensor 和 bedroom_temp_sensor 均正常上报数值,排除系统性故障", "传感器在灶具关闭后的下一个定时采样周期恢复正常读数,呈现可复现的间歇性失效模式"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近导致高温超量程,必要时将传感器迁移至远离热源的位置", "对厨房温度传感器进行硬件诊断或固件更新,确认是否存在元器件老化或软件缺陷", "在传感器修复前,考虑增加厨房烟雾报警器的灵敏度或增设额外的温度监测手段,避免灶具使用期间出现安全监测盲区", "建议为独居老人设置灶具使用超时自动提醒功能(如超过30分钟未关闭灶具则发出警报),作为温度传感器失效期间的补充安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.947845935821533, "api_error": null} {"episode_id": "SQ2_TN_D_0393", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0393.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261022, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人 05:31 起床、05:37 如厕、05:57 做早餐、06:56 出门、08:24 回家、12:31 午休、16:52 做晚餐、20:37 就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件;08:24 入户时前门未关闭(BooleanState 未恢复 True),但在 20:37 就寝时确认门已关闭并上锁,属于回家后忘关门但睡前补锁的情况。\",\n \"推理步骤3: 厨房温度传感器在三次灶具使用期间(05:58、06:22、11:09、11:21、16:53、17:39)均报告 MeasuredValue = None,共出现 6 次。灶具开启后约 30 秒即出现 None,关闭后约 1 分钟再次报告 None,之后在下一个整点周期才恢复正常数值。这说明传感器在灶具工作时持续无法提供有效读数。\",\n \"推理步骤4: 客厅和卧室温度传感器全天正常上报,数值随气温自然波动(夜间约 22-23°C,午间峰值约 25.8°C),无异常跳变。唯独厨房传感器在灶具使用时失效,指向该传感器本身存在问题(可能是高温导致读数溢出、通信中断或硬件老化)。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生干烧或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全隐患。\",\n \"推理步骤6: 烟雾报警器全天未触发,说明目前没有实际火灾或烟雾事件,但传感器故障降低了整体安全冗余度。\",\n \"推理步骤7: 08:24 回家后前门传感器显示门开启(StateValue=False),直到 20:37 才记录到门关闭(StateValue=True)。长达约 12 小时前门可能处于未关状态,对独居老人存在一定入侵风险,但期间无异常运动传感器触发,实际入侵可能性低,更可能是传感器状态未及时更新或老人在家时未完全关门。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共 6 次报告 MeasuredValue = None(05:58、06:22、11:09、11:21、16:53、17:39),而同期客厅和卧室传感器均正常\",\n \"None 值出现的时间模式高度一致:灶具开启后约 30 秒出现,灶具关闭后约 1 分钟再次出现,之后恢复正常\",\n \"08:24 前门开启后直到 20:37 才记录关闭,中间约 12 小时前门传感器显示未关闭状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"对厨房温度传感器进行固件检查和硬件诊断,确认 None 值是通信超时还是读数溢出所致\",\n \"在传感器修复前,建议增加灶具使用时长自动提醒规则(如超过 30 分钟未关闭灶具则报警),弥补温度监测的空窗期\",\n \"检查前门接触传感器是否存在安装松动或灵敏度问题,确认其能准确反映门的开关状态\",\n \"考虑为独居老人设置出门未锁门提醒和长时间门未关闭告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人 05:31 起床、05:37 如厕、05:57 做早餐、06:56 出门、08:24 回家、12:31 午休、16:52 做晚餐、20:37 就寝,符合独居老人的典型日常规律。", "推理步骤2: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件;08:24 入户时前门未关闭(BooleanState 未恢复 True),但在 20:37 就寝时确认门已关闭并上锁,属于回家后忘关门但睡前补锁的情况。", "推理步骤3: 厨房温度传感器在三次灶具使用期间(05:58、06:22、11:09、11:21、16:53、17:39)均报告 MeasuredValue = None,共出现 6 次。灶具开启后约 30 秒即出现 None,关闭后约 1 分钟再次报告 None,之后在下一个整点周期才恢复正常数值。这说明传感器在灶具工作时持续无法提供有效读数。", "推理步骤4: 客厅和卧室温度传感器全天正常上报,数值随气温自然波动(夜间约 22-23°C,午间峰值约 25.8°C),无异常跳变。唯独厨房传感器在灶具使用时失效,指向该传感器本身存在问题(可能是高温导致读数溢出、通信中断或硬件老化)。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生干烧或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全隐患。", "推理步骤6: 烟雾报警器全天未触发,说明目前没有实际火灾或烟雾事件,但传感器故障降低了整体安全冗余度。", "推理步骤7: 08:24 回家后前门传感器显示门开启(StateValue=False),直到 20:37 才记录到门关闭(StateValue=True)。长达约 12 小时前门可能处于未关状态,对独居老人存在一定入侵风险,但期间无异常运动传感器触发,实际入侵可能性低,更可能是传感器状态未及时更新或老人在家时未完全关门。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共 6 次报告 MeasuredValue = None(05:58、06:22、11:09、11:21、16:53、17:39),而同期客厅和卧室传感器均正常", "None 值出现的时间模式高度一致:灶具开启后约 30 秒出现,灶具关闭后约 1 分钟再次出现,之后恢复正常", "08:24 前门开启后直到 20:37 才记录关闭,中间约 12 小时前门传感器显示未关闭状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "对厨房温度传感器进行固件检查和硬件诊断,确认 None 值是通信超时还是读数溢出所致", "在传感器修复前,建议增加灶具使用时长自动提醒规则(如超过 30 分钟未关闭灶具则报警),弥补温度监测的空窗期", "检查前门接触传感器是否存在安装松动或灵敏度问题,确认其能准确反映门的开关状态", "考虑为独居老人设置出门未锁门提醒和长时间门未关闭告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 50.05151033401489, "api_error": null} {"episode_id": "SQ2_TN_D_0399", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0399.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261028, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约 05:31 起床如厕,06:07 进厨房做早餐,07:09 出门,08:26 回家,12:39 午休,13:56 起床,16:54 做晚餐,20:27 洗漱,20:55 就寝。这是一个规律的独居老人日常,无入侵或健康异常迹象。\",\n \"推理步骤2: 灶具共使用三次(06:07-06:34、10:56-11:34、16:54-17:24),每次使用时长约 27-38 分钟,属于正常烹饪时长,且每次使用后均正常关闭,烟雾报警器全天未触发,无火灾风险。\",\n \"推理步骤3: 但厨房温度传感器在灶具开启后均报告 MeasuredValue = None(06:08、06:35、10:57、11:35、16:55、17:25),共出现 6 次。灶具开启时厨房温度升高是正常的,传感器应能正常读数,而非返回 None。这表明传感器在高温环境下可能存在故障或通信异常。\",\n \"推理步骤4: 灶具关闭后传感器也报告了一次 None(如 06:35、11:35、17:25 分别在灶具关闭后 1 分钟出现 None),但在下一个 30 分钟整点周期时恢复了正常数值,说明故障是间歇性的、与灶具使用高度相关。\",\n \"推理步骤5: 厨房温度传感器是独居老人用火安全的关键监测设备。如果传感器在灶具使用期间无法提供有效温度读数,一旦发生干烧或灶具异常高温,系统将无法及时发出预警,这对独居老人构成潜在安全隐患。\",\n \"推理步骤6: 入户门锁操作均为正常手动开锁/自动上锁,门窗传感器状态正常,漏水传感器全天未触发,无入侵或漏水问题。20:55 就寝前门锁确认为已上锁状态(LockState=1),安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间及关闭后共 6 次报告 MeasuredValue = None(06:08、06:35、10:57、11:35、16:55、17:25),与灶具开关操作高度关联\",\n \"传感器在非烹饪时段(每 30 分钟整点采样)均能正常报告温度值,说明故障仅在灶具使用场景下出现\",\n \"该传感器是厨房高温/火灾预警的核心依赖,失效将导致安全监测盲区\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程\",\n \"检查传感器固件版本并尝试更新,排除软件层面的异常值处理问题\",\n \"如确认为硬件故障,尽快更换厨房温度传感器,确保烹饪期间的温度监测不中断\",\n \"在传感器修复前,考虑为灶具设置自动定时关闭规则(如超过 40 分钟未手动操作则自动断电),作为补偿性安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约 05:31 起床如厕,06:07 进厨房做早餐,07:09 出门,08:26 回家,12:39 午休,13:56 起床,16:54 做晚餐,20:27 洗漱,20:55 就寝。这是一个规律的独居老人日常,无入侵或健康异常迹象。", "推理步骤2: 灶具共使用三次(06:07-06:34、10:56-11:34、16:54-17:24),每次使用时长约 27-38 分钟,属于正常烹饪时长,且每次使用后均正常关闭,烟雾报警器全天未触发,无火灾风险。", "推理步骤3: 但厨房温度传感器在灶具开启后均报告 MeasuredValue = None(06:08、06:35、10:57、11:35、16:55、17:25),共出现 6 次。灶具开启时厨房温度升高是正常的,传感器应能正常读数,而非返回 None。这表明传感器在高温环境下可能存在故障或通信异常。", "推理步骤4: 灶具关闭后传感器也报告了一次 None(如 06:35、11:35、17:25 分别在灶具关闭后 1 分钟出现 None),但在下一个 30 分钟整点周期时恢复了正常数值,说明故障是间歇性的、与灶具使用高度相关。", "推理步骤5: 厨房温度传感器是独居老人用火安全的关键监测设备。如果传感器在灶具使用期间无法提供有效温度读数,一旦发生干烧或灶具异常高温,系统将无法及时发出预警,这对独居老人构成潜在安全隐患。", "推理步骤6: 入户门锁操作均为正常手动开锁/自动上锁,门窗传感器状态正常,漏水传感器全天未触发,无入侵或漏水问题。20:55 就寝前门锁确认为已上锁状态(LockState=1),安防状态良好。"], "key_evidence": ["厨房温度传感器在灶具使用期间及关闭后共 6 次报告 MeasuredValue = None(06:08、06:35、10:57、11:35、16:55、17:25),与灶具开关操作高度关联", "传感器在非烹饪时段(每 30 分钟整点采样)均能正常报告温度值,说明故障仅在灶具使用场景下出现", "该传感器是厨房高温/火灾预警的核心依赖,失效将导致安全监测盲区"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程", "检查传感器固件版本并尝试更新,排除软件层面的异常值处理问题", "如确认为硬件故障,尽快更换厨房温度传感器,确保烹饪期间的温度监测不中断", "在传感器修复前,考虑为灶具设置自动定时关闭规则(如超过 40 分钟未手动操作则自动断电),作为补偿性安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.530582666397095, "api_error": null} {"episode_id": "SQ2_TN_D_0407", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0407.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261036, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出归来后长时间处于未锁状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(05:57:10、11:04:00、17:07:00),灶具关闭后也再次报告 None(06:22:00、11:41:00、17:24:00)。这一天三次做饭均复现此现象,说明并非偶发,而是传感器在高温或灶具工作环境下存在系统性故障。\",\n \"推理步骤2: 厨房温度传感器的核心职责是在灶具使用时监测异常高温,配合烟雾报警器预防火灾。恰恰在最需要它工作的时刻(灶具开启期间)它失效了,这意味着火灾预警能力存在盲区。对于独居老人场景,这是一个不可忽视的安全隐患。\",\n \"推理步骤3: 08:33 老人回家时,入户门解锁(LockOperationType=1),但直到 20:44:16 才记录到门锁上锁(LockOperationType=0, Auto)。中间长达约12小时门锁处于解锁状态,期间老人在家活动(客厅、厨房、卧室均有运动记录),虽然门接触传感器在 08:33:09 之后未报告开门事件(说明门是关着的),但未上锁的入户门对独居老人存在入侵风险。\",\n \"推理步骤4: 其余行为模式基本正常——老人 05:25 起床、05:33 洗漱、05:56 做早餐、06:53 出门并自动上锁、08:33 回家、11:03 做午餐、12:21 午休拉窗帘、14:09 起床、17:06 做晚餐、20:31 洗漱、20:44 就寝关窗帘关灯,符合独居老人的典型日常作息。\",\n \"推理步骤5: 温度趋势整体合理:夜间约22°C,白天随气温升至约25.8°C,傍晚回落,无异常温度飙升。烟雾报警器全天无触发,漏水传感器无触发,窗户传感器无异常开合,排除火灾、漏水和入侵的即时威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值(05:57:10、06:22:00、11:04:00、11:41:00、17:07:00、17:24:00),共6次读数失效\",\n \"入户门在 08:33:00 解锁后直到 20:44:16 才重新上锁,中间约12小时处于未锁定状态\",\n \"传感器失效恰好发生在灶具工作的高风险时段,削弱了厨房火灾监测能力\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——当前传感器在灶具使用时持续失效,可能是高温导致传感器超量程或硬件老化,需尽快排查修复以恢复厨房火灾预警能力\",\n \"配置入户门锁自动上锁策略——建议设置门关闭后若干分钟内自动上锁,避免老人忘记锁门导致长时间门户未锁\",\n \"在厨房温度传感器修复前,考虑增加灶具使用超时自动关闭功能,作为补偿性安全措施\",\n \"建议为家属或护理人员配置远程通知,当温度传感器报告 None 值或门锁长时间未上锁时自动推送告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出归来后长时间处于未锁状态。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(05:57:10、11:04:00、17:07:00),灶具关闭后也再次报告 None(06:22:00、11:41:00、17:24:00)。这一天三次做饭均复现此现象,说明并非偶发,而是传感器在高温或灶具工作环境下存在系统性故障。", "推理步骤2: 厨房温度传感器的核心职责是在灶具使用时监测异常高温,配合烟雾报警器预防火灾。恰恰在最需要它工作的时刻(灶具开启期间)它失效了,这意味着火灾预警能力存在盲区。对于独居老人场景,这是一个不可忽视的安全隐患。", "推理步骤3: 08:33 老人回家时,入户门解锁(LockOperationType=1),但直到 20:44:16 才记录到门锁上锁(LockOperationType=0, Auto)。中间长达约12小时门锁处于解锁状态,期间老人在家活动(客厅、厨房、卧室均有运动记录),虽然门接触传感器在 08:33:09 之后未报告开门事件(说明门是关着的),但未上锁的入户门对独居老人存在入侵风险。", "推理步骤4: 其余行为模式基本正常——老人 05:25 起床、05:33 洗漱、05:56 做早餐、06:53 出门并自动上锁、08:33 回家、11:03 做午餐、12:21 午休拉窗帘、14:09 起床、17:06 做晚餐、20:31 洗漱、20:44 就寝关窗帘关灯,符合独居老人的典型日常作息。", "推理步骤5: 温度趋势整体合理:夜间约22°C,白天随气温升至约25.8°C,傍晚回落,无异常温度飙升。烟雾报警器全天无触发,漏水传感器无触发,窗户传感器无异常开合,排除火灾、漏水和入侵的即时威胁。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值(05:57:10、06:22:00、11:04:00、11:41:00、17:07:00、17:24:00),共6次读数失效", "入户门在 08:33:00 解锁后直到 20:44:16 才重新上锁,中间约12小时处于未锁定状态", "传感器失效恰好发生在灶具工作的高风险时段,削弱了厨房火灾监测能力"], "recommended_actions": ["检查或更换厨房温度传感器——当前传感器在灶具使用时持续失效,可能是高温导致传感器超量程或硬件老化,需尽快排查修复以恢复厨房火灾预警能力", "配置入户门锁自动上锁策略——建议设置门关闭后若干分钟内自动上锁,避免老人忘记锁门导致长时间门户未锁", "在厨房温度传感器修复前,考虑增加灶具使用超时自动关闭功能,作为补偿性安全措施", "建议为家属或护理人员配置远程通知,当温度传感器报告 None 值或门锁长时间未上锁时自动推送告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.18973708152771, "api_error": null} {"episode_id": "SQ2_TN_D_0408", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0408.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261037, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间(08:30)一直未关闭,直到晚间(20:44)才重新锁上。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具使用期间及关闭后多次报告 MeasuredValue = None(06:02、06:22、11:07、11:31、17:11、17:31),共出现6次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在故障或超量程异常。\",\n \"推理步骤2: 厨房灶具的使用模式本身是正常的——早餐(06:01-06:21,约20分钟)、午餐(11:06-11:30,约24分钟)、晚餐(17:10-17:30,约20分钟),时长合理,且每次使用后都正常关闭,烟雾报警器未触发,不构成火灾风险。\",\n \"推理步骤3: 老人 06:58 手动开锁出门,门在6秒内关闭并自动上锁,这是正常的。但 08:30 门锁再次被手动解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),之后日志中没有门关闭和重新上锁的记录,直到 20:44 才出现门关闭(StateValue=True)和自动上锁。这意味着入户门可能在 08:30 至 20:44 之间长达约12小时处于未锁定/未完全关闭状态。\",\n \"推理步骤4: 08:30 开门后,玄关和客厅运动传感器检测到有人进入,客厅灯被打开——这可能是老人回家,也可能是其他人进入。考虑到老人独居的场景,长时间门未锁存在入侵风险,但 08:30 后室内活动模式(午休、做饭、看电视)与老人日常生活一致,更可能是老人自己回来后忘记关门/锁门。\",\n \"推理步骤5: 老人的整体生活作息正常——05:35起床、三餐规律、12:31-13:54午休、20:44就寝,卫生间使用时长合理,未发现长时间无活动的健康异常信号。\",\n \"推理步骤6: 卧室窗帘在 20:44 被完全关闭(10000 = 100%),但卧室窗户传感器全天无开关记录,说明窗户始终处于关闭状态,无入侵迹象。客厅窗户传感器同样无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 None 值(06:02、06:22、11:07、11:31、17:11、17:31),均发生在灶具使用前后\",\n \"08:30 入户门被手动解锁并打开(front_door_contact=False),但直到 20:44 才出现关门和上锁记录,中间约12小时无门锁状态变化\",\n \"08:30 开门后有人进入客厅(entrance_occupancy=1, living_room_occupancy=1),后续室内活动模式与独居老人日常一致\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:多次返回 None 值表明传感器可能故障,在灶具使用场景下无法正常监测温度会削弱火灾预警能力\",\n \"为入户门设置未锁定超时提醒:建议配置规则——若门锁处于解锁状态超过10分钟,自动向老人或紧急联系人发送提醒通知\",\n \"确认 08:30 进入者身份:虽然后续活动模式正常,但建议与老人确认当时是否为本人回家,排除他人持钥匙进入的可能\",\n \"考虑为入户门增加自动上锁策略:例如门关闭后30秒自动上锁,防止老人忘记锁门带来的安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间(08:30)一直未关闭,直到晚间(20:44)才重新锁上。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具使用期间及关闭后多次报告 MeasuredValue = None(06:02、06:22、11:07、11:31、17:11、17:31),共出现6次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在故障或超量程异常。", "推理步骤2: 厨房灶具的使用模式本身是正常的——早餐(06:01-06:21,约20分钟)、午餐(11:06-11:30,约24分钟)、晚餐(17:10-17:30,约20分钟),时长合理,且每次使用后都正常关闭,烟雾报警器未触发,不构成火灾风险。", "推理步骤3: 老人 06:58 手动开锁出门,门在6秒内关闭并自动上锁,这是正常的。但 08:30 门锁再次被手动解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),之后日志中没有门关闭和重新上锁的记录,直到 20:44 才出现门关闭(StateValue=True)和自动上锁。这意味着入户门可能在 08:30 至 20:44 之间长达约12小时处于未锁定/未完全关闭状态。", "推理步骤4: 08:30 开门后,玄关和客厅运动传感器检测到有人进入,客厅灯被打开——这可能是老人回家,也可能是其他人进入。考虑到老人独居的场景,长时间门未锁存在入侵风险,但 08:30 后室内活动模式(午休、做饭、看电视)与老人日常生活一致,更可能是老人自己回来后忘记关门/锁门。", "推理步骤5: 老人的整体生活作息正常——05:35起床、三餐规律、12:31-13:54午休、20:44就寝,卫生间使用时长合理,未发现长时间无活动的健康异常信号。", "推理步骤6: 卧室窗帘在 20:44 被完全关闭(10000 = 100%),但卧室窗户传感器全天无开关记录,说明窗户始终处于关闭状态,无入侵迹象。客厅窗户传感器同样无异常。"], "key_evidence": ["厨房温度传感器6次报告 None 值(06:02、06:22、11:07、11:31、17:11、17:31),均发生在灶具使用前后", "08:30 入户门被手动解锁并打开(front_door_contact=False),但直到 20:44 才出现关门和上锁记录,中间约12小时无门锁状态变化", "08:30 开门后有人进入客厅(entrance_occupancy=1, living_room_occupancy=1),后续室内活动模式与独居老人日常一致"], "recommended_actions": ["检修或更换厨房温度传感器:多次返回 None 值表明传感器可能故障,在灶具使用场景下无法正常监测温度会削弱火灾预警能力", "为入户门设置未锁定超时提醒:建议配置规则——若门锁处于解锁状态超过10分钟,自动向老人或紧急联系人发送提醒通知", "确认 08:30 进入者身份:虽然后续活动模式正常,但建议与老人确认当时是否为本人回家,排除他人持钥匙进入的可能", "考虑为入户门增加自动上锁策略:例如门关闭后30秒自动上锁,防止老人忘记锁门带来的安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.33350968360901, "api_error": null} {"episode_id": "SQ2_TN_D_0419", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0419.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261048, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出归来后未及时上锁存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内(06:01:10、10:56:00、16:59:00)均报告 MeasuredValue = None,灶具关闭后约1分钟(06:28:00、11:21:00、17:33:00)也报告 None。这一现象在三次烹饪中重复出现,说明并非偶发,而是系统性故障。\",\n \"推理步骤2: 正常温度传感器不应因灶具开关而丢失读数。可能原因包括:灶具产生的电磁干扰影响传感器通信、传感器量程溢出导致报告 null、或传感器硬件本身存在间歇性故障。无论哪种原因,在独居老人家庭中,厨房温度监测失效意味着无法及时检测到过热或火灾风险。\",\n \"推理步骤3: 08:37 老人回家时,入户门锁解锁(LockState=2)、门打开又关闭,但日志中没有后续的上锁事件(LockOperationType=0)。直到 20:47:08 才出现自动上锁记录。这意味着入户门在白天约12小时内处于未上锁状态。对独居老人而言,这是入侵风险。\",\n \"推理步骤4: 其余行为模式基本正常——老人 05:24 起床、06:00 做早餐、07:09 出门(门自动上锁)、08:37 回家、12:30 午休拉窗帘、13:55 起床、16:58 做晚餐、20:47 就寝锁门关灯,符合独居老人的典型日常作息。\",\n \"推理步骤5: 19:40 客厅灯亮度被调至 CurrentLevel=11(约4%),非常暗。结合老人即将就寝的时间线,这可能是有意调暗,但也可能反映老人视力问题或误操作,值得关注但不构成直接威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:01:10、06:28:00、10:56:00、11:21:00、16:59:00、17:33:00),共6次异常读数\",\n \"08:37 入户门解锁后无上锁记录,直到 20:47:08 才自动上锁,门锁处于未锁定状态长达约12小时\",\n \"其他房间温度传感器在同一时段正常工作,排除全局网络故障,指向厨房传感器本身的问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否受灶具电磁干扰影响,必要时更换传感器或调整安装位置使其远离灶具\",\n \"配置入户门锁自动上锁策略:门关闭后若超过一定时间(如2分钟)未手动上锁,则自动执行上锁操作,避免长时间未锁定\",\n \"在厨房温度传感器故障期间,加强对烟雾报警器的依赖,确认 kitchen_smoke_alarm 工作正常,作为火灾检测的备用手段\",\n \"关注老人晚间将客厅灯调至极低亮度的行为,评估是否需要设置最低亮度阈值以防止跌倒风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出归来后未及时上锁存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内(06:01:10、10:56:00、16:59:00)均报告 MeasuredValue = None,灶具关闭后约1分钟(06:28:00、11:21:00、17:33:00)也报告 None。这一现象在三次烹饪中重复出现,说明并非偶发,而是系统性故障。", "推理步骤2: 正常温度传感器不应因灶具开关而丢失读数。可能原因包括:灶具产生的电磁干扰影响传感器通信、传感器量程溢出导致报告 null、或传感器硬件本身存在间歇性故障。无论哪种原因,在独居老人家庭中,厨房温度监测失效意味着无法及时检测到过热或火灾风险。", "推理步骤3: 08:37 老人回家时,入户门锁解锁(LockState=2)、门打开又关闭,但日志中没有后续的上锁事件(LockOperationType=0)。直到 20:47:08 才出现自动上锁记录。这意味着入户门在白天约12小时内处于未上锁状态。对独居老人而言,这是入侵风险。", "推理步骤4: 其余行为模式基本正常——老人 05:24 起床、06:00 做早餐、07:09 出门(门自动上锁)、08:37 回家、12:30 午休拉窗帘、13:55 起床、16:58 做晚餐、20:47 就寝锁门关灯,符合独居老人的典型日常作息。", "推理步骤5: 19:40 客厅灯亮度被调至 CurrentLevel=11(约4%),非常暗。结合老人即将就寝的时间线,这可能是有意调暗,但也可能反映老人视力问题或误操作,值得关注但不构成直接威胁。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:01:10、06:28:00、10:56:00、11:21:00、16:59:00、17:33:00),共6次异常读数", "08:37 入户门解锁后无上锁记录,直到 20:47:08 才自动上锁,门锁处于未锁定状态长达约12小时", "其他房间温度传感器在同一时段正常工作,排除全局网络故障,指向厨房传感器本身的问题"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否受灶具电磁干扰影响,必要时更换传感器或调整安装位置使其远离灶具", "配置入户门锁自动上锁策略:门关闭后若超过一定时间(如2分钟)未手动上锁,则自动执行上锁操作,避免长时间未锁定", "在厨房温度传感器故障期间,加强对烟雾报警器的依赖,确认 kitchen_smoke_alarm 工作正常,作为火灾检测的备用手段", "关注老人晚间将客厅灯调至极低亮度的行为,评估是否需要设置最低亮度阈值以防止跌倒风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.66176438331604, "api_error": null} {"episode_id": "SQ2_TN_D_0421", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0421.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261050, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在老人回家时未经历正常的开锁-开门流程,存在门锁状态异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了5次 MeasuredValue = None 的读数(05:55、06:31、11:10、11:30、16:59、17:23),均发生在灶具开启或关闭前后。其他两个温度传感器在相同时段均正常上报数值,说明这不是系统性通信故障,而是该传感器自身的问题。\",\n \"推理步骤2: 该传感器的 None 值与灶具操作高度相关——每次灶具 OnOff 状态变化后约30秒到1分钟内就会出现 None 读数。可能原因包括:灶具产生的高温或电磁干扰导致传感器暂时失效,或传感器本身老化。对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段,其不可靠会降低安全冗余。\",\n \"推理步骤3: 20:52 老人从客厅回到卧室准备就寝时,日志显示 front_door_contact = True(门关闭)和 front_door_lock LockState = 1(上锁),但之前没有对应的开锁和开门记录。回溯发现老人 08:29 回家时开锁进门,但此后直到 20:52 才出现门锁/门磁事件。这意味着从 08:29 到 20:52 长达12小时内,入户门可能一直处于未锁状态(08:29 开锁进门后未见重新上锁记录),直到 20:52 才自动上锁。对独居老人而言,白天长时间门未上锁存在入侵风险。\",\n \"推理步骤4: 老人的整体生活作息模式基本正常——05:22 起床、05:44 如厕、05:54 做早餐、07:09 出门、08:29 回家、12:28 午休、13:53 起床、16:58 做晚餐、20:32 洗漱、20:52 就寝。活动节奏合理,无长时间无活动的健康告警信号。\",\n \"推理步骤5: 19:34 客厅灯亮度被设置为 CurrentLevel = 19(约7.5%亮度),这是一个非常低的亮度值。虽然可能是老人有意调暗作为夜灯使用,但对于独居老人来说,过暗的照明环境增加跌倒风险,值得关注。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:55、06:31、11:10、11:30、16:59、17:23 共报告了多次 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"08:29 老人回家开锁进门后,直到 20:52 才出现门锁上锁记录(LockState=1),中间约12.5小时无上锁事件\",\n \"同时段客厅和卧室温度传感器均正常上报,排除系统性网络故障\",\n \"19:34 客厅灯亮度仅为 7.5%(Level=19/254),独居老人低照明环境存在跌倒隐患\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认是否因灶具高温或电磁干扰导致间歇性失效;在修复前可考虑临时增加独立的厨房温度监测手段\",\n \"配置入户门锁自动上锁策略:老人进门后若超过一定时间(如5分钟)未手动上锁,系统应自动上锁并推送提醒\",\n \"为客厅灯设置最低亮度阈值(建议不低于30%),避免独居老人在过暗环境中活动导致跌倒\",\n \"建议为厨房烟雾报警器增加定期自检提醒,在温度传感器不可靠期间作为主要火灾预警手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在老人回家时未经历正常的开锁-开门流程,存在门锁状态异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了5次 MeasuredValue = None 的读数(05:55、06:31、11:10、11:30、16:59、17:23),均发生在灶具开启或关闭前后。其他两个温度传感器在相同时段均正常上报数值,说明这不是系统性通信故障,而是该传感器自身的问题。", "推理步骤2: 该传感器的 None 值与灶具操作高度相关——每次灶具 OnOff 状态变化后约30秒到1分钟内就会出现 None 读数。可能原因包括:灶具产生的高温或电磁干扰导致传感器暂时失效,或传感器本身老化。对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段,其不可靠会降低安全冗余。", "推理步骤3: 20:52 老人从客厅回到卧室准备就寝时,日志显示 front_door_contact = True(门关闭)和 front_door_lock LockState = 1(上锁),但之前没有对应的开锁和开门记录。回溯发现老人 08:29 回家时开锁进门,但此后直到 20:52 才出现门锁/门磁事件。这意味着从 08:29 到 20:52 长达12小时内,入户门可能一直处于未锁状态(08:29 开锁进门后未见重新上锁记录),直到 20:52 才自动上锁。对独居老人而言,白天长时间门未上锁存在入侵风险。", "推理步骤4: 老人的整体生活作息模式基本正常——05:22 起床、05:44 如厕、05:54 做早餐、07:09 出门、08:29 回家、12:28 午休、13:53 起床、16:58 做晚餐、20:32 洗漱、20:52 就寝。活动节奏合理,无长时间无活动的健康告警信号。", "推理步骤5: 19:34 客厅灯亮度被设置为 CurrentLevel = 19(约7.5%亮度),这是一个非常低的亮度值。虽然可能是老人有意调暗作为夜灯使用,但对于独居老人来说,过暗的照明环境增加跌倒风险,值得关注。"], "key_evidence": ["厨房温度传感器在 05:55、06:31、11:10、11:30、16:59、17:23 共报告了多次 MeasuredValue = None,均与灶具操作时间高度关联", "08:29 老人回家开锁进门后,直到 20:52 才出现门锁上锁记录(LockState=1),中间约12.5小时无上锁事件", "同时段客厅和卧室温度传感器均正常上报,排除系统性网络故障", "19:34 客厅灯亮度仅为 7.5%(Level=19/254),独居老人低照明环境存在跌倒隐患"], "recommended_actions": ["检查或更换厨房温度传感器,确认是否因灶具高温或电磁干扰导致间歇性失效;在修复前可考虑临时增加独立的厨房温度监测手段", "配置入户门锁自动上锁策略:老人进门后若超过一定时间(如5分钟)未手动上锁,系统应自动上锁并推送提醒", "为客厅灯设置最低亮度阈值(建议不低于30%),避免独居老人在过暗环境中活动导致跌倒", "建议为厨房烟雾报警器增加定期自检提醒,在温度传感器不可靠期间作为主要火灾预警手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.85907483100891, "api_error": null} {"episode_id": "SQ2_TN_D_0425", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0425.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261054, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致无法及时发现厨房火灾/过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 日志中厨房温度传感器在灶具开启后约1分钟内就报告 MeasuredValue = None(06:01、06:34、11:03、11:27、16:58、17:23),共出现6次,而客厅和卧室传感器在同一时段始终正常上报数值。\",\n \"推理步骤2: None 值出现的时间与灶具 OnOff 状态高度相关——每次灶具开启后约30秒~1分钟出现 None,灶具关闭后约1分钟再次出现 None,之后在下一个整点/半点周期恢复正常数值。这说明传感器可能在灶具工作产生的高温或电磁干扰下出现读数失败。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是防范灶具忘关、油烟起火等场景的关键安全设备。如果传感器在灶具使用时恰好失效,就无法在温度异常升高时触发报警,形成安全监控盲区。\",\n \"推理步骤4: 除传感器问题外,老人的整体生活作息正常——05:31起床、06:00早餐做饭、06:52出门、08:33回家、11:02午餐、12:32午休、14:05起床、16:57晚餐、20:37洗漱就寝,门锁开关和运动传感器的时序合理,未发现入侵、漏水、烟雾报警或健康异常迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None(06:01、06:34、11:03、11:27、16:58、17:23),而同时段其他温度传感器均正常\",\n \"None 值与 kitchen_cook_surface 的 OnOff 状态变化存在强时间关联(灶具开启/关闭后约30~60秒即出现)\",\n \"传感器在非灶具使用时段(整点/半点周期性上报)数值正常,说明并非完全离线,而是在特定条件下失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数\",\n \"检查传感器固件版本并更新,排除软件层面的读数溢出或通信超时问题\",\n \"考虑增加一个备用温度传感器或将烟雾报警器作为灶具使用期间的主要安全监测手段\",\n \"在传感器修复前,建议为老人设置灶具使用时长提醒(如超过30分钟未关闭则推送通知给家属)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致无法及时发现厨房火灾/过热风险。", "reasoning": ["推理步骤1: 日志中厨房温度传感器在灶具开启后约1分钟内就报告 MeasuredValue = None(06:01、06:34、11:03、11:27、16:58、17:23),共出现6次,而客厅和卧室传感器在同一时段始终正常上报数值。", "推理步骤2: None 值出现的时间与灶具 OnOff 状态高度相关——每次灶具开启后约30秒~1分钟出现 None,灶具关闭后约1分钟再次出现 None,之后在下一个整点/半点周期恢复正常数值。这说明传感器可能在灶具工作产生的高温或电磁干扰下出现读数失败。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是防范灶具忘关、油烟起火等场景的关键安全设备。如果传感器在灶具使用时恰好失效,就无法在温度异常升高时触发报警,形成安全监控盲区。", "推理步骤4: 除传感器问题外,老人的整体生活作息正常——05:31起床、06:00早餐做饭、06:52出门、08:33回家、11:02午餐、12:32午休、14:05起床、16:57晚餐、20:37洗漱就寝,门锁开关和运动传感器的时序合理,未发现入侵、漏水、烟雾报警或健康异常迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None(06:01、06:34、11:03、11:27、16:58、17:23),而同时段其他温度传感器均正常", "None 值与 kitchen_cook_surface 的 OnOff 状态变化存在强时间关联(灶具开启/关闭后约30~60秒即出现)", "传感器在非灶具使用时段(整点/半点周期性上报)数值正常,说明并非完全离线,而是在特定条件下失效"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数", "检查传感器固件版本并更新,排除软件层面的读数溢出或通信超时问题", "考虑增加一个备用温度传感器或将烟雾报警器作为灶具使用期间的主要安全监测手段", "在传感器修复前,建议为老人设置灶具使用时长提醒(如超过30分钟未关闭则推送通知给家属)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.913906574249268, "api_error": null} {"episode_id": "SQ2_TN_D_0428", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TN_D_0428.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20261057, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 全天共出现 6 次 kitchen_temp_sensor 报告 MeasuredValue = None 的情况,分别发生在 05:52、06:29、11:06、11:38、16:52、17:27,每次都紧跟在灶具开启或关闭的时间点附近。\",\n \"推理步骤2: 其他两个温度传感器(客厅、卧室)在同一时段始终正常上报数值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房温度传感器在灶具未使用时段(如整点半点的定期上报)能正常返回数值,说明传感器并非完全失效,而是在灶具工作导致温度快速变化时出现读数异常(可能超出量程或受电磁干扰)。\",\n \"推理步骤4: 对于独居老人家庭,厨房是火灾高风险区域。灶具使用期间恰恰是最需要温度监控的时刻,而传感器在此时失效意味着如果发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时预警。\",\n \"推理步骤5: 除传感器问题外,老人的整体生活模式正常——早起(05:28)、三餐规律(早餐05:51-06:28、午餐11:05-11:37、晚餐16:51-17:26)、午休(12:37-13:57)、晚间就寝(20:46),门锁和出入记录合理,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启/关闭前后共 6 次报告 MeasuredValue = None(05:52、06:29、11:06、11:38、16:52、17:27)\",\n \"同时段客厅和卧室温度传感器均正常上报,排除系统性故障\",\n \"传感器在灶具未使用的整点/半点定期上报中数值正常,故障仅在灶具工作相关时段出现\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰\",\n \"检查传感器的量程配置,确认是否因灶具附近温度超出测量范围而返回 None\",\n \"考虑更换或增加一个耐高温的厨房温度传感器,确保灶具使用期间的温度监控不中断\",\n \"在传感器修复前,建议为灶具设置自动定时关闭规则(如超过 40 分钟未手动操作则自动断电),作为补偿性安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 全天共出现 6 次 kitchen_temp_sensor 报告 MeasuredValue = None 的情况,分别发生在 05:52、06:29、11:06、11:38、16:52、17:27,每次都紧跟在灶具开启或关闭的时间点附近。", "推理步骤2: 其他两个温度传感器(客厅、卧室)在同一时段始终正常上报数值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房温度传感器在灶具未使用时段(如整点半点的定期上报)能正常返回数值,说明传感器并非完全失效,而是在灶具工作导致温度快速变化时出现读数异常(可能超出量程或受电磁干扰)。", "推理步骤4: 对于独居老人家庭,厨房是火灾高风险区域。灶具使用期间恰恰是最需要温度监控的时刻,而传感器在此时失效意味着如果发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时预警。", "推理步骤5: 除传感器问题外,老人的整体生活模式正常——早起(05:28)、三餐规律(早餐05:51-06:28、午餐11:05-11:37、晚餐16:51-17:26)、午休(12:37-13:57)、晚间就寝(20:46),门锁和出入记录合理,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启/关闭前后共 6 次报告 MeasuredValue = None(05:52、06:29、11:06、11:38、16:52、17:27)", "同时段客厅和卧室温度传感器均正常上报,排除系统性故障", "传感器在灶具未使用的整点/半点定期上报中数值正常,故障仅在灶具工作相关时段出现"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰", "检查传感器的量程配置,确认是否因灶具附近温度超出测量范围而返回 None", "考虑更换或增加一个耐高温的厨房温度传感器,确保灶具使用期间的温度监控不中断", "在传感器修复前,建议为灶具设置自动定时关闭规则(如超过 40 分钟未手动操作则自动断电),作为补偿性安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.539889097213745, "api_error": null} {"episode_id": "SQ2_TP_A_0190", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0190.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20260819, "scenario_id": "FG-04", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-14T13:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次离线(None),且烟雾报警器电池低电量,存在火灾监控盲区风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 11:00 和 11:30 报告了约 29.5°C 和 29.4°C 的读数,而同一时段客厅仅约 25.5°C、卧室约 24.4°C。厨房比其他房间高出约 4-5°C,且当时灶具并未开启(灶具在 09:27 已关闭,11:53 才再次开启),这一温差异常偏大。\",\n \"推理步骤2: 13:34 灶具开启后,13:44 厨房温度传感器报告 28.75°C,但到 14:00 定时读数却骤降至 25.38°C,且日志中未见灶具关闭事件。这意味着灶具可能仍在运行而温度却大幅下降,或者传感器读数不可靠。结合 11:00 的异常高温,该传感器的准确性存疑。\",\n \"推理步骤3: 厨房温度传感器在一天内出现了至少 6 次 MeasuredValue = None(09:21、09:28、11:54、12:26、18:04、18:28),均发生在灶具操作前后。虽然部分可能与灶具热干扰有关,但频繁离线表明传感器工作状态不稳定,可能存在硬件故障或安装位置不当。\",\n \"推理步骤4: 厨房烟雾报警器在 6月13日 13:34 已报告 BatteryAlert = 1(低电量警告)。如果温度传感器同时不可靠,那么厨房的两道火灾防线都存在隐患——烟雾报警器可能因电量耗尽而失效,温度传感器读数不准确无法作为辅助预警。\",\n \"推理步骤5: 13:44 的 SmokeState = 0 表示当时无烟雾,排除了即时火灾风险。但这不能消除设备故障带来的长期监控盲区问题。\",\n \"推理步骤6: 其余家居行为模式正常——住户约 08:30 起床、三餐规律做饭、22:51 就寝锁门,入侵/漏水等其他威胁类型无异常信号。\"\n ],\n \"key_evidence\": [\n \"厨房烟雾报警器 BatteryAlert = 1(6月13日 13:34),电池电量低\",\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None,频繁离线\",\n \"11:00-11:30 厨房温度异常飙升至约 29.5°C,比客厅高约 4°C,且灶具当时未开启\",\n \"13:34 灶具开启后 13:44 温度达 28.75°C,但 14:00 骤降至 25.38°C,读数波动不合理\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾报警功能正常\",\n \"检查厨房温度传感器的安装位置,避免靠近灶具热源或通风口,排除环境干扰\",\n \"对厨房温度传感器进行校准或更换,解决频繁离线和读数异常问题\",\n \"在传感器修复前,加强厨房用火期间的人工监控,避免无人看管灶具\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次离线(None),且烟雾报警器电池低电量,存在火灾监控盲区风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 11:00 和 11:30 报告了约 29.5°C 和 29.4°C 的读数,而同一时段客厅仅约 25.5°C、卧室约 24.4°C。厨房比其他房间高出约 4-5°C,且当时灶具并未开启(灶具在 09:27 已关闭,11:53 才再次开启),这一温差异常偏大。", "推理步骤2: 13:34 灶具开启后,13:44 厨房温度传感器报告 28.75°C,但到 14:00 定时读数却骤降至 25.38°C,且日志中未见灶具关闭事件。这意味着灶具可能仍在运行而温度却大幅下降,或者传感器读数不可靠。结合 11:00 的异常高温,该传感器的准确性存疑。", "推理步骤3: 厨房温度传感器在一天内出现了至少 6 次 MeasuredValue = None(09:21、09:28、11:54、12:26、18:04、18:28),均发生在灶具操作前后。虽然部分可能与灶具热干扰有关,但频繁离线表明传感器工作状态不稳定,可能存在硬件故障或安装位置不当。", "推理步骤4: 厨房烟雾报警器在 6月13日 13:34 已报告 BatteryAlert = 1(低电量警告)。如果温度传感器同时不可靠,那么厨房的两道火灾防线都存在隐患——烟雾报警器可能因电量耗尽而失效,温度传感器读数不准确无法作为辅助预警。", "推理步骤5: 13:44 的 SmokeState = 0 表示当时无烟雾,排除了即时火灾风险。但这不能消除设备故障带来的长期监控盲区问题。", "推理步骤6: 其余家居行为模式正常——住户约 08:30 起床、三餐规律做饭、22:51 就寝锁门,入侵/漏水等其他威胁类型无异常信号。"], "key_evidence": ["厨房烟雾报警器 BatteryAlert = 1(6月13日 13:34),电池电量低", "厨房温度传感器一天内 6 次报告 MeasuredValue = None,频繁离线", "11:00-11:30 厨房温度异常飙升至约 29.5°C,比客厅高约 4°C,且灶具当时未开启", "13:34 灶具开启后 13:44 温度达 28.75°C,但 14:00 骤降至 25.38°C,读数波动不合理"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾报警功能正常", "检查厨房温度传感器的安装位置,避免靠近灶具热源或通风口,排除环境干扰", "对厨房温度传感器进行校准或更换,解决频繁离线和读数异常问题", "在传感器修复前,加强厨房用火期间的人工监控,避免无人看管灶具"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.99235773086548, "api_error": null} {"episode_id": "SQ2_TP_A_0194", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0194.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20260823, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T04:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨 4:49 触发报警,且截至日志结束未见复位,漏水可能仍在持续。\",\n \"reasoning\": [\n \"推理步骤1: 04:49 卫生间漏水传感器 bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,表明检测到积水。\",\n \"推理步骤2: 此时为凌晨,卫生间无人活动(bathroom_occupancy 直到 06:26 才检测到有人),排除了正常用水溅水的可能。\",\n \"推理步骤3: 在整个日志时间范围内(直到 23:30),未出现 bathroom_water_leak StateValue = False 的复位记录,说明漏水状态可能一直持续。\",\n \"推理步骤4: 住户 06:26 进入卫生间使用约 28 分钟后离开,但漏水传感器仍未复位,说明住户可能未注意到漏水,或漏水源头未被处理。\",\n \"推理步骤5: 其余设备行为均属正常:住户早起洗漱、做早餐、07:30 出门上锁、18:04 回家开空调做饭、21:46 回卧室睡觉,生活节奏无异常。厨房 18:00 温度短暂飙升至 28.56°C 后在做饭期间恢复正常,属于灶具使用的合理波动。厨房温度传感器在 18:47 和 19:45 两次报 None 值属于轻微设备异常,但不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"04:49 bathroom_water_leak StateValue = True,触发漏水事件\",\n \"整日日志中无 StateValue = False 的复位记录,漏水状态持续超过 18 小时\",\n \"漏水发生在凌晨无人使用卫生间期间,非正常用水行为\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否存在积水,确认漏水来源(水管接头、马桶底座、热水器等)\",\n \"如确认漏水,关闭卫生间对应的水阀止损\",\n \"检查漏水是否已渗透到相邻区域(卧室、客厅),防止地板或墙体受损\",\n \"漏水修复后确认传感器复位(StateValue = False),若传感器未复位需检查传感器本身是否故障\",\n \"建议配置自动化规则:漏水传感器触发时自动发送手机推送通知,避免长时间无人知晓\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨 4:49 触发报警,且截至日志结束未见复位,漏水可能仍在持续。", "reasoning": ["推理步骤1: 04:49 卫生间漏水传感器 bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,表明检测到积水。", "推理步骤2: 此时为凌晨,卫生间无人活动(bathroom_occupancy 直到 06:26 才检测到有人),排除了正常用水溅水的可能。", "推理步骤3: 在整个日志时间范围内(直到 23:30),未出现 bathroom_water_leak StateValue = False 的复位记录,说明漏水状态可能一直持续。", "推理步骤4: 住户 06:26 进入卫生间使用约 28 分钟后离开,但漏水传感器仍未复位,说明住户可能未注意到漏水,或漏水源头未被处理。", "推理步骤5: 其余设备行为均属正常:住户早起洗漱、做早餐、07:30 出门上锁、18:04 回家开空调做饭、21:46 回卧室睡觉,生活节奏无异常。厨房 18:00 温度短暂飙升至 28.56°C 后在做饭期间恢复正常,属于灶具使用的合理波动。厨房温度传感器在 18:47 和 19:45 两次报 None 值属于轻微设备异常,但不构成安全威胁。"], "key_evidence": ["04:49 bathroom_water_leak StateValue = True,触发漏水事件", "整日日志中无 StateValue = False 的复位记录,漏水状态持续超过 18 小时", "漏水发生在凌晨无人使用卫生间期间,非正常用水行为"], "recommended_actions": ["立即检查卫生间是否存在积水,确认漏水来源(水管接头、马桶底座、热水器等)", "如确认漏水,关闭卫生间对应的水阀止损", "检查漏水是否已渗透到相邻区域(卧室、客厅),防止地板或墙体受损", "漏水修复后确认传感器复位(StateValue = False),若传感器未复位需检查传感器本身是否故障", "建议配置自动化规则:漏水传感器触发时自动发送手机推送通知,避免长时间无人知晓"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.895569562911987, "api_error": null} {"episode_id": "SQ2_TP_A_0201", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0201.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20260830, "scenario_id": "INS-01", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-08T01:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次读数丢失(None),同时客厅窗户在深夜被打开后全天未关闭,存在设备故障和安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约24.6°C跳升至28.33°C,升幅约3.7°C,远超正常半小时波动范围(通常<0.5°C),且此时灶具尚未开启(19:06才开),排除烹饪导致的正常升温。\",\n \"推理步骤2: 厨房温度传感器在19:07和19:33两次报告MeasuredValue=None,表示传感器读数丢失。结合19:00的异常跳变,高度怀疑该传感器存在硬件故障或通信异常。\",\n \"推理步骤3: 19:30厨房温度读数为28.43°C(灶具已开启约24分钟),但19:32灶具关闭、19:32:30厨房窗户打开通风后,20:00温度迅速回落至24.08°C。传感器在正常工作时段的读数合理,但间歇性None值说明其工作状态不稳定。\",\n \"推理步骤4: 客厅窗户传感器在01:29报告StateValue=False(窗户打开),此后整天日志中再无该窗户关闭的记录。凌晨1:29是深夜时段,住户当时在卧室(01:29:30卧室有人体感应),客厅窗户被打开缺乏合理解释。虽然未触发入侵(无后续异常活动),但窗户全天敞开在住户外出期间(07:40-18:21)存在安全隐患。\",\n \"推理步骤5: 烟雾报警器全天未触发,厨房烹饪期间温度虽高但在灶具关闭后正常回落,排除火灾风险。漏水传感器无报警,排除水患。入户门锁操作均为正常手动/自动锁闭,排除入侵。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.6°C异常跳升至28.33°C,灶具尚未开启\",\n \"19:07和19:33厨房温度传感器两次报告MeasuredValue=None(读数丢失)\",\n \"01:29客厅窗户打开(StateValue=False),全天未见关闭记录,住户07:40-18:21期间外出家中窗户敞开\",\n \"22:41卧室灯在已关闭(22:34 OnOff=False)且无人(22:36 Occupancy=0)的情况下收到亮度调节事件(CurrentLevel=26),存在轻微设备状态异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,必要时重启或更换传感器\",\n \"确认客厅窗户当前是否仍处于打开状态,如是则尽快关闭;建议设置离家模式自动检查门窗状态并发出提醒\",\n \"排查卧室灯在无人且关闭状态下收到亮度调节指令的原因,检查是否有自动化规则误触发\",\n \"建议为外出场景配置安全规则:离家时自动检测所有窗户传感器状态,若有未关闭窗户则推送告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次读数丢失(None),同时客厅窗户在深夜被打开后全天未关闭,存在设备故障和安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约24.6°C跳升至28.33°C,升幅约3.7°C,远超正常半小时波动范围(通常<0.5°C),且此时灶具尚未开启(19:06才开),排除烹饪导致的正常升温。", "推理步骤2: 厨房温度传感器在19:07和19:33两次报告MeasuredValue=None,表示传感器读数丢失。结合19:00的异常跳变,高度怀疑该传感器存在硬件故障或通信异常。", "推理步骤3: 19:30厨房温度读数为28.43°C(灶具已开启约24分钟),但19:32灶具关闭、19:32:30厨房窗户打开通风后,20:00温度迅速回落至24.08°C。传感器在正常工作时段的读数合理,但间歇性None值说明其工作状态不稳定。", "推理步骤4: 客厅窗户传感器在01:29报告StateValue=False(窗户打开),此后整天日志中再无该窗户关闭的记录。凌晨1:29是深夜时段,住户当时在卧室(01:29:30卧室有人体感应),客厅窗户被打开缺乏合理解释。虽然未触发入侵(无后续异常活动),但窗户全天敞开在住户外出期间(07:40-18:21)存在安全隐患。", "推理步骤5: 烟雾报警器全天未触发,厨房烹饪期间温度虽高但在灶具关闭后正常回落,排除火灾风险。漏水传感器无报警,排除水患。入户门锁操作均为正常手动/自动锁闭,排除入侵。"], "key_evidence": ["19:00厨房温度从约24.6°C异常跳升至28.33°C,灶具尚未开启", "19:07和19:33厨房温度传感器两次报告MeasuredValue=None(读数丢失)", "01:29客厅窗户打开(StateValue=False),全天未见关闭记录,住户07:40-18:21期间外出家中窗户敞开", "22:41卧室灯在已关闭(22:34 OnOff=False)且无人(22:36 Occupancy=0)的情况下收到亮度调节事件(CurrentLevel=26),存在轻微设备状态异常"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,必要时重启或更换传感器", "确认客厅窗户当前是否仍处于打开状态,如是则尽快关闭;建议设置离家模式自动检查门窗状态并发出提醒", "排查卧室灯在无人且关闭状态下收到亮度调节指令的原因,检查是否有自动化规则误触发", "建议为外出场景配置安全规则:离家时自动检测所有窗户传感器状态,若有未关闭窗户则推送告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.657801151275635, "api_error": null} {"episode_id": "SQ2_TP_A_0204", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0204.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20260833, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-24T10:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.68°C),随后在灶具使用期间两次报告None值,存在火灾风险隐患且传感器可能故障。\",\n \"reasoning\": [\n \"推理步骤1: 18:00厨房温度传感器突然从约25.3°C跳升至28.68°C(值2868),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.50°C / 23.51°C),说明这不是全屋环境变化,而是厨房局部异常升温。\",\n \"推理步骤2: 18:30厨房温度仍高达28.57°C,此时住户尚未开始做饭(灶具18:53才开启),排除了烹饪导致升温的可能。无人操作厨房设备却出现近3°C的异常温升,可能存在电器故障发热或其他热源。\",\n \"推理步骤3: 18:54(灶具开启后1分钟)和19:49(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None,说明传感器在高温/烹饪环境下出现了读数失效,可能是传感器本身故障或温度超出量程。\",\n \"推理步骤4: 在传感器失效期间灶具正在使用,这意味着如果发生过热或火情,烟雾报警器是唯一的安全防线,温度监测处于盲区状态,安全冗余大幅降低。\",\n \"推理步骤5: 19:00温度传感器恢复读数后显示24.30°C,与客厅温度基本一致,说明之前18:00-18:30的28.6°C高温已消退,但原因不明。\",\n \"推理步骤6: 10:47厨房窗户曾被打开3分钟(住户不在家期间),结合18:00的异常高温,需要排查是否有外部因素或设备异常。不过该窗户事件与客厅运动传感器同时触发,可能是入侵迹象,但也可能是误报或远程操作。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度异常飙升至2868(28.68°C),较前一读数2479(24.79°C)上升近4°C,而此时灶具未开启、住户尚未进入厨房\",\n \"18:30厨房温度仍为2857(28.57°C),持续高温确认非瞬时读数错误\",\n \"18:54和19:49厨房温度传感器两次报告MeasuredValue=None,传感器在灶具使用前后失效\",\n \"10:47-10:50住户外出期间厨房窗户被打开又关闭,同时客厅运动传感器被触发\",\n \"烟雾报警器在整个过程中未触发(未见报警日志),但温度传感器失效削弱了安全监测能力\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器工作状态,排查两次None读数的原因,必要时更换传感器以恢复温度监测能力\",\n \"排查厨房18:00异常升温的热源——检查厨房内所有电器(冰箱、微波炉等)是否存在故障发热\",\n \"核实10:47住户外出期间厨房窗户开关和客厅运动检测事件的来源,确认是否为远程操作或存在未授权进入\",\n \"确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,在温度传感器修复前它是唯一的火灾预警手段\",\n \"考虑为灶具设置安全联动规则:当厨房温度传感器离线时自动关闭灶具或发出告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.68°C),随后在灶具使用期间两次报告None值,存在火灾风险隐患且传感器可能故障。", "reasoning": ["推理步骤1: 18:00厨房温度传感器突然从约25.3°C跳升至28.68°C(值2868),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.50°C / 23.51°C),说明这不是全屋环境变化,而是厨房局部异常升温。", "推理步骤2: 18:30厨房温度仍高达28.57°C,此时住户尚未开始做饭(灶具18:53才开启),排除了烹饪导致升温的可能。无人操作厨房设备却出现近3°C的异常温升,可能存在电器故障发热或其他热源。", "推理步骤3: 18:54(灶具开启后1分钟)和19:49(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None,说明传感器在高温/烹饪环境下出现了读数失效,可能是传感器本身故障或温度超出量程。", "推理步骤4: 在传感器失效期间灶具正在使用,这意味着如果发生过热或火情,烟雾报警器是唯一的安全防线,温度监测处于盲区状态,安全冗余大幅降低。", "推理步骤5: 19:00温度传感器恢复读数后显示24.30°C,与客厅温度基本一致,说明之前18:00-18:30的28.6°C高温已消退,但原因不明。", "推理步骤6: 10:47厨房窗户曾被打开3分钟(住户不在家期间),结合18:00的异常高温,需要排查是否有外部因素或设备异常。不过该窗户事件与客厅运动传感器同时触发,可能是入侵迹象,但也可能是误报或远程操作。"], "key_evidence": ["18:00厨房温度异常飙升至2868(28.68°C),较前一读数2479(24.79°C)上升近4°C,而此时灶具未开启、住户尚未进入厨房", "18:30厨房温度仍为2857(28.57°C),持续高温确认非瞬时读数错误", "18:54和19:49厨房温度传感器两次报告MeasuredValue=None,传感器在灶具使用前后失效", "10:47-10:50住户外出期间厨房窗户被打开又关闭,同时客厅运动传感器被触发", "烟雾报警器在整个过程中未触发(未见报警日志),但温度传感器失效削弱了安全监测能力"], "recommended_actions": ["立即检查厨房温度传感器工作状态,排查两次None读数的原因,必要时更换传感器以恢复温度监测能力", "排查厨房18:00异常升温的热源——检查厨房内所有电器(冰箱、微波炉等)是否存在故障发热", "核实10:47住户外出期间厨房窗户开关和客厅运动检测事件的来源,确认是否为远程操作或存在未授权进入", "确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,在温度传感器修复前它是唯一的火灾预警手段", "考虑为灶具设置安全联动规则:当厨房温度传感器离线时自动关闭灶具或发出告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.909727096557617, "api_error": null} {"episode_id": "SQ2_TP_A_0215", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0215.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20260844, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-11T02:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"凌晨2:05卫生间漏水传感器触发报警,且整日无复位记录,漏水可能仍在持续。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-11T02:05,bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,表明卫生间检测到漏水。\",\n \"推理步骤2: 此时为凌晨2点,住户正在卧室睡觉(卧室运动传感器直到06:27才有活动),无人能及时发现和处理漏水。\",\n \"推理步骤3: 在整日剩余的日志中(02:05至23:30),未出现 bathroom_water_leak StateValue = False 的复位事件,说明漏水状态持续了超过21小时未被解除。\",\n \"推理步骤4: 住户06:27进入卫生间使用约30分钟后离开,但漏水传感器仍未复位,可能住户未注意到漏水,或漏水源头未被修复。\",\n \"推理步骤5: 长时间漏水可能导致地板损坏、墙体渗水、霉菌滋生,甚至影响楼下邻居,属于需要立即处理的安全隐患。\"\n ],\n \"key_evidence\": [\n \"[02:05] bathroom_water_leak StateValue = True,漏水报警触发\",\n \"全天日志中无 StateValue = False 的复位记录,漏水状态持续超过21小时\",\n \"报警发生在凌晨2点,住户处于睡眠状态,无法及时响应\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送高优先级通知(推送、短信、电话),告知卫生间漏水报警已持续超过21小时\",\n \"建议住户尽快检查卫生间水源(水龙头、马桶、水管接头),关闭相关阀门止水\",\n \"检查漏水传感器本身是否正常工作,排除传感器故障导致的误报可能\",\n \"如确认漏水,联系物业或水管维修人员进行检修\",\n \"检查卫生间及相邻区域是否已出现积水或渗水痕迹,防止二次损害\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "凌晨2:05卫生间漏水传感器触发报警,且整日无复位记录,漏水可能仍在持续。", "reasoning": ["推理步骤1: 2026-06-11T02:05,bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,表明卫生间检测到漏水。", "推理步骤2: 此时为凌晨2点,住户正在卧室睡觉(卧室运动传感器直到06:27才有活动),无人能及时发现和处理漏水。", "推理步骤3: 在整日剩余的日志中(02:05至23:30),未出现 bathroom_water_leak StateValue = False 的复位事件,说明漏水状态持续了超过21小时未被解除。", "推理步骤4: 住户06:27进入卫生间使用约30分钟后离开,但漏水传感器仍未复位,可能住户未注意到漏水,或漏水源头未被修复。", "推理步骤5: 长时间漏水可能导致地板损坏、墙体渗水、霉菌滋生,甚至影响楼下邻居,属于需要立即处理的安全隐患。"], "key_evidence": ["[02:05] bathroom_water_leak StateValue = True,漏水报警触发", "全天日志中无 StateValue = False 的复位记录,漏水状态持续超过21小时", "报警发生在凌晨2点,住户处于睡眠状态,无法及时响应"], "recommended_actions": ["立即向住户发送高优先级通知(推送、短信、电话),告知卫生间漏水报警已持续超过21小时", "建议住户尽快检查卫生间水源(水龙头、马桶、水管接头),关闭相关阀门止水", "检查漏水传感器本身是否正常工作,排除传感器故障导致的误报可能", "如确认漏水,联系物业或水管维修人员进行检修", "检查卫生间及相邻区域是否已出现积水或渗水痕迹,防止二次损害"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.40996527671814, "api_error": null} {"episode_id": "SQ2_TP_A_0223", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0223.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20260852, "scenario_id": "WD-03", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-28T05:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器从凌晨5:50起持续报警,且无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在05:50首次触发StateValue=True,随后在06:00和06:20持续报告漏水状态,说明漏水未停止。\",\n \"推理步骤2: 住户在08:34才起床(卧室运动传感器触发),08:45进入卫生间,但日志中未见漏水传感器恢复为False,说明漏水可能一直未被处理或仍在持续。\",\n \"推理步骤3: 整日日志中漏水传感器再无状态更新(既无True也无False),可能意味着传感器停止上报或漏水已被处理但未记录恢复事件——前者是设备故障,后者仍需确认。\",\n \"推理步骤4: 持续漏水超过2小时无人干预(05:50至08:45),可能造成地板、墙体浸泡损坏,甚至影响楼下邻居。\"\n ],\n \"key_evidence\": [\n \"05:50、06:00、06:20 卫生间漏水传感器连续三次报告 StateValue=True\",\n \"整日日志中未见漏水传感器恢复为 StateValue=False\",\n \"住户08:45进入卫生间前漏水已持续近3小时无人处理\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否仍有积水或漏水源(水管接头、马桶、洗衣机进水管等)\",\n \"关闭卫生间相关水阀以止损\",\n \"检查漏水传感器是否正常工作(确认是否需要手动复位或更换电池)\",\n \"检查地板及墙面是否有水渍扩散,评估是否需要维修\",\n \"考虑设置漏水报警联动自动关闭水阀的自动化规则,避免未来长时间无人处理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器从凌晨5:50起持续报警,且无人处理,存在水损风险。", "reasoning": ["推理步骤1: 卫生间漏水传感器在05:50首次触发StateValue=True,随后在06:00和06:20持续报告漏水状态,说明漏水未停止。", "推理步骤2: 住户在08:34才起床(卧室运动传感器触发),08:45进入卫生间,但日志中未见漏水传感器恢复为False,说明漏水可能一直未被处理或仍在持续。", "推理步骤3: 整日日志中漏水传感器再无状态更新(既无True也无False),可能意味着传感器停止上报或漏水已被处理但未记录恢复事件——前者是设备故障,后者仍需确认。", "推理步骤4: 持续漏水超过2小时无人干预(05:50至08:45),可能造成地板、墙体浸泡损坏,甚至影响楼下邻居。"], "key_evidence": ["05:50、06:00、06:20 卫生间漏水传感器连续三次报告 StateValue=True", "整日日志中未见漏水传感器恢复为 StateValue=False", "住户08:45进入卫生间前漏水已持续近3小时无人处理"], "recommended_actions": ["立即检查卫生间是否仍有积水或漏水源(水管接头、马桶、洗衣机进水管等)", "关闭卫生间相关水阀以止损", "检查漏水传感器是否正常工作(确认是否需要手动复位或更换电池)", "检查地板及墙面是否有水渍扩散,评估是否需要维修", "考虑设置漏水报警联动自动关闭水阀的自动化规则,避免未来长时间无人处理"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.487145900726318, "api_error": null} {"episode_id": "SQ2_TP_A_0227", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0227.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20260856, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-23T22:29:00", "variant": "TP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.9123401641845703, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ2_TP_A_0224", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0224.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20260853, "scenario_id": "WD-03", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-20T11:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在无人期间持续报警超过30分钟,存在真实漏水风险,可能造成财产损失。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在 11:23、11:33、11:53 连续三次报告 StateValue = True,持续时间至少30分钟,表明这不是瞬时误触而是持续性漏水。\",\n \"推理步骤2: 在漏水报警期间,卫生间运动传感器自 09:14 起一直为无人状态(Occupancy = 0),说明没有住户在场使用水设施(如洗澡、洗手),排除了正常用水导致溅水触发传感器的可能。\",\n \"推理步骤3: 住户当时活动区域在客厅(09:58 客厅运动传感器触发、空调和灯开启),与卫生间无关联操作,进一步确认卫生间无人为用水行为。\",\n \"推理步骤4: 直到日志结束(23:30),未见漏水传感器恢复为 False 的记录,也未见任何人进入卫生间处理,说明漏水可能一直未被发现和处理。\",\n \"推理步骤5: 另外注意到厨房温度传感器存在异常——12:00 时突然跳升至 2982(29.82°C),较 11:30 的 2545(25.45°C)在30分钟内飙升约4.4°C,且灶具当时处于关闭状态(09:36已关),这可能是传感器故障,也需要关注。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 11:23、11:33、11:53 连续三次报告 StateValue = True,持续超过30分钟\",\n \"卫生间运动传感器自 09:14 起持续为 Occupancy = 0,漏水期间无人在卫生间\",\n \"直到日志结束(23:30)未见漏水传感器恢复正常的记录\",\n \"厨房温度传感器在 12:00 出现异常跳升至 29.82°C(灶具处于关闭状态),疑似传感器故障\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送漏水警报通知,提醒尽快检查卫生间水管、马桶、水龙头等可能的漏水点\",\n \"如果家中配有智能水阀,建议自动关闭卫生间供水总阀以止损\",\n \"检查卫生间地面及相邻房间(如卧室)是否有渗水迹象,防止扩大损失\",\n \"排查厨房温度传感器是否存在故障(12:00 无热源情况下异常升温),必要时校准或更换\",\n \"建议为漏水传感器配置自动化规则:持续报警超过10分钟且无人在场时,自动关阀并推送紧急通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在无人期间持续报警超过30分钟,存在真实漏水风险,可能造成财产损失。", "reasoning": ["推理步骤1: 卫生间漏水传感器在 11:23、11:33、11:53 连续三次报告 StateValue = True,持续时间至少30分钟,表明这不是瞬时误触而是持续性漏水。", "推理步骤2: 在漏水报警期间,卫生间运动传感器自 09:14 起一直为无人状态(Occupancy = 0),说明没有住户在场使用水设施(如洗澡、洗手),排除了正常用水导致溅水触发传感器的可能。", "推理步骤3: 住户当时活动区域在客厅(09:58 客厅运动传感器触发、空调和灯开启),与卫生间无关联操作,进一步确认卫生间无人为用水行为。", "推理步骤4: 直到日志结束(23:30),未见漏水传感器恢复为 False 的记录,也未见任何人进入卫生间处理,说明漏水可能一直未被发现和处理。", "推理步骤5: 另外注意到厨房温度传感器存在异常——12:00 时突然跳升至 2982(29.82°C),较 11:30 的 2545(25.45°C)在30分钟内飙升约4.4°C,且灶具当时处于关闭状态(09:36已关),这可能是传感器故障,也需要关注。"], "key_evidence": ["bathroom_water_leak 在 11:23、11:33、11:53 连续三次报告 StateValue = True,持续超过30分钟", "卫生间运动传感器自 09:14 起持续为 Occupancy = 0,漏水期间无人在卫生间", "直到日志结束(23:30)未见漏水传感器恢复正常的记录", "厨房温度传感器在 12:00 出现异常跳升至 29.82°C(灶具处于关闭状态),疑似传感器故障"], "recommended_actions": ["立即向住户发送漏水警报通知,提醒尽快检查卫生间水管、马桶、水龙头等可能的漏水点", "如果家中配有智能水阀,建议自动关闭卫生间供水总阀以止损", "检查卫生间地面及相邻房间(如卧室)是否有渗水迹象,防止扩大损失", "排查厨房温度传感器是否存在故障(12:00 无热源情况下异常升温),必要时校准或更换", "建议为漏水传感器配置自动化规则:持续报警超过10分钟且无人在场时,自动关阀并推送紧急通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.068993091583252, "api_error": null} {"episode_id": "SQ2_TP_A_0236", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0236.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20260865, "scenario_id": "INS-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-05T02:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨2:08发生入户门锁连续4次错误密码尝试并触发防撬/强制入侵报警,疑似非法闯入企图。\",\n \"reasoning\": [\n \"推理步骤1: 在02:08:00至02:08:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常对应远程/键盘输入方式,OperationError=1表示无效凭证(错误密码/PIN)。\",\n \"推理步骤2: 紧接着在02:08:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3在Matter DoorLock Cluster中对应ForcedDoorOpenUnderDoorLockedCondition或类似的强制入侵告警,说明门锁检测到异常的物理干预或多次失败后自动进入报警状态。\",\n \"推理步骤3: 事件发生在凌晨2点,属于深夜时段。此时住户已入睡(从00:00起无任何人体活动、灯光操作记录,所有房间温度平稳无人为干预),深夜的密码暴力尝试高度可疑。\",\n \"推理步骤4: 入户门传感器(front_door_contact)在此期间未报告开门事件(StateValue未变化),说明入侵者未能成功打开门锁,但尝试行为本身构成严重安全威胁。\",\n \"推理步骤5: 住户直到06:37才起床活动(卧室运动传感器触发),07:14正常手动开锁出门,说明凌晨2点的操作并非住户本人所为。\"\n ],\n \"key_evidence\": [\n \"02:08:00-02:08:40 连续4次LockOperationError(OperationError=1, OperationSource=3)——40秒内4次无效凭证尝试\",\n \"02:08:50 触发DoorLockAlarm(AlarmCode=3)——门锁主动发出入侵/强制开门报警\",\n \"事件发生在凌晨2点深夜时段,住户处于睡眠状态,无任何正常活动迹象\",\n \"入户门传感器未报告开门,说明未被攻破但存在明确的入侵企图\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵告警通知,确认住户是否知情\",\n \"检查门锁是否有物理损坏痕迹,必要时联系物业或报警\",\n \"调取门口监控摄像头(如有)回放凌晨02:08前后的录像,识别可疑人员\",\n \"考虑启用门锁的连续失败自动锁定策略(如5次失败后锁定30分钟),防止暴力破解\",\n \"更换门锁密码/PIN码,排除密码泄露的可能性\",\n \"同时关注:厨房温度传感器在18:00出现异常跳升(从约24.9°C骤升至28.6°C)且18:50和19:42两次报告None值,建议检查该传感器是否存在故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨2:08发生入户门锁连续4次错误密码尝试并触发防撬/强制入侵报警,疑似非法闯入企图。", "reasoning": ["推理步骤1: 在02:08:00至02:08:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常对应远程/键盘输入方式,OperationError=1表示无效凭证(错误密码/PIN)。", "推理步骤2: 紧接着在02:08:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3在Matter DoorLock Cluster中对应ForcedDoorOpenUnderDoorLockedCondition或类似的强制入侵告警,说明门锁检测到异常的物理干预或多次失败后自动进入报警状态。", "推理步骤3: 事件发生在凌晨2点,属于深夜时段。此时住户已入睡(从00:00起无任何人体活动、灯光操作记录,所有房间温度平稳无人为干预),深夜的密码暴力尝试高度可疑。", "推理步骤4: 入户门传感器(front_door_contact)在此期间未报告开门事件(StateValue未变化),说明入侵者未能成功打开门锁,但尝试行为本身构成严重安全威胁。", "推理步骤5: 住户直到06:37才起床活动(卧室运动传感器触发),07:14正常手动开锁出门,说明凌晨2点的操作并非住户本人所为。"], "key_evidence": ["02:08:00-02:08:40 连续4次LockOperationError(OperationError=1, OperationSource=3)——40秒内4次无效凭证尝试", "02:08:50 触发DoorLockAlarm(AlarmCode=3)——门锁主动发出入侵/强制开门报警", "事件发生在凌晨2点深夜时段,住户处于睡眠状态,无任何正常活动迹象", "入户门传感器未报告开门,说明未被攻破但存在明确的入侵企图"], "recommended_actions": ["立即向住户手机推送高优先级入侵告警通知,确认住户是否知情", "检查门锁是否有物理损坏痕迹,必要时联系物业或报警", "调取门口监控摄像头(如有)回放凌晨02:08前后的录像,识别可疑人员", "考虑启用门锁的连续失败自动锁定策略(如5次失败后锁定30分钟),防止暴力破解", "更换门锁密码/PIN码,排除密码泄露的可能性", "同时关注:厨房温度传感器在18:00出现异常跳升(从约24.9°C骤升至28.6°C)且18:50和19:42两次报告None值,建议检查该传感器是否存在故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.034451723098755, "api_error": null} {"episode_id": "SQ2_TP_A_0240", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0240.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20260869, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T03:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨3:03触发报警,且至今未恢复,住户无人响应处理。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨03:03卫生间漏水传感器(bathroom_water_leak)报告StateValue=True,表明检测到漏水。\",\n \"推理步骤2: 该事件发生在深夜,住户处于睡眠状态(无任何运动传感器触发、灯光全灭),直到06:32才起床,期间漏水持续超过3.5小时无人处理。\",\n \"推理步骤3: 整个日志中未出现漏水传感器恢复为False的记录,说明漏水状态可能一直持续到日志结束(23:30),长达约20小时。\",\n \"推理步骤4: 住户起床后使用了卫生间(06:36 bathroom_occupancy触发),但日志中仍未见漏水传感器复位,说明漏水问题可能未被注意到或未彻底解决。\"\n ],\n \"key_evidence\": [\n \"03:03 bathroom_water_leak StateValue=True 且全天未见恢复为False\",\n \"漏水发生时住户在睡眠中,无人及时响应\",\n \"住户06:36进入卫生间后漏水状态仍未解除\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否存在持续漏水,重点排查水管接头、马桶底部密封、水龙头等位置\",\n \"关闭卫生间进水阀门以防止水损扩大\",\n \"检查漏水是否已渗透到地板下方或相邻房间,评估是否造成结构损害\",\n \"建议设置漏水报警联动规则:检测到漏水时自动发送手机推送通知并触发声光报警,避免深夜漏水无人知晓\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨3:03触发报警,且至今未恢复,住户无人响应处理。", "reasoning": ["推理步骤1: 凌晨03:03卫生间漏水传感器(bathroom_water_leak)报告StateValue=True,表明检测到漏水。", "推理步骤2: 该事件发生在深夜,住户处于睡眠状态(无任何运动传感器触发、灯光全灭),直到06:32才起床,期间漏水持续超过3.5小时无人处理。", "推理步骤3: 整个日志中未出现漏水传感器恢复为False的记录,说明漏水状态可能一直持续到日志结束(23:30),长达约20小时。", "推理步骤4: 住户起床后使用了卫生间(06:36 bathroom_occupancy触发),但日志中仍未见漏水传感器复位,说明漏水问题可能未被注意到或未彻底解决。"], "key_evidence": ["03:03 bathroom_water_leak StateValue=True 且全天未见恢复为False", "漏水发生时住户在睡眠中,无人及时响应", "住户06:36进入卫生间后漏水状态仍未解除"], "recommended_actions": ["立即检查卫生间是否存在持续漏水,重点排查水管接头、马桶底部密封、水龙头等位置", "关闭卫生间进水阀门以防止水损扩大", "检查漏水是否已渗透到地板下方或相邻房间,评估是否造成结构损害", "建议设置漏水报警联动规则:检测到漏水时自动发送手机推送通知并触发声光报警,避免深夜漏水无人知晓"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.680309057235718, "api_error": null} {"episode_id": "SQ2_TP_A_0247", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0247.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20260876, "scenario_id": "INS-01", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T03:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失,疑似传感器故障;同时凌晨客厅窗户被打开且检测到运动但无人开灯,存在轻微入侵可疑迹象。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约2461(24.61°C)跳升至2827(28.27°C),升幅约3.7°C,远超正常半小时波动幅度。此时灶具尚未开启(19:11才开),无法用烹饪解释这一跳变。\",\n \"推理步骤2: 19:12和19:27厨房温度传感器连续两次报告MeasuredValue=None,表明传感器数据丢失或通信中断。19:30又恢复为2829,依然是异常高值。直到20:00才回落至2407,与客厅温度重新趋同。这种'跳变→丢数→跳变→恢复'的模式高度符合传感器故障特征。\",\n \"推理步骤3: 灶具在19:11-19:26期间使用了约15分钟,使用后住户打开了厨房窗户通风(19:26:30 kitchen_window_contact=False),这是正常的烹饪行为。但传感器异常发生在灶具开启之前,说明异常并非由烹饪引起。\",\n \"推理步骤4: 凌晨03:59客厅窗户传感器报告StateValue=False(窗户被打开),随后03:59:05和03:59:30客厅运动传感器连续检测到有人。但此时住户应在卧室睡觉(全屋灯光关闭,卧室运动传感器直到06:15才触发),且没有任何灯被打开、没有门锁操作。这一事件值得关注,但也可能是风吹动窗帘触发运动传感器、或住户半夜起来开窗通风未开灯。\",\n \"推理步骤5: 其余事件链均符合正常生活模式:06:15起床→卫生间→厨房早餐→07:20出门锁门→18:20回家开灯开空调→做饭→洗碗机→21:48回卧室睡觉。门锁操作均为正常手动/自动,入户门开关时间极短(7秒),无异常。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.6°C骤升至28.27°C,灶具尚未开启,无合理热源解释\",\n \"19:12和19:27厨房温度传感器连续报告MeasuredValue=None(数据丢失)\",\n \"19:30厨房温度仍为28.29°C的异常高值,20:00才恢复正常\",\n \"03:59凌晨客厅窗户被打开并检测到运动,但全屋无灯光操作、无门锁事件,住户应在睡眠中\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到热源干扰,必要时更换传感器\",\n \"查看厨房温度传感器的历史数据,确认此类跳变和None值是否反复出现,以判断是偶发还是持续性故障\",\n \"确认03:59客厅窗户打开是否为住户本人操作(如半夜通风),若非本人操作,建议检查窗户锁扣并考虑加装窗户报警\",\n \"考虑为夜间无人活动时段设置安防模式,当检测到窗户打开或运动时自动推送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失,疑似传感器故障;同时凌晨客厅窗户被打开且检测到运动但无人开灯,存在轻微入侵可疑迹象。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约2461(24.61°C)跳升至2827(28.27°C),升幅约3.7°C,远超正常半小时波动幅度。此时灶具尚未开启(19:11才开),无法用烹饪解释这一跳变。", "推理步骤2: 19:12和19:27厨房温度传感器连续两次报告MeasuredValue=None,表明传感器数据丢失或通信中断。19:30又恢复为2829,依然是异常高值。直到20:00才回落至2407,与客厅温度重新趋同。这种'跳变→丢数→跳变→恢复'的模式高度符合传感器故障特征。", "推理步骤3: 灶具在19:11-19:26期间使用了约15分钟,使用后住户打开了厨房窗户通风(19:26:30 kitchen_window_contact=False),这是正常的烹饪行为。但传感器异常发生在灶具开启之前,说明异常并非由烹饪引起。", "推理步骤4: 凌晨03:59客厅窗户传感器报告StateValue=False(窗户被打开),随后03:59:05和03:59:30客厅运动传感器连续检测到有人。但此时住户应在卧室睡觉(全屋灯光关闭,卧室运动传感器直到06:15才触发),且没有任何灯被打开、没有门锁操作。这一事件值得关注,但也可能是风吹动窗帘触发运动传感器、或住户半夜起来开窗通风未开灯。", "推理步骤5: 其余事件链均符合正常生活模式:06:15起床→卫生间→厨房早餐→07:20出门锁门→18:20回家开灯开空调→做饭→洗碗机→21:48回卧室睡觉。门锁操作均为正常手动/自动,入户门开关时间极短(7秒),无异常。"], "key_evidence": ["19:00厨房温度从约24.6°C骤升至28.27°C,灶具尚未开启,无合理热源解释", "19:12和19:27厨房温度传感器连续报告MeasuredValue=None(数据丢失)", "19:30厨房温度仍为28.29°C的异常高值,20:00才恢复正常", "03:59凌晨客厅窗户被打开并检测到运动,但全屋无灯光操作、无门锁事件,住户应在睡眠中"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到热源干扰,必要时更换传感器", "查看厨房温度传感器的历史数据,确认此类跳变和None值是否反复出现,以判断是偶发还是持续性故障", "确认03:59客厅窗户打开是否为住户本人操作(如半夜通风),若非本人操作,建议检查窗户锁扣并考虑加装窗户报警", "考虑为夜间无人活动时段设置安防模式,当检测到窗户打开或运动时自动推送告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.160489797592163, "api_error": null} {"episode_id": "SQ2_TP_A_0249", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0249.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20260878, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-09T08:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现多次异常:无人时温度飙升至28.5°C以上、做饭期间两次报告None值,同时烟雾报警器电池低电量,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00报告2851(28.51°C),18:30报告2861(28.61°C),但此时住户尚未进厨房(18:56才开厨房灯和灶具),且同时段客厅温度仅24.58°C、卧室23.54°C,厨房温度异常偏高约4°C,无合理热源解释。\",\n \"推理步骤2: 类似的异常在早晨08:38也出现过——灶具08:28开启仅10分钟,厨房温度就从24.50°C骤升至28.59°C,升幅超过4°C,这在正常烹饪场景下不太合理(其他房间同期仅微升),传感器可能受灶具热辐射直接影响或本身存在读数漂移。\",\n \"推理步骤3: 厨房温度传感器在18:57和19:29两次报告MeasuredValue = None,说明传感器在烹饪期间出现了数据丢失或通信故障。传感器在高温后失联,进一步印证其工作状态不稳定。\",\n \"推理步骤4: 厨房烟雾报警器在前一天(06-08 08:28)已报告BatteryAlert = 1(低电量警告)。如果温度传感器同时存在故障,厨房的火灾监测能力将严重下降——烟雾报警器可能因电量不足无法正常报警,温度传感器又无法提供可靠的温度监测。\",\n \"推理步骤5: 其余设备行为均属正常:住户06:41起床、07:29出门上锁、18:27回家开灯开空调、18:56做饭、21:52就寝,门锁开关和自动上锁逻辑正确,温度日变化曲线(除厨房异常点外)符合夏季昼夜规律,无入侵或漏水迹象。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度28.51°C、18:30达28.61°C,而灶具18:56才开启,无人烹饪时厨房温度异常偏高\",\n \"08:38厨房温度从24.50°C骤升至28.59°C,灶具仅开启10分钟,升幅不合理\",\n \"18:57和19:29厨房温度传感器报告MeasuredValue = None,传感器数据丢失\",\n \"06-08 08:28烟雾报警器BatteryAlert = 1,电池低电量未处理\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的安装位置和工作状态,确认是否距灶具过近导致读数失真,或传感器本身存在硬件故障\",\n \"尽快更换厨房烟雾报警器电池,恢复其正常报警能力,避免与温度传感器故障叠加形成监控盲区\",\n \"检查厨房温度传感器的网络连接稳定性,排查两次None值报告的原因(通信中断或传感器过热保护)\",\n \"考虑将温度传感器远离灶具热源重新安装,并设置温度异常阈值告警规则,当厨房温度偏离其他房间超过3°C时自动提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现多次异常:无人时温度飙升至28.5°C以上、做饭期间两次报告None值,同时烟雾报警器电池低电量,存在安全监控盲区。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00报告2851(28.51°C),18:30报告2861(28.61°C),但此时住户尚未进厨房(18:56才开厨房灯和灶具),且同时段客厅温度仅24.58°C、卧室23.54°C,厨房温度异常偏高约4°C,无合理热源解释。", "推理步骤2: 类似的异常在早晨08:38也出现过——灶具08:28开启仅10分钟,厨房温度就从24.50°C骤升至28.59°C,升幅超过4°C,这在正常烹饪场景下不太合理(其他房间同期仅微升),传感器可能受灶具热辐射直接影响或本身存在读数漂移。", "推理步骤3: 厨房温度传感器在18:57和19:29两次报告MeasuredValue = None,说明传感器在烹饪期间出现了数据丢失或通信故障。传感器在高温后失联,进一步印证其工作状态不稳定。", "推理步骤4: 厨房烟雾报警器在前一天(06-08 08:28)已报告BatteryAlert = 1(低电量警告)。如果温度传感器同时存在故障,厨房的火灾监测能力将严重下降——烟雾报警器可能因电量不足无法正常报警,温度传感器又无法提供可靠的温度监测。", "推理步骤5: 其余设备行为均属正常:住户06:41起床、07:29出门上锁、18:27回家开灯开空调、18:56做饭、21:52就寝,门锁开关和自动上锁逻辑正确,温度日变化曲线(除厨房异常点外)符合夏季昼夜规律,无入侵或漏水迹象。"], "key_evidence": ["18:00厨房温度28.51°C、18:30达28.61°C,而灶具18:56才开启,无人烹饪时厨房温度异常偏高", "08:38厨房温度从24.50°C骤升至28.59°C,灶具仅开启10分钟,升幅不合理", "18:57和19:29厨房温度传感器报告MeasuredValue = None,传感器数据丢失", "06-08 08:28烟雾报警器BatteryAlert = 1,电池低电量未处理"], "recommended_actions": ["立即检查厨房温度传感器的安装位置和工作状态,确认是否距灶具过近导致读数失真,或传感器本身存在硬件故障", "尽快更换厨房烟雾报警器电池,恢复其正常报警能力,避免与温度传感器故障叠加形成监控盲区", "检查厨房温度传感器的网络连接稳定性,排查两次None值报告的原因(通信中断或传感器过热保护)", "考虑将温度传感器远离灶具热源重新安装,并设置温度异常阈值告警规则,当厨房温度偏离其他房间超过3°C时自动提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.041694402694702, "api_error": null} {"episode_id": "SQ2_TP_A_0257", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0257.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20260886, "scenario_id": "INS-02", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-28T16:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在短时间内连续4次操作失败并触发防撬报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 16:22:00至16:22:40期间,front_door_lock连续报告了4次LockOperationError,OperationError=1表示密码/凭证错误,OperationSource=3表示来自键盘(物理按键)输入。\",\n \"推理步骤2: 4次错误尝试密集发生在不到30秒内(16:22:00→16:22:15→16:22:25→16:22:40),这种高频试错模式不符合住户偶尔输错密码的正常行为,更像是暴力猜测密码。\",\n \"推理步骤3: 紧接着在16:22:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数超限锁定,门锁自身已判定为异常攻击行为。\",\n \"推理步骤4: 结合时间背景分析——16:22正值下午,住户当天的活动模式显示早上8:34起床、全天在家活动(做饭、使用客厅等),此时住户应在家中。住户在家却有人从外部键盘反复尝试错误密码,排除了住户自己忘记密码的可能性。\",\n \"推理步骤5: 事件发生后门锁并未被成功打开(日志中无后续的LockOperation成功事件),说明入侵尝试被门锁拦截,但威胁行为本身已经发生。\"\n ],\n \"key_evidence\": [\n \"16:22:00-16:22:40:28秒内4次LockOperationError(OperationError=1, OperationSource=3),密码错误来自物理键盘\",\n \"16:22:50:触发DoorLockAlarm(AlarmCode=3)——错误输入次数超限报警\",\n \"全天无任何合法的门锁解锁/上锁操作记录(直到23:00才有一次自动上锁),说明住户未外出,外部试错者非住户本人\"\n ],\n \"recommended_actions\": [\n \"立即查看入户门外的监控摄像头录像(如有),确认16:22前后是否有可疑人员在门前逗留\",\n \"向住户手机推送高优先级安全警报,告知门锁遭到暴力密码尝试\",\n \"考虑临时启用门锁更高安全策略:增加错误锁定时间、减少允许的错误尝试次数\",\n \"如确认非住户本人或已知访客所为,建议报警并更换门锁密码\",\n \"检查门锁固件是否为最新版本,确保没有已知的安全漏洞\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在短时间内连续4次操作失败并触发防撬报警,疑似有人尝试非法入侵。", "reasoning": ["推理步骤1: 16:22:00至16:22:40期间,front_door_lock连续报告了4次LockOperationError,OperationError=1表示密码/凭证错误,OperationSource=3表示来自键盘(物理按键)输入。", "推理步骤2: 4次错误尝试密集发生在不到30秒内(16:22:00→16:22:15→16:22:25→16:22:40),这种高频试错模式不符合住户偶尔输错密码的正常行为,更像是暴力猜测密码。", "推理步骤3: 紧接着在16:22:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数超限锁定,门锁自身已判定为异常攻击行为。", "推理步骤4: 结合时间背景分析——16:22正值下午,住户当天的活动模式显示早上8:34起床、全天在家活动(做饭、使用客厅等),此时住户应在家中。住户在家却有人从外部键盘反复尝试错误密码,排除了住户自己忘记密码的可能性。", "推理步骤5: 事件发生后门锁并未被成功打开(日志中无后续的LockOperation成功事件),说明入侵尝试被门锁拦截,但威胁行为本身已经发生。"], "key_evidence": ["16:22:00-16:22:40:28秒内4次LockOperationError(OperationError=1, OperationSource=3),密码错误来自物理键盘", "16:22:50:触发DoorLockAlarm(AlarmCode=3)——错误输入次数超限报警", "全天无任何合法的门锁解锁/上锁操作记录(直到23:00才有一次自动上锁),说明住户未外出,外部试错者非住户本人"], "recommended_actions": ["立即查看入户门外的监控摄像头录像(如有),确认16:22前后是否有可疑人员在门前逗留", "向住户手机推送高优先级安全警报,告知门锁遭到暴力密码尝试", "考虑临时启用门锁更高安全策略:增加错误锁定时间、减少允许的错误尝试次数", "如确认非住户本人或已知访客所为,建议报警并更换门锁密码", "检查门锁固件是否为最新版本,确保没有已知的安全漏洞"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.367298364639282, "api_error": null} {"episode_id": "SQ2_TP_A_0250", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0250.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20260879, "scenario_id": "FG-01", "total_events": 197, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-05T04:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨4:50厨房灶具在无人状态下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 04:50 厨房灶具(kitchen_cook_surface)开启,但同一时刻客厅运动传感器显示 Occupancy=0,且从00:00到06:24期间全屋无任何运动传感器触发占用状态,说明住户处于深度睡眠或家中无人,灶具在无人操作的情况下启动极为异常。\",\n \"推理步骤2: 灶具开启5分钟后(04:55),厨房温度从约2302(23.02°C)飙升至3142(31.42°C),10分钟后(05:00)进一步升至3500(35.00°C),短时间内上升超过12°C,这是典型的明火/干烧导致的异常升温曲线。\",\n \"推理步骤3: 05:05 厨房烟雾报警器触发——SmokeState=1(烟雾检测)、ExpressedState=1(报警激活)、并发出 SmokeAlarm 事件,确认现场已产生烟雾,火灾风险从'可能'升级为'正在发生'。\",\n \"推理步骤4: 住户直到06:24才在卧室被检测到活动(起床),意味着从04:50灶具异常启动到住户起床之间有约1.5小时的无人响应窗口,期间火情可能持续恶化。\",\n \"推理步骤5: 05:30厨房温度回落至2305(23.05°C),烟雾报警后未见后续持续升温,可能是灶具自动保护机制介入或火源自行熄灭,但这并不能排除已经造成的损害或残留风险。\",\n \"推理步骤6: 另外注意到18:00和18:30厨房温度传感器出现异常高值2863/2854(约28.5°C),而同时段客厅仅24.6°C,以及18:56和19:56两次报告MeasuredValue=None,说明该传感器可能在凌晨火情中受损,存在间歇性故障,后续读数可靠性存疑。\"\n ],\n \"key_evidence\": [\n \"04:50 灶具开启时全屋无人活动(living_room_occupancy=0,无任何occupancy=1记录),灶具不应在无人状态下自启动\",\n \"04:55 厨房温度5分钟内从23°C飙升至31.4°C,05:00进一步升至35°C\",\n \"05:05 烟雾报警器触发: SmokeState=1, ExpressedState=1, SmokeAlarm事件\",\n \"住户06:24才起床,火情无人响应长达约1.5小时\",\n \"18:56和19:56厨房温度传感器两次报告None值,疑似传感器受损\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具,排查凌晨自动启动的原因——可能是设备故障、固件bug或被异常指令触发,在查明原因前建议物理断开灶具电源/气源\",\n \"检查厨房是否有烧焦痕迹、残留烟雾或物品损坏,确认火情是否已完全消除\",\n \"检修厨房温度传感器,两次None值和18:00的异常高温读数表明传感器可能在火情中受损,需要更换或重新校准\",\n \"为灶具设置安全联动规则:当全屋无人活动(所有occupancy=0)超过一定时间时,自动关闭灶具并发送告警通知\",\n \"检查灶具的Matter协议通信日志,排查是否存在未授权的远程控制指令(潜在网络安全问题)\",\n \"建议为烟雾报警器配置即时推送通知到手机,确保住户即使在睡眠中也能被及时唤醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨4:50厨房灶具在无人状态下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 04:50 厨房灶具(kitchen_cook_surface)开启,但同一时刻客厅运动传感器显示 Occupancy=0,且从00:00到06:24期间全屋无任何运动传感器触发占用状态,说明住户处于深度睡眠或家中无人,灶具在无人操作的情况下启动极为异常。", "推理步骤2: 灶具开启5分钟后(04:55),厨房温度从约2302(23.02°C)飙升至3142(31.42°C),10分钟后(05:00)进一步升至3500(35.00°C),短时间内上升超过12°C,这是典型的明火/干烧导致的异常升温曲线。", "推理步骤3: 05:05 厨房烟雾报警器触发——SmokeState=1(烟雾检测)、ExpressedState=1(报警激活)、并发出 SmokeAlarm 事件,确认现场已产生烟雾,火灾风险从'可能'升级为'正在发生'。", "推理步骤4: 住户直到06:24才在卧室被检测到活动(起床),意味着从04:50灶具异常启动到住户起床之间有约1.5小时的无人响应窗口,期间火情可能持续恶化。", "推理步骤5: 05:30厨房温度回落至2305(23.05°C),烟雾报警后未见后续持续升温,可能是灶具自动保护机制介入或火源自行熄灭,但这并不能排除已经造成的损害或残留风险。", "推理步骤6: 另外注意到18:00和18:30厨房温度传感器出现异常高值2863/2854(约28.5°C),而同时段客厅仅24.6°C,以及18:56和19:56两次报告MeasuredValue=None,说明该传感器可能在凌晨火情中受损,存在间歇性故障,后续读数可靠性存疑。"], "key_evidence": ["04:50 灶具开启时全屋无人活动(living_room_occupancy=0,无任何occupancy=1记录),灶具不应在无人状态下自启动", "04:55 厨房温度5分钟内从23°C飙升至31.4°C,05:00进一步升至35°C", "05:05 烟雾报警器触发: SmokeState=1, ExpressedState=1, SmokeAlarm事件", "住户06:24才起床,火情无人响应长达约1.5小时", "18:56和19:56厨房温度传感器两次报告None值,疑似传感器受损"], "recommended_actions": ["立即检查厨房灶具,排查凌晨自动启动的原因——可能是设备故障、固件bug或被异常指令触发,在查明原因前建议物理断开灶具电源/气源", "检查厨房是否有烧焦痕迹、残留烟雾或物品损坏,确认火情是否已完全消除", "检修厨房温度传感器,两次None值和18:00的异常高温读数表明传感器可能在火情中受损,需要更换或重新校准", "为灶具设置安全联动规则:当全屋无人活动(所有occupancy=0)超过一定时间时,自动关闭灶具并发送告警通知", "检查灶具的Matter协议通信日志,排查是否存在未授权的远程控制指令(潜在网络安全问题)", "建议为烟雾报警器配置即时推送通知到手机,确保住户即使在睡眠中也能被及时唤醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.5185604095459, "api_error": null} {"episode_id": "SQ2_TP_A_0266", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0266.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20260895, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-19T18:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在设备故障风险,可能导致火灾预警能力下降。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:07 和 19:36 两次报告 MeasuredValue = None,表明传感器读数异常或设备通信故障。\",\n \"推理步骤2: 在 18:29 和 19:00 时厨房温度飙升至 2813/2840(约 28.1°C/28.4°C),随后传感器报 None,可能是灶具使用导致传感器过热或故障。\",\n \"推理步骤3: 厨房烟雾报警器在前一天 18:19 已报告 BatteryAlert = 1(低电量警告),如果温度传感器同时失效,厨房的火灾监测能力将严重削弱。\",\n \"推理步骤4: 住户行为模式正常——早晨 6:30 起床、7:22 出门、18:05 回家、做饭、22:40 就寝,无入侵迹象。\",\n \"推理步骤5: 厨房温度在 20:00 恢复正常读数(2401),说明传感器并非永久损坏,但间歇性故障仍需关注。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 19:07 和 19:36 报告 MeasuredValue = None\",\n \"kitchen_smoke_alarm 在 2026-06-18T18:19 报告 BatteryAlert = 1(低电量)\",\n \"厨房温度在灶具使用期间异常升高至 28.1-28.4°C,随后传感器失效\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾预警功能正常\",\n \"检查厨房温度传感器安装位置,确认其是否距离灶具过近导致间歇性过热故障\",\n \"考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知用户\",\n \"在烟雾报警器电池更换前,避免无人看管使用灶具\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在设备故障风险,可能导致火灾预警能力下降。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:07 和 19:36 两次报告 MeasuredValue = None,表明传感器读数异常或设备通信故障。", "推理步骤2: 在 18:29 和 19:00 时厨房温度飙升至 2813/2840(约 28.1°C/28.4°C),随后传感器报 None,可能是灶具使用导致传感器过热或故障。", "推理步骤3: 厨房烟雾报警器在前一天 18:19 已报告 BatteryAlert = 1(低电量警告),如果温度传感器同时失效,厨房的火灾监测能力将严重削弱。", "推理步骤4: 住户行为模式正常——早晨 6:30 起床、7:22 出门、18:05 回家、做饭、22:40 就寝,无入侵迹象。", "推理步骤5: 厨房温度在 20:00 恢复正常读数(2401),说明传感器并非永久损坏,但间歇性故障仍需关注。"], "key_evidence": ["kitchen_temp_sensor 在 19:07 和 19:36 报告 MeasuredValue = None", "kitchen_smoke_alarm 在 2026-06-18T18:19 报告 BatteryAlert = 1(低电量)", "厨房温度在灶具使用期间异常升高至 28.1-28.4°C,随后传感器失效"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾预警功能正常", "检查厨房温度传感器安装位置,确认其是否距离灶具过近导致间歇性过热故障", "考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知用户", "在烟雾报警器电池更换前,避免无人看管使用灶具"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.962555170059204, "api_error": null} {"episode_id": "SQ2_TP_A_0271", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0271.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20260900, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-22T21:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在无人操作、灶具已关闭近2小时的情况下出现异常高温尖峰并触发烟雾报警,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:26 灶具已关闭(kitchen_cook_surface OnOff=False),厨房温度在 19:30 报告 28.36°C 后逐步回落,20:00 降至 24.06°C,21:00 降至 23.77°C,说明烹饪余热正在正常消散。\",\n \"推理步骤2: 然而在 21:26,厨房温度传感器突然报告 MeasuredValue=3633(即 36.33°C),相比 4 分钟前的 23.77°C 骤升约 12.5°C;21:31 再次报告 3200(32.00°C)。这两条记录的上报格式也缺少完整的 Cluster 前缀(TemperatureMeasurement.),本身就是异常信号。\",\n \"推理步骤3: 21:36 厨房烟雾报警器触发(SmokeState=1),确认厨房存在烟雾。此时灶具已关闭近 2 小时,洗碗机在 19:48 启动但不会产生明火或烟雾,住户活动区域在客厅/卧室,厨房无人操作。\",\n \"推理步骤4: 21:30 的常规温度读数(23.93°C)与异常尖峰读数(36.33°C / 32.00°C)在时间上交错出现,说明可能存在局部热源或传感器受到高温辐射影响,而非全局环境温度变化。\",\n \"推理步骤5: 住户在 21:51 关闭客厅灯、空调并进入卧室准备就寝,似乎未对烟雾报警做出响应(未开厨房灯检查、未开窗通风),这进一步增加了风险——如果存在真实火情,睡眠中可能错过最佳处置时机。\",\n \"推理步骤6: 厨房窗户在 19:26 被打开(contact=False)后日志中未见关闭记录,虽然通风有助于散烟,但如果存在明火,开窗反而会助燃。\"\n ],\n \"key_evidence\": [\n \"21:26 厨房温度异常飙升至 36.33°C(此前 21:00 仅 23.77°C),21:31 仍高达 32.00°C\",\n \"21:36 厨房烟雾报警器触发 SmokeState=1\",\n \"灶具早在 19:26 已关闭,厨房无人操作,排除正常烹饪导致的烟雾\",\n \"异常温度上报格式缺少完整 Cluster 前缀,可能指示传感器工作在极端条件下\",\n \"住户 21:51 进入卧室就寝,未见对烟雾报警的响应动作\"\n ],\n \"recommended_actions\": [\n \"立即向住户推送高优先级火灾警报通知(手机推送 + 室内声光报警),确保住户从卧室醒来并知晓情况\",\n \"自动开启厨房灯以便住户检查,同时考虑关闭厨房窗户防止助燃(如窗户支持远程控制)\",\n \"如住户 2 分钟内未响应,自动联系物业或拨打 119 火警电话\",\n \"检查厨房是否有遗留的可燃物(抹布、油渍等)靠近灶具残余热源或电器\",\n \"事后检查厨房温度传感器是否存在故障(异常上报格式、极端读数),必要时更换传感器\",\n \"检查洗碗机运行状态是否正常,排除电器故障引发过热的可能性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在无人操作、灶具已关闭近2小时的情况下出现异常高温尖峰并触发烟雾报警,存在火灾风险。", "reasoning": ["推理步骤1: 19:26 灶具已关闭(kitchen_cook_surface OnOff=False),厨房温度在 19:30 报告 28.36°C 后逐步回落,20:00 降至 24.06°C,21:00 降至 23.77°C,说明烹饪余热正在正常消散。", "推理步骤2: 然而在 21:26,厨房温度传感器突然报告 MeasuredValue=3633(即 36.33°C),相比 4 分钟前的 23.77°C 骤升约 12.5°C;21:31 再次报告 3200(32.00°C)。这两条记录的上报格式也缺少完整的 Cluster 前缀(TemperatureMeasurement.),本身就是异常信号。", "推理步骤3: 21:36 厨房烟雾报警器触发(SmokeState=1),确认厨房存在烟雾。此时灶具已关闭近 2 小时,洗碗机在 19:48 启动但不会产生明火或烟雾,住户活动区域在客厅/卧室,厨房无人操作。", "推理步骤4: 21:30 的常规温度读数(23.93°C)与异常尖峰读数(36.33°C / 32.00°C)在时间上交错出现,说明可能存在局部热源或传感器受到高温辐射影响,而非全局环境温度变化。", "推理步骤5: 住户在 21:51 关闭客厅灯、空调并进入卧室准备就寝,似乎未对烟雾报警做出响应(未开厨房灯检查、未开窗通风),这进一步增加了风险——如果存在真实火情,睡眠中可能错过最佳处置时机。", "推理步骤6: 厨房窗户在 19:26 被打开(contact=False)后日志中未见关闭记录,虽然通风有助于散烟,但如果存在明火,开窗反而会助燃。"], "key_evidence": ["21:26 厨房温度异常飙升至 36.33°C(此前 21:00 仅 23.77°C),21:31 仍高达 32.00°C", "21:36 厨房烟雾报警器触发 SmokeState=1", "灶具早在 19:26 已关闭,厨房无人操作,排除正常烹饪导致的烟雾", "异常温度上报格式缺少完整 Cluster 前缀,可能指示传感器工作在极端条件下", "住户 21:51 进入卧室就寝,未见对烟雾报警的响应动作"], "recommended_actions": ["立即向住户推送高优先级火灾警报通知(手机推送 + 室内声光报警),确保住户从卧室醒来并知晓情况", "自动开启厨房灯以便住户检查,同时考虑关闭厨房窗户防止助燃(如窗户支持远程控制)", "如住户 2 分钟内未响应,自动联系物业或拨打 119 火警电话", "检查厨房是否有遗留的可燃物(抹布、油渍等)靠近灶具残余热源或电器", "事后检查厨房温度传感器是否存在故障(异常上报格式、极端读数),必要时更换传感器", "检查洗碗机运行状态是否正常,排除电器故障引发过热的可能性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.180777549743652, "api_error": null} {"episode_id": "SQ2_TP_A_0272", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0272.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20260901, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-01T00:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现多次异常读数(突然飙升、返回None),且烟雾报警器电池低电量,同时凌晨1点灶具异常开启,存在设备故障与潜在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在01:03突然从约22.9°C飙升至31.71°C,3分钟内上升近9°C,这与灶具在00:53被开启有关,但凌晨00:53开灶具本身就极不寻常——住户此时应在睡眠状态(无任何运动传感器触发、无灯光开启)。\",\n \"推理步骤2: 厨房温度传感器在19:00读数突然从约24.6°C跳至28.35°C,随后在19:03和19:54两次返回None(空值),说明传感器出现故障或通信异常。19:30恢复后读数为28.44°C,与正常做饭场景的温升幅度不匹配(此时灶具确实在使用,但传感器行为不稳定)。\",\n \"推理步骤3: 烟雾报警器在5月31日00:53报告BatteryAlert=1(低电量警告),这意味着在火灾风险场景下,烟雾报警器可能无法正常工作。虽然01:03的SmokeState=0表示当时未检测到烟雾,但低电量状态下传感器的可靠性存疑。\",\n \"推理步骤4: 凌晨00:53灶具开启时,没有任何运动传感器检测到人体活动(客厅、卧室、厨房均无occupancy事件),也没有灯光开启。这可能是设备误触发、远程误操作或系统故障,无人看管的灶具运行存在火灾风险。\",\n \"推理步骤5: 入户门在18:11前一直处于锁定状态,住户约07:18出门、18:11回家,白天家中无人。凌晨的灶具开启发生在住户睡眠期间(06:40才起床),进一步印证这不是正常的人为操作。\"\n ],\n \"key_evidence\": [\n \"00:53 厨房灶具在无人活动的凌晨被开启(无运动传感器触发、无灯光)\",\n \"01:03 厨房温度3分钟内从22.9°C飙升至31.7°C\",\n \"19:03和19:54 厨房温度传感器两次返回None,传感器工作异常\",\n \"19:00 厨房温度从约24.6°C异常跳升至28.35°C(灶具尚未开启时已异常升高)\",\n \"05-31 00:53 烟雾报警器报告BatteryAlert=1(低电量)\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾检测能力正常\",\n \"检查厨房温度传感器是否存在硬件故障或通信问题,必要时更换设备\",\n \"排查厨房灶具凌晨自动开启的原因——检查是否有定时任务、远程控制记录或设备固件bug\",\n \"为灶具添加安全规则:当无人在家或深夜时段(23:00-06:00)禁止灶具开启,或开启后若无人活动则自动关闭\",\n \"建议在厨房增加运动传感器,以便更好地关联灶具使用与人员在场状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现多次异常读数(突然飙升、返回None),且烟雾报警器电池低电量,同时凌晨1点灶具异常开启,存在设备故障与潜在火灾隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在01:03突然从约22.9°C飙升至31.71°C,3分钟内上升近9°C,这与灶具在00:53被开启有关,但凌晨00:53开灶具本身就极不寻常——住户此时应在睡眠状态(无任何运动传感器触发、无灯光开启)。", "推理步骤2: 厨房温度传感器在19:00读数突然从约24.6°C跳至28.35°C,随后在19:03和19:54两次返回None(空值),说明传感器出现故障或通信异常。19:30恢复后读数为28.44°C,与正常做饭场景的温升幅度不匹配(此时灶具确实在使用,但传感器行为不稳定)。", "推理步骤3: 烟雾报警器在5月31日00:53报告BatteryAlert=1(低电量警告),这意味着在火灾风险场景下,烟雾报警器可能无法正常工作。虽然01:03的SmokeState=0表示当时未检测到烟雾,但低电量状态下传感器的可靠性存疑。", "推理步骤4: 凌晨00:53灶具开启时,没有任何运动传感器检测到人体活动(客厅、卧室、厨房均无occupancy事件),也没有灯光开启。这可能是设备误触发、远程误操作或系统故障,无人看管的灶具运行存在火灾风险。", "推理步骤5: 入户门在18:11前一直处于锁定状态,住户约07:18出门、18:11回家,白天家中无人。凌晨的灶具开启发生在住户睡眠期间(06:40才起床),进一步印证这不是正常的人为操作。"], "key_evidence": ["00:53 厨房灶具在无人活动的凌晨被开启(无运动传感器触发、无灯光)", "01:03 厨房温度3分钟内从22.9°C飙升至31.7°C", "19:03和19:54 厨房温度传感器两次返回None,传感器工作异常", "19:00 厨房温度从约24.6°C异常跳升至28.35°C(灶具尚未开启时已异常升高)", "05-31 00:53 烟雾报警器报告BatteryAlert=1(低电量)"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾检测能力正常", "检查厨房温度传感器是否存在硬件故障或通信问题,必要时更换设备", "排查厨房灶具凌晨自动开启的原因——检查是否有定时任务、远程控制记录或设备固件bug", "为灶具添加安全规则:当无人在家或深夜时段(23:00-06:00)禁止灶具开启,或开启后若无人活动则自动关闭", "建议在厨房增加运动传感器,以便更好地关联灶具使用与人员在场状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.00486731529236, "api_error": null} {"episode_id": "SQ2_TP_A_0292", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_A_0292.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260921, "scenario_id": "INS-05", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-02T01:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和两次 None 读数,疑似传感器故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度从 18:30 的 2459(24.59°C)突然跳升至 2828(28.28°C),30 分钟内上升近 3.7°C,而同时段客厅和卧室温度仅正常下降,排除全屋环境突变。\",\n \"推理步骤2: 19:07 灶具开启,但 19:00 的异常高温出现在灶具开启之前,说明这次跳变不是烹饪导致的,更像是传感器读数异常。\",\n \"推理步骤3: 19:08 和 19:46 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器无法正常采集数据,出现了通信中断或硬件故障。\",\n \"推理步骤4: 19:30 传感器短暂恢复,报告 2838(28.38°C),仍然异常偏高;而 19:45 灶具关闭、窗户打开通风后,20:00 恢复到 2419(24.19°C),温度骤降 4°C 也不符合自然散热规律,进一步佐证传感器读数不可靠。\",\n \"推理步骤5: 烟雾报警器全天未触发任何告警,排除真实火灾或烟雾风险;厨房烹饪行为(19:07-19:45)本身是正常的晚餐活动。\",\n \"推理步骤6: 其余所有设备行为均正常——凌晨 01:12 开门回家(密码开锁+用户索引1,合法用户)、早晨起床洗漱出门、傍晚 18:17 回家开灯开空调、晚间就寝关灯锁门,符合单人一室一厅的日常作息。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.59°C 异常跳升至 28.28°C,灶具尚未开启(19:07 才开)\",\n \"19:08 和 19:46 厨房温度传感器两次报告 MeasuredValue = None,数据采集中断\",\n \"19:30 传感器读数 28.38°C 仍异常偏高,20:00 骤降至 24.19°C,变化幅度不合理\",\n \"全天烟雾报警器未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和供电情况,确认是否存在接触不良或电池电量不足\",\n \"检查传感器与 Matter 网关之间的通信链路质量,排查 None 读数是否由网络丢包引起\",\n \"如传感器持续出现异常读数或 None 值,建议更换传感器或重新配对\",\n \"在传感器不可靠期间,加强对厨房烟雾报警器的依赖,确保其处于正常工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和两次 None 读数,疑似传感器故障或通信异常。", "reasoning": ["推理步骤1: 19:00 厨房温度从 18:30 的 2459(24.59°C)突然跳升至 2828(28.28°C),30 分钟内上升近 3.7°C,而同时段客厅和卧室温度仅正常下降,排除全屋环境突变。", "推理步骤2: 19:07 灶具开启,但 19:00 的异常高温出现在灶具开启之前,说明这次跳变不是烹饪导致的,更像是传感器读数异常。", "推理步骤3: 19:08 和 19:46 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器无法正常采集数据,出现了通信中断或硬件故障。", "推理步骤4: 19:30 传感器短暂恢复,报告 2838(28.38°C),仍然异常偏高;而 19:45 灶具关闭、窗户打开通风后,20:00 恢复到 2419(24.19°C),温度骤降 4°C 也不符合自然散热规律,进一步佐证传感器读数不可靠。", "推理步骤5: 烟雾报警器全天未触发任何告警,排除真实火灾或烟雾风险;厨房烹饪行为(19:07-19:45)本身是正常的晚餐活动。", "推理步骤6: 其余所有设备行为均正常——凌晨 01:12 开门回家(密码开锁+用户索引1,合法用户)、早晨起床洗漱出门、傍晚 18:17 回家开灯开空调、晚间就寝关灯锁门,符合单人一室一厅的日常作息。"], "key_evidence": ["19:00 厨房温度从 24.59°C 异常跳升至 28.28°C,灶具尚未开启(19:07 才开)", "19:08 和 19:46 厨房温度传感器两次报告 MeasuredValue = None,数据采集中断", "19:30 传感器读数 28.38°C 仍异常偏高,20:00 骤降至 24.19°C,变化幅度不合理", "全天烟雾报警器未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的硬件状态和供电情况,确认是否存在接触不良或电池电量不足", "检查传感器与 Matter 网关之间的通信链路质量,排查 None 读数是否由网络丢包引起", "如传感器持续出现异常读数或 None 值,建议更换传感器或重新配对", "在传感器不可靠期间,加强对厨房烟雾报警器的依赖,确保其处于正常工作状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.92249369621277, "api_error": null} {"episode_id": "SQ2_TP_B_0191", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0191.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260820, "scenario_id": "FG-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-19T18:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器检测到一氧化碳(CO)泄漏,存在严重的人身健康威胁。\",\n \"reasoning\": [\n \"推理步骤1: 18:28 厨房灶具开启,18:29 厨房温度传感器短暂报告 None(可能受热干扰),灶具正在使用中。\",\n \"推理步骤2: 18:43 厨房烟雾报警器触发 CO 报警——COState=1(一氧化碳检测异常)、ExpressedState=2(警告状态)、并产生 COAlarm 事件。此时灶具已持续运行约15分钟。\",\n \"推理步骤3: CO 报警发生时灶具仍在运行(直到 19:10 才关闭),说明燃气燃烧不充分或排烟不畅导致一氧化碳积聚。厨房窗户在灶具关闭后才打开(19:10:30),通风滞后。\",\n \"推理步骤4: 一氧化碳是无色无味的有毒气体,即使浓度不高也会对人体造成中毒风险,尤其是住户当时在家(18:07 已有人通过入户门进入并在客厅活动)。\",\n \"推理步骤5: 厨房温度传感器在灶具开启后多次报告 None 值(06:43、07:21、18:29、19:11),这一反复出现的异常可能表明传感器受高温或烟气干扰存在故障,削弱了对厨房环境的监测能力。\"\n ],\n \"key_evidence\": [\n \"18:43 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发 COAlarm 事件\",\n \"18:28 灶具开启,CO 报警发生时灶具仍在运行,直到 19:10 才关闭(报警后又持续运行了27分钟)\",\n \"厨房窗户在报警前处于关闭状态,19:10:30 才打开,通风严重滞后\",\n \"厨房温度传感器多次报告 None,设备可能存在故障\"\n ],\n \"recommended_actions\": [\n \"立即确认住户安全状态,如有头晕、恶心等 CO 中毒症状应立即就医或拨打急救电话\",\n \"立即开窗通风(所有房间),确保室内空气流通,降低 CO 浓度\",\n \"检查燃气灶具及燃气管路,排查燃烧不充分或燃气泄漏的原因,必要时联系燃气公司上门检修\",\n \"检修厨房温度传感器,排查其频繁报告 None 值的故障原因\",\n \"考虑增加厨房排气扇联动规则:灶具开启时自动开窗或启动排风,避免 CO 积聚\",\n \"设置自动化规则:CO 报警触发时自动关闭灶具并打开厨房窗户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器检测到一氧化碳(CO)泄漏,存在严重的人身健康威胁。", "reasoning": ["推理步骤1: 18:28 厨房灶具开启,18:29 厨房温度传感器短暂报告 None(可能受热干扰),灶具正在使用中。", "推理步骤2: 18:43 厨房烟雾报警器触发 CO 报警——COState=1(一氧化碳检测异常)、ExpressedState=2(警告状态)、并产生 COAlarm 事件。此时灶具已持续运行约15分钟。", "推理步骤3: CO 报警发生时灶具仍在运行(直到 19:10 才关闭),说明燃气燃烧不充分或排烟不畅导致一氧化碳积聚。厨房窗户在灶具关闭后才打开(19:10:30),通风滞后。", "推理步骤4: 一氧化碳是无色无味的有毒气体,即使浓度不高也会对人体造成中毒风险,尤其是住户当时在家(18:07 已有人通过入户门进入并在客厅活动)。", "推理步骤5: 厨房温度传感器在灶具开启后多次报告 None 值(06:43、07:21、18:29、19:11),这一反复出现的异常可能表明传感器受高温或烟气干扰存在故障,削弱了对厨房环境的监测能力。"], "key_evidence": ["18:43 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发 COAlarm 事件", "18:28 灶具开启,CO 报警发生时灶具仍在运行,直到 19:10 才关闭(报警后又持续运行了27分钟)", "厨房窗户在报警前处于关闭状态,19:10:30 才打开,通风严重滞后", "厨房温度传感器多次报告 None,设备可能存在故障"], "recommended_actions": ["立即确认住户安全状态,如有头晕、恶心等 CO 中毒症状应立即就医或拨打急救电话", "立即开窗通风(所有房间),确保室内空气流通,降低 CO 浓度", "检查燃气灶具及燃气管路,排查燃烧不充分或燃气泄漏的原因,必要时联系燃气公司上门检修", "检修厨房温度传感器,排查其频繁报告 None 值的故障原因", "考虑增加厨房排气扇联动规则:灶具开启时自动开窗或启动排风,避免 CO 积聚", "设置自动化规则:CO 报警触发时自动关闭灶具并打开厨房窗户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.815114736557007, "api_error": null} {"episode_id": "SQ2_TP_B_0196", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0196.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260825, "scenario_id": "INS-02", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-09T08:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"08:40 住户外出期间,入户门锁在50秒内连续4次解锁失败并触发强制入侵报警,疑似有人尝试暴力破解门锁。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:15 手动开锁出门,门关闭后自动上锁(LockState=1),此后家中无任何运动传感器触发,确认住户已离家。\",\n \"推理步骤2: 08:40:00 至 08:40:40 期间,front_door_lock 连续报告 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应 Keypad(密码输入),OperationError=1 表示凭证无效,说明有人在反复尝试错误密码。\",\n \"推理步骤3: 4 次失败尝试集中在 50 秒内,频率极高,不符合住户偶尔输错密码的正常模式(正常情况下最多错 1-2 次且间隔较长)。\",\n \"推理步骤4: 08:40:50 门锁触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵报警\"(Wrong Code Entry Limit),说明门锁自身已判定这是一次入侵尝试并主动告警。\",\n \"推理步骤5: 此时段内无任何成功的开锁事件,门锁始终保持锁定状态(LockState=1),入侵者未能成功进入,但威胁是真实存在的。\"\n ],\n \"key_evidence\": [\n \"08:40:00-08:40:40 共 4 次 LockOperationError(OperationError=1, OperationSource=3),50秒内密码输入全部失败\",\n \"08:40:50 触发 DoorLockAlarm(AlarmCode=3)——门锁错误密码次数超限报警\",\n \"07:15 住户出门后家中无人,排除住户本人操作的可能性\",\n \"直到 16:25 才有下一次正常的手动开锁事件,中间无合法进入记录\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送入侵告警通知,告知门锁在无人在家时被多次尝试错误密码\",\n \"如有摄像头或可视门铃,调取 08:39-08:42 时段的录像,确认门口人员身份\",\n \"临时启用门锁更高安全策略:增加错误密码后的锁定时间,考虑暂时禁用密码解锁仅保留物理钥匙或手机解锁\",\n \"检查是否存在密码泄露风险,建议住户更换门锁密码\",\n \"如确认非住户本人或已知访客,考虑报警处理\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"08:40 住户外出期间,入户门锁在50秒内连续4次解锁失败并触发强制入侵报警,疑似有人尝试暴力破解门锁。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:15 手动开锁出门,门关闭后自动上锁(LockState=1),此后家中无任何运动传感器触发,确认住户已离家。\",\n \"推理步骤2: 08:40:00 至 08:40:40 期间,front_door_lock 连续报告 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应 Keypad(密码输入),OperationError=1 表示凭证无效,说明有人在反复尝试错误密码。\",\n \"推理步骤3: 4 次失败尝试集中在 50 秒内,频率极高,不符合住户偶尔输错密码的"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 21.540618181228638, "api_error": null} {"episode_id": "SQ2_TP_B_0199", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0199.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260828, "scenario_id": "FG-02", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-11T10:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧温度传感器在10:13和10:18出现异常高温读数(36.69°C和32.00°C),疑似传感器故障;同时厨房烟雾报警器在10:23触发,但缺乏其他火灾佐证,可能为误报或需排查隐患。\",\n \"reasoning\": [\n \"推理步骤1: 次卧温度传感器在10:00报告25.22°C,但10:13突然跳升至36.69°C,10:18为32.00°C,10:30又恢复至25.20°C。短短10分钟内温度飙升超过11°C再回落,且同一时段其他房间温度均稳定在25°C左右,不符合真实环境温度变化规律。\",\n \"推理步骤2: 这两条异常读数的上报格式也与其他记录不同——缺少完整的 TemperatureMeasurement 前缀,仅写了 MeasuredValue,可能暗示传感器固件异常或通信故障导致数据格式错乱和数值失真。\",\n \"推理步骤3: 厨房烟雾报警器在10:23报告 SmokeState=1(检测到烟雾)。但此时厨房灶具处于关闭状态(07:33已关灯离家,灶具在06:55关闭后于07:06短暂开启,07:33前住户出门),厨房温度在10:00为25.28°C、10:30为25.20°C,没有异常升温,也没有任何人员活动迹象。\",\n \"推理步骤4: 烟雾报警触发时家中无人(住户07:33出门、16:35才回来),且无灶具运行、无温度异常,真实火灾的可能性较低。更可能是传感器灰尘积累、昆虫进入或传感器老化导致的误报。但不能完全排除隐患,需要现场确认。\",\n \"推理步骤5: 厨房温度传感器在灶具开关前后多次报告 None 值(06:56、07:07、18:12、18:58),说明该传感器在灶具运行环境下存在间歇性读数丢失问题,也属于设备异常。\"\n ],\n \"key_evidence\": [\n \"10:13 次卧温度传感器突然报告 3669(36.69°C),10:18 报告 3200(32.00°C),而10:00和10:30的正常读数分别为 2522 和 2520,属于明显的异常尖峰\",\n \"10:23 厨房烟雾报警器 SmokeState=1 触发,但灶具处于关闭状态、厨房温度正常、家中无人\",\n \"次卧异常读数的上报格式缺少 TemperatureMeasurement 前缀,与正常日志格式不一致\",\n \"厨房温度传感器在灶具操作前后多次报告 MeasuredValue=None,存在间歇性数据丢失\"\n ],\n \"recommended_actions\": [\n \"立即远程查看家中摄像头或安排人员到场确认厨房是否存在真实烟雾或火源,排除火灾隐患\",\n \"对次卧温度传感器进行检查或重启,确认是否为硬件故障、接线松动或固件bug,必要时更换传感器\",\n \"清洁或更换厨房烟雾报警器,检查是否有灰尘、油烟残留或昆虫进入导致误报\",\n \"检查厨房温度传感器与灶具之间的安装距离和工作状态,解决间歇性 None 值问题\",\n \"考虑为烟雾报警器设置联动规则:触发时自动推送通知并联动摄像头抓拍,便于远程快速确认\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧温度传感器在10:13和10:18出现异常高温读数(36.69°C和32.00°C),疑似传感器故障;同时厨房烟雾报警器在10:23触发,但缺乏其他火灾佐证,可能为误报或需排查隐患。", "reasoning": ["推理步骤1: 次卧温度传感器在10:00报告25.22°C,但10:13突然跳升至36.69°C,10:18为32.00°C,10:30又恢复至25.20°C。短短10分钟内温度飙升超过11°C再回落,且同一时段其他房间温度均稳定在25°C左右,不符合真实环境温度变化规律。", "推理步骤2: 这两条异常读数的上报格式也与其他记录不同——缺少完整的 TemperatureMeasurement 前缀,仅写了 MeasuredValue,可能暗示传感器固件异常或通信故障导致数据格式错乱和数值失真。", "推理步骤3: 厨房烟雾报警器在10:23报告 SmokeState=1(检测到烟雾)。但此时厨房灶具处于关闭状态(07:33已关灯离家,灶具在06:55关闭后于07:06短暂开启,07:33前住户出门),厨房温度在10:00为25.28°C、10:30为25.20°C,没有异常升温,也没有任何人员活动迹象。", "推理步骤4: 烟雾报警触发时家中无人(住户07:33出门、16:35才回来),且无灶具运行、无温度异常,真实火灾的可能性较低。更可能是传感器灰尘积累、昆虫进入或传感器老化导致的误报。但不能完全排除隐患,需要现场确认。", "推理步骤5: 厨房温度传感器在灶具开关前后多次报告 None 值(06:56、07:07、18:12、18:58),说明该传感器在灶具运行环境下存在间歇性读数丢失问题,也属于设备异常。"], "key_evidence": ["10:13 次卧温度传感器突然报告 3669(36.69°C),10:18 报告 3200(32.00°C),而10:00和10:30的正常读数分别为 2522 和 2520,属于明显的异常尖峰", "10:23 厨房烟雾报警器 SmokeState=1 触发,但灶具处于关闭状态、厨房温度正常、家中无人", "次卧异常读数的上报格式缺少 TemperatureMeasurement 前缀,与正常日志格式不一致", "厨房温度传感器在灶具操作前后多次报告 MeasuredValue=None,存在间歇性数据丢失"], "recommended_actions": ["立即远程查看家中摄像头或安排人员到场确认厨房是否存在真实烟雾或火源,排除火灾隐患", "对次卧温度传感器进行检查或重启,确认是否为硬件故障、接线松动或固件bug,必要时更换传感器", "清洁或更换厨房烟雾报警器,检查是否有灰尘、油烟残留或昆虫进入导致误报", "检查厨房温度传感器与灶具之间的安装距离和工作状态,解决间歇性 None 值问题", "考虑为烟雾报警器设置联动规则:触发时自动推送通知并联动摄像头抓拍,便于远程快速确认"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.394532680511475, "api_error": null} {"episode_id": "SQ2_TP_B_0209", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0209.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20260838, "scenario_id": "FG-01", "total_events": 238, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-19T18:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具使用期间温度异常飙升并触发烟雾报警,且厨房温度传感器疑似因高温损坏(读数为 None),存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:33 灶具开启后,厨房温度在5分钟内从约24.6°C骤升至30.4°C(18:38),10分钟后达到35.0°C(18:43),升温速率远超正常烹饪范围。\",\n \"推理步骤2: 18:48 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认现场产生了大量烟雾,与温度异常飙升吻合。\",\n \"推理步骤3: 烟雾报警触发后,日志中未见灶具立即关闭的记录。灶具在19:05仍显示OnOff=True(可能是用户确认/重新操作),直到19:48才最终关闭,说明高温状态持续了较长时间。\",\n \"推理步骤4: 19:06和19:49厨房温度传感器读数为None,表明传感器可能因持续高温而故障或超出量程,这是严重过热的佐证。\",\n \"推理步骤5: 19:00时厨房温度仍高达28.45°C,而同一时刻其他房间温度已降至约24°C,厨房与其他区域存在约4.5°C的显著温差,说明厨房热源异常。\",\n \"推理步骤6: 19:48灶具关闭后用户打开了厨房窗户(kitchen_window_contact StateValue=False),属于事后通风处理,侧面印证了烟雾/高温事件的严重性。\"\n ],\n \"key_evidence\": [\n \"厨房温度在18:33~18:43期间从约24.6°C飙升至35.0°C,升幅超过10°C\",\n \"18:48 烟雾报警器触发:SmokeState=1, ExpressedState=1, SmokeAlarm事件\",\n \"19:06和19:49厨房温度传感器返回None,疑似高温导致传感器故障\",\n \"灶具从18:33持续运行至19:48才关闭,烟雾报警后仍运行了约1小时\",\n \"19:00厨房温度28.45°C,比其他房间高出约4.5°C\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器是否损坏(两次返回None),必要时更换\",\n \"检查烟雾报警器当前状态是否已恢复正常(日志中未见SmokeState归零的记录)\",\n \"设置自动化规则:烟雾报警触发时自动关闭灶具,避免火灾风险扩大\",\n \"设置灶具使用时长上限告警,超过一定时间未关闭时提醒用户\",\n \"考虑为厨房增加自动灭火或燃气切断联动装置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具使用期间温度异常飙升并触发烟雾报警,且厨房温度传感器疑似因高温损坏(读数为 None),存在火灾风险。", "reasoning": ["推理步骤1: 18:33 灶具开启后,厨房温度在5分钟内从约24.6°C骤升至30.4°C(18:38),10分钟后达到35.0°C(18:43),升温速率远超正常烹饪范围。", "推理步骤2: 18:48 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认现场产生了大量烟雾,与温度异常飙升吻合。", "推理步骤3: 烟雾报警触发后,日志中未见灶具立即关闭的记录。灶具在19:05仍显示OnOff=True(可能是用户确认/重新操作),直到19:48才最终关闭,说明高温状态持续了较长时间。", "推理步骤4: 19:06和19:49厨房温度传感器读数为None,表明传感器可能因持续高温而故障或超出量程,这是严重过热的佐证。", "推理步骤5: 19:00时厨房温度仍高达28.45°C,而同一时刻其他房间温度已降至约24°C,厨房与其他区域存在约4.5°C的显著温差,说明厨房热源异常。", "推理步骤6: 19:48灶具关闭后用户打开了厨房窗户(kitchen_window_contact StateValue=False),属于事后通风处理,侧面印证了烟雾/高温事件的严重性。"], "key_evidence": ["厨房温度在18:33~18:43期间从约24.6°C飙升至35.0°C,升幅超过10°C", "18:48 烟雾报警器触发:SmokeState=1, ExpressedState=1, SmokeAlarm事件", "19:06和19:49厨房温度传感器返回None,疑似高温导致传感器故障", "灶具从18:33持续运行至19:48才关闭,烟雾报警后仍运行了约1小时", "19:00厨房温度28.45°C,比其他房间高出约4.5°C"], "recommended_actions": ["立即检查厨房温度传感器是否损坏(两次返回None),必要时更换", "检查烟雾报警器当前状态是否已恢复正常(日志中未见SmokeState归零的记录)", "设置自动化规则:烟雾报警触发时自动关闭灶具,避免火灾风险扩大", "设置灶具使用时长上限告警,超过一定时间未关闭时提醒用户", "考虑为厨房增加自动灭火或燃气切断联动装置"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.56872034072876, "api_error": null} {"episode_id": "SQ2_TP_B_0211", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0211.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20260840, "scenario_id": "FG-01", "total_events": 238, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-05T04:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨4:04厨房灶具在无人操作情况下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨4:04:00,厨房灶具(kitchen_cook_surface)被开启(OnOff=True)。同一时刻次卧运动传感器显示Occupancy=0,说明住户并未起床活动;整夜(00:00-04:00)无任何房间的运动传感器、灯光或门锁有活动记录,表明住户处于深度睡眠状态。\",\n \"推理步骤2: 灶具开启前,厨房温度稳定在约22.9-23.1°C(2290-2310)。灶具开启仅5分钟后(04:09),厨房温度飙升至28.46°C(2846),再过5分钟(04:14)达到35.00°C(3500),10分钟内温升超过12°C,这是极其异常的升温速率。\",\n \"推理步骤3: 04:19烟雾报警器触发——SmokeState=1(检测到烟雾)、ExpressedState=1(报警激活)、并产生SmokeAlarm事件。这证实厨房已出现烟雾,存在实际火灾隐患。\",\n \"推理步骤4: 日志中没有任何人手动关闭灶具的记录。到04:30温度回落至22.91°C,说明灶具可能在某个时间点被关闭(或自动保护机制介入),但日志中缺少明确的关闭事件,过程不透明。\",\n \"推理步骤5: 灶具在凌晨4点无人状态下启动,最可能的原因是设备故障、自动化规则误触发、或远程误操作。无论哪种原因,无人看管的灶具运行都构成严重火灾风险。\"\n ],\n \"key_evidence\": [\n \"04:04 厨房灶具在全屋无人活动的凌晨时段自动开启\",\n \"04:09 厨房温度从约23°C飙升至28.46°C,04:14进一步升至35°C(10分钟内升温超12°C)\",\n \"04:19 厨房烟雾报警器触发 SmokeAlarm 事件,SmokeState=1\",\n \"整个凌晨时段(00:00-06:35)无任何运动传感器、灯光或门锁活动,确认无人操作灶具\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具硬件是否存在故障(如控制板短路、阀门异常),必要时断电/断气处理\",\n \"排查是否有自动化规则或场景误配置导致灶具在非预期时间启动,发现后立即禁用相关规则\",\n \"为灶具增加安全联动策略:当烟雾报警触发时自动关闭灶具,当深夜无人活动时禁止灶具远程/自动开启\",\n \"检查灶具的远程控制访问日志,排除未授权的远程操控可能性\",\n \"考虑为厨房加装燃气泄漏传感器,与灶具和烟雾报警器形成联动保护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨4:04厨房灶具在无人操作情况下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 凌晨4:04:00,厨房灶具(kitchen_cook_surface)被开启(OnOff=True)。同一时刻次卧运动传感器显示Occupancy=0,说明住户并未起床活动;整夜(00:00-04:00)无任何房间的运动传感器、灯光或门锁有活动记录,表明住户处于深度睡眠状态。", "推理步骤2: 灶具开启前,厨房温度稳定在约22.9-23.1°C(2290-2310)。灶具开启仅5分钟后(04:09),厨房温度飙升至28.46°C(2846),再过5分钟(04:14)达到35.00°C(3500),10分钟内温升超过12°C,这是极其异常的升温速率。", "推理步骤3: 04:19烟雾报警器触发——SmokeState=1(检测到烟雾)、ExpressedState=1(报警激活)、并产生SmokeAlarm事件。这证实厨房已出现烟雾,存在实际火灾隐患。", "推理步骤4: 日志中没有任何人手动关闭灶具的记录。到04:30温度回落至22.91°C,说明灶具可能在某个时间点被关闭(或自动保护机制介入),但日志中缺少明确的关闭事件,过程不透明。", "推理步骤5: 灶具在凌晨4点无人状态下启动,最可能的原因是设备故障、自动化规则误触发、或远程误操作。无论哪种原因,无人看管的灶具运行都构成严重火灾风险。"], "key_evidence": ["04:04 厨房灶具在全屋无人活动的凌晨时段自动开启", "04:09 厨房温度从约23°C飙升至28.46°C,04:14进一步升至35°C(10分钟内升温超12°C)", "04:19 厨房烟雾报警器触发 SmokeAlarm 事件,SmokeState=1", "整个凌晨时段(00:00-06:35)无任何运动传感器、灯光或门锁活动,确认无人操作灶具"], "recommended_actions": ["立即检查厨房灶具硬件是否存在故障(如控制板短路、阀门异常),必要时断电/断气处理", "排查是否有自动化规则或场景误配置导致灶具在非预期时间启动,发现后立即禁用相关规则", "为灶具增加安全联动策略:当烟雾报警触发时自动关闭灶具,当深夜无人活动时禁止灶具远程/自动开启", "检查灶具的远程控制访问日志,排除未授权的远程操控可能性", "考虑为厨房加装燃气泄漏传感器,与灶具和烟雾报警器形成联动保护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.20594334602356, "api_error": null} {"episode_id": "SQ2_TP_B_0212", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0212.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20260841, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-15T18:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数(突然飙升至28.42°C并多次报告None),疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 19:00时厨房温度传感器突然从前一时刻的约24.3°C跳升至28.42°C(2842),而同一时刻其他三个房间温度均在24.3°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具19:09才开)。\",\n \"推理步骤2: 19:10和19:28两次读数报告为None(空值),说明传感器在这段时间内无法正常采集数据,出现了数据丢失。\",\n \"推理步骤3: 19:30时厨房温度再次报告2842(28.42°C),此时灶具已于19:27关闭、窗户已打开通风,按常理温度应开始回落,但读数与19:00异常值完全一致,进一步说明这不是真实温度变化,而是传感器卡在了一个错误值上。\",\n \"推理步骤4: 20:00之后厨房温度恢复到与其他房间一致的正常范围(约24.1°C),说明传感器可能短暂恢复,但19:00-19:30期间的异常行为表明硬件或固件存在间歇性故障。\",\n \"推理步骤5: 其余所有设备行为均正常——早晨出门、傍晚回家、做饭、洗碗、睡前关灯锁门的生活节奏合理,门锁操作来源正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至2842(28.42°C),灶具尚未开启,其他房间温度正常约24.3°C\",\n \"19:10 和 19:28 厨房温度传感器读数为 None,数据采集中断\",\n \"19:30 厨房温度仍为2842,与19:00异常值完全相同,但灶具已关闭且窗户已打开\",\n \"20:00 之后厨房温度恢复正常(2417),说明异常为间歇性故障而非真实高温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态,清洁探头并确认安装位置是否受热源直接影响\",\n \"查看传感器固件版本,如有更新建议升级以修复可能的数据采集Bug\",\n \"在传感器修复前,为厨房烟雾报警器(kitchen_smoke_alarm)设置独立的高温联动规则,避免因温度传感器故障导致火灾预警失效\",\n \"考虑为厨房温度传感器配置异常值过滤规则:当读数突变超过阈值或连续报告None时,自动发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数(突然飙升至28.42°C并多次报告None),疑似传感器故障。", "reasoning": ["推理步骤1: 19:00时厨房温度传感器突然从前一时刻的约24.3°C跳升至28.42°C(2842),而同一时刻其他三个房间温度均在24.3°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具19:09才开)。", "推理步骤2: 19:10和19:28两次读数报告为None(空值),说明传感器在这段时间内无法正常采集数据,出现了数据丢失。", "推理步骤3: 19:30时厨房温度再次报告2842(28.42°C),此时灶具已于19:27关闭、窗户已打开通风,按常理温度应开始回落,但读数与19:00异常值完全一致,进一步说明这不是真实温度变化,而是传感器卡在了一个错误值上。", "推理步骤4: 20:00之后厨房温度恢复到与其他房间一致的正常范围(约24.1°C),说明传感器可能短暂恢复,但19:00-19:30期间的异常行为表明硬件或固件存在间歇性故障。", "推理步骤5: 其余所有设备行为均正常——早晨出门、傍晚回家、做饭、洗碗、睡前关灯锁门的生活节奏合理,门锁操作来源正常,无入侵迹象。"], "key_evidence": ["19:00 厨房温度突跳至2842(28.42°C),灶具尚未开启,其他房间温度正常约24.3°C", "19:10 和 19:28 厨房温度传感器读数为 None,数据采集中断", "19:30 厨房温度仍为2842,与19:00异常值完全相同,但灶具已关闭且窗户已打开", "20:00 之后厨房温度恢复正常(2417),说明异常为间歇性故障而非真实高温"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态,清洁探头并确认安装位置是否受热源直接影响", "查看传感器固件版本,如有更新建议升级以修复可能的数据采集Bug", "在传感器修复前,为厨房烟雾报警器(kitchen_smoke_alarm)设置独立的高温联动规则,避免因温度传感器故障导致火灾预警失效", "考虑为厨房温度传感器配置异常值过滤规则:当读数突变超过阈值或连续报告None时,自动发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.23808002471924, "api_error": null} {"episode_id": "SQ2_TP_B_0217", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0217.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260846, "scenario_id": "WD-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-02T07:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在无人使用时触发报警,且长时间未恢复,存在漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:09 卫生间漏水传感器 (bathroom_water_leak) 报告 StateValue = True,表示检测到水。\",\n \"推理步骤2: 回溯上下文——06:55 卫生间有短暂人体活动(occupancy 从1变0仅持续52秒),之后无人再进入卫生间,说明漏水并非住户正在用水导致的误报。\",\n \"推理步骤3: 从 07:09 到日志结束(23:30),整整超过16小时内没有任何漏水传感器恢复为 False 的记录,说明漏水状态持续存在未被处理。\",\n \"推理步骤4: 07:18 住户出门(关厨房灯→玄关运动→手动开锁→开关门→自动上锁),家中无人,漏水无人处置,风险随时间累积。\",\n \"推理步骤5: 住户直到 18:10 才回家,期间漏水持续约11小时无人干预,可能造成地板、墙体或楼下邻居的水损。\"\n ],\n \"key_evidence\": [\n \"07:09 bathroom_water_leak | StateValue = True,漏水报警触发\",\n \"06:55 卫生间短暂占用后即无人,排除正常用水场景\",\n \"07:18 住户出门且门锁自动上锁,家中长时间无人\",\n \"整日日志中未出现漏水传感器恢复(StateValue = False)的记录\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水位置(马桶底部、水管接头、地漏周围等)\",\n \"如有智能水阀,建议联动漏水传感器自动关闭卫生间进水阀\",\n \"检查是否已造成积水或渗漏到楼下,必要时联系物业\",\n \"设置漏水报警的即时推送通知,确保住户外出时也能第一时间收到警报\",\n \"排查洗碗机(07:04 运行中)是否与卫生间管路有关联导致回水\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在无人使用时触发报警,且长时间未恢复,存在漏水风险。", "reasoning": ["推理步骤1: 07:09 卫生间漏水传感器 (bathroom_water_leak) 报告 StateValue = True,表示检测到水。", "推理步骤2: 回溯上下文——06:55 卫生间有短暂人体活动(occupancy 从1变0仅持续52秒),之后无人再进入卫生间,说明漏水并非住户正在用水导致的误报。", "推理步骤3: 从 07:09 到日志结束(23:30),整整超过16小时内没有任何漏水传感器恢复为 False 的记录,说明漏水状态持续存在未被处理。", "推理步骤4: 07:18 住户出门(关厨房灯→玄关运动→手动开锁→开关门→自动上锁),家中无人,漏水无人处置,风险随时间累积。", "推理步骤5: 住户直到 18:10 才回家,期间漏水持续约11小时无人干预,可能造成地板、墙体或楼下邻居的水损。"], "key_evidence": ["07:09 bathroom_water_leak | StateValue = True,漏水报警触发", "06:55 卫生间短暂占用后即无人,排除正常用水场景", "07:18 住户出门且门锁自动上锁,家中长时间无人", "整日日志中未出现漏水传感器恢复(StateValue = False)的记录"], "recommended_actions": ["立即检查卫生间漏水位置(马桶底部、水管接头、地漏周围等)", "如有智能水阀,建议联动漏水传感器自动关闭卫生间进水阀", "检查是否已造成积水或渗漏到楼下,必要时联系物业", "设置漏水报警的即时推送通知,确保住户外出时也能第一时间收到警报", "排查洗碗机(07:04 运行中)是否与卫生间管路有关联导致回水"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.274391651153564, "api_error": null} {"episode_id": "SQ2_TP_B_0214", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0214.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20260843, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-10T09:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和间歇性离线,疑似传感器故障,需排除火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.57°C,而同一时刻其他三个房间温度均在 24.5-24.7°C 范围内,厨房与全屋温差高达约 4°C,且此时灶具尚未开启(灶具 18:45 才开)。\",\n \"推理步骤2: 18:30 厨房温度进一步升至 28.70°C,仍然远高于其他房间(约 24.5°C),异常持续了至少 30 分钟,排除瞬时干扰的可能。\",\n \"推理步骤3: 18:46 灶具刚开启后,厨房温度传感器报告 MeasuredValue = None(离线/无效读数);19:52 灶具关闭后再次报告 None。传感器两次丢失数据,说明设备工作状态不稳定。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到与其他房间一致的水平(约 24.3°C),说明之前的高温读数并非真实环境温度持续升高,更像是传感器自身故障(如接触不良、元件老化导致的虚高读数)。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发,排除了实际火灾的可能性,但传感器故障意味着未来可能无法准确监测厨房温度,存在安全监控盲区。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突增至 2857(28.57°C),比其他房间高约 4°C,且灶具尚未开启\",\n \"18:30 厨房温度继续维持在 2870(28.70°C)的异常高位\",\n \"18:46 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,数据丢失\",\n \"19:00 之后厨房温度恢复正常,与其他房间一致,说明之前的高温非真实环境变化\",\n \"全程烟雾报警器未触发,排除实际火情\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,确认是否存在接触不良、元件老化或受热源干扰的情况\",\n \"清理或更换厨房温度传感器,确保其能稳定提供准确读数\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,并考虑增设备用温度监测手段\",\n \"检查传感器附近是否有新增热源(如电器、阳光直射)导致局部温度异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和间歇性离线,疑似传感器故障,需排除火灾隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.57°C,而同一时刻其他三个房间温度均在 24.5-24.7°C 范围内,厨房与全屋温差高达约 4°C,且此时灶具尚未开启(灶具 18:45 才开)。", "推理步骤2: 18:30 厨房温度进一步升至 28.70°C,仍然远高于其他房间(约 24.5°C),异常持续了至少 30 分钟,排除瞬时干扰的可能。", "推理步骤3: 18:46 灶具刚开启后,厨房温度传感器报告 MeasuredValue = None(离线/无效读数);19:52 灶具关闭后再次报告 None。传感器两次丢失数据,说明设备工作状态不稳定。", "推理步骤4: 19:00 之后厨房温度恢复到与其他房间一致的水平(约 24.3°C),说明之前的高温读数并非真实环境温度持续升高,更像是传感器自身故障(如接触不良、元件老化导致的虚高读数)。", "推理步骤5: 烟雾报警器在整个时段内未触发,排除了实际火灾的可能性,但传感器故障意味着未来可能无法准确监测厨房温度,存在安全监控盲区。"], "key_evidence": ["18:00 厨房温度突增至 2857(28.57°C),比其他房间高约 4°C,且灶具尚未开启", "18:30 厨房温度继续维持在 2870(28.70°C)的异常高位", "18:46 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,数据丢失", "19:00 之后厨房温度恢复正常,与其他房间一致,说明之前的高温非真实环境变化", "全程烟雾报警器未触发,排除实际火情"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,确认是否存在接触不良、元件老化或受热源干扰的情况", "清理或更换厨房温度传感器,确保其能稳定提供准确读数", "在传感器修复前,加强对厨房烟雾报警器的依赖,并考虑增设备用温度监测手段", "检查传感器附近是否有新增热源(如电器、阳光直射)导致局部温度异常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.147324323654175, "api_error": null} {"episode_id": "SQ2_TP_B_0220", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0220.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20260849, "scenario_id": "WD-03", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-14T16:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器持续报警超过30分钟,且无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 16:57 卫生间漏水传感器首次触发 StateValue=True,随后在 17:07 和 17:27 持续报告 True,说明漏水状态已持续至少30分钟未解除。\",\n \"推理步骤2: 在漏水报警期间,卫生间运动传感器没有任何占用事件(上一次卫生间活动是 08:48-09:06),说明无人进入卫生间查看或处理漏水。\",\n \"推理步骤3: 漏水传感器连续三次报告 True 而非自动恢复为 False,排除了瞬时误报的可能性,表明存在真实且持续的漏水。\",\n \"推理步骤4: 住户当时似乎在厨房区域活动(17:47 开始做饭),可能未注意到卫生间的漏水情况。\"\n ],\n \"key_evidence\": [\n \"16:57 bathroom_water_leak StateValue=True(首次报警)\",\n \"17:07 bathroom_water_leak StateValue=True(10分钟后仍在漏水)\",\n \"17:27 bathroom_water_leak StateValue=True(30分钟后仍在漏水)\",\n \"漏水期间卫生间无任何人员活动记录,无人处理\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送高优先级漏水警报通知\",\n \"如果家中有智能水阀,建议自动关闭卫生间供水总阀\",\n \"住户应尽快前往卫生间检查漏水源头(可能是水管接头、马桶底座密封圈或淋浴软管)\",\n \"检查漏水是否已蔓延至相邻区域,防止地板和墙体水损\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器持续报警超过30分钟,且无人处理,存在水损风险。", "reasoning": ["推理步骤1: 16:57 卫生间漏水传感器首次触发 StateValue=True,随后在 17:07 和 17:27 持续报告 True,说明漏水状态已持续至少30分钟未解除。", "推理步骤2: 在漏水报警期间,卫生间运动传感器没有任何占用事件(上一次卫生间活动是 08:48-09:06),说明无人进入卫生间查看或处理漏水。", "推理步骤3: 漏水传感器连续三次报告 True 而非自动恢复为 False,排除了瞬时误报的可能性,表明存在真实且持续的漏水。", "推理步骤4: 住户当时似乎在厨房区域活动(17:47 开始做饭),可能未注意到卫生间的漏水情况。"], "key_evidence": ["16:57 bathroom_water_leak StateValue=True(首次报警)", "17:07 bathroom_water_leak StateValue=True(10分钟后仍在漏水)", "17:27 bathroom_water_leak StateValue=True(30分钟后仍在漏水)", "漏水期间卫生间无任何人员活动记录,无人处理"], "recommended_actions": ["立即向住户发送高优先级漏水警报通知", "如果家中有智能水阀,建议自动关闭卫生间供水总阀", "住户应尽快前往卫生间检查漏水源头(可能是水管接头、马桶底座密封圈或淋浴软管)", "检查漏水是否已蔓延至相邻区域,防止地板和墙体水损"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.26845908164978, "api_error": null} {"episode_id": "SQ2_TP_B_0225", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0225.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20260854, "scenario_id": "WD-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-10T09:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在住户外出期间持续报警超过30分钟,存在真实漏水风险,且当前无人在家处理。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:16 手动开锁出门,门锁自动上锁,之后整个上午家中无任何运动传感器触发、无灯光操作,判断为无人在家状态。\",\n \"推理步骤2: 09:31 卫生间漏水传感器首次报告 StateValue=True,随后在 09:41 和 10:01 持续报告 True,说明漏水状态至少持续了 30 分钟未消除。\",\n \"推理步骤3: 漏水传感器连续三次报警而非单次触发,排除了传感器偶发误报的可能性;如果是短暂溅水,传感器应在数分钟内恢复 False。\",\n \"推理步骤4: 住户直到 16:02 才有开门记录(且该次进入后未见任何处理漏水的操作),18:20 正式回家。漏水在无人状态下长时间未被处理,可能造成地板、墙体浸泡损坏,甚至渗漏到楼下。\",\n \"推理步骤5: 其余事件均属正常生活模式——早起做饭出门、傍晚回家开空调做饭、晚间关灯就寝,入户门锁操作均为手动开锁+自动上锁的正常序列,厨房温度传感器在灶具使用期间报 None 属于高温保护的已知行为。\"\n ],\n \"key_evidence\": [\n \"09:31、09:41、10:01 卫生间漏水传感器连续三次报告 StateValue=True,持续时间≥30分钟\",\n \"07:16 住户出门后至 16:02 期间家中无人(无运动传感器触发、无设备操作),漏水无人处理\",\n \"漏水报警后日志中未出现 StateValue=False 的恢复记录,说明漏水状态可能一直持续\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送漏水紧急通知,提醒尽快回家检查或联系物业\",\n \"如果智能家居系统接入了电磁水阀,建议自动关闭卫生间进水总阀以止损\",\n \"检查卫生间水管接头、马桶底座密封圈、热水器等可能的漏水源\",\n \"漏水解除后对传感器进行校准测试,确认其工作正常\",\n \"考虑在卫生间加装智能水阀联动规则:漏水传感器触发时自动关阀\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在住户外出期间持续报警超过30分钟,存在真实漏水风险,且当前无人在家处理。", "reasoning": ["推理步骤1: 住户于 07:16 手动开锁出门,门锁自动上锁,之后整个上午家中无任何运动传感器触发、无灯光操作,判断为无人在家状态。", "推理步骤2: 09:31 卫生间漏水传感器首次报告 StateValue=True,随后在 09:41 和 10:01 持续报告 True,说明漏水状态至少持续了 30 分钟未消除。", "推理步骤3: 漏水传感器连续三次报警而非单次触发,排除了传感器偶发误报的可能性;如果是短暂溅水,传感器应在数分钟内恢复 False。", "推理步骤4: 住户直到 16:02 才有开门记录(且该次进入后未见任何处理漏水的操作),18:20 正式回家。漏水在无人状态下长时间未被处理,可能造成地板、墙体浸泡损坏,甚至渗漏到楼下。", "推理步骤5: 其余事件均属正常生活模式——早起做饭出门、傍晚回家开空调做饭、晚间关灯就寝,入户门锁操作均为手动开锁+自动上锁的正常序列,厨房温度传感器在灶具使用期间报 None 属于高温保护的已知行为。"], "key_evidence": ["09:31、09:41、10:01 卫生间漏水传感器连续三次报告 StateValue=True,持续时间≥30分钟", "07:16 住户出门后至 16:02 期间家中无人(无运动传感器触发、无设备操作),漏水无人处理", "漏水报警后日志中未出现 StateValue=False 的恢复记录,说明漏水状态可能一直持续"], "recommended_actions": ["立即向住户手机推送漏水紧急通知,提醒尽快回家检查或联系物业", "如果智能家居系统接入了电磁水阀,建议自动关闭卫生间进水总阀以止损", "检查卫生间水管接头、马桶底座密封圈、热水器等可能的漏水源", "漏水解除后对传感器进行校准测试,确认其工作正常", "考虑在卫生间加装智能水阀联动规则:漏水传感器触发时自动关阀"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.95172691345215, "api_error": null} {"episode_id": "SQ2_TP_B_0229", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0229.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20260858, "scenario_id": "INS-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T04:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障,同时厨房窗户在深夜仍处于开启状态未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.5°C 飙升至 28.7°C,而同一时刻其他房间温度均在 24.5°C 左右,厨房与全屋温差高达 4°C 以上。此时灶具尚未开启(18:51 才开),无合理热源解释这一跳变。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.63°C,持续异常。但 18:52 灶具刚开启时,传感器读数变为 None(数据丢失);19:39 灶具关闭后,传感器再次报告 None。正常传感器不应在工作期间反复丢失数据,这是典型的传感器故障或通信异常表现。\",\n \"推理步骤3: 19:00 厨房温度突然恢复到 24.45°C(与其他房间一致),说明 18:00-18:30 的 28.7°C 高温读数很可能是传感器漂移或误报,而非真实环境温度。传感器在「异常高温→数据丢失→恢复正常」之间反复切换,进一步印证硬件故障。\",\n \"推理步骤4: 04:33 客厅窗户传感器报告 StateValue=False(窗户打开),但整个日志中没有对应的关闭事件(StateValue=True)。同样,19:38 厨房窗户打开后也无关闭记录。深夜住户已入睡(22:05 关灯锁门),窗户持续开启存在安全隐患。\",\n \"推理步骤5: 其余事件均属正常生活模式:早起如厕(04:33/06:26)、早餐后出门上班(07:20 手动开锁出门、自动锁门)、傍晚回家(18:02)、做饭(18:51-19:38)、洗碗机运行(20:08)、睡前关灯关空调(22:05)。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突跳至 2870(28.7°C),较其他房间高出约 4°C,且灶具当时未开启\",\n \"18:30 厨房温度仍为 2863(28.63°C),持续异常偏高\",\n \"18:52 和 19:39 厨房温度传感器两次报告 MeasuredValue = None,数据丢失\",\n \"19:00 厨房温度突然恢复正常(2445),说明此前高温为传感器误报\",\n \"客厅窗户(04:33 开启)和厨房窗户(19:38 开启)在日志中均无关闭记录,深夜仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除接触不良、积灰或老化导致的读数漂移和数据丢失问题\",\n \"关闭厨房窗户和客厅窗户,或设置自动化规则在睡前(如 22:00)检查所有窗户状态并提醒关闭\",\n \"为厨房温度传感器设置合理性校验规则:当读数在短时间内跳变超过 3°C 或出现 None 时,触发告警而非直接采信数据\",\n \"考虑为厨房增加备用温度传感器,与烟雾报警器联动,避免因单一传感器故障导致火灾风险漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障,同时厨房窗户在深夜仍处于开启状态未关闭。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.5°C 飙升至 28.7°C,而同一时刻其他房间温度均在 24.5°C 左右,厨房与全屋温差高达 4°C 以上。此时灶具尚未开启(18:51 才开),无合理热源解释这一跳变。", "推理步骤2: 18:30 厨房温度仍高达 28.63°C,持续异常。但 18:52 灶具刚开启时,传感器读数变为 None(数据丢失);19:39 灶具关闭后,传感器再次报告 None。正常传感器不应在工作期间反复丢失数据,这是典型的传感器故障或通信异常表现。", "推理步骤3: 19:00 厨房温度突然恢复到 24.45°C(与其他房间一致),说明 18:00-18:30 的 28.7°C 高温读数很可能是传感器漂移或误报,而非真实环境温度。传感器在「异常高温→数据丢失→恢复正常」之间反复切换,进一步印证硬件故障。", "推理步骤4: 04:33 客厅窗户传感器报告 StateValue=False(窗户打开),但整个日志中没有对应的关闭事件(StateValue=True)。同样,19:38 厨房窗户打开后也无关闭记录。深夜住户已入睡(22:05 关灯锁门),窗户持续开启存在安全隐患。", "推理步骤5: 其余事件均属正常生活模式:早起如厕(04:33/06:26)、早餐后出门上班(07:20 手动开锁出门、自动锁门)、傍晚回家(18:02)、做饭(18:51-19:38)、洗碗机运行(20:08)、睡前关灯关空调(22:05)。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。"], "key_evidence": ["18:00 厨房温度突跳至 2870(28.7°C),较其他房间高出约 4°C,且灶具当时未开启", "18:30 厨房温度仍为 2863(28.63°C),持续异常偏高", "18:52 和 19:39 厨房温度传感器两次报告 MeasuredValue = None,数据丢失", "19:00 厨房温度突然恢复正常(2445),说明此前高温为传感器误报", "客厅窗户(04:33 开启)和厨房窗户(19:38 开启)在日志中均无关闭记录,深夜仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除接触不良、积灰或老化导致的读数漂移和数据丢失问题", "关闭厨房窗户和客厅窗户,或设置自动化规则在睡前(如 22:00)检查所有窗户状态并提醒关闭", "为厨房温度传感器设置合理性校验规则:当读数在短时间内跳变超过 3°C 或出现 None 时,触发告警而非直接采信数据", "考虑为厨房增加备用温度传感器,与烟雾报警器联动,避免因单一传感器故障导致火灾风险漏报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.047247886657715, "api_error": null} {"episode_id": "SQ2_TP_B_0230", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0230.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20260859, "scenario_id": "WD-01", "total_events": 233, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-15T15:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在住户外出期间触发报警,且持续数小时无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 15:45 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,触发漏水事件。\",\n \"推理步骤2: 住户于 07:18 出门(前门解锁→开门→关门→自动上锁),直到 18:30 才回家(前门解锁→开门→进入玄关→客厅),说明 15:45 漏水发生时家中无人。\",\n \"推理步骤3: 从 15:45 漏水触发到 18:30 住户回家,漏水状态持续了约 2 小时 45 分钟,期间无任何人为干预或传感器恢复正常的记录。\",\n \"推理步骤4: 整个日志中未出现 bathroom_water_leak StateValue=False 的恢复事件,说明截至日志结束(23:30)漏水状态可能仍未解除。\",\n \"推理步骤5: 卫生间当天早晨 06:31 有人使用过(运动传感器触发、灯亮),可能与水管或设备(如马桶、水龙头)未完全关闭有关。\"\n ],\n \"key_evidence\": [\n \"15:45 bathroom_water_leak StateValue=True 且触发 StateChange 事件\",\n \"07:18 住户出门后家中无人,15:45~18:30 期间无任何运动传感器或灯光活动\",\n \"全天日志中未出现漏水传感器恢复(StateValue=False)的记录\",\n \"06:31 卫生间有约 20 分钟的使用记录,可能是漏水源头\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送漏水警报通知,提示尽快检查卫生间\",\n \"如果智能家居系统接入了电磁水阀,建议自动关闭卫生间供水总阀以止损\",\n \"住户回家后应优先检查卫生间地面、马桶底部、水管接口及洗手盆下方是否有积水\",\n \"检查漏水传感器当前状态,确认是否仍在报警;若已干燥但未自动恢复,可能需要检查传感器本身\",\n \"长期建议:设置漏水联动自动化规则,漏水触发时自动关阀并发送紧急通知\"\n ]\n}\n```\n\n补充说明几个次要观察点(未达到独立告警级别,但值得关注):\n\n1. **厨房温度异常飙升**:18:00 和 18:30 厨房温度传感器读数分别为 2858 和 2864(约 28.6°C),而同时段其他房间约 24.5°C,偏高约 4°C。随后 18:52 和 19:26 两次报告 `None` 值。这可能是灶具使用前的余热或传感器短暂故障,但住户 18:51 才开灶,时间线上温度先于开灶升高,值得留意传感器是否工作正常。\n\n2. **厨房窗户未关闭**:19:25 关灶后打开了厨房窗户通风(`kitchen_window_contact = False`),但日志中未见关闭记录。夜间窗户敞开存在一定安全隐患。\n\n3. **入户门状态**:18:30 住户回家时前门开启(`StateValue=False`),但直到 21:48 才记录关门上锁,中间约 3 小时 18 分钟门处于开启状态。如果这不是传感器延迟上报,建议确认门是否确实长时间未关。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在住户外出期间触发报警,且持续数小时无人处理,存在水损风险。", "reasoning": ["推理步骤1: 15:45 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,触发漏水事件。", "推理步骤2: 住户于 07:18 出门(前门解锁→开门→关门→自动上锁),直到 18:30 才回家(前门解锁→开门→进入玄关→客厅),说明 15:45 漏水发生时家中无人。", "推理步骤3: 从 15:45 漏水触发到 18:30 住户回家,漏水状态持续了约 2 小时 45 分钟,期间无任何人为干预或传感器恢复正常的记录。", "推理步骤4: 整个日志中未出现 bathroom_water_leak StateValue=False 的恢复事件,说明截至日志结束(23:30)漏水状态可能仍未解除。", "推理步骤5: 卫生间当天早晨 06:31 有人使用过(运动传感器触发、灯亮),可能与水管或设备(如马桶、水龙头)未完全关闭有关。"], "key_evidence": ["15:45 bathroom_water_leak StateValue=True 且触发 StateChange 事件", "07:18 住户出门后家中无人,15:45~18:30 期间无任何运动传感器或灯光活动", "全天日志中未出现漏水传感器恢复(StateValue=False)的记录", "06:31 卫生间有约 20 分钟的使用记录,可能是漏水源头"], "recommended_actions": ["立即向住户手机推送漏水警报通知,提示尽快检查卫生间", "如果智能家居系统接入了电磁水阀,建议自动关闭卫生间供水总阀以止损", "住户回家后应优先检查卫生间地面、马桶底部、水管接口及洗手盆下方是否有积水", "检查漏水传感器当前状态,确认是否仍在报警;若已干燥但未自动恢复,可能需要检查传感器本身", "长期建议:设置漏水联动自动化规则,漏水触发时自动关阀并发送紧急通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.71486496925354, "api_error": null} {"episode_id": "SQ2_TP_B_0231", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0231.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20260860, "scenario_id": "INS-02", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-24T23:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"深夜23:14,入户门锁在短时间内连续4次解锁失败并触发强制入侵报警,高度疑似非法闯入尝试。\",\n \"reasoning\": [\n \"推理步骤1: 住户在22:35已关闭客厅灯和空调、拉上主卧窗帘、关闭主卧灯并确认入户门已关闭(BooleanState=True)且自动上锁(LockState=1),表明住户已就寝,家中处于夜间安防状态。\",\n \"推理步骤2: 23:14:00起,入户门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1 表示凭证无效,OperationSource=3 表示来自外部物理操作如键盘/指纹),说明有人在门外反复尝试用错误凭证开锁。\",\n \"推理步骤3: 23:14:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应强制入侵报警(Forced Door Open / Wrong Entry),这是门锁内置安全机制在检测到多次非法尝试后主动发出的最高级别警报。\",\n \"推理步骤4: 当天仅有一位住户(早晨6:02起床、7:44出门、18:08回家),全天的开锁操作均为 Manual/Auto 且成功,从未出现过错误。深夜的连续失败操作与住户正常行为模式完全不符。\",\n \"推理步骤5: 玄关运动传感器在该时段未报告占用(住户在主卧),进一步排除了住户自己在门口操作的可能性。\"\n ],\n \"key_evidence\": [\n \"23:14:00~23:14:40 连续4次 LockOperationError(OperationError=1, OperationSource=3)——无效凭证、外部物理操作源\",\n \"23:14:50 触发 DoorLockAlarm(AlarmCode=3)——强制入侵报警\",\n \"22:35 住户已就寝,门已锁定(LockState=1),深夜无任何合法开门需求\",\n \"全天正常开锁记录均为成功操作,无任何失败记录,排除设备故障可能\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵警报,确认住户是否安全\",\n \"自动开启玄关区域的灯光和录像(如有摄像头),起到威慑和取证作用\",\n \"如住户确认非本人操作,立即联系物业安保或报警(110)\",\n \"临时启用门锁锁定模式(Lockout),在一定时间内禁止外部解锁尝试,防止暴力破解\",\n \"事后检查门锁是否有物理损坏痕迹,并考虑更换更高安全等级的锁芯或增加门口监控设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "深夜23:14,入户门锁在短时间内连续4次解锁失败并触发强制入侵报警,高度疑似非法闯入尝试。", "reasoning": ["推理步骤1: 住户在22:35已关闭客厅灯和空调、拉上主卧窗帘、关闭主卧灯并确认入户门已关闭(BooleanState=True)且自动上锁(LockState=1),表明住户已就寝,家中处于夜间安防状态。", "推理步骤2: 23:14:00起,入户门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1 表示凭证无效,OperationSource=3 表示来自外部物理操作如键盘/指纹),说明有人在门外反复尝试用错误凭证开锁。", "推理步骤3: 23:14:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应强制入侵报警(Forced Door Open / Wrong Entry),这是门锁内置安全机制在检测到多次非法尝试后主动发出的最高级别警报。", "推理步骤4: 当天仅有一位住户(早晨6:02起床、7:44出门、18:08回家),全天的开锁操作均为 Manual/Auto 且成功,从未出现过错误。深夜的连续失败操作与住户正常行为模式完全不符。", "推理步骤5: 玄关运动传感器在该时段未报告占用(住户在主卧),进一步排除了住户自己在门口操作的可能性。"], "key_evidence": ["23:14:00~23:14:40 连续4次 LockOperationError(OperationError=1, OperationSource=3)——无效凭证、外部物理操作源", "23:14:50 触发 DoorLockAlarm(AlarmCode=3)——强制入侵报警", "22:35 住户已就寝,门已锁定(LockState=1),深夜无任何合法开门需求", "全天正常开锁记录均为成功操作,无任何失败记录,排除设备故障可能"], "recommended_actions": ["立即向住户手机推送高优先级入侵警报,确认住户是否安全", "自动开启玄关区域的灯光和录像(如有摄像头),起到威慑和取证作用", "如住户确认非本人操作,立即联系物业安保或报警(110)", "临时启用门锁锁定模式(Lockout),在一定时间内禁止外部解锁尝试,防止暴力破解", "事后检查门锁是否有物理损坏痕迹,并考虑更换更高安全等级的锁芯或增加门口监控设备"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.656278610229492, "api_error": null} {"episode_id": "SQ2_TP_B_0239", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0239.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20260868, "scenario_id": "INS-04", "total_events": 237, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-08T10:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2458(24.58°C)跳升至 2837(28.37°C),而同一时刻其他房间温度仅在 24.3°C 左右,温差近 4°C 属于异常跳变\",\n \"推理步骤2: 19:03 灶具开启后,19:04 厨房温度传感器报告 MeasuredValue = None(空值),表明传感器读数丢失;19:33 灶具关闭后 19:34 再次报告 None,说明传感器在灶具使用前后均出现故障\",\n \"推理步骤3: 19:30 传感器恢复报告时读数为 2841(28.41°C),但到 20:00 已回落至 2409(24.09°C),这种先异常高再骤降的模式不符合正常烹饪散热曲线\",\n \"推理步骤4: 灶具正常使用(19:03-19:33 约 30 分钟)本身不构成安全威胁,烟雾报警器未触发,排除火灾风险;但传感器两次报 null 值意味着在关键时刻失去了温度监控能力\",\n \"推理步骤5: 厨房窗户在 19:33:30 打开通风属于正常操作,但日志中未见窗户关闭事件,结合当前无人在家(22:07 已离开),窗户可能仍处于开启状态\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.6°C 异常跳升至 28.37°C(灶具尚未开启)\",\n \"19:04 和 19:34 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 读数 2841 与 20:00 读数 2409 之间存在约 4.3°C 的异常落差\",\n \"厨房窗户 19:33:30 打开后日志中无关闭记录,住户 22:07 已离家\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号\",\n \"排查传感器硬件是否存在故障,两次 null 读数可能表明传感器间歇性失效\",\n \"确认厨房窗户当前状态,若仍开启建议远程提醒住户或自动关闭,避免夜间安全隐患\",\n \"考虑为厨房温度传感器设置异常值过滤规则,当读数为 null 时触发告警以确保监控连续性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2458(24.58°C)跳升至 2837(28.37°C),而同一时刻其他房间温度仅在 24.3°C 左右,温差近 4°C 属于异常跳变", "推理步骤2: 19:03 灶具开启后,19:04 厨房温度传感器报告 MeasuredValue = None(空值),表明传感器读数丢失;19:33 灶具关闭后 19:34 再次报告 None,说明传感器在灶具使用前后均出现故障", "推理步骤3: 19:30 传感器恢复报告时读数为 2841(28.41°C),但到 20:00 已回落至 2409(24.09°C),这种先异常高再骤降的模式不符合正常烹饪散热曲线", "推理步骤4: 灶具正常使用(19:03-19:33 约 30 分钟)本身不构成安全威胁,烟雾报警器未触发,排除火灾风险;但传感器两次报 null 值意味着在关键时刻失去了温度监控能力", "推理步骤5: 厨房窗户在 19:33:30 打开通风属于正常操作,但日志中未见窗户关闭事件,结合当前无人在家(22:07 已离开),窗户可能仍处于开启状态"], "key_evidence": ["19:00 厨房温度从 ~24.6°C 异常跳升至 28.37°C(灶具尚未开启)", "19:04 和 19:34 厨房温度传感器两次报告 MeasuredValue = None", "19:30 读数 2841 与 20:00 读数 2409 之间存在约 4.3°C 的异常落差", "厨房窗户 19:33:30 打开后日志中无关闭记录,住户 22:07 已离家"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号", "排查传感器硬件是否存在故障,两次 null 读数可能表明传感器间歇性失效", "确认厨房窗户当前状态,若仍开启建议远程提醒住户或自动关闭,避免夜间安全隐患", "考虑为厨房温度传感器设置异常值过滤规则,当读数为 null 时触发告警以确保监控连续性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.718899965286255, "api_error": null} {"episode_id": "SQ2_TP_B_0241", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0241.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20260870, "scenario_id": "FG-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-14T13:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在13:13-13:23期间出现异常高温并触发烟雾报警,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 13:00时厨房温度为25.54°C,属于正常范围,与其他房间一致。\",\n \"推理步骤2: 13:13时厨房温度骤升至35.89°C,仅13分钟内上升超过10°C,而同时段其他房间温度无变化,排除全屋升温的可能。\",\n \"推理步骤3: 13:18时厨房温度为32.00°C(略有回落但仍远高于正常值),说明高温持续存在。\",\n \"推理步骤4: 13:23时厨房烟雾报警器 SmokeState=1(告警状态),进一步印证厨房存在烟雾或燃烧产物。\",\n \"推理步骤5: 13:30时厨房温度回落至25.64°C,烟雾报警未见后续持续触发,说明事件可能已被处置或自行缓解,但不排除残留隐患。\",\n \"推理步骤6: 温度异常仅出现在厨房,结合该区域有灶具(kitchen_cook_surface),最可能的场景是灶具使用不当导致油烟/干烧/食物烧焦,引发局部高温和烟雾。\"\n ],\n \"key_evidence\": [\n \"13:13 厨房温度从25.54°C骤升至35.89°C,13分钟内升幅超10°C\",\n \"13:18 厨房温度仍高达32.00°C\",\n \"13:23 厨房烟雾报警器触发 SmokeState=1\",\n \"同时段客厅、主卧、次卧温度均无异常波动,异常仅限厨房\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具是否已关闭,确认无明火或阴燃\",\n \"检查厨房是否有食物烧焦、油锅过热等情况并清理\",\n \"开窗或开启排风扇通风,排出残余烟雾\",\n \"确认烟雾报警器已恢复正常状态(SmokeState=0),若持续告警需现场排查\",\n \"检查灶具周围是否有易燃物,排除复燃风险\",\n \"考虑为灶具设置无人看管自动关火的自动化规则,防止类似事件再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在13:13-13:23期间出现异常高温并触发烟雾报警,存在火灾风险。", "reasoning": ["推理步骤1: 13:00时厨房温度为25.54°C,属于正常范围,与其他房间一致。", "推理步骤2: 13:13时厨房温度骤升至35.89°C,仅13分钟内上升超过10°C,而同时段其他房间温度无变化,排除全屋升温的可能。", "推理步骤3: 13:18时厨房温度为32.00°C(略有回落但仍远高于正常值),说明高温持续存在。", "推理步骤4: 13:23时厨房烟雾报警器 SmokeState=1(告警状态),进一步印证厨房存在烟雾或燃烧产物。", "推理步骤5: 13:30时厨房温度回落至25.64°C,烟雾报警未见后续持续触发,说明事件可能已被处置或自行缓解,但不排除残留隐患。", "推理步骤6: 温度异常仅出现在厨房,结合该区域有灶具(kitchen_cook_surface),最可能的场景是灶具使用不当导致油烟/干烧/食物烧焦,引发局部高温和烟雾。"], "key_evidence": ["13:13 厨房温度从25.54°C骤升至35.89°C,13分钟内升幅超10°C", "13:18 厨房温度仍高达32.00°C", "13:23 厨房烟雾报警器触发 SmokeState=1", "同时段客厅、主卧、次卧温度均无异常波动,异常仅限厨房"], "recommended_actions": ["立即检查厨房灶具是否已关闭,确认无明火或阴燃", "检查厨房是否有食物烧焦、油锅过热等情况并清理", "开窗或开启排风扇通风,排出残余烟雾", "确认烟雾报警器已恢复正常状态(SmokeState=0),若持续告警需现场排查", "检查灶具周围是否有易燃物,排除复燃风险", "考虑为灶具设置无人看管自动关火的自动化规则,防止类似事件再次发生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.02317476272583, "api_error": null} {"episode_id": "SQ2_TP_B_0253", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0253.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20260882, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-02T01:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2456(24.56°C)跳升至 2828(28.28°C),而同一时刻其他房间温度均在 24.2-24.3°C 范围,单个房间在 30 分钟内跳升近 4°C 不合常理——此时灶具尚未开启(19:14 才开启),说明该跳变并非烹饪导致\",\n \"推理步骤2: 19:15 和 19:45 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器读数丢失。正常传感器不应出现 null 读数,这是设备故障的典型信号\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2840(28.40°C),仍然异常偏高。但到 20:00 读数回落至 2406(24.06°C),与其他房间一致,说明传感器间歇性恢复正常\",\n \"推理步骤4: 排除火灾风险——厨房烟雾报警器全天无任何触发事件,灶具在 19:14-19:44 正常使用约 30 分钟后关闭,19:44 还开窗通风,整体烹饪流程合理\",\n \"推理步骤5: 其余家庭活动均正常:凌晨 01:24 有人回家(密码开锁+运动传感器联动)、07:40 出门上班(手动开锁-关门-自动上锁)、18:25 下班回家(开灯开空调)、21:49 睡前确认门锁,全天温度曲线符合夏季昼夜变化规律\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2456 异常跳升至 2828,此时灶具尚未开启,其他房间温度正常\",\n \"19:15 和 19:45 厨房温度传感器连续两次报告 MeasuredValue = None\",\n \"19:30 传感器读数 2840 仍异常偏高,20:00 自行恢复至 2406\",\n \"全天厨房烟雾报警器未触发,排除真实火灾\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰\",\n \"检查该传感器的电池电量和通信状态,null 读数可能是电量不足或无线连接不稳定所致\",\n \"持续观察未来几天该传感器是否再次出现异常跳变或 null 值,若反复出现建议更换传感器\",\n \"考虑将厨房温度传感器迁移到远离灶具的位置,避免烹饪时的热辐射影响读数准确性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2456(24.56°C)跳升至 2828(28.28°C),而同一时刻其他房间温度均在 24.2-24.3°C 范围,单个房间在 30 分钟内跳升近 4°C 不合常理——此时灶具尚未开启(19:14 才开启),说明该跳变并非烹饪导致", "推理步骤2: 19:15 和 19:45 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器读数丢失。正常传感器不应出现 null 读数,这是设备故障的典型信号", "推理步骤3: 19:30 传感器恢复后读数为 2840(28.40°C),仍然异常偏高。但到 20:00 读数回落至 2406(24.06°C),与其他房间一致,说明传感器间歇性恢复正常", "推理步骤4: 排除火灾风险——厨房烟雾报警器全天无任何触发事件,灶具在 19:14-19:44 正常使用约 30 分钟后关闭,19:44 还开窗通风,整体烹饪流程合理", "推理步骤5: 其余家庭活动均正常:凌晨 01:24 有人回家(密码开锁+运动传感器联动)、07:40 出门上班(手动开锁-关门-自动上锁)、18:25 下班回家(开灯开空调)、21:49 睡前确认门锁,全天温度曲线符合夏季昼夜变化规律"], "key_evidence": ["19:00 厨房温度从 2456 异常跳升至 2828,此时灶具尚未开启,其他房间温度正常", "19:15 和 19:45 厨房温度传感器连续两次报告 MeasuredValue = None", "19:30 传感器读数 2840 仍异常偏高,20:00 自行恢复至 2406", "全天厨房烟雾报警器未触发,排除真实火灾"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰", "检查该传感器的电池电量和通信状态,null 读数可能是电量不足或无线连接不稳定所致", "持续观察未来几天该传感器是否再次出现异常跳变或 null 值,若反复出现建议更换传感器", "考虑将厨房温度传感器迁移到远离灶具的位置,避免烹饪时的热辐射影响读数准确性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.79597306251526, "api_error": null} {"episode_id": "SQ2_TP_B_0260", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0260.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260889, "scenario_id": "INS-05", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-11T10:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 10:13 有人通过远程方式开锁进入但未关门/锁门,16:01 开锁进入后同样长时间未见关门记录,存在入户门未关闭的安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:04、07:31、18:30、19:27 四次报告 MeasuredValue = None。前两次发生在早晨做饭前后,后两次发生在晚间做饭前后。虽然做饭时温度骤变可能导致传感器短暂超量程,但正常传感器应报告数值而非 None,这表明传感器可能存在间歇性故障或通信中断。\",\n \"推理步骤2: 10:13 入户门通过 OperationSource=8(远程/App)开锁,UserIndex=1,随后门传感器显示门打开(StateValue=False),玄关和客厅检测到有人,但日志中没有后续的关门(StateValue=True)和上锁记录,直到 22:13 才出现 front_door_contact=True 和自动上锁。这意味着入户门从 10:13 到 22:13 约 12 小时处于未关闭或未上锁状态。\",\n \"推理步骤3: 16:01 手动开锁进入,门传感器显示门打开(StateValue=False),同样没有后续关门记录。结合 10:13 的情况,入户门在白天长时间未关闭,存在入侵风险。\",\n \"推理步骤4: 其余行为模式基本正常——06:13 起床开灯、07:03 做早饭、07:44 出门并自动锁门、18:16 回家开灯开空调、18:29 做晚饭、19:59 开洗碗机、22:13 睡前关灯锁门,符合单人居住的日常作息。\",\n \"推理步骤5: 温度整体趋势合理(夜间约 23°C,午间峰值约 25.8°C,晚间回落),各房间温度一致,无异常热源迹象。烟雾报警器全天无触发,无漏水报警,无火灾或水灾风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:04、07:31、18:30、19:27 四次报告 MeasuredValue = None,指示传感器间歇性故障\",\n \"10:13 远程开锁(OperationSource=8)后,front_door_contact 显示门打开(StateValue=False),但直到 22:13 才有关门和上锁记录,门可能长达约 12 小时未关闭\",\n \"16:01 手动开锁后门传感器同样显示门打开,无后续关门记录\",\n \"07:30 和 19:26 做饭后开厨房窗户(kitchen_window_contact=False),但全天无关窗记录,窗户可能一直处于打开状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,确认是否需要更换或重新配对\",\n \"检查入户门锁的自动关门/自动上锁策略,建议启用门未关闭超时告警(如门打开超过 5 分钟未关闭则推送提醒)\",\n \"确认 10:13 的远程开锁操作是否为户主本人操作,排除账号被盗用的可能\",\n \"检查厨房窗户是否仍处于打开状态,夜间无人时建议关闭窗户以保障安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 10:13 有人通过远程方式开锁进入但未关门/锁门,16:01 开锁进入后同样长时间未见关门记录,存在入户门未关闭的安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:04、07:31、18:30、19:27 四次报告 MeasuredValue = None。前两次发生在早晨做饭前后,后两次发生在晚间做饭前后。虽然做饭时温度骤变可能导致传感器短暂超量程,但正常传感器应报告数值而非 None,这表明传感器可能存在间歇性故障或通信中断。", "推理步骤2: 10:13 入户门通过 OperationSource=8(远程/App)开锁,UserIndex=1,随后门传感器显示门打开(StateValue=False),玄关和客厅检测到有人,但日志中没有后续的关门(StateValue=True)和上锁记录,直到 22:13 才出现 front_door_contact=True 和自动上锁。这意味着入户门从 10:13 到 22:13 约 12 小时处于未关闭或未上锁状态。", "推理步骤3: 16:01 手动开锁进入,门传感器显示门打开(StateValue=False),同样没有后续关门记录。结合 10:13 的情况,入户门在白天长时间未关闭,存在入侵风险。", "推理步骤4: 其余行为模式基本正常——06:13 起床开灯、07:03 做早饭、07:44 出门并自动锁门、18:16 回家开灯开空调、18:29 做晚饭、19:59 开洗碗机、22:13 睡前关灯锁门,符合单人居住的日常作息。", "推理步骤5: 温度整体趋势合理(夜间约 23°C,午间峰值约 25.8°C,晚间回落),各房间温度一致,无异常热源迹象。烟雾报警器全天无触发,无漏水报警,无火灾或水灾风险。"], "key_evidence": ["kitchen_temp_sensor 在 07:04、07:31、18:30、19:27 四次报告 MeasuredValue = None,指示传感器间歇性故障", "10:13 远程开锁(OperationSource=8)后,front_door_contact 显示门打开(StateValue=False),但直到 22:13 才有关门和上锁记录,门可能长达约 12 小时未关闭", "16:01 手动开锁后门传感器同样显示门打开,无后续关门记录", "07:30 和 19:26 做饭后开厨房窗户(kitchen_window_contact=False),但全天无关窗记录,窗户可能一直处于打开状态"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,确认是否需要更换或重新配对", "检查入户门锁的自动关门/自动上锁策略,建议启用门未关闭超时告警(如门打开超过 5 分钟未关闭则推送提醒)", "确认 10:13 的远程开锁操作是否为户主本人操作,排除账号被盗用的可能", "检查厨房窗户是否仍处于打开状态,夜间无人时建议关闭窗户以保障安全"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.046760320663452, "api_error": null} {"episode_id": "SQ2_TP_B_0261", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0261.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20260890, "scenario_id": "FG-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-12T11:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失,烟雾报警器电池低电量,同时厨房灶具使用期间传感器失联,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 厨房烟雾报警器在 6月11日 11:56 报告 BatteryAlert=1,表示电池电量低,报警器可能无法在紧急情况下正常工作。\",\n \"推理步骤2: 6月12日 19:00 厨房温度传感器读数突然从 ~2450(约24.5°C)跳升至 2827(约28.3°C),而同一时刻其他房间温度均在 2429-2442 范围内,厨房温度异常偏高约4°C,且此时灶具尚未开启(19:14 才开启),说明该读数不是烹饪导致的,传感器可能出现故障。\",\n \"推理步骤3: 19:15 和 19:28 厨房温度传感器连续两次报告 MeasuredValue=None,表明传感器在灶具使用期间(19:14-19:27)完全失联或故障,无法提供温度监测数据。\",\n \"推理步骤4: 19:30 传感器恢复后读数为 2837(约28.4°C),依然显著高于其他房间(~2437-2445),虽然灶具刚关闭(19:27)有余热是合理的,但结合之前的 None 值和 19:00 的异常跳变,传感器的可靠性存疑。\",\n \"推理步骤5: 12:06 也出现过一次异常——厨房温度从 2586 跳至 3046(约30.5°C),虽然灶具在 11:56 开启可以解释温度上升,但跳幅达 4.6°C 且烟雾报警器同时报告 SmokeState=0(正常),这个幅度仍然偏大,进一步佐证传感器可能存在间歇性故障。\",\n \"推理步骤6: 烟雾报警器低电量 + 温度传感器间歇性故障,意味着厨房的两道安全防线同时削弱。如果发生火灾或燃气泄漏,可能无法及时检测和报警。\"\n ],\n \"key_evidence\": [\n \"kitchen_smoke_alarm 在 6月11日 11:56 报告 BatteryAlert=1(电池低电量)\",\n \"kitchen_temp_sensor 在 19:00 读数异常跳升至 2827,灶具尚未开启,其他房间温度正常(~2430-2442)\",\n \"kitchen_temp_sensor 在 19:15 和 19:28 连续报告 MeasuredValue=None,灶具使用期间完全无温度数据\",\n \"kitchen_temp_sensor 在 12:06 读数从 2586 跳至 3046,跳幅异常\",\n \"19:30 恢复后读数 2837 仍显著高于其他房间约 4°C\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保报警功能正常\",\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除间歇性故障\",\n \"在温度传感器修复前,避免无人看管使用灶具,防止厨房安全监控盲区期间发生意外\",\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数异常波动\",\n \"考虑为厨房增加冗余温度监测设备,避免单点故障导致安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失,烟雾报警器电池低电量,同时厨房灶具使用期间传感器失联,存在安全监控盲区。", "reasoning": ["推理步骤1: 厨房烟雾报警器在 6月11日 11:56 报告 BatteryAlert=1,表示电池电量低,报警器可能无法在紧急情况下正常工作。", "推理步骤2: 6月12日 19:00 厨房温度传感器读数突然从 ~2450(约24.5°C)跳升至 2827(约28.3°C),而同一时刻其他房间温度均在 2429-2442 范围内,厨房温度异常偏高约4°C,且此时灶具尚未开启(19:14 才开启),说明该读数不是烹饪导致的,传感器可能出现故障。", "推理步骤3: 19:15 和 19:28 厨房温度传感器连续两次报告 MeasuredValue=None,表明传感器在灶具使用期间(19:14-19:27)完全失联或故障,无法提供温度监测数据。", "推理步骤4: 19:30 传感器恢复后读数为 2837(约28.4°C),依然显著高于其他房间(~2437-2445),虽然灶具刚关闭(19:27)有余热是合理的,但结合之前的 None 值和 19:00 的异常跳变,传感器的可靠性存疑。", "推理步骤5: 12:06 也出现过一次异常——厨房温度从 2586 跳至 3046(约30.5°C),虽然灶具在 11:56 开启可以解释温度上升,但跳幅达 4.6°C 且烟雾报警器同时报告 SmokeState=0(正常),这个幅度仍然偏大,进一步佐证传感器可能存在间歇性故障。", "推理步骤6: 烟雾报警器低电量 + 温度传感器间歇性故障,意味着厨房的两道安全防线同时削弱。如果发生火灾或燃气泄漏,可能无法及时检测和报警。"], "key_evidence": ["kitchen_smoke_alarm 在 6月11日 11:56 报告 BatteryAlert=1(电池低电量)", "kitchen_temp_sensor 在 19:00 读数异常跳升至 2827,灶具尚未开启,其他房间温度正常(~2430-2442)", "kitchen_temp_sensor 在 19:15 和 19:28 连续报告 MeasuredValue=None,灶具使用期间完全无温度数据", "kitchen_temp_sensor 在 12:06 读数从 2586 跳至 3046,跳幅异常", "19:30 恢复后读数 2837 仍显著高于其他房间约 4°C"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保报警功能正常", "检查厨房温度传感器硬件状态,清洁探头或更换设备,排除间歇性故障", "在温度传感器修复前,避免无人看管使用灶具,防止厨房安全监控盲区期间发生意外", "检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数异常波动", "考虑为厨房增加冗余温度监测设备,避免单点故障导致安全盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.64314341545105, "api_error": null} {"episode_id": "SQ2_TP_B_0269", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0269.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260898, "scenario_id": "FG-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-09T08:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"住户外出期间灶具持续运行无人看管,且厨房温度传感器存在故障,烟雾报警器电池低电量,多重安全防线失效。\",\n \"reasoning\": [\n \"推理步骤1: 07:03:32 灶具开启,但 07:12:07 厨房灯关闭、07:12:21 住户手动开锁出门、门自动上锁,表明住户已离家。灶具从未关闭,从 07:03 到 16:02 住户回家,灶具无人看管长达近 9 小时。\",\n \"推理步骤2: 08:34:00 日志显示灶具仍处于开启状态(kitchen_cook_surface | OnOff = True),08:44:00 厨房温度飙升至 3172(即 31.72°C),相比同时段其他房间的 ~24.5°C 高出约 7°C,这是灶具持续加热的直接证据。\",\n \"推理步骤3: 厨房温度传感器在 07:02、07:04、18:38、19:21 多次报告 MeasuredValue = None,说明传感器存在间歇性故障,无法持续监测厨房温度变化,削弱了火灾预警能力。\",\n \"推理步骤4: 08:44:00 烟雾报警器报告 SmokeState = 0(正常),但该报警器在前一天(06-08 08:34)已报告 BatteryAlert = 1(低电量警告),其可靠性存疑。低电量状态下报警器可能无法在关键时刻正常触发。\",\n \"推理步骤5: 07:01:30 厨房窗户打开(StateValue = False),灶具运行期间窗户保持开启状态,虽然有助于通风散热,但也意味着如果发生明火,外部气流可能助燃。\",\n \"推理步骤6: 16:02 住户回家后未见灶具关闭记录,直到 17:46 住户再次回家后 18:37:30 灶具才再次出现开启记录(可能是重新使用)。结合 16:02 回家时入户门未关闭(无 StateValue=True 记录)、未上锁的情况,住户可能只是短暂回来又离开,灶具安全隐患持续存在。\",\n \"推理步骤7: 综合来看——灶具长时间无人看管 + 温度传感器间歇性故障 + 烟雾报警器低电量,三重安全防线同时存在缺陷,构成严重的火灾风险。\"\n ],\n \"key_evidence\": [\n \"灶具 07:03:32 开启后住户 07:12:21 离家,灶具无人看管近 9 小时(至少到 08:34 仍确认开启)\",\n \"08:44:00 厨房温度骤升至 3172(31.72°C),比其他房间高约 7°C\",\n \"厨房温度传感器多次报告 None(07:02、07:04、18:38、19:21),存在间歇性故障\",\n \"烟雾报警器 06-08 已报告 BatteryAlert = 1(低电量),可靠性下降\",\n \"16:02 住户回家后入户门未见关闭和上锁记录,安全状态不明\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保报警功能正常\",\n \"检修或更换厨房温度传感器,解决间歇性读数为 None 的故障\",\n \"设置自动化规则:当住户离家(门锁上锁)时检测灶具状态,若灶具仍开启则发送告警通知并考虑自动关闭\",\n \"设置灶具持续运行时长上限告警(如超过 30 分钟无人活动则提醒)\",\n \"检查入户门自动上锁机制,确保 16:02 回家场景下门能正常关闭和上锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "住户外出期间灶具持续运行无人看管,且厨房温度传感器存在故障,烟雾报警器电池低电量,多重安全防线失效。", "reasoning": ["推理步骤1: 07:03:32 灶具开启,但 07:12:07 厨房灯关闭、07:12:21 住户手动开锁出门、门自动上锁,表明住户已离家。灶具从未关闭,从 07:03 到 16:02 住户回家,灶具无人看管长达近 9 小时。", "推理步骤2: 08:34:00 日志显示灶具仍处于开启状态(kitchen_cook_surface | OnOff = True),08:44:00 厨房温度飙升至 3172(即 31.72°C),相比同时段其他房间的 ~24.5°C 高出约 7°C,这是灶具持续加热的直接证据。", "推理步骤3: 厨房温度传感器在 07:02、07:04、18:38、19:21 多次报告 MeasuredValue = None,说明传感器存在间歇性故障,无法持续监测厨房温度变化,削弱了火灾预警能力。", "推理步骤4: 08:44:00 烟雾报警器报告 SmokeState = 0(正常),但该报警器在前一天(06-08 08:34)已报告 BatteryAlert = 1(低电量警告),其可靠性存疑。低电量状态下报警器可能无法在关键时刻正常触发。", "推理步骤5: 07:01:30 厨房窗户打开(StateValue = False),灶具运行期间窗户保持开启状态,虽然有助于通风散热,但也意味着如果发生明火,外部气流可能助燃。", "推理步骤6: 16:02 住户回家后未见灶具关闭记录,直到 17:46 住户再次回家后 18:37:30 灶具才再次出现开启记录(可能是重新使用)。结合 16:02 回家时入户门未关闭(无 StateValue=True 记录)、未上锁的情况,住户可能只是短暂回来又离开,灶具安全隐患持续存在。", "推理步骤7: 综合来看——灶具长时间无人看管 + 温度传感器间歇性故障 + 烟雾报警器低电量,三重安全防线同时存在缺陷,构成严重的火灾风险。"], "key_evidence": ["灶具 07:03:32 开启后住户 07:12:21 离家,灶具无人看管近 9 小时(至少到 08:34 仍确认开启)", "08:44:00 厨房温度骤升至 3172(31.72°C),比其他房间高约 7°C", "厨房温度传感器多次报告 None(07:02、07:04、18:38、19:21),存在间歇性故障", "烟雾报警器 06-08 已报告 BatteryAlert = 1(低电量),可靠性下降", "16:02 住户回家后入户门未见关闭和上锁记录,安全状态不明"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保报警功能正常", "检修或更换厨房温度传感器,解决间歇性读数为 None 的故障", "设置自动化规则:当住户离家(门锁上锁)时检测灶具状态,若灶具仍开启则发送告警通知并考虑自动关闭", "设置灶具持续运行时长上限告警(如超过 30 分钟无人活动则提醒)", "检查入户门自动上锁机制,确保 16:02 回家场景下门能正常关闭和上锁"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.553884267807007, "api_error": null} {"episode_id": "SQ2_TP_B_0289", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_B_0289.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20260918, "scenario_id": "INS-05", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-28T04:39:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),同时该传感器多次报告None值,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在11:00读数突然从2530(25.3°C)跳升至2947(29.47°C),11:30进一步升至2960(29.6°C),而同一时段其他房间温度仅在25.5°C左右,厨房温度比其他房间高出约4°C,且此时灶具并未开启(灶具在09:36已关闭,11:51才再次开启)。\",\n \"推理步骤2: 厨房温度传感器在当天多次报告MeasuredValue=None(09:07、09:37、11:52、12:36、18:13、18:56),共计6次。虽然部分None值出现在灶具开启期间(可能是传感器设计上在灶具工作时暂停读数),但09:37的None出现在灶具刚关闭后,且11:00-11:30的异常高温发生在灶具关闭状态下,说明传感器本身可能存在故障。\",\n \"推理步骤3: 11:00-11:30期间灶具处于关闭状态(09:36关闭,11:51才重新开启),厨房窗户在09:36曾打开通风,不应导致温度异常升高。排除烹饪热源后,29.5°C的读数与其他传感器的25.5°C偏差过大,最合理的解释是传感器读数漂移或硬件故障。\",\n \"推理步骤4: 烟雾报警器在整个时段内未触发任何告警,排除了真实火灾或烟雾风险。这进一步佐证异常高温是传感器故障而非真实环境温度。\",\n \"推理步骤5: 其余事件均属正常生活模式——凌晨4:39通过密码/指纹(OperationSource=8, UserIndex=1)开锁回家、早晚做饭、使用洗碗机、睡前关灯锁门(自动上锁),无入侵或其他安全威胁迹象。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度传感器读数2947(29.47°C),11:30读数2960(29.6°C),而同时段客厅/卧室温度仅约25.5°C,偏差约4°C\",\n \"此时段灶具处于关闭状态(09:36关→11:51开),无合理热源解释该温度跳升\",\n \"厨房温度传感器当天6次报告MeasuredValue=None,频率异常\",\n \"烟雾报警器全天未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器探头,确认安装位置是否受到阳光直射或其他热源干扰\",\n \"对比厨房温度传感器与其他房间传感器的读数,若持续出现大幅偏差,建议更换或重新校准该传感器\",\n \"排查传感器频繁报告None值的原因,可能是通信不稳定、固件Bug或硬件老化,必要时升级固件或更换设备\",\n \"在传感器修复前,可临时依赖烟雾报警器作为厨房安全的主要监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),同时该传感器多次报告None值,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在11:00读数突然从2530(25.3°C)跳升至2947(29.47°C),11:30进一步升至2960(29.6°C),而同一时段其他房间温度仅在25.5°C左右,厨房温度比其他房间高出约4°C,且此时灶具并未开启(灶具在09:36已关闭,11:51才再次开启)。", "推理步骤2: 厨房温度传感器在当天多次报告MeasuredValue=None(09:07、09:37、11:52、12:36、18:13、18:56),共计6次。虽然部分None值出现在灶具开启期间(可能是传感器设计上在灶具工作时暂停读数),但09:37的None出现在灶具刚关闭后,且11:00-11:30的异常高温发生在灶具关闭状态下,说明传感器本身可能存在故障。", "推理步骤3: 11:00-11:30期间灶具处于关闭状态(09:36关闭,11:51才重新开启),厨房窗户在09:36曾打开通风,不应导致温度异常升高。排除烹饪热源后,29.5°C的读数与其他传感器的25.5°C偏差过大,最合理的解释是传感器读数漂移或硬件故障。", "推理步骤4: 烟雾报警器在整个时段内未触发任何告警,排除了真实火灾或烟雾风险。这进一步佐证异常高温是传感器故障而非真实环境温度。", "推理步骤5: 其余事件均属正常生活模式——凌晨4:39通过密码/指纹(OperationSource=8, UserIndex=1)开锁回家、早晚做饭、使用洗碗机、睡前关灯锁门(自动上锁),无入侵或其他安全威胁迹象。"], "key_evidence": ["11:00厨房温度传感器读数2947(29.47°C),11:30读数2960(29.6°C),而同时段客厅/卧室温度仅约25.5°C,偏差约4°C", "此时段灶具处于关闭状态(09:36关→11:51开),无合理热源解释该温度跳升", "厨房温度传感器当天6次报告MeasuredValue=None,频率异常", "烟雾报警器全天未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器探头,确认安装位置是否受到阳光直射或其他热源干扰", "对比厨房温度传感器与其他房间传感器的读数,若持续出现大幅偏差,建议更换或重新校准该传感器", "排查传感器频繁报告None值的原因,可能是通信不稳定、固件Bug或硬件老化,必要时升级固件或更换设备", "在传感器修复前,可临时依赖烟雾报警器作为厨房安全的主要监测手段"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.312342643737793, "api_error": null} {"episode_id": "SQ2_TP_C_0200", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0200.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260829, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-11T13:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水。\",\n \"reasoning\": [\n \"推理步骤1: 13:21 洗碗机启动(OperationalState = 1),仅5分钟后(13:26)厨房漏水传感器触发(StateValue = True),时间高度关联。\",\n \"推理步骤2: 漏水报警触发时洗碗机仍在运行(13:26 OperationalState = 1),说明洗碗机并未因故障自动停机,漏水可能来自接口松动、排水管溢出或机身密封问题。\",\n \"推理步骤3: 整个日志中未见漏水传感器被复位(StateValue 回到 False),说明漏水状态持续存在,未被处理。\",\n \"推理步骤4: 当天家中07:20已出门、16:10才有人回来,漏水发生在13:26属于无人在家时段,无法及时人工干预,水损风险随时间累积。\",\n \"推理步骤5: 厨房温度传感器多次报告 None(06:59、07:23、18:51、19:03),虽然与灶具使用时间吻合可能是高温干扰,但也需关注该传感器是否存在故障,属于次要异常。\"\n ],\n \"key_evidence\": [\n \"13:21 洗碗机启动 → 13:26 厨房漏水传感器 StateValue = True,间隔仅5分钟\",\n \"漏水报警后洗碗机未停机(13:26 OperationalState 仍为 1)\",\n \"全天日志中漏水传感器未复位,漏水状态持续至日志结束\",\n \"漏水发生在无人在家时段(07:20出门,16:10回家)\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机并发送紧急通知给住户\",\n \"如有智能水阀,关闭厨房供水管路以止损\",\n \"住户回家后检查洗碗机进水管、排水管及机身底部密封情况\",\n \"检查厨房地面积水范围,评估是否造成地板或橱柜水损\",\n \"排查厨房温度传感器多次报告 None 的原因,确认是灶具高温干扰还是传感器故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水。", "reasoning": ["推理步骤1: 13:21 洗碗机启动(OperationalState = 1),仅5分钟后(13:26)厨房漏水传感器触发(StateValue = True),时间高度关联。", "推理步骤2: 漏水报警触发时洗碗机仍在运行(13:26 OperationalState = 1),说明洗碗机并未因故障自动停机,漏水可能来自接口松动、排水管溢出或机身密封问题。", "推理步骤3: 整个日志中未见漏水传感器被复位(StateValue 回到 False),说明漏水状态持续存在,未被处理。", "推理步骤4: 当天家中07:20已出门、16:10才有人回来,漏水发生在13:26属于无人在家时段,无法及时人工干预,水损风险随时间累积。", "推理步骤5: 厨房温度传感器多次报告 None(06:59、07:23、18:51、19:03),虽然与灶具使用时间吻合可能是高温干扰,但也需关注该传感器是否存在故障,属于次要异常。"], "key_evidence": ["13:21 洗碗机启动 → 13:26 厨房漏水传感器 StateValue = True,间隔仅5分钟", "漏水报警后洗碗机未停机(13:26 OperationalState 仍为 1)", "全天日志中漏水传感器未复位,漏水状态持续至日志结束", "漏水发生在无人在家时段(07:20出门,16:10回家)"], "recommended_actions": ["立即远程关闭洗碗机并发送紧急通知给住户", "如有智能水阀,关闭厨房供水管路以止损", "住户回家后检查洗碗机进水管、排水管及机身底部密封情况", "检查厨房地面积水范围,评估是否造成地板或橱柜水损", "排查厨房温度传感器多次报告 None 的原因,确认是灶具高温干扰还是传感器故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.330371856689453, "api_error": null} {"episode_id": "SQ2_TP_C_0198", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0198.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260827, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-19T15:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;同时下午无人在家期间出现短暂的运动检测和厨房窗户开关事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:42、07:05、18:33、19:29 四次报告 MeasuredValue = None。每次都发生在灶具开启期间或刚关闭后,说明传感器可能受高温干扰导致读数失效,或传感器本身存在硬件故障。\",\n \"推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)全天正常上报,数值在 22.9°C~25.9°C 之间随日间升温/夜间降温平稳波动,无异常跳变,排除全局网络问题。\",\n \"推理步骤3: 15:09-15:12 期间,家中应处于无人状态(07:22 全家出门、门锁上锁,16:35 才有人回来),但厨房窗户传感器触发了开→关,客厅和主卧运动传感器短暂检测到占用。这段约3分钟的活动链值得关注——可能是宠物活动、风吹窗户传感器误触发,也不能完全排除有人通过厨房窗户进入的可能。但由于持续时间极短、未触发门锁事件、且之后无任何后续活动,入侵的可能性较低。\",\n \"推理步骤4: 整体生活模式合理:早晨 06:17 起床→做早餐→07:22 出门上锁→16:35 孩子先回家→17:40 大人回家→做晚饭→21:07 孩子睡觉→22:35 大人睡觉并确认门锁。门锁操作均为 Manual/Auto,无异常解锁尝试。\",\n \"推理步骤5: 16:35 有人开门进入但门锁未记录到重新上锁事件(直到 22:35 才自动上锁),意味着从 16:35 到 22:35 约6小时入户门可能处于未锁状态,存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器4次报告 None:06:42、07:05、18:33、19:29,均与灶具使用时段高度相关\",\n \"15:09-15:12 无人在家期间出现厨房窗户开关和客厅/主卧运动传感器触发\",\n \"16:35 开门后至 22:35 期间无门锁上锁记录,入户门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换耐高温型号或调整安装位置\",\n \"排查 15:09-15:12 的异常活动来源:检查是否有宠物、确认厨房窗户是否有物理锁扣防止从外部打开,必要时查看摄像头录像\",\n \"建议设置自动化规则:出门模式下如检测到运动传感器触发,立即推送告警通知\",\n \"建议设置门锁自动化:入户门解锁后若超过一定时间未上锁,推送提醒或自动上锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;同时下午无人在家期间出现短暂的运动检测和厨房窗户开关事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:42、07:05、18:33、19:29 四次报告 MeasuredValue = None。每次都发生在灶具开启期间或刚关闭后,说明传感器可能受高温干扰导致读数失效,或传感器本身存在硬件故障。", "推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)全天正常上报,数值在 22.9°C~25.9°C 之间随日间升温/夜间降温平稳波动,无异常跳变,排除全局网络问题。", "推理步骤3: 15:09-15:12 期间,家中应处于无人状态(07:22 全家出门、门锁上锁,16:35 才有人回来),但厨房窗户传感器触发了开→关,客厅和主卧运动传感器短暂检测到占用。这段约3分钟的活动链值得关注——可能是宠物活动、风吹窗户传感器误触发,也不能完全排除有人通过厨房窗户进入的可能。但由于持续时间极短、未触发门锁事件、且之后无任何后续活动,入侵的可能性较低。", "推理步骤4: 整体生活模式合理:早晨 06:17 起床→做早餐→07:22 出门上锁→16:35 孩子先回家→17:40 大人回家→做晚饭→21:07 孩子睡觉→22:35 大人睡觉并确认门锁。门锁操作均为 Manual/Auto,无异常解锁尝试。", "推理步骤5: 16:35 有人开门进入但门锁未记录到重新上锁事件(直到 22:35 才自动上锁),意味着从 16:35 到 22:35 约6小时入户门可能处于未锁状态,存在一定安全隐患。"], "key_evidence": ["厨房温度传感器4次报告 None:06:42、07:05、18:33、19:29,均与灶具使用时段高度相关", "15:09-15:12 无人在家期间出现厨房窗户开关和客厅/主卧运动传感器触发", "16:35 开门后至 22:35 期间无门锁上锁记录,入户门可能长时间未锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换耐高温型号或调整安装位置", "排查 15:09-15:12 的异常活动来源:检查是否有宠物、确认厨房窗户是否有物理锁扣防止从外部打开,必要时查看摄像头录像", "建议设置自动化规则:出门模式下如检测到运动传感器触发,立即推送告警通知", "建议设置门锁自动化:入户门解锁后若超过一定时间未上锁,推送提醒或自动上锁"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.814384937286377, "api_error": null} {"episode_id": "SQ2_TP_C_0203", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0203.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20260832, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-06T17:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"住户正常回家,所有设备状态符合预期,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 17:04 入户门锁通过合法方式解锁(LockOperationType=1 表示Lock/Unlock操作,OperationSource=3 通常表示通过密码/指纹等本地凭证操作,UserIndex=1 表示已注册的第一位用户),这是正常的授权开锁行为。\",\n \"推理步骤2: 开锁后2秒入户门传感器显示门被打开(StateValue=False),6秒后门关闭(StateValue=True),开门持续时间约6秒,符合正常进门的时间窗口。\",\n \"推理步骤3: 运动传感器的触发顺序完全符合从入户到室内的物理动线:玄关(17:04:04) → 客厅(17:04:10) → 玄关仍有检测(17:04:12) → 客厅和次卧同时检测到(17:04:15),说明至少有两人进入(一人去往次卧,一人留在客厅区域),这与家庭成员下班/放学回家的场景一致。\",\n \"推理步骤4: 时间点为17:04(下午5点),属于典型的下班/放学回家时段,完全合理。\",\n \"推理步骤5: 全天温度数据呈现正常的日间升温-夜间降温曲线(夜间约22.9-23.1°C,午间峰值约25.8°C),各房间温度一致且无异常突变,排除火灾或设备故障风险。\",\n \"推理步骤6: 整个日志中无烟雾报警、漏水报警、窗户异常开启等任何告警事件,所有安全传感器保持静默。\"\n ],\n \"key_evidence\": [\n \"入户门锁由已注册用户(UserIndex=1)通过本地凭证(OperationSource=3)正常解锁\",\n \"开门到关门间隔约6秒,符合正常进出时间\",\n \"运动传感器触发顺序(玄关→客厅→次卧)符合从门口进入室内的物理动线\",\n \"事件发生在17:04,属于正常回家时段\",\n \"全天温度曲线平稳正常,无任何安全告警触发\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "住户正常回家,所有设备状态符合预期,无安全威胁。", "reasoning": ["推理步骤1: 17:04 入户门锁通过合法方式解锁(LockOperationType=1 表示Lock/Unlock操作,OperationSource=3 通常表示通过密码/指纹等本地凭证操作,UserIndex=1 表示已注册的第一位用户),这是正常的授权开锁行为。", "推理步骤2: 开锁后2秒入户门传感器显示门被打开(StateValue=False),6秒后门关闭(StateValue=True),开门持续时间约6秒,符合正常进门的时间窗口。", "推理步骤3: 运动传感器的触发顺序完全符合从入户到室内的物理动线:玄关(17:04:04) → 客厅(17:04:10) → 玄关仍有检测(17:04:12) → 客厅和次卧同时检测到(17:04:15),说明至少有两人进入(一人去往次卧,一人留在客厅区域),这与家庭成员下班/放学回家的场景一致。", "推理步骤4: 时间点为17:04(下午5点),属于典型的下班/放学回家时段,完全合理。", "推理步骤5: 全天温度数据呈现正常的日间升温-夜间降温曲线(夜间约22.9-23.1°C,午间峰值约25.8°C),各房间温度一致且无异常突变,排除火灾或设备故障风险。", "推理步骤6: 整个日志中无烟雾报警、漏水报警、窗户异常开启等任何告警事件,所有安全传感器保持静默。"], "key_evidence": ["入户门锁由已注册用户(UserIndex=1)通过本地凭证(OperationSource=3)正常解锁", "开门到关门间隔约6秒,符合正常进出时间", "运动传感器触发顺序(玄关→客厅→次卧)符合从门口进入室内的物理动线", "事件发生在17:04,属于正常回家时段", "全天温度曲线平稳正常,无任何安全告警触发"], "recommended_actions": ["无需采取任何措施,当前状态正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.216567039489746, "api_error": null} {"episode_id": "SQ2_TP_C_0207", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0207.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20260836, "scenario_id": "INS-05", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-10T09:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、07:07、18:43、19:01 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚使用后,说明传感器在高温/油烟环境下反复出现读数丢失,这不是偶发现象而是可复现的故障模式。\",\n \"推理步骤2: 温度传感器对厨房安全至关重要——它与烟雾报警器配合监测火灾风险。如果传感器在灶具工作时恰好失效,意味着在最需要温度监控的时刻反而失去了监控能力,这是一个显著的安全盲区。\",\n \"推理步骤3: 厨房窗户传感器在 07:06:30 报告 StateValue=False(窗户打开),之后整天日志中没有出现关闭事件。到 19:00:30 再次报告 False(仍然打开或再次打开)。家人 07:27 出门后厨房窗户持续处于开启状态,在无人看管的情况下存在入侵风险。\",\n \"推理步骤4: 其余家庭活动模式正常——早晨起床(06:14)、孩子起床(06:34)、做早餐(06:46-07:06)、出门上班上学(07:27)并自动锁门、下午孩子回家(15:55)、大人回家(18:08)、晚餐(18:42-19:00)、孩子就寝(20:56)、大人就寝(22:31)并确认锁门,生活节奏合理无异常。\",\n \"推理步骤5: 入户门锁操作均正常:手动开锁出入、自动上锁,09:40 有一次通过 OperationSource=8(远程/密码)开锁并有人进入后关灯,可能是家政人员或家庭成员远程开门,行为模式无明显入侵特征。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:07、18:43、19:01 四次报告 MeasuredValue = None,均与灶具使用时段高度关联\",\n \"kitchen_window_contact 在 07:06:30 报告窗户打开后,全天日志未见关闭事件,家人外出期间窗户持续敞开\",\n \"其他所有传感器(客厅、主卧、儿童房温度传感器)全天正常报告数值,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或油烟干扰,必要时更换耐高温型号或调整安装位置\",\n \"设置自动化规则:当家人离家(门锁上锁)时,若厨房窗户仍处于打开状态,发送提醒通知\",\n \"为厨房温度传感器设置离线/异常值告警,当连续报告 None 时立即通知住户\",\n \"考虑对 09:40 的远程开锁事件进行确认,核实是否为已授权用户操作(UserIndex=1)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、07:07、18:43、19:01 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚使用后,说明传感器在高温/油烟环境下反复出现读数丢失,这不是偶发现象而是可复现的故障模式。", "推理步骤2: 温度传感器对厨房安全至关重要——它与烟雾报警器配合监测火灾风险。如果传感器在灶具工作时恰好失效,意味着在最需要温度监控的时刻反而失去了监控能力,这是一个显著的安全盲区。", "推理步骤3: 厨房窗户传感器在 07:06:30 报告 StateValue=False(窗户打开),之后整天日志中没有出现关闭事件。到 19:00:30 再次报告 False(仍然打开或再次打开)。家人 07:27 出门后厨房窗户持续处于开启状态,在无人看管的情况下存在入侵风险。", "推理步骤4: 其余家庭活动模式正常——早晨起床(06:14)、孩子起床(06:34)、做早餐(06:46-07:06)、出门上班上学(07:27)并自动锁门、下午孩子回家(15:55)、大人回家(18:08)、晚餐(18:42-19:00)、孩子就寝(20:56)、大人就寝(22:31)并确认锁门,生活节奏合理无异常。", "推理步骤5: 入户门锁操作均正常:手动开锁出入、自动上锁,09:40 有一次通过 OperationSource=8(远程/密码)开锁并有人进入后关灯,可能是家政人员或家庭成员远程开门,行为模式无明显入侵特征。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:07、18:43、19:01 四次报告 MeasuredValue = None,均与灶具使用时段高度关联", "kitchen_window_contact 在 07:06:30 报告窗户打开后,全天日志未见关闭事件,家人外出期间窗户持续敞开", "其他所有传感器(客厅、主卧、儿童房温度传感器)全天正常报告数值,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或油烟干扰,必要时更换耐高温型号或调整安装位置", "设置自动化规则:当家人离家(门锁上锁)时,若厨房窗户仍处于打开状态,发送提醒通知", "为厨房温度传感器设置离线/异常值告警,当连续报告 None 时立即通知住户", "考虑对 09:40 的远程开锁事件进行确认,核实是否为已授权用户操作(UserIndex=1)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.154321670532227, "api_error": null} {"episode_id": "SQ2_TP_C_0210", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0210.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20260839, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-23T22:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"深夜22:59入户门锁遭受连续4次错误密码/凭证尝试,触发门锁防撬报警(AlarmCode=3),疑似非法入侵尝试。\",\n \"reasoning\": [\n \"推理步骤1: 22:39住户已完成睡前流程——关闭客厅灯和空调、进入主卧、关闭主卧窗帘、确认前门已关闭并自动上锁(LockState=1),全家进入就寝状态。\",\n \"推理步骤2: 仅20分钟后(22:59:00起),前门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常表示远程/外部操作来源,OperationError=1 表示凭证无效,说明有人在用错误的密码或凭证反复尝试开锁。\",\n \"推理步骤3: 4次失败尝试后,门锁触发了 DoorLockAlarm(AlarmCode=3),即强制入侵/篡改报警。这是门锁内置的安全机制,在检测到多次非法开锁尝试后主动告警。\",\n \"推理步骤4: 此时段(深夜近23点)家中无任何运动传感器触发、无灯光开启,排除了住户自己忘带钥匙在门外尝试的可能性(若是住户,通常会有门铃或其他交互行为,且不会连续使用错误凭证)。\",\n \"推理步骤5: 整个白天的门锁操作均为正常的手动开锁/自动上锁模式,从未出现过操作错误,进一步证实这次深夜的连续失败尝试属于异常行为。\"\n ],\n \"key_evidence\": [\n \"22:59:00-22:59:40 在不到1分钟内连续4次 LockOperationError(OperationError=1, OperationSource=3)——无效凭证、外部来源\",\n \"22:59:50 触发 DoorLockAlarm(AlarmCode=3)——门锁防撬/强制入侵报警\",\n \"22:39已确认前门关闭上锁(LockState=1),住户已在主卧就寝\",\n \"事件发生时全屋无任何运动传感器触发或灯光变化,排除住户自身操作\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵警报通知,确认是否为本人操作\",\n \"自动开启玄关灯和客厅灯进行威慑,同时激活入口区域的监控录像(如有)\",\n \"若住户确认非本人操作,立即联系物业安保或报警(110)\",\n \"临时锁定门锁一段时间(lockout),阻止进一步的开锁尝试\",\n \"检查门锁是否支持远程操作来源(OperationSource=3)的访问控制,排查是否有未授权的远程访问凭证泄露\",\n \"事后建议更换门锁密码/凭证,并审查门锁的授权用户列表\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "深夜22:59入户门锁遭受连续4次错误密码/凭证尝试,触发门锁防撬报警(AlarmCode=3),疑似非法入侵尝试。", "reasoning": ["推理步骤1: 22:39住户已完成睡前流程——关闭客厅灯和空调、进入主卧、关闭主卧窗帘、确认前门已关闭并自动上锁(LockState=1),全家进入就寝状态。", "推理步骤2: 仅20分钟后(22:59:00起),前门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常表示远程/外部操作来源,OperationError=1 表示凭证无效,说明有人在用错误的密码或凭证反复尝试开锁。", "推理步骤3: 4次失败尝试后,门锁触发了 DoorLockAlarm(AlarmCode=3),即强制入侵/篡改报警。这是门锁内置的安全机制,在检测到多次非法开锁尝试后主动告警。", "推理步骤4: 此时段(深夜近23点)家中无任何运动传感器触发、无灯光开启,排除了住户自己忘带钥匙在门外尝试的可能性(若是住户,通常会有门铃或其他交互行为,且不会连续使用错误凭证)。", "推理步骤5: 整个白天的门锁操作均为正常的手动开锁/自动上锁模式,从未出现过操作错误,进一步证实这次深夜的连续失败尝试属于异常行为。"], "key_evidence": ["22:59:00-22:59:40 在不到1分钟内连续4次 LockOperationError(OperationError=1, OperationSource=3)——无效凭证、外部来源", "22:59:50 触发 DoorLockAlarm(AlarmCode=3)——门锁防撬/强制入侵报警", "22:39已确认前门关闭上锁(LockState=1),住户已在主卧就寝", "事件发生时全屋无任何运动传感器触发或灯光变化,排除住户自身操作"], "recommended_actions": ["立即向住户手机推送高优先级入侵警报通知,确认是否为本人操作", "自动开启玄关灯和客厅灯进行威慑,同时激活入口区域的监控录像(如有)", "若住户确认非本人操作,立即联系物业安保或报警(110)", "临时锁定门锁一段时间(lockout),阻止进一步的开锁尝试", "检查门锁是否支持远程操作来源(OperationSource=3)的访问控制,排查是否有未授权的远程访问凭证泄露", "事后建议更换门锁密码/凭证,并审查门锁的授权用户列表"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.35871124267578, "api_error": null} {"episode_id": "SQ2_TP_C_0213", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0213.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260842, "scenario_id": "WD-01", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-08T07:41:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在住户外出期间触发报警,且长时间无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:32 住户关闭各房间灯光,手动开锁出门,门锁自动上锁,表明全家外出。直到 16:07 才有人回家。\",\n \"推理步骤2: 07:41 次卫漏水传感器 second_bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,明确检测到漏水。\",\n \"推理步骤3: 从 07:41 漏水触发到 16:07 有人回家,中间超过 8 小时无人在家,漏水未被处理。整个日志中也没有出现漏水传感器恢复正常(StateValue=False)的记录,说明漏水状态一直持续到日志结束。\",\n \"推理步骤4: 次卫灯在 06:28 被打开过,但之后没有关闭记录,也没有运动传感器(次卫未配备运动传感器),无法判断漏水前是否有人使用过次卫,但漏水发生在出门之后,无人能及时止水。\",\n \"推理步骤5: 厨房温度传感器多次报告 None 值(06:39、07:24、18:37、19:27),属于设备小异常,但结合灶具使用时间点来看,可能是灶具高温干扰传感器读数,属于次要问题。\"\n ],\n \"key_evidence\": [\n \"07:41 second_bathroom_water_leak StateValue=True 及 StateChange 事件触发\",\n \"07:32 全家外出(灯光全关、前门上锁),16:07 才有人回家,漏水无人处理超过 8 小时\",\n \"全天日志中未出现 second_bathroom_water_leak StateValue=False 的恢复记录,漏水持续未止\"\n ],\n \"recommended_actions\": [\n \"立即检查次卫现场,确认漏水源头(水管接头、马桶、地漏等),关闭次卫供水阀门\",\n \"评估水损范围,检查次卫地面、墙面及相邻房间是否有渗水痕迹\",\n \"配置漏水报警的远程推送通知,确保住户外出时能第一时间收到警报\",\n \"考虑安装电动水阀,在漏水传感器触发时自动关闭该区域供水\",\n \"关注厨房温度传感器多次报告 None 值的问题,检查传感器是否安装位置过于靠近灶具,或传感器本身存在故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器在住户外出期间触发报警,且长时间无人处理,存在水损风险。", "reasoning": ["推理步骤1: 07:32 住户关闭各房间灯光,手动开锁出门,门锁自动上锁,表明全家外出。直到 16:07 才有人回家。", "推理步骤2: 07:41 次卫漏水传感器 second_bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,明确检测到漏水。", "推理步骤3: 从 07:41 漏水触发到 16:07 有人回家,中间超过 8 小时无人在家,漏水未被处理。整个日志中也没有出现漏水传感器恢复正常(StateValue=False)的记录,说明漏水状态一直持续到日志结束。", "推理步骤4: 次卫灯在 06:28 被打开过,但之后没有关闭记录,也没有运动传感器(次卫未配备运动传感器),无法判断漏水前是否有人使用过次卫,但漏水发生在出门之后,无人能及时止水。", "推理步骤5: 厨房温度传感器多次报告 None 值(06:39、07:24、18:37、19:27),属于设备小异常,但结合灶具使用时间点来看,可能是灶具高温干扰传感器读数,属于次要问题。"], "key_evidence": ["07:41 second_bathroom_water_leak StateValue=True 及 StateChange 事件触发", "07:32 全家外出(灯光全关、前门上锁),16:07 才有人回家,漏水无人处理超过 8 小时", "全天日志中未出现 second_bathroom_water_leak StateValue=False 的恢复记录,漏水持续未止"], "recommended_actions": ["立即检查次卫现场,确认漏水源头(水管接头、马桶、地漏等),关闭次卫供水阀门", "评估水损范围,检查次卫地面、墙面及相邻房间是否有渗水痕迹", "配置漏水报警的远程推送通知,确保住户外出时能第一时间收到警报", "考虑安装电动水阀,在漏水传感器触发时自动关闭该区域供水", "关注厨房温度传感器多次报告 None 值的问题,检查传感器是否安装位置过于靠近灶具,或传感器本身存在故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.761878728866577, "api_error": null} {"episode_id": "SQ2_TP_C_0216", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0216.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20260845, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-04T03:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在凌晨持续报警超过30分钟,且无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 次卫漏水传感器(second_bathroom_water_leak)在 03:04、03:14、03:34 三次报告 StateValue = True,时间跨度达30分钟,说明漏水状态持续存在而非瞬时误报。\",\n \"推理步骤2: 事件发生在凌晨3点,属于深夜时段,全屋无任何运动传感器触发(住户均在熟睡),意味着没有人察觉到漏水情况。\",\n \"推理步骤3: 整个日志中未出现 second_bathroom_water_leak StateValue = False 的恢复事件,说明漏水状态可能一直持续到住户起床甚至更久,未被解除。\",\n \"推理步骤4: 次卫在当天06:34有开灯记录(可能是孩子起床使用),但仍未见漏水传感器恢复正常,进一步印证漏水未被处理。\",\n \"推理步骤5: 其余设备行为均属正常——温度随昼夜自然波动、住户早晨起床做饭出门、傍晚回家做饭就寝的生活节奏合理,厨房温度传感器偶尔报 None 可能是灶具使用时的短暂干扰,不构成独立威胁。\"\n ],\n \"key_evidence\": [\n \"03:04 second_bathroom_water_leak StateValue = True(首次报警)\",\n \"03:14 second_bathroom_water_leak StateValue = True(10分钟后仍在报警)\",\n \"03:34 second_bathroom_water_leak StateValue = True(30分钟后第三次报警)\",\n \"全天日志中未出现 second_bathroom_water_leak StateValue = False 的恢复记录\",\n \"凌晨3点全屋无运动传感器触发,无人察觉漏水\"\n ],\n \"recommended_actions\": [\n \"立即检查次卫现场,确认漏水位置和严重程度(地漏、水管接头、马桶底部等)\",\n \"如确认漏水,关闭次卫对应的水阀止损\",\n \"检查漏水是否已造成地板、墙面或楼下渗水等损害\",\n \"排查漏水原因(管道老化、接头松动、防水层失效等)并进行维修\",\n \"考虑为漏水传感器配置即时推送告警(电话/短信),确保深夜也能及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器在凌晨持续报警超过30分钟,且无人处理,存在水损风险。", "reasoning": ["推理步骤1: 次卫漏水传感器(second_bathroom_water_leak)在 03:04、03:14、03:34 三次报告 StateValue = True,时间跨度达30分钟,说明漏水状态持续存在而非瞬时误报。", "推理步骤2: 事件发生在凌晨3点,属于深夜时段,全屋无任何运动传感器触发(住户均在熟睡),意味着没有人察觉到漏水情况。", "推理步骤3: 整个日志中未出现 second_bathroom_water_leak StateValue = False 的恢复事件,说明漏水状态可能一直持续到住户起床甚至更久,未被解除。", "推理步骤4: 次卫在当天06:34有开灯记录(可能是孩子起床使用),但仍未见漏水传感器恢复正常,进一步印证漏水未被处理。", "推理步骤5: 其余设备行为均属正常——温度随昼夜自然波动、住户早晨起床做饭出门、傍晚回家做饭就寝的生活节奏合理,厨房温度传感器偶尔报 None 可能是灶具使用时的短暂干扰,不构成独立威胁。"], "key_evidence": ["03:04 second_bathroom_water_leak StateValue = True(首次报警)", "03:14 second_bathroom_water_leak StateValue = True(10分钟后仍在报警)", "03:34 second_bathroom_water_leak StateValue = True(30分钟后第三次报警)", "全天日志中未出现 second_bathroom_water_leak StateValue = False 的恢复记录", "凌晨3点全屋无运动传感器触发,无人察觉漏水"], "recommended_actions": ["立即检查次卫现场,确认漏水位置和严重程度(地漏、水管接头、马桶底部等)", "如确认漏水,关闭次卫对应的水阀止损", "检查漏水是否已造成地板、墙面或楼下渗水等损害", "排查漏水原因(管道老化、接头松动、防水层失效等)并进行维修", "考虑为漏水传感器配置即时推送告警(电话/短信),确保深夜也能及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.20212745666504, "api_error": null} {"episode_id": "SQ2_TP_C_0218", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0218.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20260847, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "balcony", "injection_time": "2026-06-05T04:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨4:23厨房灶具在无人活动时自行开启,导致厨房温度骤升至28.58°C,同时烟雾报警器电池低电量且未能正常报警,存在严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 04:23厨房灶具(kitchen_cook_surface)开启,但此时全屋无任何运动传感器检测到人体活动——最早的人体活动出现在06:29(主卧),说明凌晨4点住户均在睡眠状态,灶具不应被手动开启。\",\n \"推理步骤2: 灶具开启10分钟后(04:33),厨房温度从约23.09°C骤升至28.58°C(MeasuredValue从2309跳至2858),升幅约5.5°C,远超同时段其他房间的正常波动(±0.1°C),说明灶具确实在加热运行。\",\n \"推理步骤3: 04:33烟雾报警器上报SmokeState=0(正常/无烟),表面看似正常,但前一天(06-04 04:23)该报警器已报告BatteryAlert=1(低电量警告),其检测可靠性存疑。\",\n \"推理步骤4: 灶具在无人看管的情况下持续运行了近3小时(04:23至07:23才关闭),期间厨房温度传感器还多次报告MeasuredValue=None(读数异常),进一步说明厨房环境异常。\",\n \"推理步骤5: 综合来看——无人时段灶具自启、长时间无人看管运行、温度骤升、温度传感器读数丢失、烟雾报警器低电量——构成了严重的火灾风险链条。\"\n ],\n \"key_evidence\": [\n \"04:23 kitchen_cook_surface OnOff=True,全屋无任何occupancy传感器触发,属于无人时段灶具异常启动\",\n \"04:33 厨房温度从~23.09°C骤升至28.58°C,10分钟内升幅约5.5°C\",\n \"06-04 04:23 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量,检测能力可能受损\",\n \"06:46、07:24 kitchen_temp_sensor MeasuredValue=None,厨房温度传感器多次读数丢失\",\n \"灶具从04:23持续运行至07:23(约3小时),期间无人在厨房活动\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具是否存在硬件故障或误触发问题,排查是否有自动化规则在凌晨意外触发灶具\",\n \"立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常报警\",\n \"检查厨房温度传感器,排查多次返回None的原因(可能是高温导致传感器故障或通信中断)\",\n \"为灶具设置安全规则:无人活动时段(如深夜)禁止远程或自动开启,或开启超过一定时长且无人活动时自动关闭\",\n \"考虑增加厨房运动传感器,以便在无人时灶具开启时能立即触发告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨4:23厨房灶具在无人活动时自行开启,导致厨房温度骤升至28.58°C,同时烟雾报警器电池低电量且未能正常报警,存在严重火灾隐患。", "reasoning": ["推理步骤1: 04:23厨房灶具(kitchen_cook_surface)开启,但此时全屋无任何运动传感器检测到人体活动——最早的人体活动出现在06:29(主卧),说明凌晨4点住户均在睡眠状态,灶具不应被手动开启。", "推理步骤2: 灶具开启10分钟后(04:33),厨房温度从约23.09°C骤升至28.58°C(MeasuredValue从2309跳至2858),升幅约5.5°C,远超同时段其他房间的正常波动(±0.1°C),说明灶具确实在加热运行。", "推理步骤3: 04:33烟雾报警器上报SmokeState=0(正常/无烟),表面看似正常,但前一天(06-04 04:23)该报警器已报告BatteryAlert=1(低电量警告),其检测可靠性存疑。", "推理步骤4: 灶具在无人看管的情况下持续运行了近3小时(04:23至07:23才关闭),期间厨房温度传感器还多次报告MeasuredValue=None(读数异常),进一步说明厨房环境异常。", "推理步骤5: 综合来看——无人时段灶具自启、长时间无人看管运行、温度骤升、温度传感器读数丢失、烟雾报警器低电量——构成了严重的火灾风险链条。"], "key_evidence": ["04:23 kitchen_cook_surface OnOff=True,全屋无任何occupancy传感器触发,属于无人时段灶具异常启动", "04:33 厨房温度从~23.09°C骤升至28.58°C,10分钟内升幅约5.5°C", "06-04 04:23 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量,检测能力可能受损", "06:46、07:24 kitchen_temp_sensor MeasuredValue=None,厨房温度传感器多次读数丢失", "灶具从04:23持续运行至07:23(约3小时),期间无人在厨房活动"], "recommended_actions": ["立即检查厨房灶具是否存在硬件故障或误触发问题,排查是否有自动化规则在凌晨意外触发灶具", "立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常报警", "检查厨房温度传感器,排查多次返回None的原因(可能是高温导致传感器故障或通信中断)", "为灶具设置安全规则:无人活动时段(如深夜)禁止远程或自动开启,或开启超过一定时长且无人活动时自动关闭", "考虑增加厨房运动传感器,以便在无人时灶具开启时能立即触发告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.32262921333313, "api_error": null} {"episode_id": "SQ2_TP_C_0221", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0221.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20260850, "scenario_id": "INS-01", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T03:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨03:56客厅窗户被打开并触发室内运动传感器,全屋无人活动迹象,疑似非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 03:56:00 客厅窗户传感器 living_room_window_contact_1 报告 StateValue=False(窗户打开),此时为深夜凌晨近4点。\",\n \"推理步骤2: 仅5秒后(03:56:05)客厅运动传感器检测到有人活动(Occupancy=1),随后30秒内餐厅运动传感器也被触发(03:56:30),说明有人从客厅窗户进入后向餐厅方向移动。\",\n \"推理步骤3: 在此事件之前,全屋从00:00到03:56没有任何运动传感器触发、灯光操作或门锁操作记录,表明住户处于深度睡眠或家中无人状态。\",\n \"推理步骤4: 入户门锁在整个凌晨时段没有任何开锁事件,排除了住户正常从大门进出的可能性。\",\n \"推理步骤5: 正常住户夜间起身通常会触发卧室或卫生间的运动传感器,而此次活动直接从客厅窗户开始,不符合住户正常行为模式。\",\n \"推理步骤6: 该事件之后没有开灯操作,也没有后续的门锁操作,活动轨迹为窗户→客厅→餐厅后消失,行为模式高度可疑。\",\n \"推理步骤7: 住户的正常起床时间为05:55(主卧运动传感器首次触发),与03:56的异常活动间隔约2小时,进一步排除住户自身行为的可能。\"\n ],\n \"key_evidence\": [\n \"03:56:00 客厅窗户传感器打开(living_room_window_contact_1 StateValue=False)\",\n \"03:56:05 客厅运动传感器触发(living_room_occupancy Occupancy=1),窗户打开仅5秒后\",\n \"03:56:30 餐厅运动传感器触发(dining_room_occupancy Occupancy=1),显示移动轨迹\",\n \"00:00-03:55 全屋无任何人体活动记录,入户门锁无操作\",\n \"事件期间无任何灯光被打开,行为隐蔽\"\n ],\n \"recommended_actions\": [\n \"立即触发全屋警报并向住户手机推送高优先级入侵告警\",\n \"自动开启全屋灯光以威慑入侵者\",\n \"联系物业安保或拨打110报警\",\n \"如有摄像头,立即保存03:50-04:10时段的录像作为证据\",\n \"检查客厅窗户门锁是否完好,评估是否需要加装窗户安全锁或振动报警器\",\n \"后续建议:为窗户添加自动化规则,深夜窗户打开时立即告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨03:56客厅窗户被打开并触发室内运动传感器,全屋无人活动迹象,疑似非法入侵。", "reasoning": ["推理步骤1: 03:56:00 客厅窗户传感器 living_room_window_contact_1 报告 StateValue=False(窗户打开),此时为深夜凌晨近4点。", "推理步骤2: 仅5秒后(03:56:05)客厅运动传感器检测到有人活动(Occupancy=1),随后30秒内餐厅运动传感器也被触发(03:56:30),说明有人从客厅窗户进入后向餐厅方向移动。", "推理步骤3: 在此事件之前,全屋从00:00到03:56没有任何运动传感器触发、灯光操作或门锁操作记录,表明住户处于深度睡眠或家中无人状态。", "推理步骤4: 入户门锁在整个凌晨时段没有任何开锁事件,排除了住户正常从大门进出的可能性。", "推理步骤5: 正常住户夜间起身通常会触发卧室或卫生间的运动传感器,而此次活动直接从客厅窗户开始,不符合住户正常行为模式。", "推理步骤6: 该事件之后没有开灯操作,也没有后续的门锁操作,活动轨迹为窗户→客厅→餐厅后消失,行为模式高度可疑。", "推理步骤7: 住户的正常起床时间为05:55(主卧运动传感器首次触发),与03:56的异常活动间隔约2小时,进一步排除住户自身行为的可能。"], "key_evidence": ["03:56:00 客厅窗户传感器打开(living_room_window_contact_1 StateValue=False)", "03:56:05 客厅运动传感器触发(living_room_occupancy Occupancy=1),窗户打开仅5秒后", "03:56:30 餐厅运动传感器触发(dining_room_occupancy Occupancy=1),显示移动轨迹", "00:00-03:55 全屋无任何人体活动记录,入户门锁无操作", "事件期间无任何灯光被打开,行为隐蔽"], "recommended_actions": ["立即触发全屋警报并向住户手机推送高优先级入侵告警", "自动开启全屋灯光以威慑入侵者", "联系物业安保或拨打110报警", "如有摄像头,立即保存03:50-04:10时段的录像作为证据", "检查客厅窗户门锁是否完好,评估是否需要加装窗户安全锁或振动报警器", "后续建议:为窗户添加自动化规则,深夜窗户打开时立即告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.4563992023468, "api_error": null} {"episode_id": "SQ2_TP_C_0228", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0228.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20260857, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T17:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在短时间内遭受多次连续错误解锁尝试并触发强制入侵报警,疑似有人试图非法闯入。\",\n \"reasoning\": [\n \"推理步骤1: 17:29:00 至 17:29:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3),即通过远程/外部方式尝试解锁均失败,间隔仅 10-15 秒,属于密集暴力尝试模式。\",\n \"推理步骤2: 17:29:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode 3 对应 'ForcedDoorOpenUnderDoorLockedCondition' 或连续错误尝试告警,说明门锁自身已判定该行为构成安全威胁并主动报警。\",\n \"推理步骤3: 此时家中有人在——16:27 有人回家进入儿童房(儿童放学回家的合理时间),但门锁错误尝试的 OperationSource=3 表明操作来源并非手动(Manual)或内部,而是来自外部/远程渠道,与家中已有住户的正常操作不符。\",\n \"推理步骤4: 17:44 有人通过 Manual 方式正常开锁进入(可能是家长回家),说明 17:29 的尝试者并非持有正确凭证的家庭成员。\",\n \"推理步骤5: 排除误报可能——单次错误可能是误操作,但 40 秒内 4 次连续失败加上触发门锁报警,模式高度符合非法入侵尝试。\"\n ],\n \"key_evidence\": [\n \"17:29:00-17:29:40 四次连续 LockOperationError(OperationError=1, OperationSource=3),间隔极短(10-15秒)\",\n \"17:29:50 触发 DoorLockAlarm(AlarmCode=3),门锁自身判定为安全告警\",\n \"操作来源 OperationSource=3 为外部/远程方式,非手动或自动\",\n \"当时家中有儿童(16:27 回家),存在人身安全风险\"\n ],\n \"recommended_actions\": [\n \"立即向户主手机推送高优先级入侵告警通知,告知门锁遭受多次非法解锁尝试\",\n \"确认门锁当前处于锁定状态,如未锁定则立即远程锁定\",\n \"检查是否存在远程访问凭证泄露,建议立即更换门锁密码/PIN码并撤销可疑的远程访问授权\",\n \"调取门口摄像头(如有)17:29 前后的录像,确认尝试者身份\",\n \"考虑启用门锁连续错误自动锁定策略(如 3 次失败后锁定 30 分钟),防止暴力破解\",\n \"因家中有儿童独处,建议户主尽快确认孩子安全状况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在短时间内遭受多次连续错误解锁尝试并触发强制入侵报警,疑似有人试图非法闯入。", "reasoning": ["推理步骤1: 17:29:00 至 17:29:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3),即通过远程/外部方式尝试解锁均失败,间隔仅 10-15 秒,属于密集暴力尝试模式。", "推理步骤2: 17:29:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode 3 对应 'ForcedDoorOpenUnderDoorLockedCondition' 或连续错误尝试告警,说明门锁自身已判定该行为构成安全威胁并主动报警。", "推理步骤3: 此时家中有人在——16:27 有人回家进入儿童房(儿童放学回家的合理时间),但门锁错误尝试的 OperationSource=3 表明操作来源并非手动(Manual)或内部,而是来自外部/远程渠道,与家中已有住户的正常操作不符。", "推理步骤4: 17:44 有人通过 Manual 方式正常开锁进入(可能是家长回家),说明 17:29 的尝试者并非持有正确凭证的家庭成员。", "推理步骤5: 排除误报可能——单次错误可能是误操作,但 40 秒内 4 次连续失败加上触发门锁报警,模式高度符合非法入侵尝试。"], "key_evidence": ["17:29:00-17:29:40 四次连续 LockOperationError(OperationError=1, OperationSource=3),间隔极短(10-15秒)", "17:29:50 触发 DoorLockAlarm(AlarmCode=3),门锁自身判定为安全告警", "操作来源 OperationSource=3 为外部/远程方式,非手动或自动", "当时家中有儿童(16:27 回家),存在人身安全风险"], "recommended_actions": ["立即向户主手机推送高优先级入侵告警通知,告知门锁遭受多次非法解锁尝试", "确认门锁当前处于锁定状态,如未锁定则立即远程锁定", "检查是否存在远程访问凭证泄露,建议立即更换门锁密码/PIN码并撤销可疑的远程访问授权", "调取门口摄像头(如有)17:29 前后的录像,确认尝试者身份", "考虑启用门锁连续错误自动锁定策略(如 3 次失败后锁定 30 分钟),防止暴力破解", "因家中有儿童独处,建议户主尽快确认孩子安全状况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.742438316345215, "api_error": null} {"episode_id": "SQ2_TP_C_0232", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0232.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20260861, "scenario_id": "INS-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T00:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时客厅窗户在深夜处于打开状态且整夜未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:23、18:45、19:10 四个时间点报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温导致读数异常),但灶具关闭后(07:22 关灶、07:23 仍为 None)以及 19:10(灶具 19:09 已关闭)依然出现 None 值,说明这不完全是灶具干扰,传感器本身可能存在间歇性故障。\",\n \"推理步骤2: 在 07:30 和 19:30 的定时读数中传感器又恢复了正常数值,说明故障是间歇性的,但这种不稳定性会影响厨房火灾/高温预警的可靠性,存在安全隐患。\",\n \"推理步骤3: 客厅窗户传感器1(living_room_window_contact_1)在 00:35 报告 StateValue = False(窗户打开),之后整个日志中再无该传感器的关闭事件(StateValue = True)。这意味着窗户在深夜打开后可能整天都未关闭,包括家人 07:31 出门后无人在家的时段,存在入侵风险。\",\n \"推理步骤4: 其余设备行为均符合正常生活模式:约 06:00 起床、06:50 做早餐、07:31 出门并自动锁门、16:08 孩子放学回家、18:08 大人下班回家做晚饭、20:42 孩子关灯睡觉、22:23 大人就寝。门锁开关、灯光、空调使用均合理。\",\n \"推理步骤5: 厨房窗户(kitchen_window_contact)在 07:22:30 和 19:09:30 两次打开(做饭后通风),属于正常行为,但日志中同样未见关闭事件,可能也处于持续打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:53、07:23、18:45、19:10 四次报告 MeasuredValue = None,表明传感器间歇性失效\",\n \"living_room_window_contact_1 在 00:35 报告 StateValue = False(打开)后,全天无关闭记录,包括 07:31-16:08 家中无人时段\",\n \"kitchen_window_contact 在 07:22:30 和 19:09:30 两次打开,日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,必要时更换设备,确保厨房高温/火灾预警功能可靠\",\n \"确认客厅窗户当前是否仍处于打开状态,若是则尽快关闭;建议设置离家模式自动检查所有窗户状态并发出提醒\",\n \"确认厨房窗户当前状态,长时间开窗在无人时段存在安全隐患\",\n \"建议在离家自动化场景中加入窗户状态检查:若检测到出门锁门时有窗户未关闭,自动发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时客厅窗户在深夜处于打开状态且整夜未关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:23、18:45、19:10 四个时间点报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温导致读数异常),但灶具关闭后(07:22 关灶、07:23 仍为 None)以及 19:10(灶具 19:09 已关闭)依然出现 None 值,说明这不完全是灶具干扰,传感器本身可能存在间歇性故障。", "推理步骤2: 在 07:30 和 19:30 的定时读数中传感器又恢复了正常数值,说明故障是间歇性的,但这种不稳定性会影响厨房火灾/高温预警的可靠性,存在安全隐患。", "推理步骤3: 客厅窗户传感器1(living_room_window_contact_1)在 00:35 报告 StateValue = False(窗户打开),之后整个日志中再无该传感器的关闭事件(StateValue = True)。这意味着窗户在深夜打开后可能整天都未关闭,包括家人 07:31 出门后无人在家的时段,存在入侵风险。", "推理步骤4: 其余设备行为均符合正常生活模式:约 06:00 起床、06:50 做早餐、07:31 出门并自动锁门、16:08 孩子放学回家、18:08 大人下班回家做晚饭、20:42 孩子关灯睡觉、22:23 大人就寝。门锁开关、灯光、空调使用均合理。", "推理步骤5: 厨房窗户(kitchen_window_contact)在 07:22:30 和 19:09:30 两次打开(做饭后通风),属于正常行为,但日志中同样未见关闭事件,可能也处于持续打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:53、07:23、18:45、19:10 四次报告 MeasuredValue = None,表明传感器间歇性失效", "living_room_window_contact_1 在 00:35 报告 StateValue = False(打开)后,全天无关闭记录,包括 07:31-16:08 家中无人时段", "kitchen_window_contact 在 07:22:30 和 19:09:30 两次打开,日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,必要时更换设备,确保厨房高温/火灾预警功能可靠", "确认客厅窗户当前是否仍处于打开状态,若是则尽快关闭;建议设置离家模式自动检查所有窗户状态并发出提醒", "确认厨房窗户当前状态,长时间开窗在无人时段存在安全隐患", "建议在离家自动化场景中加入窗户状态检查:若检测到出门锁门时有窗户未关闭,自动发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.21785020828247, "api_error": null} {"episode_id": "SQ2_TP_C_0235", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0235.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20260864, "scenario_id": "FG-03", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-28T17:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"客厅烟雾报警器在17:02检测到一氧化碳(CO)泄漏警报,存在严重的人身安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 17:02时客厅烟雾报警器报告 COState = 1(一氧化碳警告状态),ExpressedState = 2(CO报警激活),并触发了 COAlarm 事件,表明检测到一氧化碳浓度超标。\",\n \"推理步骤2: 一氧化碳是无色无味气体,人体无法自行察觉,低浓度即可导致头晕、恶心,高浓度可致命,因此CO报警属于最高优先级的安全事件。\",\n \"推理步骤3: 查看温度日志,各房间温度在当天呈现正常的日间升温-夜间降温曲线(夜间约23°C,午间峰值约25.9°C),未出现局部异常高温,排除明火或火灾引发的CO可能性。\",\n \"推理步骤4: 厨房烟雾报警器未触发,厨房灶具无使用记录,说明CO来源不太可能是烹饪。需要排查燃气管道泄漏、热水器故障、或外部CO侵入等原因。\",\n \"推理步骤5: 报警发生后直至日志结束(23:30),未见 COState 恢复为 0 或报警解除的记录,说明CO问题可能持续存在,风险仍未消除。\"\n ],\n \"key_evidence\": [\n \"17:02 living_room_smoke_alarm COState = 1(CO警告级别触发)\",\n \"17:02 living_room_smoke_alarm ExpressedState = 2(设备进入CO报警表达状态)\",\n \"17:02 living_room_smoke_alarm 触发 COAlarm 事件\",\n \"整个日志期间未见CO报警解除记录,表明问题可能持续\",\n \"厨房烟雾报警器未触发、灶具无使用记录,CO来源不明确\"\n ],\n \"recommended_actions\": [\n \"立即开窗通风,打开所有门窗(阳台门、厨房窗户、客厅窗户等)让空气流通\",\n \"所有家庭成员立即撤离至室外安全区域,尤其注意儿童房是否有人\",\n \"拨打燃气公司紧急热线或119,请专业人员上门检测CO来源\",\n \"排查可能的CO来源:燃气热水器、燃气管道、壁挂炉等燃气设备是否存在不完全燃烧或泄漏\",\n \"在CO来源确认并排除前,不要返回室内居住\",\n \"考虑在主卧、儿童房等其他房间增设独立CO探测器,提升检测覆盖范围\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "客厅烟雾报警器在17:02检测到一氧化碳(CO)泄漏警报,存在严重的人身安全威胁。", "reasoning": ["推理步骤1: 17:02时客厅烟雾报警器报告 COState = 1(一氧化碳警告状态),ExpressedState = 2(CO报警激活),并触发了 COAlarm 事件,表明检测到一氧化碳浓度超标。", "推理步骤2: 一氧化碳是无色无味气体,人体无法自行察觉,低浓度即可导致头晕、恶心,高浓度可致命,因此CO报警属于最高优先级的安全事件。", "推理步骤3: 查看温度日志,各房间温度在当天呈现正常的日间升温-夜间降温曲线(夜间约23°C,午间峰值约25.9°C),未出现局部异常高温,排除明火或火灾引发的CO可能性。", "推理步骤4: 厨房烟雾报警器未触发,厨房灶具无使用记录,说明CO来源不太可能是烹饪。需要排查燃气管道泄漏、热水器故障、或外部CO侵入等原因。", "推理步骤5: 报警发生后直至日志结束(23:30),未见 COState 恢复为 0 或报警解除的记录,说明CO问题可能持续存在,风险仍未消除。"], "key_evidence": ["17:02 living_room_smoke_alarm COState = 1(CO警告级别触发)", "17:02 living_room_smoke_alarm ExpressedState = 2(设备进入CO报警表达状态)", "17:02 living_room_smoke_alarm 触发 COAlarm 事件", "整个日志期间未见CO报警解除记录,表明问题可能持续", "厨房烟雾报警器未触发、灶具无使用记录,CO来源不明确"], "recommended_actions": ["立即开窗通风,打开所有门窗(阳台门、厨房窗户、客厅窗户等)让空气流通", "所有家庭成员立即撤离至室外安全区域,尤其注意儿童房是否有人", "拨打燃气公司紧急热线或119,请专业人员上门检测CO来源", "排查可能的CO来源:燃气热水器、燃气管道、壁挂炉等燃气设备是否存在不完全燃烧或泄漏", "在CO来源确认并排除前,不要返回室内居住", "考虑在主卧、儿童房等其他房间增设独立CO探测器,提升检测覆盖范围"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.416524648666382, "api_error": null} {"episode_id": "SQ2_TP_C_0237", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0237.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20260866, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T10:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在家中无人时段遭受连续密码/凭证暴力尝试,触发防撬报警\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:32 关灯、手动开锁出门,门关闭后自动上锁(LockState=1),此后全屋无任何运动传感器触发、无灯光操作,表明家中无人\",\n \"推理步骤2: 10:43:00 至 10:43:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3),即通过远程/键盘方式输入了错误凭证,间隔仅 15-15-15 秒,呈现典型的暴力尝试模式\",\n \"推理步骤3: 10:43:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵/错误次数过多\"报警,说明门锁自身已判定为入侵威胁\",\n \"推理步骤4: 整个过程中入户门传感器(front_door_contact)未报告开门事件,说明入侵者未成功进入,但威胁真实存在\",\n \"推理步骤5: 直到 15:57 才有人通过手动开锁正常进入(疑似孩子放学回家),期间长达 5 小时无人在家,排除了住户自己忘记密码的可能性\"\n ],\n \"key_evidence\": [\n \"10:43:00-10:43:40 连续 4 次 LockOperationError(OperationError=1, OperationSource=3)——错误凭证通过键盘/远程方式尝试开锁\",\n \"10:43:50 触发 DoorLockAlarm(AlarmCode=3)——门锁防入侵报警\",\n \"07:32-15:57 全屋无人(无运动传感器触发、无灯光操作),排除住户误操作\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵警报,告知门锁遭到暴力尝试\",\n \"检查门锁是否已自动进入锁定/冻结状态,若未锁定则远程启用临时锁定策略,阻止进一步尝试\",\n \"调取入户门区域的监控摄像头录像(如有),确认 10:43 前后是否有可疑人员\",\n \"考虑更换或升级门锁密码,启用双因素认证(如密码+指纹)\",\n \"向物业或社区安保通报此事件,必要时报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在家中无人时段遭受连续密码/凭证暴力尝试,触发防撬报警\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:32 关灯、手动开锁出门,门关闭后自动上锁(LockState=1),此后全屋无任何运动传感器触发、无灯光操作,表明家中无人\",\n \"推理步骤2: 10:43:00 至 10:43:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3),即通过远程/键盘方式输入了错误凭证,间隔仅 15-15-15 秒,呈现典型的暴力尝试模式\",\n \"推理步骤3: 10:43:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵/错误次数过多\"报警,说明门锁自身已判定为入侵威胁\",\n "], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 20.83905553817749, "api_error": null} {"episode_id": "SQ2_TP_C_0238", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0238.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20260867, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T23:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"深夜23:57入户门锁遭受连续多次错误解锁尝试,触发门锁报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 23:57发生了4次连续的LockOperationError事件,错误类型为OperationError=1(无效凭证),操作来源为OperationSource=3(远程/键盘输入),间隔仅10-15秒,属于短时间内密集尝试。\",\n \"推理步骤2: 最终触发了DoorLockAlarm(AlarmCode=3),即多次错误尝试后的锁定报警,说明门锁安全机制已被激活。\",\n \"推理步骤3: 此时家庭成员已于22:12进入主卧就寝(主卧运动传感器触发、窗帘关闭、灯关闭),全屋无任何运动传感器触发,排除了住户自己忘带钥匙在门外操作的可能性(住户在室内)。\",\n \"推理步骤4: 当天正常的开锁操作均为Manual来源且成功,而此次为OperationSource=3(远程键盘/密码输入)且全部失败,行为模式与暴力破解密码一致。\"\n ],\n \"key_evidence\": [\n \"23:57:00-23:57:40 四次LockOperationError(OperationError=1, OperationSource=3),间隔极短\",\n \"23:57:50 触发DoorLockAlarm(AlarmCode=3)——多次错误尝试报警\",\n \"22:12已确认住户在室内就寝,入户门已锁定(LockState=1),排除住户自身操作\",\n \"全天无其他异常远程解锁尝试,此为孤立的深夜异常事件\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵警报通知\",\n \"激活玄关区域摄像头(如有)进行录像取证\",\n \"考虑触发室外警报/门廊灯光闪烁以威慑入侵者\",\n \"如短时间内门锁状态发生变化(被打开),立即自动报警联系物业或警方\",\n \"建议住户检查并更换门锁密码,排查密码是否泄露\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "深夜23:57入户门锁遭受连续多次错误解锁尝试,触发门锁报警,疑似有人试图非法入侵。", "reasoning": ["推理步骤1: 23:57发生了4次连续的LockOperationError事件,错误类型为OperationError=1(无效凭证),操作来源为OperationSource=3(远程/键盘输入),间隔仅10-15秒,属于短时间内密集尝试。", "推理步骤2: 最终触发了DoorLockAlarm(AlarmCode=3),即多次错误尝试后的锁定报警,说明门锁安全机制已被激活。", "推理步骤3: 此时家庭成员已于22:12进入主卧就寝(主卧运动传感器触发、窗帘关闭、灯关闭),全屋无任何运动传感器触发,排除了住户自己忘带钥匙在门外操作的可能性(住户在室内)。", "推理步骤4: 当天正常的开锁操作均为Manual来源且成功,而此次为OperationSource=3(远程键盘/密码输入)且全部失败,行为模式与暴力破解密码一致。"], "key_evidence": ["23:57:00-23:57:40 四次LockOperationError(OperationError=1, OperationSource=3),间隔极短", "23:57:50 触发DoorLockAlarm(AlarmCode=3)——多次错误尝试报警", "22:12已确认住户在室内就寝,入户门已锁定(LockState=1),排除住户自身操作", "全天无其他异常远程解锁尝试,此为孤立的深夜异常事件"], "recommended_actions": ["立即向住户手机推送高优先级入侵警报通知", "激活玄关区域摄像头(如有)进行录像取证", "考虑触发室外警报/门廊灯光闪烁以威慑入侵者", "如短时间内门锁状态发生变化(被打开),立即自动报警联系物业或警方", "建议住户检查并更换门锁密码,排查密码是否泄露"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.86053156852722, "api_error": null} {"episode_id": "SQ2_TP_C_0242", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0242.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20260871, "scenario_id": "INS-02", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-28T06:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在清晨06:35连续4次解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在06:35:00至06:35:40的40秒内,入户门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationError=1 表示密码/凭证错误,OperationSource=3 通常对应远程或键盘输入方式,说明有人在反复尝试错误密码开锁。\",\n \"推理步骤2: 紧接着在06:35:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"(错误密码次数超限报警),这是门锁内置的防暴力破解保护机制被触发。\",\n \"推理步骤3: 事件发生在清晨06:35,属于大多数家庭尚在睡眠或刚起床的时段。整个过程仅持续约50秒,4次错误尝试间隔极短(15秒、10秒、15秒),呈现出快速连续试探的模式,不符合住户偶尔输错密码的正常行为。\",\n \"推理步骤4: 日志中没有任何运动传感器(玄关、客厅等)在该时段报告有人活动,也没有门锁成功解锁的记录,说明尝试者未能进入室内,但入侵意图明确。\",\n \"推理步骤5: 温度数据全天正常波动(夜间约23°C,午间峰值约25.9°C),各房间温度一致,无火灾或设备异常迹象,排除其他威胁类型。本次唯一的安全事件集中在门锁。\"\n ],\n \"key_evidence\": [\n \"06:35:00-06:35:40 共4次 LockOperationError(OperationError=1 密码错误, OperationSource=3 键盘/远程输入),间隔仅10-15秒\",\n \"06:35:50 触发 DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警,确认暴力尝试触发了门锁安全机制\",\n \"事件发生在清晨06:35,无对应的室内运动传感器触发,无成功开锁记录\"\n ],\n \"recommended_actions\": [\n \"立即查看入户门外的监控摄像头录像(如有),确认06:35前后是否有可疑人员逗留\",\n \"检查门锁是否已自动进入锁定/冻结状态,确认当前门锁仍处于锁定安全状态\",\n \"如确认非家庭成员操作,及时更换门锁密码,并考虑报警处理\",\n \"启用门锁的连续错误尝试自动通知功能,确保类似事件能第一时间推送到住户手机\",\n \"考虑在玄关区域增设摄像头或加强夜间安防模式(如联动玄关灯自动亮起)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在清晨06:35连续4次解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在06:35:00至06:35:40的40秒内,入户门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationError=1 表示密码/凭证错误,OperationSource=3 通常对应远程或键盘输入方式,说明有人在反复尝试错误密码开锁。\",\n \"推理步骤2: 紧接着在06:35:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"(错误密码次数超限报警),这是门锁内置的防暴力破"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 22.647725105285645, "api_error": null} {"episode_id": "SQ2_TP_C_0244", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0244.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260873, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-30T10:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了三次 MeasuredValue = None 的情况(07:07、07:12、18:39、19:22),而其他房间的温度传感器始终正常上报数值,说明这不是系统级通信问题,而是该传感器的个体问题。\",\n \"推理步骤2: None 值均出现在灶具开启期间或刚关闭后(07:06:38 灶具开启 → 07:07:08 首次 None;18:38:30 灶具开启 → 18:39 None),推测灶具工作时产生的高温或电磁干扰可能导致传感器读数异常或暂时失联。\",\n \"推理步骤3: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合用于火灾预警。如果传感器在灶具使用时恰好失效,将形成安全监控盲区,无法及时发现异常高温。\",\n \"推理步骤4: 其余家庭活动模式均属正常——早晨 06:08 起床、07:22 出门上班/上学并自动锁门、16:04 孩子放学回家、18:17 大人下班回家、22:44 就寝锁门,符合典型三口之家的作息规律。\",\n \"推理步骤5: 入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件;10:24 主卧窗户短暂开关(约3分钟)期间有运动传感器检测到人员活动,但家人已于 07:22 出门,这可能是家政人员或值得关注的事件,不过置信度不足以判定为入侵。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:07、07:12、18:39、19:22 四次报告 MeasuredValue = None\",\n \"None 值均与 kitchen_cook_surface 开启时段高度关联(07:06-07:11 和 18:38-19:21)\",\n \"同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数据\",\n \"07:30 和 19:30 的读数恢复正常,说明传感器并非永久损坏,而是间歇性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温或油烟影响,必要时调整安装位置\",\n \"检查该传感器的固件版本并更新,排除软件层面的兼容性问题\",\n \"如问题持续出现,建议更换传感器或增加一个备用温度传感器,避免灶具使用期间出现监控盲区\",\n \"关注 10:24 主卧窗户开关事件——家人已于 07:22 全部外出,若无家政人员预约,建议核实是否有人未经授权进入\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了三次 MeasuredValue = None 的情况(07:07、07:12、18:39、19:22),而其他房间的温度传感器始终正常上报数值,说明这不是系统级通信问题,而是该传感器的个体问题。", "推理步骤2: None 值均出现在灶具开启期间或刚关闭后(07:06:38 灶具开启 → 07:07:08 首次 None;18:38:30 灶具开启 → 18:39 None),推测灶具工作时产生的高温或电磁干扰可能导致传感器读数异常或暂时失联。", "推理步骤3: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合用于火灾预警。如果传感器在灶具使用时恰好失效,将形成安全监控盲区,无法及时发现异常高温。", "推理步骤4: 其余家庭活动模式均属正常——早晨 06:08 起床、07:22 出门上班/上学并自动锁门、16:04 孩子放学回家、18:17 大人下班回家、22:44 就寝锁门,符合典型三口之家的作息规律。", "推理步骤5: 入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件;10:24 主卧窗户短暂开关(约3分钟)期间有运动传感器检测到人员活动,但家人已于 07:22 出门,这可能是家政人员或值得关注的事件,不过置信度不足以判定为入侵。"], "key_evidence": ["kitchen_temp_sensor 在 07:07、07:12、18:39、19:22 四次报告 MeasuredValue = None", "None 值均与 kitchen_cook_surface 开启时段高度关联(07:06-07:11 和 18:38-19:21)", "同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数据", "07:30 和 19:30 的读数恢复正常,说明传感器并非永久损坏,而是间歇性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温或油烟影响,必要时调整安装位置", "检查该传感器的固件版本并更新,排除软件层面的兼容性问题", "如问题持续出现,建议更换传感器或增加一个备用温度传感器,避免灶具使用期间出现监控盲区", "关注 10:24 主卧窗户开关事件——家人已于 07:22 全部外出,若无家政人员预约,建议核实是否有人未经授权进入"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.969114065170288, "api_error": null} {"episode_id": "SQ2_TP_C_0246", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0246.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20260875, "scenario_id": "FG-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-14T13:23:00", "variant": "TP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.957073926925659, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ2_TP_C_0245", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0245.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260874, "scenario_id": "FG-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-20T19:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅在19:32出现异常高温飙升并触发烟雾报警,高度疑似火灾事件。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度数据呈现正常的昼夜波动曲线,各房间温度在22.9°C~25.9°C之间平稳变化,彼此高度一致,符合夏季室内温度规律。\",\n \"推理步骤2: 19:30客厅温度为24.38°C,仅2分钟后(19:32)客厅温度传感器突然报告34.00°C,5分钟后(19:37)仍高达32.00°C。这是一次约10°C的瞬间跳变,远超正常环境温度变化速率,且仅发生在客厅,其他房间同时段温度正常。\",\n \"推理步骤3: 19:42客厅烟雾报警器触发(SmokeState = 1,表示检测到烟雾),与温度异常飙升在时间和空间上高度吻合,形成'高温+烟雾'的火灾特征证据链。\",\n \"推理步骤4: 20:00客厅温度回落至24.06°C,说明高温事件持续约20-30分钟后消退。这可能是火源被扑灭或自行熄灭,但烟雾报警已触发,不能排除余烬或复燃风险。\",\n \"推理步骤5: 排除传感器故障的可能性——如果仅是温度传感器误报,不会同时触发独立的烟雾报警器。两个不同类型的传感器交叉印证,大幅提高了真实火灾事件的可信度。\"\n ],\n \"key_evidence\": [\n \"19:32 客厅温度从约24.4°C瞬间飙升至34.0°C,19:37仍为32.0°C,远超正常波动范围\",\n \"19:42 客厅烟雾报警器触发 SmokeState = 1,与温度异常在时间和位置上完全吻合\",\n \"同时段其他房间(主卧、儿童房、厨房)温度均正常,排除全屋性环境因素\"\n ],\n \"recommended_actions\": [\n \"立即确认客厅现场情况,检查是否存在明火、冒烟或烧焦痕迹,必要时拨打119报警\",\n \"确保所有家庭成员(尤其是儿童)安全撤离或远离客厅区域\",\n \"检查客厅可能的火源:电器短路、插线板过载、未熄灭的蜡烛或烟头等\",\n \"在确认安全后手动复位烟雾报警器,并开窗通风排烟\",\n \"事后检查客厅电气线路和相关电器,排除隐患防止复发\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅在19:32出现异常高温飙升并触发烟雾报警,高度疑似火灾事件。", "reasoning": ["推理步骤1: 全天温度数据呈现正常的昼夜波动曲线,各房间温度在22.9°C~25.9°C之间平稳变化,彼此高度一致,符合夏季室内温度规律。", "推理步骤2: 19:30客厅温度为24.38°C,仅2分钟后(19:32)客厅温度传感器突然报告34.00°C,5分钟后(19:37)仍高达32.00°C。这是一次约10°C的瞬间跳变,远超正常环境温度变化速率,且仅发生在客厅,其他房间同时段温度正常。", "推理步骤3: 19:42客厅烟雾报警器触发(SmokeState = 1,表示检测到烟雾),与温度异常飙升在时间和空间上高度吻合,形成'高温+烟雾'的火灾特征证据链。", "推理步骤4: 20:00客厅温度回落至24.06°C,说明高温事件持续约20-30分钟后消退。这可能是火源被扑灭或自行熄灭,但烟雾报警已触发,不能排除余烬或复燃风险。", "推理步骤5: 排除传感器故障的可能性——如果仅是温度传感器误报,不会同时触发独立的烟雾报警器。两个不同类型的传感器交叉印证,大幅提高了真实火灾事件的可信度。"], "key_evidence": ["19:32 客厅温度从约24.4°C瞬间飙升至34.0°C,19:37仍为32.0°C,远超正常波动范围", "19:42 客厅烟雾报警器触发 SmokeState = 1,与温度异常在时间和位置上完全吻合", "同时段其他房间(主卧、儿童房、厨房)温度均正常,排除全屋性环境因素"], "recommended_actions": ["立即确认客厅现场情况,检查是否存在明火、冒烟或烧焦痕迹,必要时拨打119报警", "确保所有家庭成员(尤其是儿童)安全撤离或远离客厅区域", "检查客厅可能的火源:电器短路、插线板过载、未熄灭的蜡烛或烟头等", "在确认安全后手动复位烟雾报警器,并开窗通风排烟", "事后检查客厅电气线路和相关电器,排除隐患防止复发"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.20431351661682, "api_error": null} {"episode_id": "SQ2_TP_C_0248", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0248.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20260877, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-15T14:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"客厅烟雾报警器在14:12触发一氧化碳(CO)警报,家中无人且无明显CO来源,存在CO中毒隐患。\",\n \"reasoning\": [\n \"推理步骤1: 14:12客厅烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO告警状态)并触发COAlarm事件,这是一次真实的一氧化碳警报。\",\n \"推理步骤2: 此时家中处于无人状态——住户在07:26出门并锁门,直到16:04才有人回家。CO警报发生在空房期间,无人能察觉或处置。\",\n \"推理步骤3: 回溯CO可能来源:厨房灶具在07:10-07:13短暂使用后已关闭,距CO警报已过去7小时,且厨房窗户在07:13已打开通风。厨房烟雾报警器未触发,说明CO并非来自厨房残留燃气。\",\n \"推理步骤4: 客厅没有明显的燃烧源或燃气设备,CO警报却单独在客厅触发,需要排查是否存在隐蔽的CO泄漏源(如墙体内管道泄漏、邻居串味、热水器排气倒灌等),或传感器本身故障。\",\n \"推理步骤5: 日志中CO警报触发后无任何后续复位记录(COState未恢复为0),说明CO可能持续存在,直到住户16:04回家时仍未解除,对回家的住户(包括儿童)构成健康威胁。\",\n \"推理步骤6: 厨房温度传感器在07:11、07:14、18:28、19:22多次报告MeasuredValue=None,虽然这更可能是灶具使用时的热干扰导致的传感器读数异常,但也值得关注设备健康状态。\"\n ],\n \"key_evidence\": [\n \"14:12 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件\",\n \"CO警报发生时家中无人(07:26出门,16:04回家),无人处置\",\n \"客厅无燃烧设备,厨房灶具早在07:13已关闭,CO来源不明\",\n \"CO警报在后续日志中未见复位,可能持续存在\",\n \"16:04有人(含儿童)回家进入可能仍有CO的环境\"\n ],\n \"recommended_actions\": [\n \"立即远程通知住户:家中客厅已触发CO警报,回家后应先开窗通风,如感到头晕、恶心等症状立即撤离并拨打急救电话\",\n \"远程开启客厅窗帘/检查是否可远程打开窗户进行通风,开启所有可用的通风设备\",\n \"联系燃气公司或专业人员上门检测CO泄漏源,排查管道、热水器、邻居串味等可能原因\",\n \"检查客厅烟雾报警器是否需要校准或更换,排除传感器误报的可能\",\n \"检查厨房温度传感器多次报告None的原因,确认设备工作正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "客厅烟雾报警器在14:12触发一氧化碳(CO)警报,家中无人且无明显CO来源,存在CO中毒隐患。", "reasoning": ["推理步骤1: 14:12客厅烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO告警状态)并触发COAlarm事件,这是一次真实的一氧化碳警报。", "推理步骤2: 此时家中处于无人状态——住户在07:26出门并锁门,直到16:04才有人回家。CO警报发生在空房期间,无人能察觉或处置。", "推理步骤3: 回溯CO可能来源:厨房灶具在07:10-07:13短暂使用后已关闭,距CO警报已过去7小时,且厨房窗户在07:13已打开通风。厨房烟雾报警器未触发,说明CO并非来自厨房残留燃气。", "推理步骤4: 客厅没有明显的燃烧源或燃气设备,CO警报却单独在客厅触发,需要排查是否存在隐蔽的CO泄漏源(如墙体内管道泄漏、邻居串味、热水器排气倒灌等),或传感器本身故障。", "推理步骤5: 日志中CO警报触发后无任何后续复位记录(COState未恢复为0),说明CO可能持续存在,直到住户16:04回家时仍未解除,对回家的住户(包括儿童)构成健康威胁。", "推理步骤6: 厨房温度传感器在07:11、07:14、18:28、19:22多次报告MeasuredValue=None,虽然这更可能是灶具使用时的热干扰导致的传感器读数异常,但也值得关注设备健康状态。"], "key_evidence": ["14:12 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件", "CO警报发生时家中无人(07:26出门,16:04回家),无人处置", "客厅无燃烧设备,厨房灶具早在07:13已关闭,CO来源不明", "CO警报在后续日志中未见复位,可能持续存在", "16:04有人(含儿童)回家进入可能仍有CO的环境"], "recommended_actions": ["立即远程通知住户:家中客厅已触发CO警报,回家后应先开窗通风,如感到头晕、恶心等症状立即撤离并拨打急救电话", "远程开启客厅窗帘/检查是否可远程打开窗户进行通风,开启所有可用的通风设备", "联系燃气公司或专业人员上门检测CO泄漏源,排查管道、热水器、邻居串味等可能原因", "检查客厅烟雾报警器是否需要校准或更换,排除传感器误报的可能", "检查厨房温度传感器多次报告None的原因,确认设备工作正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.696388483047485, "api_error": null} {"episode_id": "SQ2_TP_C_0251", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0251.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20260880, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-22T21:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器报警,洗碗机运行期间检测到漏水,且洗碗机未自动停止。\",\n \"reasoning\": [\n \"推理步骤1: 21:36 厨房漏水传感器 kitchen_water_leak 的 StateValue 变为 True,表明检测到积水。\",\n \"推理步骤2: 漏水发生时洗碗机正在运行(19:27 开启,OperationalState=1 表示运行中),21:31 和 21:36 两次确认洗碗机仍处于运行状态,高度怀疑漏水与洗碗机有关(进水管/排水管接口松动、门封老化等)。\",\n \"推理步骤3: 漏水报警后洗碗机未被关闭或暂停,水损风险持续扩大。厨房地面积水可能蔓延至橱柜底部、地板下方,造成不可逆的财产损失和电气安全隐患。\",\n \"推理步骤4: 当前时段为深夜(21:36 之后住户约 22:28 进入主卧就寝),若未及时处理,整夜持续漏水后果严重。\"\n ],\n \"key_evidence\": [\n \"21:36 kitchen_water_leak | StateValue = True — 厨房漏水传感器触发\",\n \"19:27 kitchen_dishwasher 开启运行(OperationalState=1),21:31 和 21:36 仍在运行,未因漏水停机\",\n \"日志中无后续 kitchen_water_leak StateValue=False 的记录,说明漏水状态持续未解除\"\n ],\n \"recommended_actions\": [\n \"立即关闭洗碗机并切断其供水阀门\",\n \"检查洗碗机进水管、排水管连接处及门封胶条是否破损或松脱\",\n \"清理厨房地面积水,检查是否渗入橱柜底部或地板接缝\",\n \"在漏水原因排查清楚之前不要重新启动洗碗机\",\n \"建议配置自动化规则:漏水传感器触发时自动关闭洗碗机并发送紧急通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器报警,洗碗机运行期间检测到漏水,且洗碗机未自动停止。", "reasoning": ["推理步骤1: 21:36 厨房漏水传感器 kitchen_water_leak 的 StateValue 变为 True,表明检测到积水。", "推理步骤2: 漏水发生时洗碗机正在运行(19:27 开启,OperationalState=1 表示运行中),21:31 和 21:36 两次确认洗碗机仍处于运行状态,高度怀疑漏水与洗碗机有关(进水管/排水管接口松动、门封老化等)。", "推理步骤3: 漏水报警后洗碗机未被关闭或暂停,水损风险持续扩大。厨房地面积水可能蔓延至橱柜底部、地板下方,造成不可逆的财产损失和电气安全隐患。", "推理步骤4: 当前时段为深夜(21:36 之后住户约 22:28 进入主卧就寝),若未及时处理,整夜持续漏水后果严重。"], "key_evidence": ["21:36 kitchen_water_leak | StateValue = True — 厨房漏水传感器触发", "19:27 kitchen_dishwasher 开启运行(OperationalState=1),21:31 和 21:36 仍在运行,未因漏水停机", "日志中无后续 kitchen_water_leak StateValue=False 的记录,说明漏水状态持续未解除"], "recommended_actions": ["立即关闭洗碗机并切断其供水阀门", "检查洗碗机进水管、排水管连接处及门封胶条是否破损或松脱", "清理厨房地面积水,检查是否渗入橱柜底部或地板接缝", "在漏水原因排查清楚之前不要重新启动洗碗机", "建议配置自动化规则:漏水传感器触发时自动关闭洗碗机并发送紧急通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.976174116134644, "api_error": null} {"episode_id": "SQ2_TP_C_0256", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0256.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260885, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-02T09:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或受到灶具热源干扰\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:51、07:02、18:33、19:27 四次报告 MeasuredValue = None,而其他房间传感器始终正常上报数值\",\n \"推理步骤2: 这些 None 值出现的时间点与灶具操作高度相关——06:50 灶具状态为 Off 但厨房有活动、07:01 灶具开启、18:32 灶具开启、19:26 灶具关闭,说明传感器可能受灶具热辐射影响导致读数超量程或通信中断\",\n \"推理步骤3: 传感器在非烹饪时段(如 07:00、07:30、19:30 等)能恢复正常读数,排除了永久性硬件损坏,但间歇性故障仍影响厨房安全监控的可靠性——若发生真实火灾,温度传感器可能无法及时报警\",\n \"推理步骤4: 除传感器异常外,整体家庭活动模式正常:早晨 6 点起床、7:21 出门上班/上学并自动锁门、16:35 孩子放学回家、17:51 大人回家、22:11 就寝锁门,无入侵迹象\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:51、07:02、18:33、19:27 四次报告 MeasuredValue = None\",\n \"None 值均出现在灶具操作前后(开启或关闭时刻),其他时段传感器正常\",\n \"其他三个房间的温度传感器全天无异常,排除系统性网络问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确保其远离灶具热源直接辐射范围\",\n \"检查传感器固件版本,确认是否存在已知的超量程读数处理缺陷,必要时更新固件\",\n \"考虑为厨房增加冗余温度监测手段(如烟雾报警器已有,可确认其独立工作正常),避免单点故障影响火灾预警\",\n \"若问题持续,更换传感器或调整其测量量程配置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或受到灶具热源干扰", "reasoning": ["推理步骤1: 厨房温度传感器在 06:51、07:02、18:33、19:27 四次报告 MeasuredValue = None,而其他房间传感器始终正常上报数值", "推理步骤2: 这些 None 值出现的时间点与灶具操作高度相关——06:50 灶具状态为 Off 但厨房有活动、07:01 灶具开启、18:32 灶具开启、19:26 灶具关闭,说明传感器可能受灶具热辐射影响导致读数超量程或通信中断", "推理步骤3: 传感器在非烹饪时段(如 07:00、07:30、19:30 等)能恢复正常读数,排除了永久性硬件损坏,但间歇性故障仍影响厨房安全监控的可靠性——若发生真实火灾,温度传感器可能无法及时报警", "推理步骤4: 除传感器异常外,整体家庭活动模式正常:早晨 6 点起床、7:21 出门上班/上学并自动锁门、16:35 孩子放学回家、17:51 大人回家、22:11 就寝锁门,无入侵迹象"], "key_evidence": ["kitchen_temp_sensor 在 06:51、07:02、18:33、19:27 四次报告 MeasuredValue = None", "None 值均出现在灶具操作前后(开启或关闭时刻),其他时段传感器正常", "其他三个房间的温度传感器全天无异常,排除系统性网络问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确保其远离灶具热源直接辐射范围", "检查传感器固件版本,确认是否存在已知的超量程读数处理缺陷,必要时更新固件", "考虑为厨房增加冗余温度监测手段(如烟雾报警器已有,可确认其独立工作正常),避免单点故障影响火灾预警", "若问题持续,更换传感器或调整其测量量程配置"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.838475704193115, "api_error": null} {"episode_id": "SQ2_TP_C_0255", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0255.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20260884, "scenario_id": "INS-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T00:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时客厅窗户在深夜处于打开状态且未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:51、07:25、18:18、19:24 共四次报告 MeasuredValue = None。这些时间点均与灶具开启或关闭的时间高度吻合(06:50 灶具开、07:24 灶具关、18:17 灶具开、19:23 灶具关),说明传感器可能在灶具工作产生的高温或油烟环境下出现读数异常。\",\n \"推理步骤2: 正常的温度传感器即使在高温环境下也应返回数值(哪怕超出量程),返回 None 通常意味着传感器通信超时、硬件故障或数据解析错误。该问题在一天内重复出现四次,具有规律性,不是偶发现象。\",\n \"推理步骤3: 客厅窗户传感器1(living_room_window_contact_1)在 00:52 报告 StateValue = False(窗户打开),但在整个日志周期内没有出现对应的关闭事件(StateValue = True)。深夜至凌晨窗户持续打开,在家人外出(07:35 全家出门)期间也未关闭,存在一定的安全隐患。\",\n \"推理步骤4: 其余设备行为均符合正常家庭作息模式——早起开灯、做早餐、07:35 出门上锁、16:27 孩子先回家、17:50 大人回家开空调、做晚餐、22:22 睡前关灯锁门。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常入侵迹象。\",\n \"推理步骤5: 温度整体趋势合理:夜间约 23°C,白天逐步升至约 25.8°C 峰值(中午),傍晚回落,符合夏季自然温度变化。无异常温升提示火灾风险。烟雾报警器全天无触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:51、07:25、18:18、19:24 四次报告 MeasuredValue = None,均与灶具状态切换时间强相关\",\n \"living_room_window_contact_1 在 00:52 报告窗户打开(StateValue = False),全天日志中无对应关闭事件,包括 07:35 全家外出期间窗户仍处于打开状态\",\n \"厨房窗户传感器(kitchen_window_contact)在 07:24 和 19:23 报告 StateValue = False(打开),同样无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如有必要重新定位或更换耐高温型号\",\n \"排查厨房温度传感器的固件版本和通信链路,确认 None 值是传感器端故障还是网关端解析问题\",\n \"确认客厅窗户是否确实处于打开状态,建议设置外出模式自动化规则:当入户门上锁且无人在家时,检查并提醒关闭所有窗户\",\n \"为厨房窗户同样设置关闭提醒,避免外出或夜间长时间开窗带来的安全风险\",\n \"考虑为灶具使用场景添加联动规则:灶具开启时如温度传感器持续返回 None,触发告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时客厅窗户在深夜处于打开状态且未关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:51、07:25、18:18、19:24 共四次报告 MeasuredValue = None。这些时间点均与灶具开启或关闭的时间高度吻合(06:50 灶具开、07:24 灶具关、18:17 灶具开、19:23 灶具关),说明传感器可能在灶具工作产生的高温或油烟环境下出现读数异常。", "推理步骤2: 正常的温度传感器即使在高温环境下也应返回数值(哪怕超出量程),返回 None 通常意味着传感器通信超时、硬件故障或数据解析错误。该问题在一天内重复出现四次,具有规律性,不是偶发现象。", "推理步骤3: 客厅窗户传感器1(living_room_window_contact_1)在 00:52 报告 StateValue = False(窗户打开),但在整个日志周期内没有出现对应的关闭事件(StateValue = True)。深夜至凌晨窗户持续打开,在家人外出(07:35 全家出门)期间也未关闭,存在一定的安全隐患。", "推理步骤4: 其余设备行为均符合正常家庭作息模式——早起开灯、做早餐、07:35 出门上锁、16:27 孩子先回家、17:50 大人回家开空调、做晚餐、22:22 睡前关灯锁门。入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常入侵迹象。", "推理步骤5: 温度整体趋势合理:夜间约 23°C,白天逐步升至约 25.8°C 峰值(中午),傍晚回落,符合夏季自然温度变化。无异常温升提示火灾风险。烟雾报警器全天无触发。"], "key_evidence": ["kitchen_temp_sensor 在 06:51、07:25、18:18、19:24 四次报告 MeasuredValue = None,均与灶具状态切换时间强相关", "living_room_window_contact_1 在 00:52 报告窗户打开(StateValue = False),全天日志中无对应关闭事件,包括 07:35 全家外出期间窗户仍处于打开状态", "厨房窗户传感器(kitchen_window_contact)在 07:24 和 19:23 报告 StateValue = False(打开),同样无对应关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如有必要重新定位或更换耐高温型号", "排查厨房温度传感器的固件版本和通信链路,确认 None 值是传感器端故障还是网关端解析问题", "确认客厅窗户是否确实处于打开状态,建议设置外出模式自动化规则:当入户门上锁且无人在家时,检查并提醒关闭所有窗户", "为厨房窗户同样设置关闭提醒,避免外出或夜间长时间开窗带来的安全风险", "考虑为灶具使用场景添加联动规则:灶具开启时如温度传感器持续返回 None,触发告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.213526964187622, "api_error": null} {"episode_id": "SQ2_TP_C_0259", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0259.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20260888, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-25T03:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"凌晨4点洗碗机运行期间厨房漏水传感器触发报警,且至今未见复位记录,存在持续漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 03:55 洗碗机进入运行状态(OperationalState=1),04:00 厨房漏水传感器报告 StateValue=True,时间高度吻合,说明漏水与洗碗机运行直接相关。\",\n \"推理步骤2: 漏水发生在凌晨4点,全屋无任何人员活动(所有运动传感器无触发、所有灯关闭),住户处于深度睡眠状态,无人能及时发现和处理漏水。\",\n \"推理步骤3: 在整个日志时间范围(04:00至23:30)内,未见 kitchen_water_leak 传感器恢复为 False 的记录,说明漏水状态可能一直持续,或者至少未被确认处理。\",\n \"推理步骤4: 晚间19:38 洗碗机再次启动运行,如果漏水源头(如进水管接头、排水管)未修复,二次运行可能加剧漏水情况。\",\n \"推理步骤5: 厨房温度传感器在06:46、07:31、18:24、19:25多次报告 MeasuredValue=None,虽然可能是灶具使用时的干扰,但也需排查是否因水渍导致传感器故障。\"\n ],\n \"key_evidence\": [\n \"04:00 kitchen_water_leak | StateValue = True — 漏水报警触发\",\n \"03:55 kitchen_dishwasher | OperationalState = 1 — 洗碗机在漏水前5分钟开始运行\",\n \"全天日志中无 kitchen_water_leak StateValue = False 的复位记录\",\n \"漏水时段(凌晨4点)全屋无人员活动,无人及时响应\",\n \"kitchen_temp_sensor 多次报告 None,可能存在设备受损迹象\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房地面是否有积水,确认漏水是否仍在持续\",\n \"检查洗碗机进水管、排水管接头及机身底部是否有渗漏\",\n \"在确认漏水源头修复前,暂停使用洗碗机(晚间已再次启动,建议关注)\",\n \"检查厨房漏水传感器本身是否正常工作,确认其未因浸水而卡在报警状态\",\n \"排查厨房温度传感器多次返回 None 的原因,确认是否因水渍导致电路故障\",\n \"建议为洗碗机加装自动断水阀,在漏水传感器触发时自动切断进水\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "凌晨4点洗碗机运行期间厨房漏水传感器触发报警,且至今未见复位记录,存在持续漏水风险。", "reasoning": ["推理步骤1: 03:55 洗碗机进入运行状态(OperationalState=1),04:00 厨房漏水传感器报告 StateValue=True,时间高度吻合,说明漏水与洗碗机运行直接相关。", "推理步骤2: 漏水发生在凌晨4点,全屋无任何人员活动(所有运动传感器无触发、所有灯关闭),住户处于深度睡眠状态,无人能及时发现和处理漏水。", "推理步骤3: 在整个日志时间范围(04:00至23:30)内,未见 kitchen_water_leak 传感器恢复为 False 的记录,说明漏水状态可能一直持续,或者至少未被确认处理。", "推理步骤4: 晚间19:38 洗碗机再次启动运行,如果漏水源头(如进水管接头、排水管)未修复,二次运行可能加剧漏水情况。", "推理步骤5: 厨房温度传感器在06:46、07:31、18:24、19:25多次报告 MeasuredValue=None,虽然可能是灶具使用时的干扰,但也需排查是否因水渍导致传感器故障。"], "key_evidence": ["04:00 kitchen_water_leak | StateValue = True — 漏水报警触发", "03:55 kitchen_dishwasher | OperationalState = 1 — 洗碗机在漏水前5分钟开始运行", "全天日志中无 kitchen_water_leak StateValue = False 的复位记录", "漏水时段(凌晨4点)全屋无人员活动,无人及时响应", "kitchen_temp_sensor 多次报告 None,可能存在设备受损迹象"], "recommended_actions": ["立即检查厨房地面是否有积水,确认漏水是否仍在持续", "检查洗碗机进水管、排水管接头及机身底部是否有渗漏", "在确认漏水源头修复前,暂停使用洗碗机(晚间已再次启动,建议关注)", "检查厨房漏水传感器本身是否正常工作,确认其未因浸水而卡在报警状态", "排查厨房温度传感器多次返回 None 的原因,确认是否因水渍导致电路故障", "建议为洗碗机加装自动断水阀,在漏水传感器触发时自动切断进水"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.538378953933716, "api_error": null} {"episode_id": "SQ2_TP_C_0268", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0268.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20260897, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-22T21:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器持续报警超过30分钟,存在真实漏水风险,且当前无人处理。\",\n \"reasoning\": [\n \"推理步骤1: 次卫漏水传感器在 21:15、21:25、21:45 连续三次报告 StateValue = True,表明漏水状态持续存在且未消除,时间跨度至少30分钟。\",\n \"推理步骤2: 如果是短暂溅水或传感器误触,通常会在几分钟内恢复为 False。持续30分钟的 True 状态强烈指向真实漏水。\",\n \"推理步骤3: 从日志看,21:10 儿童房关灯就寝,22:19 主卧关灯就寝,全家进入睡眠状态。漏水发生在夜间无人活跃区域,不太可能被住户自行发现。\",\n \"推理步骤4: 次卫当天仅在 06:51 有开灯记录(无运动传感器),此后无任何使用迹象,排除了正在使用卫生间导致的正常溅水。\",\n \"推理步骤5: 厨房温度传感器在 06:55、07:05、18:18、19:12 四次报告 MeasuredValue = None,属于设备故障的次要异常,但不构成即时安全威胁。\"\n ],\n \"key_evidence\": [\n \"21:15 second_bathroom_water_leak | StateValue = True\",\n \"21:25 second_bathroom_water_leak | StateValue = True(10分钟后仍未恢复)\",\n \"21:45 second_bathroom_water_leak | StateValue = True(30分钟后仍未恢复)\",\n \"次卫当天几乎无使用记录,排除正常用水导致的误报\",\n \"全家已进入睡眠状态,无人能及时发现和处理漏水\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送高优先级漏水警报通知(推送+短信),确保能唤醒住户\",\n \"如果家中有智能水阀,建议自动关闭次卫供水管路以止损\",\n \"住户应尽快前往次卫检查漏水源头(水管接头、马桶底部、地漏等)\",\n \"检查漏水是否已扩散到相邻区域(儿童房、走廊),防止浸泡地板和家具\",\n \"另外建议排查厨房温度传感器多次报告 None 的问题,可能存在设备故障或连接不稳定\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器持续报警超过30分钟,存在真实漏水风险,且当前无人处理。", "reasoning": ["推理步骤1: 次卫漏水传感器在 21:15、21:25、21:45 连续三次报告 StateValue = True,表明漏水状态持续存在且未消除,时间跨度至少30分钟。", "推理步骤2: 如果是短暂溅水或传感器误触,通常会在几分钟内恢复为 False。持续30分钟的 True 状态强烈指向真实漏水。", "推理步骤3: 从日志看,21:10 儿童房关灯就寝,22:19 主卧关灯就寝,全家进入睡眠状态。漏水发生在夜间无人活跃区域,不太可能被住户自行发现。", "推理步骤4: 次卫当天仅在 06:51 有开灯记录(无运动传感器),此后无任何使用迹象,排除了正在使用卫生间导致的正常溅水。", "推理步骤5: 厨房温度传感器在 06:55、07:05、18:18、19:12 四次报告 MeasuredValue = None,属于设备故障的次要异常,但不构成即时安全威胁。"], "key_evidence": ["21:15 second_bathroom_water_leak | StateValue = True", "21:25 second_bathroom_water_leak | StateValue = True(10分钟后仍未恢复)", "21:45 second_bathroom_water_leak | StateValue = True(30分钟后仍未恢复)", "次卫当天几乎无使用记录,排除正常用水导致的误报", "全家已进入睡眠状态,无人能及时发现和处理漏水"], "recommended_actions": ["立即向住户发送高优先级漏水警报通知(推送+短信),确保能唤醒住户", "如果家中有智能水阀,建议自动关闭次卫供水管路以止损", "住户应尽快前往次卫检查漏水源头(水管接头、马桶底部、地漏等)", "检查漏水是否已扩散到相邻区域(儿童房、走廊),防止浸泡地板和家具", "另外建议排查厨房温度传感器多次报告 None 的问题,可能存在设备故障或连接不稳定"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.950976848602295, "api_error": null} {"episode_id": "SQ2_TP_C_0273", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0273.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20260902, "scenario_id": "INS-05", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-20T19:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"住户正常回家,所有事件符合典型的归家行为模式\",\n \"reasoning\": [\n \"推理步骤1: 19:47 入户门锁触发 LockOperation,LockOperationType=1(解锁),OperationSource=8(远程/密码操作),UserIndex=1(已注册的主用户),说明是授权用户正常开锁\",\n \"推理步骤2: 解锁后 3 秒门磁传感器 StateValue=False(门被打开),2 秒后玄关运动传感器检测到人体(Occupancy=1),时间顺序完全吻合人进门的物理过程\",\n \"推理步骤3: 进门约 15 秒后客厅运动传感器触发(Occupancy=1),符合从玄关走到客厅的正常步行时间\",\n \"推理步骤4: 次卧灯关闭(OnOff=False)发生在 19:47:25,可能是住户回家后顺手关掉了白天误开或之前留着的灯,属于正常操作\",\n \"推理步骤5: 全天温度数据呈现典型的日间升温、夜间降温曲线(凌晨约 22.9°C → 正午峰值约 25.9°C → 晚间回落至约 23.4°C),各房间温度高度一致,无异常热源或火灾迹象\",\n \"推理步骤6: 整个日志中无烟雾报警、漏水报警、未授权开锁、异常时段的门窗开启等安全事件\"\n ],\n \"key_evidence\": [\n \"门锁由已注册用户(UserIndex=1)通过正常方式解锁,非暴力或未授权操作\",\n \"开锁 → 开门 → 玄关检测到人 → 客厅检测到人,事件链时序合理(3s → 2s → 15s),符合正常归家动线\",\n \"事件发生在 19:47(傍晚),属于典型的下班回家时间段\",\n \"全天温度曲线平稳正常,无突变,所有安全类传感器(烟雾、漏水)均未触发\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "住户正常回家,所有事件符合典型的归家行为模式", "reasoning": ["推理步骤1: 19:47 入户门锁触发 LockOperation,LockOperationType=1(解锁),OperationSource=8(远程/密码操作),UserIndex=1(已注册的主用户),说明是授权用户正常开锁", "推理步骤2: 解锁后 3 秒门磁传感器 StateValue=False(门被打开),2 秒后玄关运动传感器检测到人体(Occupancy=1),时间顺序完全吻合人进门的物理过程", "推理步骤3: 进门约 15 秒后客厅运动传感器触发(Occupancy=1),符合从玄关走到客厅的正常步行时间", "推理步骤4: 次卧灯关闭(OnOff=False)发生在 19:47:25,可能是住户回家后顺手关掉了白天误开或之前留着的灯,属于正常操作", "推理步骤5: 全天温度数据呈现典型的日间升温、夜间降温曲线(凌晨约 22.9°C → 正午峰值约 25.9°C → 晚间回落至约 23.4°C),各房间温度高度一致,无异常热源或火灾迹象", "推理步骤6: 整个日志中无烟雾报警、漏水报警、未授权开锁、异常时段的门窗开启等安全事件"], "key_evidence": ["门锁由已注册用户(UserIndex=1)通过正常方式解锁,非暴力或未授权操作", "开锁 → 开门 → 玄关检测到人 → 客厅检测到人,事件链时序合理(3s → 2s → 15s),符合正常归家动线", "事件发生在 19:47(傍晚),属于典型的下班回家时间段", "全天温度曲线平稳正常,无突变,所有安全类传感器(烟雾、漏水)均未触发"], "recommended_actions": ["无需采取任何措施,当前状态正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.099710702896118, "api_error": null} {"episode_id": "SQ2_TP_C_0270", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0270.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260899, "scenario_id": "FG-01", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-02T01:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨1:32无人在场时厨房灶具自动开启,导致厨房温度在15分钟内从22.95°C飙升至35°C并触发烟雾报警,存在严重火灾风险;同时厨房温度传感器在白天多次报告 None 值,疑似设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨01:32厨房灶具(kitchen_cook_surface)开启,但同一时刻客厅运动传感器显示 Occupancy=0,且整个深夜时段(00:00-06:16)无任何房间检测到人体活动,说明此时家中无人操作或所有人都在睡眠中。\",\n \"推理步骤2: 灶具开启后,厨房温度从01:30的22.95°C在5分钟内飙升至29.68°C(01:37),再过5分钟升至35.00°C(01:42),温升速率极其异常(约每分钟1.2°C),远超正常烹饪场景。\",\n \"推理步骤3: 01:47厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认产生了烟雾,这是火灾前兆的强信号。\",\n \"推理步骤4: 日志中未见灶具被手动关闭的记录,直到02:00厨房温度恢复至22.97°C,推测灶具可能通过某种安全机制自动关闭或报警后被远程处理,但日志中缺少明确的关闭事件,存在不确定性。\",\n \"推理步骤5: 白天07:08、07:21、18:43、19:06厨房温度传感器多次报告 MeasuredValue=None,表明该传感器可能在凌晨高温事件中受损或出现间歇性故障,无法正常采集数据。\",\n \"推理步骤6: 16:00有人回家开门后,入户门未见关门锁门记录(front_door_contact 未恢复 True、LockState 未恢复 1),直到22:16才确认门锁关闭,存在约6小时入户门未锁的安全隐患。\"\n ],\n \"key_evidence\": [\n \"01:32 厨房灶具在无人活动的深夜自行开启(living_room_occupancy=0,全屋无运动检测)\",\n \"厨房温度在10分钟内从22.95°C飙升至35.00°C(2295→3500)\",\n \"01:47 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)\",\n \"厨房温度传感器在07:08、07:21、18:43、19:06多次报告 None 值,疑似传感器故障\",\n \"16:00开门回家后至22:16期间入户门未确认上锁(约6小时)\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具,排查凌晨自行开启的原因(可能是设备故障、固件缺陷或误触),必要时断开灶具电源并联系厂商\",\n \"检修或更换厨房温度传感器,多次报告 None 值说明传感器工作不稳定,可能已被高温损坏\",\n \"为厨房灶具设置深夜时段(如23:00-06:00)自动禁用规则,防止无人时意外开启\",\n \"检查入户门锁的自动上锁策略,建议设置开门后一定时间未关闭则发送提醒通知\",\n \"确认烟雾报警器当前状态是否已恢复正常,如仍处于报警状态需现场排查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨1:32无人在场时厨房灶具自动开启,导致厨房温度在15分钟内从22.95°C飙升至35°C并触发烟雾报警,存在严重火灾风险;同时厨房温度传感器在白天多次报告 None 值,疑似设备故障。", "reasoning": ["推理步骤1: 凌晨01:32厨房灶具(kitchen_cook_surface)开启,但同一时刻客厅运动传感器显示 Occupancy=0,且整个深夜时段(00:00-06:16)无任何房间检测到人体活动,说明此时家中无人操作或所有人都在睡眠中。", "推理步骤2: 灶具开启后,厨房温度从01:30的22.95°C在5分钟内飙升至29.68°C(01:37),再过5分钟升至35.00°C(01:42),温升速率极其异常(约每分钟1.2°C),远超正常烹饪场景。", "推理步骤3: 01:47厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认产生了烟雾,这是火灾前兆的强信号。", "推理步骤4: 日志中未见灶具被手动关闭的记录,直到02:00厨房温度恢复至22.97°C,推测灶具可能通过某种安全机制自动关闭或报警后被远程处理,但日志中缺少明确的关闭事件,存在不确定性。", "推理步骤5: 白天07:08、07:21、18:43、19:06厨房温度传感器多次报告 MeasuredValue=None,表明该传感器可能在凌晨高温事件中受损或出现间歇性故障,无法正常采集数据。", "推理步骤6: 16:00有人回家开门后,入户门未见关门锁门记录(front_door_contact 未恢复 True、LockState 未恢复 1),直到22:16才确认门锁关闭,存在约6小时入户门未锁的安全隐患。"], "key_evidence": ["01:32 厨房灶具在无人活动的深夜自行开启(living_room_occupancy=0,全屋无运动检测)", "厨房温度在10分钟内从22.95°C飙升至35.00°C(2295→3500)", "01:47 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)", "厨房温度传感器在07:08、07:21、18:43、19:06多次报告 None 值,疑似传感器故障", "16:00开门回家后至22:16期间入户门未确认上锁(约6小时)"], "recommended_actions": ["立即检查厨房灶具,排查凌晨自行开启的原因(可能是设备故障、固件缺陷或误触),必要时断开灶具电源并联系厂商", "检修或更换厨房温度传感器,多次报告 None 值说明传感器工作不稳定,可能已被高温损坏", "为厨房灶具设置深夜时段(如23:00-06:00)自动禁用规则,防止无人时意外开启", "检查入户门锁的自动上锁策略,建议设置开门后一定时间未关闭则发送提醒通知", "确认烟雾报警器当前状态是否已恢复正常,如仍处于报警状态需现场排查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.180360078811646, "api_error": null} {"episode_id": "SQ2_TP_C_0277", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0277.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20260906, "scenario_id": "FG-01", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-10T09:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"家中无人时厨房灶具被远程开启,厨房温度在15分钟内从24.96°C飙升至35°C,触发烟雾报警器,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:36 全家关灯、手动开锁出门、门自动上锁,此后至16:26无任何人体传感器触发,确认07:36~16:26期间家中无人。\",\n \"推理步骤2: 09:29 厨房灶具被开启(kitchen_cook_surface OnOff=True),但同一时刻客厅运动传感器显示无人(living_room_occupancy=0),且全屋无任何occupancy传感器被触发,说明灶具在无人在家时被启动(可能是远程误操作或自动化规则错误)。\",\n \"推理步骤3: 09:30 厨房温度为24.96°C,09:34 急升至28.20°C,09:39 飙升至35.00°C——5分钟内升温近7°C,这是极其异常的温升速率,远超正常烹饪范围。\",\n \"推理步骤4: 09:44 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,存在实际火灾或干烧危险。\",\n \"推理步骤5: 日志中未见灶具在报警后被关闭的记录(下一次cook_surface状态变化是18:21正常做饭时),说明灶具可能在无人干预下持续运行了较长时间。\",\n \"推理步骤6: 10:00 厨房温度回落至25.24°C,可能是灶具最终被远程关闭或自动保护机制介入,但报警事件本身已表明发生了危险状况。\"\n ],\n \"key_evidence\": [\n \"09:29 家中无人时厨房灶具被开启(全屋无occupancy触发,07:36已确认出门锁门)\",\n \"厨房温度5分钟内从24.96°C飙升至35.00°C(09:30→09:34→09:39)\",\n \"09:44 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)\",\n \"灶具开启期间无任何人体传感器检测到有人在场\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前是否已关闭,若未关闭应远程紧急断电\",\n \"检查厨房是否有实际火情或物品烧焦,必要时联系消防部门\",\n \"排查灶具被无人启动的原因:检查是否存在错误的自动化规则、定时任务或误触的远程控制\",\n \"为厨房灶具增加安全联锁规则:当全屋无人(所有occupancy=0且门锁已锁)时禁止灶具启动\",\n \"建议厨房温度传感器设置高温阈值告警(如超过30°C自动关闭灶具),作为烟雾报警之前的预警机制\",\n \"检查厨房温度传感器多次报告None值的问题(06:47、06:58、18:22、19:04),可能存在设备故障需要维修\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "家中无人时厨房灶具被远程开启,厨房温度在15分钟内从24.96°C飙升至35°C,触发烟雾报警器,存在严重火灾风险。", "reasoning": ["推理步骤1: 07:36 全家关灯、手动开锁出门、门自动上锁,此后至16:26无任何人体传感器触发,确认07:36~16:26期间家中无人。", "推理步骤2: 09:29 厨房灶具被开启(kitchen_cook_surface OnOff=True),但同一时刻客厅运动传感器显示无人(living_room_occupancy=0),且全屋无任何occupancy传感器被触发,说明灶具在无人在家时被启动(可能是远程误操作或自动化规则错误)。", "推理步骤3: 09:30 厨房温度为24.96°C,09:34 急升至28.20°C,09:39 飙升至35.00°C——5分钟内升温近7°C,这是极其异常的温升速率,远超正常烹饪范围。", "推理步骤4: 09:44 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,存在实际火灾或干烧危险。", "推理步骤5: 日志中未见灶具在报警后被关闭的记录(下一次cook_surface状态变化是18:21正常做饭时),说明灶具可能在无人干预下持续运行了较长时间。", "推理步骤6: 10:00 厨房温度回落至25.24°C,可能是灶具最终被远程关闭或自动保护机制介入,但报警事件本身已表明发生了危险状况。"], "key_evidence": ["09:29 家中无人时厨房灶具被开启(全屋无occupancy触发,07:36已确认出门锁门)", "厨房温度5分钟内从24.96°C飙升至35.00°C(09:30→09:34→09:39)", "09:44 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)", "灶具开启期间无任何人体传感器检测到有人在场"], "recommended_actions": ["立即确认厨房灶具当前是否已关闭,若未关闭应远程紧急断电", "检查厨房是否有实际火情或物品烧焦,必要时联系消防部门", "排查灶具被无人启动的原因:检查是否存在错误的自动化规则、定时任务或误触的远程控制", "为厨房灶具增加安全联锁规则:当全屋无人(所有occupancy=0且门锁已锁)时禁止灶具启动", "建议厨房温度传感器设置高温阈值告警(如超过30°C自动关闭灶具),作为烟雾报警之前的预警机制", "检查厨房温度传感器多次报告None值的问题(06:47、06:58、18:22、19:04),可能存在设备故障需要维修"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.854048490524292, "api_error": null} {"episode_id": "SQ2_TP_C_0278", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0278.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20260907, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-30T10:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时灶具使用后厨房窗户未及时关闭,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None(06:51、06:53、18:32、19:05),每次都紧跟在灶具开启或关闭的时间点附近。这不是正常的温度读数,说明传感器在灶具工作期间无法正常采样。\",\n \"推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在同一时段均正常上报数值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 可能原因有两种——(a) 灶具产生的局部高温超出传感器量程导致读数溢出返回 None;(b) 传感器硬件老化或安装位置不当,受热辐射干扰。无论哪种情况,在灶具使用期间温度监测失效会削弱厨房火灾预警能力。\",\n \"推理步骤4: 厨房窗户在 06:50:30 被打开(StateValue=False),但整个日志中未见对应的关闭事件;晚间 19:04:30 又一次打开,同样无关闭记录。虽然开窗通风是做饭后的正常行为,但长时间未关闭(尤其是家人外出期间 07:17–16:19)存在安全隐患。\",\n \"推理步骤5: 其余设备行为均属正常——早晨起床、出门上锁、下午/傍晚回家、晚间做饭、睡前关灯锁门,生活节奏合理,无入侵或其他异常迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:51、06:53、18:32、19:05 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"kitchen_window_contact 在 06:50:30 和 19:04:30 两次报告 StateValue=False(窗户打开),但日志中无对应的关闭(StateValue=True)记录\",\n \"同时段其他房间温度传感器均正常上报,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确保其远离灶具热源的直接辐射范围,必要时重新定位或更换耐高温型号\",\n \"为厨房温度传感器设置 None 值告警规则,当连续返回无效值时立即通知住户,避免火灾监测盲区\",\n \"设置厨房窗户长时间未关闭的提醒(如超过30分钟),尤其是在家人外出且门锁已上锁的情况下自动推送通知\",\n \"考虑将厨房烟雾报警器(kitchen_smoke_alarm)作为灶具使用期间的主要安全监测手段,确认其工作状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时灶具使用后厨房窗户未及时关闭,存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了3次 MeasuredValue = None(06:51、06:53、18:32、19:05),每次都紧跟在灶具开启或关闭的时间点附近。这不是正常的温度读数,说明传感器在灶具工作期间无法正常采样。", "推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在同一时段均正常上报数值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 可能原因有两种——(a) 灶具产生的局部高温超出传感器量程导致读数溢出返回 None;(b) 传感器硬件老化或安装位置不当,受热辐射干扰。无论哪种情况,在灶具使用期间温度监测失效会削弱厨房火灾预警能力。", "推理步骤4: 厨房窗户在 06:50:30 被打开(StateValue=False),但整个日志中未见对应的关闭事件;晚间 19:04:30 又一次打开,同样无关闭记录。虽然开窗通风是做饭后的正常行为,但长时间未关闭(尤其是家人外出期间 07:17–16:19)存在安全隐患。", "推理步骤5: 其余设备行为均属正常——早晨起床、出门上锁、下午/傍晚回家、晚间做饭、睡前关灯锁门,生活节奏合理,无入侵或其他异常迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:51、06:53、18:32、19:05 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "kitchen_window_contact 在 06:50:30 和 19:04:30 两次报告 StateValue=False(窗户打开),但日志中无对应的关闭(StateValue=True)记录", "同时段其他房间温度传感器均正常上报,排除系统性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确保其远离灶具热源的直接辐射范围,必要时重新定位或更换耐高温型号", "为厨房温度传感器设置 None 值告警规则,当连续返回无效值时立即通知住户,避免火灾监测盲区", "设置厨房窗户长时间未关闭的提醒(如超过30分钟),尤其是在家人外出且门锁已上锁的情况下自动推送通知", "考虑将厨房烟雾报警器(kitchen_smoke_alarm)作为灶具使用期间的主要安全监测手段,确认其工作状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.09301447868347, "api_error": null} {"episode_id": "SQ2_TP_C_0280", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0280.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20260909, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T02:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨2:10发生入户门锁连续4次操作失败并触发防撬报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在02:10:00至02:10:40的40秒内,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/外部操作来源,OperationError=1表示凭证无效或操作失败。\",\n \"推理步骤2: 紧接着在02:10:50触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应强制入侵/防撬报警,说明门锁检测到异常物理操作。\",\n \"推理步骤3: 事件发生在凌晨2点,属于深夜时段,全屋无任何运动传感器触发、无灯光开启,住户明显处于睡眠状态,排除了住户自己忘带钥匙反复尝试的可能性。\",\n \"推理步骤4: 事件后门锁状态未变为解锁(后续日志中门锁直到早上07:10才被手动解锁),说明入侵尝试未成功,但威胁是真实存在的。\"\n ],\n \"key_evidence\": [\n \"02:10:00-02:10:40 连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒\",\n \"02:10:50 触发DoorLockAlarm(AlarmCode=3)防撬/强制入侵报警\",\n \"事件发生在凌晨2点深夜时段,全屋无人活动迹象\",\n \"入侵尝试未成功,门锁保持锁定状态直到早晨住户手动开锁\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级安全警报,告知入户门在凌晨遭到多次非法开锁尝试\",\n \"自动开启玄关区域摄像头(如有)进行录像取证\",\n \"联系物业安保或考虑报警,提供事件时间戳供调查\",\n \"检查门锁是否有物理损伤痕迹,必要时更换锁芯或升级门锁安全等级\",\n \"考虑设置门锁连续失败自动锁定策略(如3次失败后锁定5分钟)以增加暴力破解难度\"\n ]\n}\n```\n\n另外补充一个低优先级的设备异常发现:\n\n厨房温度传感器在 06:55:05、07:09:00、18:30:00、19:21:00 多次报告 `MeasuredValue = None`,均发生在灶具使用前后。这可能是传感器在高温环境下暂时超出量程或通信中断导致的设备故障,建议检查该传感器的安装位置是否离灶具过近,或确认固件是否需要更新。不过这不构成安全威胁,属于设备维护事项。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨2:10发生入户门锁连续4次操作失败并触发防撬报警,疑似有人尝试非法入侵。", "reasoning": ["推理步骤1: 在02:10:00至02:10:40的40秒内,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/外部操作来源,OperationError=1表示凭证无效或操作失败。", "推理步骤2: 紧接着在02:10:50触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应强制入侵/防撬报警,说明门锁检测到异常物理操作。", "推理步骤3: 事件发生在凌晨2点,属于深夜时段,全屋无任何运动传感器触发、无灯光开启,住户明显处于睡眠状态,排除了住户自己忘带钥匙反复尝试的可能性。", "推理步骤4: 事件后门锁状态未变为解锁(后续日志中门锁直到早上07:10才被手动解锁),说明入侵尝试未成功,但威胁是真实存在的。"], "key_evidence": ["02:10:00-02:10:40 连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒", "02:10:50 触发DoorLockAlarm(AlarmCode=3)防撬/强制入侵报警", "事件发生在凌晨2点深夜时段,全屋无人活动迹象", "入侵尝试未成功,门锁保持锁定状态直到早晨住户手动开锁"], "recommended_actions": ["立即向住户手机推送高优先级安全警报,告知入户门在凌晨遭到多次非法开锁尝试", "自动开启玄关区域摄像头(如有)进行录像取证", "联系物业安保或考虑报警,提供事件时间戳供调查", "检查门锁是否有物理损伤痕迹,必要时更换锁芯或升级门锁安全等级", "考虑设置门锁连续失败自动锁定策略(如3次失败后锁定5分钟)以增加暴力破解难度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.020302772521973, "api_error": null} {"episode_id": "SQ2_TP_C_0281", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0281.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20260910, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-09T08:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在住户外出期间遭受连续密码/凭证暴力破解尝试,触发了门锁防篡改报警。\",\n \"reasoning\": [\n \"推理步骤1: 07:47 全家关灯、手动开锁出门、关门后门锁自动上锁(LockState=1),表明住户已离家,家中无人。\",\n \"推理步骤2: 08:04:00 至 08:04:40 的约40秒内,门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 对应远程/键盘输入方式,OperationError=1 表示凭证无效(InvalidCredential),说明有人在短时间内反复尝试用错误密码/PIN开锁。\",\n \"推理步骤3: 紧接着在 08:04:50 门锁触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵/篡改\"报警,这是门锁内置的安全机制在检测到多次失败尝试后主动发出的警报。\",\n \"推理步骤4: 此时段内没有任何运动传感器、门磁传感器或灯光变化表明是住户本人操作,排除了住户忘记密码的可能性。\",\n \"推理步骤5: 直到 16:08 才有人正常开锁进门(手动开锁成功),进一步证实 08:04 的尝试并非住户所为。\"\n ],\n \"key_evidence\": [\n \"08:04:00-08:04:40 连续4次 LockOperationError(InvalidCredential, OperationSource=3),间隔仅10-15秒\",\n \"08:04:50 触发 DoorLockAlarm(AlarmCode=3)——强制入侵/篡改报警\",\n \"07:47 住户已离家且门锁自动上锁,家中无人在场\",\n \"入侵尝试期间无任何室内运动传感器触发,排除住户误操作\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级入侵警报通知\",\n \"如有条件,联动门口摄像头抓拍/录像并保存证据\",\n \"检查门锁是否已自动进入锁定模式(连续失败后临时禁止输入),若未锁定则远程启用临时锁定\",\n \"建议住户回家后更换门锁密码/PIN码,并检查是否有物理撬锁痕迹\",\n \"若小区有物业安保,通知物业派人现场查看\",\n \"考虑报警处理,将门锁日志作为证据留存\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在住户外出期间遭受连续密码/凭证暴力破解尝试,触发了门锁防篡改报警。\",\n \"reasoning\": [\n \"推理步骤1: 07:47 全家关灯、手动开锁出门、关门后门锁自动上锁(LockState=1),表明住户已离家,家中无人。\",\n \"推理步骤2: 08:04:00 至 08:04:40 的约40秒内,门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 对应远程/键盘输入方式,OperationError=1 表示凭证无效(InvalidCredential),说明有人在短时间内反复尝试用错误密码/PIN开锁。\",\n \"推理步骤3: 紧接着在 08:04:50 门锁触发了 DoorLockAlarm(AlarmCode="], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 21.420358419418335, "api_error": null} {"episode_id": "SQ2_TP_C_0286", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0286.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20260915, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-19T18:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在洗碗机运行期间触发报警,存在真实漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:44 洗碗机启动(OperationalState=1),18:49 厨房漏水传感器报告 StateValue=True,两者仅相隔5分钟,时间高度关联。\",\n \"推理步骤2: 漏水报警触发后,洗碗机仍在继续运行(18:49 OperationalState=1),未被自动停止,漏水可能持续扩大。\",\n \"推理步骤3: 此时家中有人(17:56 有人通过前门进入,客厅灯和空调已开启),但日志中未见任何人对漏水做出响应(未关闭洗碗机、未有额外动作),说明住户可能未注意到漏水。\",\n \"推理步骤4: 19:41 洗碗机再次出现启动记录(OnOff=True, OperationalState=1),漏水传感器此前的报警未被清除或处理,漏水风险进一步加剧。\",\n \"推理步骤5: 另外注意到厨房温度传感器在 06:41、07:00、18:40、19:10 多次报告 MeasuredValue=None,存在设备故障的可能,但这属于次要问题,不影响漏水判断。\"\n ],\n \"key_evidence\": [\n \"18:49 kitchen_water_leak | StateValue = True — 厨房漏水传感器触发报警\",\n \"18:44 kitchen_dishwasher | OperationalState = 1 — 洗碗机在漏水前5分钟启动\",\n \"18:49 kitchen_dishwasher | OperationalState = 1 — 漏水发生时洗碗机仍在运行\",\n \"19:41 kitchen_dishwasher 再次启动,漏水未被处理\",\n \"厨房温度传感器多次报告 None,存在设备异常\"\n ],\n \"recommended_actions\": [\n \"立即关闭洗碗机并切断其水源,防止漏水扩大\",\n \"前往厨房现场检查漏水位置,确认是洗碗机接口泄漏、排水管问题还是其他水源\",\n \"检查厨房地面积水情况,必要时关闭厨房总水阀\",\n \"漏水处理完毕后检查厨房温度传感器,该传感器多次报告 None 值,可能存在硬件故障或受潮损坏\",\n \"建议设置自动化规则:漏水传感器触发时自动关闭洗碗机并发送紧急通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在洗碗机运行期间触发报警,存在真实漏水风险。", "reasoning": ["推理步骤1: 18:44 洗碗机启动(OperationalState=1),18:49 厨房漏水传感器报告 StateValue=True,两者仅相隔5分钟,时间高度关联。", "推理步骤2: 漏水报警触发后,洗碗机仍在继续运行(18:49 OperationalState=1),未被自动停止,漏水可能持续扩大。", "推理步骤3: 此时家中有人(17:56 有人通过前门进入,客厅灯和空调已开启),但日志中未见任何人对漏水做出响应(未关闭洗碗机、未有额外动作),说明住户可能未注意到漏水。", "推理步骤4: 19:41 洗碗机再次出现启动记录(OnOff=True, OperationalState=1),漏水传感器此前的报警未被清除或处理,漏水风险进一步加剧。", "推理步骤5: 另外注意到厨房温度传感器在 06:41、07:00、18:40、19:10 多次报告 MeasuredValue=None,存在设备故障的可能,但这属于次要问题,不影响漏水判断。"], "key_evidence": ["18:49 kitchen_water_leak | StateValue = True — 厨房漏水传感器触发报警", "18:44 kitchen_dishwasher | OperationalState = 1 — 洗碗机在漏水前5分钟启动", "18:49 kitchen_dishwasher | OperationalState = 1 — 漏水发生时洗碗机仍在运行", "19:41 kitchen_dishwasher 再次启动,漏水未被处理", "厨房温度传感器多次报告 None,存在设备异常"], "recommended_actions": ["立即关闭洗碗机并切断其水源,防止漏水扩大", "前往厨房现场检查漏水位置,确认是洗碗机接口泄漏、排水管问题还是其他水源", "检查厨房地面积水情况,必要时关闭厨房总水阀", "漏水处理完毕后检查厨房温度传感器,该传感器多次报告 None 值,可能存在硬件故障或受潮损坏", "建议设置自动化规则:漏水传感器触发时自动关闭洗碗机并发送紧急通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.133329153060913, "api_error": null} {"episode_id": "SQ2_TP_C_0287", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0287.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20260916, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-02T01:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"凌晨洗碗机运行期间厨房漏水传感器触发报警,且至今未见复位记录,存在持续漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 01:43 洗碗机进入运行状态(OperationalState=1),5分钟后(01:48)厨房漏水传感器报告 StateValue=True,时间高度关联,说明漏水与洗碗机运行直接相关。\",\n \"推理步骤2: 01:48 同一时刻洗碗机仍处于 OperationalState=1(运行中),漏水发生时设备并未停机,意味着水源仍在持续供给,漏水可能在扩大。\",\n \"推理步骤3: 事件发生在凌晨近2点,属于深夜时段,全屋无人活动(无任何运动传感器触发),住户大概率处于睡眠状态,无法及时发现和处理漏水。\",\n \"推理步骤4: 在整个日志时间线(直到23:30)中,未出现漏水传感器复位为 False 的记录,也未出现洗碗机被手动关闭的记录,说明漏水状态可能持续了很长时间或未被处理。\",\n \"推理步骤5: 厨房温度传感器在07:06和18:12、18:54多次报告 MeasuredValue=None,虽然这更可能是设备故障,但也不排除漏水对周边电子设备造成了影响。\"\n ],\n \"key_evidence\": [\n \"01:43 洗碗机启动运行(OperationalState=1)\",\n \"01:48 厨房漏水传感器触发(StateValue=True),与洗碗机运行仅间隔5分钟\",\n \"全天日志中未出现漏水传感器复位(StateValue=False)的记录\",\n \"事件发生在凌晨深夜,无人活动\",\n \"厨房温度传感器多次报告 None 值,可能存在设备受损\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机电源,切断水源以防止漏水进一步扩大\",\n \"向住户手机推送高优先级漏水警报通知,提醒尽快检查厨房地面及洗碗机连接管路\",\n \"检查厨房漏水传感器当前实时状态,确认漏水是否仍在持续\",\n \"安排检修洗碗机进水管、排水管及密封件,排查漏水根因\",\n \"检查厨房温度传感器多次返回 None 的原因,确认是否因水损导致传感器故障\",\n \"考虑增加自动化规则:当漏水传感器触发时自动关闭关联用水设备并发送紧急通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "凌晨洗碗机运行期间厨房漏水传感器触发报警,且至今未见复位记录,存在持续漏水风险。", "reasoning": ["推理步骤1: 01:43 洗碗机进入运行状态(OperationalState=1),5分钟后(01:48)厨房漏水传感器报告 StateValue=True,时间高度关联,说明漏水与洗碗机运行直接相关。", "推理步骤2: 01:48 同一时刻洗碗机仍处于 OperationalState=1(运行中),漏水发生时设备并未停机,意味着水源仍在持续供给,漏水可能在扩大。", "推理步骤3: 事件发生在凌晨近2点,属于深夜时段,全屋无人活动(无任何运动传感器触发),住户大概率处于睡眠状态,无法及时发现和处理漏水。", "推理步骤4: 在整个日志时间线(直到23:30)中,未出现漏水传感器复位为 False 的记录,也未出现洗碗机被手动关闭的记录,说明漏水状态可能持续了很长时间或未被处理。", "推理步骤5: 厨房温度传感器在07:06和18:12、18:54多次报告 MeasuredValue=None,虽然这更可能是设备故障,但也不排除漏水对周边电子设备造成了影响。"], "key_evidence": ["01:43 洗碗机启动运行(OperationalState=1)", "01:48 厨房漏水传感器触发(StateValue=True),与洗碗机运行仅间隔5分钟", "全天日志中未出现漏水传感器复位(StateValue=False)的记录", "事件发生在凌晨深夜,无人活动", "厨房温度传感器多次报告 None 值,可能存在设备受损"], "recommended_actions": ["立即远程关闭洗碗机电源,切断水源以防止漏水进一步扩大", "向住户手机推送高优先级漏水警报通知,提醒尽快检查厨房地面及洗碗机连接管路", "检查厨房漏水传感器当前实时状态,确认漏水是否仍在持续", "安排检修洗碗机进水管、排水管及密封件,排查漏水根因", "检查厨房温度传感器多次返回 None 的原因,确认是否因水损导致传感器故障", "考虑增加自动化规则:当漏水传感器触发时自动关闭关联用水设备并发送紧急通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.67140531539917, "api_error": null} {"episode_id": "SQ2_TP_C_0291", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0291.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20260920, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-21T20:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在20:45触发报警,检测到漏水事件。\",\n \"reasoning\": [\n \"推理步骤1: 在20:45,second_bathroom_water_leak 传感器的 StateValue 变为 True,并触发了 StateChange 事件,表明次卫检测到积水。\",\n \"推理步骤2: 当天日志中除温度传感器的常规半小时上报外,没有任何其他设备活动(无门锁、运动传感器、灯光等事件),说明这不是住户正常用水导致的短暂溅水——如果有人在使用次卫,应该会有次卫灯或附近运动传感器的触发记录。\",\n \"推理步骤3: 漏水状态持续为 True,在后续日志中未见恢复为 False 的记录,说明漏水仍在持续,而非瞬时误报。\",\n \"推理步骤4: 温度数据全天呈正常的日间升温、夜间降温曲线(夜间约22.9°C,午间峰值约25.9°C),各房间温度高度一致,排除管道冻裂等极端温度因素,更可能是管道接头松动、阀门故障或排水管堵塞溢水。\"\n ],\n \"key_evidence\": [\n \"[20:45] second_bathroom_water_leak | StateValue = True,漏水传感器触发报警\",\n \"[20:45] second_bathroom_water_leak | Event: StateChange(StateValue=True),确认为状态变化事件而非静态上报\",\n \"漏水发生时无次卫灯光或运动传感器事件,排除正常使用场景\",\n \"截至日志结束(23:30),未见漏水状态恢复为 False,漏水持续中\"\n ],\n \"recommended_actions\": [\n \"立即前往次卫现场确认漏水位置和严重程度\",\n \"如确认漏水,关闭次卫对应的水阀(或总水阀)以止损\",\n \"检查次卫地面积水情况,防止水渗透到楼下或损坏地板\",\n \"排查漏水原因:检查马桶底部密封、洗手台下方管道接头、角阀及软管是否老化破损\",\n \"漏水处理完毕后确认传感器状态恢复为 False,若长时间无法恢复需检查传感器本身是否故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器在20:45触发报警,检测到漏水事件。", "reasoning": ["推理步骤1: 在20:45,second_bathroom_water_leak 传感器的 StateValue 变为 True,并触发了 StateChange 事件,表明次卫检测到积水。", "推理步骤2: 当天日志中除温度传感器的常规半小时上报外,没有任何其他设备活动(无门锁、运动传感器、灯光等事件),说明这不是住户正常用水导致的短暂溅水——如果有人在使用次卫,应该会有次卫灯或附近运动传感器的触发记录。", "推理步骤3: 漏水状态持续为 True,在后续日志中未见恢复为 False 的记录,说明漏水仍在持续,而非瞬时误报。", "推理步骤4: 温度数据全天呈正常的日间升温、夜间降温曲线(夜间约22.9°C,午间峰值约25.9°C),各房间温度高度一致,排除管道冻裂等极端温度因素,更可能是管道接头松动、阀门故障或排水管堵塞溢水。"], "key_evidence": ["[20:45] second_bathroom_water_leak | StateValue = True,漏水传感器触发报警", "[20:45] second_bathroom_water_leak | Event: StateChange(StateValue=True),确认为状态变化事件而非静态上报", "漏水发生时无次卫灯光或运动传感器事件,排除正常使用场景", "截至日志结束(23:30),未见漏水状态恢复为 False,漏水持续中"], "recommended_actions": ["立即前往次卫现场确认漏水位置和严重程度", "如确认漏水,关闭次卫对应的水阀(或总水阀)以止损", "检查次卫地面积水情况,防止水渗透到楼下或损坏地板", "排查漏水原因:检查马桶底部密封、洗手台下方管道接头、角阀及软管是否老化破损", "漏水处理完毕后确认传感器状态恢复为 False,若长时间无法恢复需检查传感器本身是否故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.949004650115967, "api_error": null} {"episode_id": "SQ2_TP_C_0294", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_C_0294.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20260923, "scenario_id": "FG-01", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-08T07:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"家人全部外出后厨房灶具被异常开启,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:11 全家关灯、手动开锁出门,门锁随后自动上锁(LockState=1),表明住户已全部离家。\",\n \"推理步骤2: 07:18 厨房灶具(kitchen_cook_surface)在无人在家的情况下被开启(OnOff=True),同时客厅运动传感器显示无人(Occupancy=0),且整个房屋无任何运动传感器触发,说明这不是住户操作。\",\n \"推理步骤3: 07:23 厨房温度从约 2430(24.3°C)飙升至 2925(29.25°C),07:28 进一步升至 3500(35°C),5 分钟内上升近 11°C,这是极其异常的温升速率。\",\n \"推理步骤4: 07:33 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认存在烟雾/火灾隐患。\",\n \"推理步骤5: 另外,厨房温度传感器在 06:44 和 06:56 两次报告 MeasuredValue=None,说明该传感器可能存在间歇性故障,降低了对厨房温度监控的可靠性。\",\n \"推理步骤6: 07:30 的定时温度读数厨房恢复到 2424(24.24°C),与 07:23/07:28 的高温读数矛盾,可能是传感器故障导致读数不稳定,但烟雾报警器的独立触发证实了真实威胁的存在。\"\n ],\n \"key_evidence\": [\n \"07:11 全家离家并锁门,07:18 厨房灶具在无人状态下被开启\",\n \"07:23 厨房温度 29.25°C → 07:28 厨房温度 35°C,5 分钟内飙升约 6°C\",\n \"07:33 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)\",\n \"灶具开启期间全屋无任何运动传感器检测到人员存在\",\n \"厨房温度传感器在 06:44 和 06:56 曾报告 None 值,存在设备可靠性问题\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface → OnOff=False)\",\n \"立即通知住户并拨打 119 火警电话\",\n \"检查灶具异常开启的原因:排查是否存在设备故障、远程误操作或未授权访问(智能家居系统可能被入侵)\",\n \"检修厨房温度传感器,解决间歇性报告 None 值的故障\",\n \"考虑为灶具增加离家自动断电联动规则,防止无人时灶具被开启\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "家人全部外出后厨房灶具被异常开启,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 07:11 全家关灯、手动开锁出门,门锁随后自动上锁(LockState=1),表明住户已全部离家。", "推理步骤2: 07:18 厨房灶具(kitchen_cook_surface)在无人在家的情况下被开启(OnOff=True),同时客厅运动传感器显示无人(Occupancy=0),且整个房屋无任何运动传感器触发,说明这不是住户操作。", "推理步骤3: 07:23 厨房温度从约 2430(24.3°C)飙升至 2925(29.25°C),07:28 进一步升至 3500(35°C),5 分钟内上升近 11°C,这是极其异常的温升速率。", "推理步骤4: 07:33 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认存在烟雾/火灾隐患。", "推理步骤5: 另外,厨房温度传感器在 06:44 和 06:56 两次报告 MeasuredValue=None,说明该传感器可能存在间歇性故障,降低了对厨房温度监控的可靠性。", "推理步骤6: 07:30 的定时温度读数厨房恢复到 2424(24.24°C),与 07:23/07:28 的高温读数矛盾,可能是传感器故障导致读数不稳定,但烟雾报警器的独立触发证实了真实威胁的存在。"], "key_evidence": ["07:11 全家离家并锁门,07:18 厨房灶具在无人状态下被开启", "07:23 厨房温度 29.25°C → 07:28 厨房温度 35°C,5 分钟内飙升约 6°C", "07:33 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)", "灶具开启期间全屋无任何运动传感器检测到人员存在", "厨房温度传感器在 06:44 和 06:56 曾报告 None 值,存在设备可靠性问题"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface → OnOff=False)", "立即通知住户并拨打 119 火警电话", "检查灶具异常开启的原因:排查是否存在设备故障、远程误操作或未授权访问(智能家居系统可能被入侵)", "检修厨房温度传感器,解决间歇性报告 None 值的故障", "考虑为灶具增加离家自动断电联动规则,防止无人时灶具被开启"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.277724027633667, "api_error": null} {"episode_id": "SQ2_TP_D_0192", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0192.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20260821, "scenario_id": "INS-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T03:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨3:17客厅窗户被打开并检测到室内活动,独居老人当时应在卧室睡眠,高度疑似非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨3:17:00客厅窗户传感器报告 StateValue=False(窗户打开),这是一个深夜异常时间点。\",\n \"推理步骤2: 窗户打开仅5秒后(3:17:05),客厅运动传感器检测到有人活动(Occupancy=1),说明有人从窗户进入了客厅。\",\n \"推理步骤3: 25秒后(3:17:30),厨房运动传感器也检测到活动(Occupancy=1),说明该人从客厅移动到了厨房,存在室内移动轨迹。\",\n \"推理步骤4: 在此期间,卧室传感器无任何活动事件,老人上一次卧室活动是前一晚入睡,说明老人仍在卧室睡觉,客厅和厨房的活动并非老人所为。\",\n \"推理步骤5: 入户门锁和入户门传感器在此时间段无任何事件,排除了通过正门进入的可能性,进一步印证从窗户非法进入。\",\n \"推理步骤6: 没有任何灯被打开——正常住户夜间活动通常会开灯,而入侵者会避免开灯,这符合入侵行为特征。\",\n \"推理步骤7: 老人直到5:22才在卧室出现活动并开灯,说明凌晨3:17的活动与老人的正常作息完全不符。\"\n ],\n \"key_evidence\": [\n \"3:17:00 客厅窗户传感器 StateValue=False(窗户被打开)\",\n \"3:17:05 客厅运动传感器 Occupancy=1(窗户打开5秒后检测到人)\",\n \"3:17:30 厨房运动传感器 Occupancy=1(入侵者从客厅移动至厨房)\",\n \"整个过程中卧室无活动,老人仍在睡眠\",\n \"入户门锁和门传感器无任何开启记录\",\n \"全程无灯光开启,不符合住户正常行为\"\n ],\n \"recommended_actions\": [\n \"立即向老人的紧急联系人/家属发送入侵警报通知\",\n \"联系物业安保或报警,告知凌晨3:17有人通过客厅窗户进入住宅\",\n \"调取该时间段的监控录像(如有)进行确认\",\n \"检查客厅窗户锁具是否被破坏,确认入侵方式\",\n \"检查家中是否有财物丢失或被翻动的痕迹\",\n \"加固客厅窗户安全措施,考虑加装窗户报警器或窗锁传感器\",\n \"在智能家居系统中增加规则:深夜窗户打开时立即触发高优先级警报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨3:17客厅窗户被打开并检测到室内活动,独居老人当时应在卧室睡眠,高度疑似非法入侵。", "reasoning": ["推理步骤1: 凌晨3:17:00客厅窗户传感器报告 StateValue=False(窗户打开),这是一个深夜异常时间点。", "推理步骤2: 窗户打开仅5秒后(3:17:05),客厅运动传感器检测到有人活动(Occupancy=1),说明有人从窗户进入了客厅。", "推理步骤3: 25秒后(3:17:30),厨房运动传感器也检测到活动(Occupancy=1),说明该人从客厅移动到了厨房,存在室内移动轨迹。", "推理步骤4: 在此期间,卧室传感器无任何活动事件,老人上一次卧室活动是前一晚入睡,说明老人仍在卧室睡觉,客厅和厨房的活动并非老人所为。", "推理步骤5: 入户门锁和入户门传感器在此时间段无任何事件,排除了通过正门进入的可能性,进一步印证从窗户非法进入。", "推理步骤6: 没有任何灯被打开——正常住户夜间活动通常会开灯,而入侵者会避免开灯,这符合入侵行为特征。", "推理步骤7: 老人直到5:22才在卧室出现活动并开灯,说明凌晨3:17的活动与老人的正常作息完全不符。"], "key_evidence": ["3:17:00 客厅窗户传感器 StateValue=False(窗户被打开)", "3:17:05 客厅运动传感器 Occupancy=1(窗户打开5秒后检测到人)", "3:17:30 厨房运动传感器 Occupancy=1(入侵者从客厅移动至厨房)", "整个过程中卧室无活动,老人仍在睡眠", "入户门锁和门传感器无任何开启记录", "全程无灯光开启,不符合住户正常行为"], "recommended_actions": ["立即向老人的紧急联系人/家属发送入侵警报通知", "联系物业安保或报警,告知凌晨3:17有人通过客厅窗户进入住宅", "调取该时间段的监控录像(如有)进行确认", "检查客厅窗户锁具是否被破坏,确认入侵方式", "检查家中是否有财物丢失或被翻动的痕迹", "加固客厅窗户安全措施,考虑加装窗户报警器或窗锁传感器", "在智能家居系统中增加规则:深夜窗户打开时立即触发高优先级警报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.23512029647827, "api_error": null} {"episode_id": "SQ2_TP_D_0193", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0193.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20260822, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-04T04:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在凌晨持续报警超过30分钟,且至今未恢复正常,老人可能未察觉该问题。\",\n \"reasoning\": [\n \"推理步骤1: 厨房漏水传感器在 04:36、04:46、05:06 连续三次报告 StateValue = True,时间跨度约30分钟,表明这不是瞬时误报,而是持续性漏水。\",\n \"推理步骤2: 漏水发生在凌晨 04:36,此时老人仍在睡眠中(卧室无活动,直到 05:34 才出现卫生间活动),老人很可能完全未察觉漏水情况。\",\n \"推理步骤3: 在整个日志中,厨房漏水传感器从未报告 StateValue = False(恢复正常),说明漏水问题可能一直未被处理或修复。\",\n \"推理步骤4: 老人在 05:58 进入厨房做早餐,但日志中没有任何针对漏水的处理动作,说明老人可能未注意到地面积水,这对独居老人存在滑倒摔伤的风险。\",\n \"推理步骤5: 厨房温度传感器多次报告 MeasuredValue = None(05:59、06:36、10:54、11:37、16:55、17:37),虽然这可能与灶具使用时的高温干扰有关,但也需要关注是否有设备受潮故障的可能。\"\n ],\n \"key_evidence\": [\n \"04:36 ~ 05:06 厨房漏水传感器连续三次报告 StateValue = True,间隔约10分钟,持续至少30分钟\",\n \"全天日志中未出现 kitchen_water_leak StateValue = False 的恢复记录\",\n \"漏水发生时老人处于睡眠状态(05:34 才首次出现活动),未能及时响应\",\n \"老人 05:58 进入厨房活动,存在因地面积水滑倒的安全隐患\"\n ],\n \"recommended_actions\": [\n \"立即向老人或其紧急联系人发送漏水警报通知,确认厨房漏水是否已处理\",\n \"如有智能水阀,建议远程关闭厨房供水管路以防止漏水扩大\",\n \"安排人员上门检查厨房漏水源头(水管接头、水龙头、洗碗机等),尽快维修\",\n \"检查厨房温度传感器是否因受潮导致间歇性故障(多次报告 None 值)\",\n \"考虑为厨房增设防滑垫,降低独居老人因积水滑倒的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在凌晨持续报警超过30分钟,且至今未恢复正常,老人可能未察觉该问题。", "reasoning": ["推理步骤1: 厨房漏水传感器在 04:36、04:46、05:06 连续三次报告 StateValue = True,时间跨度约30分钟,表明这不是瞬时误报,而是持续性漏水。", "推理步骤2: 漏水发生在凌晨 04:36,此时老人仍在睡眠中(卧室无活动,直到 05:34 才出现卫生间活动),老人很可能完全未察觉漏水情况。", "推理步骤3: 在整个日志中,厨房漏水传感器从未报告 StateValue = False(恢复正常),说明漏水问题可能一直未被处理或修复。", "推理步骤4: 老人在 05:58 进入厨房做早餐,但日志中没有任何针对漏水的处理动作,说明老人可能未注意到地面积水,这对独居老人存在滑倒摔伤的风险。", "推理步骤5: 厨房温度传感器多次报告 MeasuredValue = None(05:59、06:36、10:54、11:37、16:55、17:37),虽然这可能与灶具使用时的高温干扰有关,但也需要关注是否有设备受潮故障的可能。"], "key_evidence": ["04:36 ~ 05:06 厨房漏水传感器连续三次报告 StateValue = True,间隔约10分钟,持续至少30分钟", "全天日志中未出现 kitchen_water_leak StateValue = False 的恢复记录", "漏水发生时老人处于睡眠状态(05:34 才首次出现活动),未能及时响应", "老人 05:58 进入厨房活动,存在因地面积水滑倒的安全隐患"], "recommended_actions": ["立即向老人或其紧急联系人发送漏水警报通知,确认厨房漏水是否已处理", "如有智能水阀,建议远程关闭厨房供水管路以防止漏水扩大", "安排人员上门检查厨房漏水源头(水管接头、水龙头、洗碗机等),尽快维修", "检查厨房温度传感器是否因受潮导致间歇性故障(多次报告 None 值)", "考虑为厨房增设防滑垫,降低独居老人因积水滑倒的风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.17029619216919, "api_error": null} {"episode_id": "SQ2_TP_D_0197", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0197.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20260826, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-18T17:38:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 17:28 灶具正常关闭,17:29 厨房温度传感器报告 None(灶具余热干扰,属正常现象)。到 17:30 厨房温度恢复正常读数 24.72°C,说明第一轮烹饪已正常结束。\",\n \"推理步骤2: 17:38 灶具再次被开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,表明厨房内无人。这是关键异常——独居老人不在厨房却有灶具启动,可能是老人忘记关灶后离开、误触,或设备故障导致意外开启。\",\n \"推理步骤3: 灶具无人看管持续运行,厨房温度从 17:43 的 28.37°C 急速飙升至 17:48 的 35.00°C,5 分钟内上升约 6.6°C,远超正常烹饪温升速率,说明可能已出现干烧或明火。\",\n \"推理步骤4: 17:53 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认已产生烟雾,火灾风险从'可能'升级为'正在发生'。\",\n \"推理步骤5: 从 17:38 灶具开启到 17:53 烟雾报警,共 15 分钟无人干预。日志中未见老人返回厨房的运动检测记录,说明老人可能完全未察觉险情。对于独居老人,这种情况尤其危险。\",\n \"推理步骤6: 18:00 厨房温度回落至 24.58°C,但日志中未见灶具关闭事件(OnOff = False),无法确认灶具是否已被关闭,火灾隐患可能仍在持续。\"\n ],\n \"key_evidence\": [\n \"17:38 灶具开启时厨房运动传感器 Occupancy = 0(无人在场)\",\n \"17:43 厨房温度 28.37°C → 17:48 飙升至 35.00°C(5 分钟升温 6.6°C,异常剧烈)\",\n \"17:53 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)\",\n \"灶具无人看管运行至少 15 分钟,日志中未记录灶具关闭事件\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface → OnOff = False),消除火源\",\n \"通过紧急联系人或社区服务立即联系老人,确认其人身安全状态\",\n \"检查厨房烟雾报警器是否仍处于报警状态,若烟雾未消散应联系消防部门\",\n \"事后排查灶具在无人时被开启的原因:是老人误操作、遗忘,还是设备/自动化规则故障\",\n \"建议为灶具增加安全联动规则:当厨房 Occupancy = 0 超过一定时间后自动关闭灶具\",\n \"考虑为独居老人安装厨房自动灭火装置或燃气自动切断阀,作为物理层安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 17:28 灶具正常关闭,17:29 厨房温度传感器报告 None(灶具余热干扰,属正常现象)。到 17:30 厨房温度恢复正常读数 24.72°C,说明第一轮烹饪已正常结束。", "推理步骤2: 17:38 灶具再次被开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,表明厨房内无人。这是关键异常——独居老人不在厨房却有灶具启动,可能是老人忘记关灶后离开、误触,或设备故障导致意外开启。", "推理步骤3: 灶具无人看管持续运行,厨房温度从 17:43 的 28.37°C 急速飙升至 17:48 的 35.00°C,5 分钟内上升约 6.6°C,远超正常烹饪温升速率,说明可能已出现干烧或明火。", "推理步骤4: 17:53 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认已产生烟雾,火灾风险从'可能'升级为'正在发生'。", "推理步骤5: 从 17:38 灶具开启到 17:53 烟雾报警,共 15 分钟无人干预。日志中未见老人返回厨房的运动检测记录,说明老人可能完全未察觉险情。对于独居老人,这种情况尤其危险。", "推理步骤6: 18:00 厨房温度回落至 24.58°C,但日志中未见灶具关闭事件(OnOff = False),无法确认灶具是否已被关闭,火灾隐患可能仍在持续。"], "key_evidence": ["17:38 灶具开启时厨房运动传感器 Occupancy = 0(无人在场)", "17:43 厨房温度 28.37°C → 17:48 飙升至 35.00°C(5 分钟升温 6.6°C,异常剧烈)", "17:53 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)", "灶具无人看管运行至少 15 分钟,日志中未记录灶具关闭事件"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface → OnOff = False),消除火源", "通过紧急联系人或社区服务立即联系老人,确认其人身安全状态", "检查厨房烟雾报警器是否仍处于报警状态,若烟雾未消散应联系消防部门", "事后排查灶具在无人时被开启的原因:是老人误操作、遗忘,还是设备/自动化规则故障", "建议为灶具增加安全联动规则:当厨房 Occupancy = 0 超过一定时间后自动关闭灶具", "考虑为独居老人安装厨房自动灭火装置或燃气自动切断阀,作为物理层安全兜底"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.3542377948761, "api_error": null} {"episode_id": "SQ2_TP_D_0195", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0195.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20260824, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "bedroom", "injection_time": "2026-06-11T10:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在 08:34 老人回家后长时间未上锁直到 20:39 才自动锁定。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内(06:06、11:04、17:06)均报告 MeasuredValue = None,且在灶具关闭后约1分钟(06:35、11:37、17:33)再次报告 None。一天内出现6次 None 读数,说明传感器在灶具工作时持续失效。\",\n \"推理步骤2: 厨房温度传感器是烟雾报警器之外的重要安全冗余。对于独居老人,灶具使用期间正是最需要温度监测的时段,传感器在此关键时刻失效会导致火灾或过热风险无法被及时发现。\",\n \"推理步骤3: 08:34 老人回家时手动开锁进门,但入户门直到 20:39(超过12小时)才被自动上锁。期间老人独自在家,门锁处于未锁定状态,存在入侵风险。虽然 10:42 有一次远程开锁事件(OperationSource=8, UserIndex=1,可能是家属远程操作),但之后门锁状态仍未恢复锁定。\",\n \"推理步骤4: 老人的日常作息模式本身正常——05:33起床、06:05做早餐、06:51出门、08:34回家、12:32午休、17:05做晚餐、20:32洗漱就寝——生活节奏规律,无健康异常迹象。\",\n \"推理步骤5: 温度数据整体走势合理(夜间约22°C,午间峰值约25.8°C),各房间温差正常,排除环境温度异常。烟雾报警器和漏水传感器全天无告警,排除火灾和水患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:35、11:04、11:37、17:06、17:33),呈现与灶具开关强相关的规律性故障\",\n \"入户门在 08:34 手动开锁后,直到 20:39 才自动上锁,中间长达约12小时处于未锁定状态\",\n \"10:42 出现 OperationSource=8(远程/App)的开锁操作,但随后无对应的关门上锁记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否受灶具热量或电磁干扰影响,考虑调整传感器安装位置或更换耐高温型号\",\n \"在传感器修复前,确保厨房烟雾报警器处于正常工作状态,作为灶具安全的主要防线\",\n \"检查入户门锁的自动上锁策略,建议设置开锁后若干分钟内自动上锁,避免长时间处于未锁定状态\",\n \"建议为独居老人配置门锁状态异常提醒,当门锁超过设定时间未上锁时通知家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在 08:34 老人回家后长时间未上锁直到 20:39 才自动锁定。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内(06:06、11:04、17:06)均报告 MeasuredValue = None,且在灶具关闭后约1分钟(06:35、11:37、17:33)再次报告 None。一天内出现6次 None 读数,说明传感器在灶具工作时持续失效。", "推理步骤2: 厨房温度传感器是烟雾报警器之外的重要安全冗余。对于独居老人,灶具使用期间正是最需要温度监测的时段,传感器在此关键时刻失效会导致火灾或过热风险无法被及时发现。", "推理步骤3: 08:34 老人回家时手动开锁进门,但入户门直到 20:39(超过12小时)才被自动上锁。期间老人独自在家,门锁处于未锁定状态,存在入侵风险。虽然 10:42 有一次远程开锁事件(OperationSource=8, UserIndex=1,可能是家属远程操作),但之后门锁状态仍未恢复锁定。", "推理步骤4: 老人的日常作息模式本身正常——05:33起床、06:05做早餐、06:51出门、08:34回家、12:32午休、17:05做晚餐、20:32洗漱就寝——生活节奏规律,无健康异常迹象。", "推理步骤5: 温度数据整体走势合理(夜间约22°C,午间峰值约25.8°C),各房间温差正常,排除环境温度异常。烟雾报警器和漏水传感器全天无告警,排除火灾和水患。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:35、11:04、11:37、17:06、17:33),呈现与灶具开关强相关的规律性故障", "入户门在 08:34 手动开锁后,直到 20:39 才自动上锁,中间长达约12小时处于未锁定状态", "10:42 出现 OperationSource=8(远程/App)的开锁操作,但随后无对应的关门上锁记录"], "recommended_actions": ["检查厨房温度传感器是否受灶具热量或电磁干扰影响,考虑调整传感器安装位置或更换耐高温型号", "在传感器修复前,确保厨房烟雾报警器处于正常工作状态,作为灶具安全的主要防线", "检查入户门锁的自动上锁策略,建议设置开锁后若干分钟内自动上锁,避免长时间处于未锁定状态", "建议为独居老人配置门锁状态异常提醒,当门锁超过设定时间未上锁时通知家属"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 42.08806896209717, "api_error": null} {"episode_id": "SQ2_TP_D_0202", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0202.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20260831, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-07T06:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下持续运行,导致温度飙升并触发烟雾报警,老人已外出,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 06:31 灶具第一次正常关闭,老人在厨房完成早餐烹饪。但在 06:57 灶具再次开启时,厨房运动传感器显示 Occupancy=0,说明厨房无人,灶具被意外开启或误操作后人已离开。\",\n \"推理步骤2: 07:02 厨房温度从正常的 2425(约24.25°C)急剧飙升至 2951(约29.5°C),07:07 进一步升至 3500(约35°C),这是极不正常的厨房环境温度,表明灶具在无人看管下持续加热。\",\n \"推理步骤3: 07:06 老人关闭厨房灯并通过手动开锁出门(LockOperationType=1, OperationSource=Manual),门在 6 秒后关闭并自动上锁,说明老人已离开家中,但灶具仍处于开启状态。\",\n \"推理步骤4: 07:12 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认厨房已产生烟雾,火灾风险极高。\",\n \"推理步骤5: 烟雾报警触发后,日志中没有任何人员返回或灶具关闭的记录。直到 08:40 老人才回家,期间灶具无人看管状态持续了约 1 小时 43 分钟。\",\n \"推理步骤6: 厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障或被高温干扰的可能,削弱了温度监控的可靠性。\"\n ],\n \"key_evidence\": [\n \"06:57 灶具开启时厨房 Occupancy=0,无人在场\",\n \"07:02 厨房温度飙升至 2951(约29.5°C),07:07 升至 3500(约35°C)\",\n \"07:06 老人手动开锁出门,灶具仍在运行\",\n \"07:12 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)\",\n \"灶具从 06:57 开启后日志中无关闭记录,直到 08:40 老人回家前处于无人看管状态\",\n \"厨房温度传感器多次报告 MeasuredValue=None,传感器可能存在故障\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除火源\",\n \"紧急联系老人或其紧急联系人,确认人身安全并告知家中烟雾报警情况\",\n \"如无法联系到老人,立即通知消防部门前往处置\",\n \"设置自动化规则:当厨房 Occupancy=0 超过一定时间且灶具仍开启时,自动关闭灶具并发送告警\",\n \"设置离家联动规则:当入户门上锁且全屋无人时,自动检查并关闭所有高危设备(灶具、烤箱等)\",\n \"排查厨房温度传感器频繁报告 None 的问题,确保温度监控链路可靠\",\n \"考虑为独居老人加装灶具自动断气/断电保护装置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下持续运行,导致温度飙升并触发烟雾报警,老人已外出,存在严重火灾风险。", "reasoning": ["推理步骤1: 06:31 灶具第一次正常关闭,老人在厨房完成早餐烹饪。但在 06:57 灶具再次开启时,厨房运动传感器显示 Occupancy=0,说明厨房无人,灶具被意外开启或误操作后人已离开。", "推理步骤2: 07:02 厨房温度从正常的 2425(约24.25°C)急剧飙升至 2951(约29.5°C),07:07 进一步升至 3500(约35°C),这是极不正常的厨房环境温度,表明灶具在无人看管下持续加热。", "推理步骤3: 07:06 老人关闭厨房灯并通过手动开锁出门(LockOperationType=1, OperationSource=Manual),门在 6 秒后关闭并自动上锁,说明老人已离开家中,但灶具仍处于开启状态。", "推理步骤4: 07:12 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认厨房已产生烟雾,火灾风险极高。", "推理步骤5: 烟雾报警触发后,日志中没有任何人员返回或灶具关闭的记录。直到 08:40 老人才回家,期间灶具无人看管状态持续了约 1 小时 43 分钟。", "推理步骤6: 厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障或被高温干扰的可能,削弱了温度监控的可靠性。"], "key_evidence": ["06:57 灶具开启时厨房 Occupancy=0,无人在场", "07:02 厨房温度飙升至 2951(约29.5°C),07:07 升至 3500(约35°C)", "07:06 老人手动开锁出门,灶具仍在运行", "07:12 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1)", "灶具从 06:57 开启后日志中无关闭记录,直到 08:40 老人回家前处于无人看管状态", "厨房温度传感器多次报告 MeasuredValue=None,传感器可能存在故障"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除火源", "紧急联系老人或其紧急联系人,确认人身安全并告知家中烟雾报警情况", "如无法联系到老人,立即通知消防部门前往处置", "设置自动化规则:当厨房 Occupancy=0 超过一定时间且灶具仍开启时,自动关闭灶具并发送告警", "设置离家联动规则:当入户门上锁且全屋无人时,自动检查并关闭所有高危设备(灶具、烤箱等)", "排查厨房温度传感器频繁报告 None 的问题,确保温度监控链路可靠", "考虑为独居老人加装灶具自动断气/断电保护装置"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.717423677444458, "api_error": null} {"episode_id": "SQ2_TP_D_0205", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0205.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20260834, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T17:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在短时间内遭受多次错误解锁尝试并触发防撬报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 17:11:00至17:11:40期间,入户门锁连续产生4次LockOperationError事件(OperationError=1表示凭证无效,OperationSource=3表示远程/键盘输入),间隔仅15-25秒,属于暴力尝试解锁模式。\",\n \"推理步骤2: 17:11:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,说明错误尝试次数已达到锁定阈值,门锁自动进入防护状态。\",\n \"推理步骤3: 事件发生时老人在家(厨房灶具17:07开启,厨房有人活动),说明这不是住户自己在门外操作失误,而是外部第三方的非法尝试。\",\n \"推理步骤4: 整天的正常开锁记录均为Manual(手动物理操作)且无错误,此次集中的远程/键盘错误尝试明显偏离正常使用模式。\"\n ],\n \"key_evidence\": [\n \"17:11:00-17:11:40 连续4次LockOperationError(OperationError=1, OperationSource=3),凭证无效的远程解锁尝试\",\n \"17:11:50 触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警\",\n \"事件发生时住户在厨房做饭(kitchen_cook_surface开启中),排除住户自身操作失误\"\n ],\n \"recommended_actions\": [\n \"立即向老人及其紧急联系人(子女/社区)发送入侵警报通知\",\n \"确认门锁已进入锁定状态,暂时禁用远程/键盘解锁功能,仅允许物理钥匙开门\",\n \"调取门口摄像头(如有)录像,记录可疑人员信息并考虑报警\",\n \"事后更换门锁密码,检查是否存在密码泄露风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在短时间内遭受多次错误解锁尝试并触发防撬报警,疑似有人试图非法入侵。", "reasoning": ["推理步骤1: 17:11:00至17:11:40期间,入户门锁连续产生4次LockOperationError事件(OperationError=1表示凭证无效,OperationSource=3表示远程/键盘输入),间隔仅15-25秒,属于暴力尝试解锁模式。", "推理步骤2: 17:11:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,说明错误尝试次数已达到锁定阈值,门锁自动进入防护状态。", "推理步骤3: 事件发生时老人在家(厨房灶具17:07开启,厨房有人活动),说明这不是住户自己在门外操作失误,而是外部第三方的非法尝试。", "推理步骤4: 整天的正常开锁记录均为Manual(手动物理操作)且无错误,此次集中的远程/键盘错误尝试明显偏离正常使用模式。"], "key_evidence": ["17:11:00-17:11:40 连续4次LockOperationError(OperationError=1, OperationSource=3),凭证无效的远程解锁尝试", "17:11:50 触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警", "事件发生时住户在厨房做饭(kitchen_cook_surface开启中),排除住户自身操作失误"], "recommended_actions": ["立即向老人及其紧急联系人(子女/社区)发送入侵警报通知", "确认门锁已进入锁定状态,暂时禁用远程/键盘解锁功能,仅允许物理钥匙开门", "调取门口摄像头(如有)录像,记录可疑人员信息并考虑报警", "事后更换门锁密码,检查是否存在密码泄露风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.821497440338135, "api_error": null} {"episode_id": "SQ2_TP_D_0206", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0206.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20260835, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-04T03:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且凌晨 3:24 触发了一氧化碳(CO)报警,但后续无任何人员响应迹象,独居老人可能未察觉警报。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨 03:24,厨房烟雾报警器触发 CO 报警(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。此时所有房间温度正常(约 22-23°C),厨房灶具处于关闭状态,排除烹饪导致的误报。\",\n \"推理步骤2: CO 报警发生在凌晨 3:24,老人正在卧室睡觉(从 20:55 关灯入睡到次日 05:29 才有卧室活动)。在报警后长达约 2 小时内,没有任何房间出现运动传感器触发或灯光变化,说明老人很可能没有被警报唤醒,这对独居老人来说是严重的健康安全隐患。\",\n \"推理步骤3: 厨房温度传感器在当天多次报告 MeasuredValue = None(06:03、06:31、10:59、11:22、17:06、17:23),共出现 6 次。虽然部分 None 值与灶具使用时间重叠(可能是高温超量程),但 06:31 时灶具已于 06:30 关闭,仍报告 None,且 CO 报警时段前后温度传感器读数正常,说明传感器本身可能存在间歇性故障,无法可靠监测厨房温度异常。\",\n \"推理步骤4: CO 报警后日志中未出现报警解除事件(COState 恢复为 0),无法确认一氧化碳浓度是否已恢复安全水平。结合独居老人场景,这构成了真实的生命安全威胁。\",\n \"推理步骤5: 入户门在 08:34 从外部手动开锁(老人 07:06 出门后返回),说明老人当天仍在正常活动,但这不能排除凌晨 CO 暴露对健康的潜在影响。\"\n ],\n \"key_evidence\": [\n \"03:24 厨房烟雾报警器触发 CO 报警:COState=1, ExpressedState=2, Event: COAlarm(),且灶具处于关闭状态\",\n \"CO 报警后超过 2 小时(03:24 至 05:29)无任何人员活动迹象,独居老人未响应警报\",\n \"厨房温度传感器当天 6 次报告 None 值(06:03、06:31、10:59、11:22、17:06、17:23),存在间歇性故障\",\n \"日志中未出现 CO 报警解除记录,无法确认一氧化碳浓度已恢复安全\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房一氧化碳来源:排查燃气管道泄漏、热水器排烟管道是否堵塞、以及其他可能的 CO 产生源\",\n \"安排专业人员检修或更换厨房温度传感器,解决间歇性 None 值故障,确保温度监测可靠性\",\n \"为独居老人配置 CO 报警联动方案:报警时自动开启卧室灯光/床头灯、推送紧急通知给家属或社区看护人员、联动开窗通风\",\n \"在卧室增设一氧化碳检测器,确保老人睡眠区域也有 CO 监测覆盖\",\n \"建议老人进行一次健康检查,排除凌晨 CO 暴露可能造成的低浓度中毒影响\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且凌晨 3:24 触发了一氧化碳(CO)报警,但后续无任何人员响应迹象,独居老人可能未察觉警报。", "reasoning": ["推理步骤1: 凌晨 03:24,厨房烟雾报警器触发 CO 报警(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。此时所有房间温度正常(约 22-23°C),厨房灶具处于关闭状态,排除烹饪导致的误报。", "推理步骤2: CO 报警发生在凌晨 3:24,老人正在卧室睡觉(从 20:55 关灯入睡到次日 05:29 才有卧室活动)。在报警后长达约 2 小时内,没有任何房间出现运动传感器触发或灯光变化,说明老人很可能没有被警报唤醒,这对独居老人来说是严重的健康安全隐患。", "推理步骤3: 厨房温度传感器在当天多次报告 MeasuredValue = None(06:03、06:31、10:59、11:22、17:06、17:23),共出现 6 次。虽然部分 None 值与灶具使用时间重叠(可能是高温超量程),但 06:31 时灶具已于 06:30 关闭,仍报告 None,且 CO 报警时段前后温度传感器读数正常,说明传感器本身可能存在间歇性故障,无法可靠监测厨房温度异常。", "推理步骤4: CO 报警后日志中未出现报警解除事件(COState 恢复为 0),无法确认一氧化碳浓度是否已恢复安全水平。结合独居老人场景,这构成了真实的生命安全威胁。", "推理步骤5: 入户门在 08:34 从外部手动开锁(老人 07:06 出门后返回),说明老人当天仍在正常活动,但这不能排除凌晨 CO 暴露对健康的潜在影响。"], "key_evidence": ["03:24 厨房烟雾报警器触发 CO 报警:COState=1, ExpressedState=2, Event: COAlarm(),且灶具处于关闭状态", "CO 报警后超过 2 小时(03:24 至 05:29)无任何人员活动迹象,独居老人未响应警报", "厨房温度传感器当天 6 次报告 None 值(06:03、06:31、10:59、11:22、17:06、17:23),存在间歇性故障", "日志中未出现 CO 报警解除记录,无法确认一氧化碳浓度已恢复安全"], "recommended_actions": ["立即检查厨房一氧化碳来源:排查燃气管道泄漏、热水器排烟管道是否堵塞、以及其他可能的 CO 产生源", "安排专业人员检修或更换厨房温度传感器,解决间歇性 None 值故障,确保温度监测可靠性", "为独居老人配置 CO 报警联动方案:报警时自动开启卧室灯光/床头灯、推送紧急通知给家属或社区看护人员、联动开窗通风", "在卧室增设一氧化碳检测器,确保老人睡眠区域也有 CO 监测覆盖", "建议老人进行一次健康检查,排除凌晨 CO 暴露可能造成的低浓度中毒影响"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.515265464782715, "api_error": null} {"episode_id": "SQ2_TP_D_0208", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0208.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20260837, "scenario_id": "INS-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-06T01:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨1:07客厅窗户被打开并检测到活动,疑似非法入侵;同时厨房温度传感器存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 在凌晨01:07,客厅窗户接触传感器报告 StateValue=False(窗户被打开),这是深夜时段,独居老人通常应在卧室睡觉。\",\n \"推理步骤2: 窗户打开后仅5秒(01:07:05),客厅运动传感器检测到有人活动(Occupancy=1),25秒后(01:07:30)厨房运动传感器也检测到活动,说明有人从客厅窗户进入后移动到了厨房。\",\n \"推理步骤3: 整个夜间(00:00-05:21)卧室运动传感器没有任何触发记录,说明老人一直在卧室睡觉未起身。老人直到05:21才在卧室被检测到活动(起床),因此01:07的客厅和厨房活动不可能是老人本人。\",\n \"推理步骤4: 入户门锁和入户门传感器在该时段没有任何开锁/开门记录,排除了从正门进入的可能性,进一步指向通过窗户非法进入。\",\n \"推理步骤5: 客厅窗户在01:07被打开后,后续日志中没有关闭记录(StateValue 未恢复为 True),窗户可能一直处于打开状态。\",\n \"推理步骤6: 附带发现——厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None(05:59、06:40、11:01、11:41、17:06、17:31),表明该传感器存在间歇性故障,可能受灶具热量干扰或传感器本身老化。\"\n ],\n \"key_evidence\": [\n \"01:07:00 客厅窗户传感器 StateValue=False(窗户被打开),时间为深夜\",\n \"01:07:05 客厅运动传感器 Occupancy=1,窗户打开仅5秒后即检测到人体活动\",\n \"01:07:30 厨房运动传感器 Occupancy=1,入侵者从客厅移动至厨房\",\n \"00:00-05:21 期间卧室运动传感器无任何触发,老人一直在卧室睡觉,排除本人活动\",\n \"该时段入户门锁和门磁传感器无任何开门/开锁事件,排除正门进入\",\n \"厨房温度传感器多次报告 None 值,存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即通知老人的紧急联系人或家属,确认老人安全状况\",\n \"回放或检查01:07前后的安防摄像头录像(如有),确认是否有人从窗户进入\",\n \"检查客厅窗户当前状态,确认是否仍处于打开状态,如是则立即关闭并锁好\",\n \"考虑在窗户上加装窗户锁定执行器或报警联动,窗户在夜间非正常打开时自动触发警报\",\n \"安排维修或更换厨房温度传感器,消除间歇性 None 值故障,避免在真正火灾风险时无法正常报警\",\n \"建议为独居老人配置夜间安防模式:深夜时段窗户/门磁异常触发时自动发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨1:07客厅窗户被打开并检测到活动,疑似非法入侵;同时厨房温度传感器存在间歇性故障。", "reasoning": ["推理步骤1: 在凌晨01:07,客厅窗户接触传感器报告 StateValue=False(窗户被打开),这是深夜时段,独居老人通常应在卧室睡觉。", "推理步骤2: 窗户打开后仅5秒(01:07:05),客厅运动传感器检测到有人活动(Occupancy=1),25秒后(01:07:30)厨房运动传感器也检测到活动,说明有人从客厅窗户进入后移动到了厨房。", "推理步骤3: 整个夜间(00:00-05:21)卧室运动传感器没有任何触发记录,说明老人一直在卧室睡觉未起身。老人直到05:21才在卧室被检测到活动(起床),因此01:07的客厅和厨房活动不可能是老人本人。", "推理步骤4: 入户门锁和入户门传感器在该时段没有任何开锁/开门记录,排除了从正门进入的可能性,进一步指向通过窗户非法进入。", "推理步骤5: 客厅窗户在01:07被打开后,后续日志中没有关闭记录(StateValue 未恢复为 True),窗户可能一直处于打开状态。", "推理步骤6: 附带发现——厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue=None(05:59、06:40、11:01、11:41、17:06、17:31),表明该传感器存在间歇性故障,可能受灶具热量干扰或传感器本身老化。"], "key_evidence": ["01:07:00 客厅窗户传感器 StateValue=False(窗户被打开),时间为深夜", "01:07:05 客厅运动传感器 Occupancy=1,窗户打开仅5秒后即检测到人体活动", "01:07:30 厨房运动传感器 Occupancy=1,入侵者从客厅移动至厨房", "00:00-05:21 期间卧室运动传感器无任何触发,老人一直在卧室睡觉,排除本人活动", "该时段入户门锁和门磁传感器无任何开门/开锁事件,排除正门进入", "厨房温度传感器多次报告 None 值,存在设备故障"], "recommended_actions": ["立即通知老人的紧急联系人或家属,确认老人安全状况", "回放或检查01:07前后的安防摄像头录像(如有),确认是否有人从窗户进入", "检查客厅窗户当前状态,确认是否仍处于打开状态,如是则立即关闭并锁好", "考虑在窗户上加装窗户锁定执行器或报警联动,窗户在夜间非正常打开时自动触发警报", "安排维修或更换厨房温度传感器,消除间歇性 None 值故障,避免在真正火灾风险时无法正常报警", "建议为独居老人配置夜间安防模式:深夜时段窗户/门磁异常触发时自动发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.750141859054565, "api_error": null} {"episode_id": "SQ2_TP_D_0219", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0219.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260848, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-21T20:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下运行,温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 20:20 厨房灶具开启(OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),说明灶具在无人看管的情况下被启动或遗留运行。\",\n \"推理步骤2: 厨房温度从正常的约24°C(2403)在5分钟内飙升至29.35°C(2935),10分钟内达到35°C(3500),温升速率极其异常,远超正常烹饪范围。\",\n \"推理步骤3: 20:35 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,火灾风险已经实质化。\",\n \"推理步骤4: 老人此时在客厅(20:32前客厅灯亮)随后进入卫生间(20:32:09),对厨房的危险情况可能毫无察觉。\",\n \"推理步骤5: 烟雾报警触发后,日志中未见灶具关闭记录(kitchen_cook_surface OnOff=False),说明灶具可能仍在持续加热,火灾风险在持续升级。\"\n ],\n \"key_evidence\": [\n \"20:20 厨房灶具开启时 kitchen_occupancy=0(无人)\",\n \"厨房温度在10分钟内从约24°C飙升至35°C(异常温升)\",\n \"20:35 厨房烟雾报警器触发 SmokeAlarm 事件\",\n \"烟雾报警后未见灶具关闭记录,火源可能仍在持续\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface Off)\",\n \"通过语音或推送通知紧急提醒老人厨房有烟雾报警,尽快撤离或查看\",\n \"联系紧急联系人或物业,告知可能的火灾情况\",\n \"如烟雾持续且无人响应,自动拨打119火警电话\",\n \"建议后续为灶具增加无人自动关闭规则(如厨房无人超过2分钟自动断气/断电)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下运行,温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 20:20 厨房灶具开启(OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),说明灶具在无人看管的情况下被启动或遗留运行。", "推理步骤2: 厨房温度从正常的约24°C(2403)在5分钟内飙升至29.35°C(2935),10分钟内达到35°C(3500),温升速率极其异常,远超正常烹饪范围。", "推理步骤3: 20:35 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,火灾风险已经实质化。", "推理步骤4: 老人此时在客厅(20:32前客厅灯亮)随后进入卫生间(20:32:09),对厨房的危险情况可能毫无察觉。", "推理步骤5: 烟雾报警触发后,日志中未见灶具关闭记录(kitchen_cook_surface OnOff=False),说明灶具可能仍在持续加热,火灾风险在持续升级。"], "key_evidence": ["20:20 厨房灶具开启时 kitchen_occupancy=0(无人)", "厨房温度在10分钟内从约24°C飙升至35°C(异常温升)", "20:35 厨房烟雾报警器触发 SmokeAlarm 事件", "烟雾报警后未见灶具关闭记录,火源可能仍在持续"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface Off)", "通过语音或推送通知紧急提醒老人厨房有烟雾报警,尽快撤离或查看", "联系紧急联系人或物业,告知可能的火灾情况", "如烟雾持续且无人响应,自动拨打119火警电话", "建议后续为灶具增加无人自动关闭规则(如厨房无人超过2分钟自动断气/断电)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.153960943222046, "api_error": null} {"episode_id": "SQ2_TP_D_0222", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0222.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20260851, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-30T05:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨5:48发生连续4次门锁操作失败并触发防撬报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在05:48:00至05:48:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示来自外部物理操作(如键盘输入错误PIN码),短时间内连续失败高度可疑。\",\n \"推理步骤2: 紧接着在05:48:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码输入次数超限触发的安全警报,这是门锁自身判定的安全威胁信号。\",\n \"推理步骤3: 此时老人已在室内活动(05:37卧室检测到人体、05:47在卫生间),说明这些门锁操作并非住户自己在外面开门,而是来自外部的未授权尝试。\",\n \"推理步骤4: 事件发生在凌晨5:48,属于天刚亮的时段,是入室盗窃的常见时间窗口,进一步增加了入侵嫌疑。\",\n \"推理步骤5: 门锁在报警后并未被成功打开(下一次正常开锁是07:09由住户手动操作),说明入侵尝试未成功,但威胁确实存在。\"\n ],\n \"key_evidence\": [\n \"05:48:00-05:48:40:40秒内连续4次LockOperationError(OperationError=1, OperationSource=3),来自外部的密码输入失败\",\n \"05:48:50:触发DoorLockAlarm(AlarmCode=3)——错误密码输入超限报警\",\n \"05:37-05:47:住户在室内(卧室→卫生间),排除住户自己操作门锁的可能\",\n \"入户门传感器未报告开门(BooleanState未变化),说明门未被打开,入侵未成功\"\n ],\n \"recommended_actions\": [\n \"立即向老人的紧急联系人(子女/社区)发送入侵警报通知\",\n \"检查入户门外的监控摄像头录像(如有),确认05:48前后是否有可疑人员\",\n \"考虑向物业或警方报告此次未遂入侵事件\",\n \"检查门锁是否存在物理损坏痕迹,确认锁体安全\",\n \"建议升级门锁安全策略:缩短错误密码锁定时间、启用实时告警推送\",\n \"考虑在入户门区域增设摄像头或门铃摄像头,增强监控能力\"\n ]\n}\n```\n\n补充说明:除入侵威胁外,日志中还有一个值得关注的次要问题——厨房温度传感器多次报告 `MeasuredValue = None`(05:58、06:35、11:04、11:23、17:00、17:36),均发生在灶具开启或关闭前后。这可能是传感器在高温环境下暂时超量程导致的读数丢失,属于轻微的设备异常,建议后续观察是否持续出现,必要时检查或更换该传感器。但相比门锁入侵事件,这不构成紧急威胁。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨5:48发生连续4次门锁操作失败并触发防撬报警,疑似有人尝试非法入侵。", "reasoning": ["推理步骤1: 在05:48:00至05:48:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示来自外部物理操作(如键盘输入错误PIN码),短时间内连续失败高度可疑。", "推理步骤2: 紧接着在05:48:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码输入次数超限触发的安全警报,这是门锁自身判定的安全威胁信号。", "推理步骤3: 此时老人已在室内活动(05:37卧室检测到人体、05:47在卫生间),说明这些门锁操作并非住户自己在外面开门,而是来自外部的未授权尝试。", "推理步骤4: 事件发生在凌晨5:48,属于天刚亮的时段,是入室盗窃的常见时间窗口,进一步增加了入侵嫌疑。", "推理步骤5: 门锁在报警后并未被成功打开(下一次正常开锁是07:09由住户手动操作),说明入侵尝试未成功,但威胁确实存在。"], "key_evidence": ["05:48:00-05:48:40:40秒内连续4次LockOperationError(OperationError=1, OperationSource=3),来自外部的密码输入失败", "05:48:50:触发DoorLockAlarm(AlarmCode=3)——错误密码输入超限报警", "05:37-05:47:住户在室内(卧室→卫生间),排除住户自己操作门锁的可能", "入户门传感器未报告开门(BooleanState未变化),说明门未被打开,入侵未成功"], "recommended_actions": ["立即向老人的紧急联系人(子女/社区)发送入侵警报通知", "检查入户门外的监控摄像头录像(如有),确认05:48前后是否有可疑人员", "考虑向物业或警方报告此次未遂入侵事件", "检查门锁是否存在物理损坏痕迹,确认锁体安全", "建议升级门锁安全策略:缩短错误密码锁定时间、启用实时告警推送", "考虑在入户门区域增设摄像头或门铃摄像头,增强监控能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.149628400802612, "api_error": null} {"episode_id": "SQ2_TP_D_0226", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0226.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20260855, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-28T16:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房一氧化碳报警器触发CO警报,但住户未做出任何响应处理,存在一氧化碳中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 16:19 厨房烟雾/CO报警器报告 COState=1(一氧化碳警告)、ExpressedState=2(CO报警激活状态)并触发了 COAlarm 事件,这是一个明确的一氧化碳泄漏警报。\",\n \"推理步骤2: CO报警触发时灶具处于关闭状态(上一次使用在 11:29 已关闭),说明CO来源可能不是正常烹饪,而是燃气管道泄漏、热水器故障或其他隐蔽的燃烧不完全问题。\",\n \"推理步骤3: 报警触发后约39分钟(16:58),住户进入厨房开灯并再次开启灶具做饭,说明老人可能没有意识到CO报警的严重性,或者听力下降未注意到警报,未采取开窗通风、关闭燃气等应急措施就继续使用明火设备,风险进一步升高。\",\n \"推理步骤4: 日志中始终没有出现CO报警解除(COState恢复为0)的记录,意味着一氧化碳问题可能持续存在,整晚都未得到处理。\",\n \"推理步骤5: 厨房温度传感器在灶具使用前后多次报告 MeasuredValue=None,虽然可能是灶具启停时的传感器干扰,但也需要关注该传感器是否存在故障,影响对厨房环境的监测能力。\"\n ],\n \"key_evidence\": [\n \"16:19 kitchen_smoke_alarm 触发 COState=1、ExpressedState=2 及 COAlarm 事件,确认一氧化碳警报\",\n \"CO报警触发时灶具处于关闭状态(11:29已关),排除正常烹饪烟气的可能\",\n \"报警后无任何开窗通风、关闭燃气阀门等应急响应动作\",\n \"16:58 住户在CO警报未解除的情况下再次开启灶具明火烹饪\",\n \"全天日志中CO报警始终未解除(无COState=0记录)\",\n \"厨房温度传感器多次报告None值,监测能力可能受损\"\n ],\n \"recommended_actions\": [\n \"立即通过语音/电话/短信等方式通知老人及其紧急联系人,告知一氧化碳警报情况,确认老人身体状况\",\n \"远程或提醒老人打开厨房及客厅窗户进行通风(可通过智能窗帘/窗户联动)\",\n \"联系燃气公司上门检查燃气管道、热水器等可能的CO泄漏源\",\n \"在CO警报未解除前,禁止或提醒老人不要使用灶具等明火设备\",\n \"检查厨房温度传感器是否存在故障,确保环境监测正常运行\",\n \"考虑为独居老人增设CO浓度数值型传感器,以便量化监测,并配置自动联动规则(如CO报警时自动关闭燃气阀门、打开排风扇)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房一氧化碳报警器触发CO警报,但住户未做出任何响应处理,存在一氧化碳中毒风险。", "reasoning": ["推理步骤1: 16:19 厨房烟雾/CO报警器报告 COState=1(一氧化碳警告)、ExpressedState=2(CO报警激活状态)并触发了 COAlarm 事件,这是一个明确的一氧化碳泄漏警报。", "推理步骤2: CO报警触发时灶具处于关闭状态(上一次使用在 11:29 已关闭),说明CO来源可能不是正常烹饪,而是燃气管道泄漏、热水器故障或其他隐蔽的燃烧不完全问题。", "推理步骤3: 报警触发后约39分钟(16:58),住户进入厨房开灯并再次开启灶具做饭,说明老人可能没有意识到CO报警的严重性,或者听力下降未注意到警报,未采取开窗通风、关闭燃气等应急措施就继续使用明火设备,风险进一步升高。", "推理步骤4: 日志中始终没有出现CO报警解除(COState恢复为0)的记录,意味着一氧化碳问题可能持续存在,整晚都未得到处理。", "推理步骤5: 厨房温度传感器在灶具使用前后多次报告 MeasuredValue=None,虽然可能是灶具启停时的传感器干扰,但也需要关注该传感器是否存在故障,影响对厨房环境的监测能力。"], "key_evidence": ["16:19 kitchen_smoke_alarm 触发 COState=1、ExpressedState=2 及 COAlarm 事件,确认一氧化碳警报", "CO报警触发时灶具处于关闭状态(11:29已关),排除正常烹饪烟气的可能", "报警后无任何开窗通风、关闭燃气阀门等应急响应动作", "16:58 住户在CO警报未解除的情况下再次开启灶具明火烹饪", "全天日志中CO报警始终未解除(无COState=0记录)", "厨房温度传感器多次报告None值,监测能力可能受损"], "recommended_actions": ["立即通过语音/电话/短信等方式通知老人及其紧急联系人,告知一氧化碳警报情况,确认老人身体状况", "远程或提醒老人打开厨房及客厅窗户进行通风(可通过智能窗帘/窗户联动)", "联系燃气公司上门检查燃气管道、热水器等可能的CO泄漏源", "在CO警报未解除前,禁止或提醒老人不要使用灶具等明火设备", "检查厨房温度传感器是否存在故障,确保环境监测正常运行", "考虑为独居老人增设CO浓度数值型传感器,以便量化监测,并配置自动联动规则(如CO报警时自动关闭燃气阀门、打开排风扇)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.67141366004944, "api_error": null} {"episode_id": "SQ2_TP_D_0233", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0233.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20260862, "scenario_id": "INS-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T02:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨2:46客厅窗户被打开并检测到运动,独居老人当时应在卧室睡眠,高度疑似入侵事件。\",\n \"reasoning\": [\n \"推理步骤1: 02:46时客厅窗户传感器报告 StateValue=False(窗户打开),5秒后客厅运动传感器检测到有人(Occupancy=1),30秒后厨房运动传感器也检测到有人(Occupancy=1)。\",\n \"推理步骤2: 凌晨2:46属于深夜时段,独居老人的正常作息显示其05:20才在卧室起床(卧室运动传感器触发、开灯、开窗帘),说明02:46时老人应仍在卧室熟睡。\",\n \"推理步骤3: 整个过程中没有入户门锁解锁或入户门打开的记录,说明进入者不是通过正门进入,而是通过客厅窗户进入,这不符合住户正常行为模式。\",\n \"推理步骤4: 客厅灯和玄关灯均未被打开,说明活动者在黑暗中移动,进一步排除了老人自己起夜的可能性(老人后续起夜时均会开灯,如05:44卫生间灯亮起)。\",\n \"推理步骤5: 运动轨迹从客厅窗户→客厅→厨房,呈现从入侵点向室内扩散的模式,且之后没有后续的离开记录(窗户未关闭),符合入侵者行为特征。\",\n \"推理步骤6: 卧室运动传感器在此期间无触发,进一步确认老人未离开卧室,客厅和厨房的活动来自另一个人。\"\n ],\n \"key_evidence\": [\n \"02:46:00 客厅窗户被打开(living_room_window_contact StateValue=False),且整晚未记录关闭\",\n \"02:46:05 客厅运动传感器触发,02:46:30 厨房运动传感器触发,活动者在无灯光情况下移动\",\n \"入户门锁在此时段无任何解锁记录,排除正常出入\",\n \"老人05:20才在卧室起床,凌晨2:46应处于睡眠状态\",\n \"活动期间所有灯光均未开启,不符合老人正常起夜习惯\"\n ],\n \"recommended_actions\": [\n \"立即触发高优先级警报,通知紧急联系人和社区安保/警方\",\n \"远程激活所有室内灯光以震慑可能仍在室内的入侵者\",\n \"锁定入户门锁防止入侵者从正门逃离(便于警方到场处置)\",\n \"调取该时段所有可用摄像头录像作为证据\",\n \"确认老人人身安全,尝试通过智能设备(如语音助手)联系老人\",\n \"事后检查客厅窗户锁具是否损坏,考虑加装窗户报警传感器和安防摄像头\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨2:46客厅窗户被打开并检测到运动,独居老人当时应在卧室睡眠,高度疑似入侵事件。", "reasoning": ["推理步骤1: 02:46时客厅窗户传感器报告 StateValue=False(窗户打开),5秒后客厅运动传感器检测到有人(Occupancy=1),30秒后厨房运动传感器也检测到有人(Occupancy=1)。", "推理步骤2: 凌晨2:46属于深夜时段,独居老人的正常作息显示其05:20才在卧室起床(卧室运动传感器触发、开灯、开窗帘),说明02:46时老人应仍在卧室熟睡。", "推理步骤3: 整个过程中没有入户门锁解锁或入户门打开的记录,说明进入者不是通过正门进入,而是通过客厅窗户进入,这不符合住户正常行为模式。", "推理步骤4: 客厅灯和玄关灯均未被打开,说明活动者在黑暗中移动,进一步排除了老人自己起夜的可能性(老人后续起夜时均会开灯,如05:44卫生间灯亮起)。", "推理步骤5: 运动轨迹从客厅窗户→客厅→厨房,呈现从入侵点向室内扩散的模式,且之后没有后续的离开记录(窗户未关闭),符合入侵者行为特征。", "推理步骤6: 卧室运动传感器在此期间无触发,进一步确认老人未离开卧室,客厅和厨房的活动来自另一个人。"], "key_evidence": ["02:46:00 客厅窗户被打开(living_room_window_contact StateValue=False),且整晚未记录关闭", "02:46:05 客厅运动传感器触发,02:46:30 厨房运动传感器触发,活动者在无灯光情况下移动", "入户门锁在此时段无任何解锁记录,排除正常出入", "老人05:20才在卧室起床,凌晨2:46应处于睡眠状态", "活动期间所有灯光均未开启,不符合老人正常起夜习惯"], "recommended_actions": ["立即触发高优先级警报,通知紧急联系人和社区安保/警方", "远程激活所有室内灯光以震慑可能仍在室内的入侵者", "锁定入户门锁防止入侵者从正门逃离(便于警方到场处置)", "调取该时段所有可用摄像头录像作为证据", "确认老人人身安全,尝试通过智能设备(如语音助手)联系老人", "事后检查客厅窗户锁具是否损坏,考虑加装窗户报警传感器和安防摄像头"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.186325073242188, "api_error": null} {"episode_id": "SQ2_TP_D_0234", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0234.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20260863, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-29T03:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨3:02厨房一氧化碳报警触发,且入户门长时间未关闭、老人深夜无响应,存在CO中毒与安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 03:02厨房烟雾报警器触发CO报警——COState=1(Warning级别)、ExpressedState=2(COAlarm),并产生COAlarm事件。这是一个明确的一氧化碳泄漏警报。\",\n \"推理步骤2: 报警发生在凌晨3点,属于深度睡眠时段。从日志看,老人自00:00至05:36之间卧室无任何运动传感器触发,说明老人一直在卧室睡觉,极可能未察觉到CO报警。\",\n \"推理步骤3: CO报警后,没有任何后续人为响应动作——没有开灯、没有运动传感器触发、没有开门开窗通风。老人直到05:36才起床,这意味着CO报警后长达约2.5小时内无人处置。\",\n \"推理步骤4: 厨房灶具(cook_surface)在报警前后均处于关闭状态(上次使用是前一天,日志中灶具首次开启在05:58),排除灶具明火燃烧导致CO的可能,更可能是燃气管道微漏、热水器不完全燃烧或其他燃气设备问题。\",\n \"推理步骤5: 厨房温度在报警前后保持稳定(约23.0°C),没有异常升温,排除火灾,但CO泄漏本身不一定伴随温度变化,这反而更符合低浓度持续泄漏的特征。\",\n \"推理步骤6: 该住户为独居老人,CO中毒风险极高——老人感知能力下降,睡眠中吸入CO可能导致昏迷甚至死亡,且无同住人员可以发现异常。\",\n \"推理步骤7: 另外注意08:30老人回家后入户门一直未关闭(front_door_contact未恢复True),直到20:38才记录到门关闭并自动上锁。这意味着入户门敞开了约12小时,对独居老人存在入侵安全隐患。\"\n ],\n \"key_evidence\": [\n \"03:02 kitchen_smoke_alarm COState=1, ExpressedState=2, Event:COAlarm() —— 厨房一氧化碳报警明确触发\",\n \"报警后2.5小时内(03:02~05:36)全屋无任何运动传感器触发、无灯光变化,老人未响应报警\",\n \"灶具在报警时处于关闭状态,CO来源可能是燃气管道或其他燃气设备隐患\",\n \"08:30入户门解锁开门后,直到20:38才关门上锁,入户门敞开约12小时\"\n ],\n \"recommended_actions\": [\n \"立即联系老人或其紧急联系人,确认老人身体状况,排除CO中毒症状(头晕、恶心、意识模糊)\",\n \"安排专业人员检查厨房燃气管道、热水器及所有燃气设备,排查CO泄漏源\",\n \"在卧室增设CO报警器,确保老人睡眠区域也能及时预警\",\n \"配置CO报警联动自动化:触发时自动开启全屋灯光、打开窗帘/窗户通风、向紧急联系人发送通知\",\n \"排查入户门自动锁逻辑,建议设置门未关闭超时提醒(如5分钟未关门则推送告警),防止长时间门户大开\",\n \"考虑为老人配备可穿戴健康监测设备,在紧急情况下自动求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨3:02厨房一氧化碳报警触发,且入户门长时间未关闭、老人深夜无响应,存在CO中毒与安全隐患。", "reasoning": ["推理步骤1: 03:02厨房烟雾报警器触发CO报警——COState=1(Warning级别)、ExpressedState=2(COAlarm),并产生COAlarm事件。这是一个明确的一氧化碳泄漏警报。", "推理步骤2: 报警发生在凌晨3点,属于深度睡眠时段。从日志看,老人自00:00至05:36之间卧室无任何运动传感器触发,说明老人一直在卧室睡觉,极可能未察觉到CO报警。", "推理步骤3: CO报警后,没有任何后续人为响应动作——没有开灯、没有运动传感器触发、没有开门开窗通风。老人直到05:36才起床,这意味着CO报警后长达约2.5小时内无人处置。", "推理步骤4: 厨房灶具(cook_surface)在报警前后均处于关闭状态(上次使用是前一天,日志中灶具首次开启在05:58),排除灶具明火燃烧导致CO的可能,更可能是燃气管道微漏、热水器不完全燃烧或其他燃气设备问题。", "推理步骤5: 厨房温度在报警前后保持稳定(约23.0°C),没有异常升温,排除火灾,但CO泄漏本身不一定伴随温度变化,这反而更符合低浓度持续泄漏的特征。", "推理步骤6: 该住户为独居老人,CO中毒风险极高——老人感知能力下降,睡眠中吸入CO可能导致昏迷甚至死亡,且无同住人员可以发现异常。", "推理步骤7: 另外注意08:30老人回家后入户门一直未关闭(front_door_contact未恢复True),直到20:38才记录到门关闭并自动上锁。这意味着入户门敞开了约12小时,对独居老人存在入侵安全隐患。"], "key_evidence": ["03:02 kitchen_smoke_alarm COState=1, ExpressedState=2, Event:COAlarm() —— 厨房一氧化碳报警明确触发", "报警后2.5小时内(03:02~05:36)全屋无任何运动传感器触发、无灯光变化,老人未响应报警", "灶具在报警时处于关闭状态,CO来源可能是燃气管道或其他燃气设备隐患", "08:30入户门解锁开门后,直到20:38才关门上锁,入户门敞开约12小时"], "recommended_actions": ["立即联系老人或其紧急联系人,确认老人身体状况,排除CO中毒症状(头晕、恶心、意识模糊)", "安排专业人员检查厨房燃气管道、热水器及所有燃气设备,排查CO泄漏源", "在卧室增设CO报警器,确保老人睡眠区域也能及时预警", "配置CO报警联动自动化:触发时自动开启全屋灯光、打开窗帘/窗户通风、向紧急联系人发送通知", "排查入户门自动锁逻辑,建议设置门未关闭超时提醒(如5分钟未关门则推送告警),防止长时间门户大开", "考虑为老人配备可穿戴健康监测设备,在紧急情况下自动求助"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.363722801208496, "api_error": null} {"episode_id": "SQ2_TP_D_0243", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0243.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260872, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-22T21:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,老人已就寝,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 20:39 老人进入卧室,关灯、拉窗帘就寝,此后卧室无任何活动事件,表明老人已入睡。\",\n \"推理步骤2: 21:51 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),说明灶具在无人看管的情况下被启动。\",\n \"推理步骤3: 21:56 厨房温度传感器报告 3134(约31.34°C),22:01 飙升至 3500(约35°C),而同时段客厅和卧室温度仅约23°C,厨房温度异常偏高约12°C,远超正常范围。\",\n \"推理步骤4: 22:06 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,火灾风险成立。\",\n \"推理步骤5: 对比当天正常用灶模式(06:00、11:03、16:58),每次灶具开启时厨房运动传感器均显示有人(Occupancy=1),且温度传感器报告 None(被灶具高温干扰属正常现象)。而 21:51 这次无人在场却开灶,模式完全异常。\",\n \"推理步骤6: 22:06 报警后至日志结束,未见灶具关闭事件,也未见老人起身(卧室/厨房无运动检测),说明老人可能未察觉报警,灶具可能仍在运行。\"\n ],\n \"key_evidence\": [\n \"21:51 厨房灶具开启,但厨房运动传感器同时报告 Occupancy=0(无人)\",\n \"21:56 厨房温度飙升至 3134(~31.3°C),22:01 进一步升至 3500(~35°C),远超同时段其他房间约23°C的正常温度\",\n \"22:06 厨房烟雾报警器触发 SmokeAlarm 事件,SmokeState=1\",\n \"20:39 老人已进入卧室就寝(关灯、拉窗帘),报警后无任何起身活动记录\",\n \"日志中未出现灶具关闭事件,灶具可能持续运行\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除火源\",\n \"紧急联系老人或其紧急联系人,确认老人是否安全、是否能自行响应\",\n \"如无法联系到老人,立即通知消防和社区服务人员上门查看\",\n \"排查灶具无人启动的原因:可能是设备故障、误触或自动化规则错误配置\",\n \"建议增加安全规则:厨房无人时自动禁止灶具启动,或灶具开启超时且无人时自动关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,老人已就寝,存在严重火灾风险。", "reasoning": ["推理步骤1: 20:39 老人进入卧室,关灯、拉窗帘就寝,此后卧室无任何活动事件,表明老人已入睡。", "推理步骤2: 21:51 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),说明灶具在无人看管的情况下被启动。", "推理步骤3: 21:56 厨房温度传感器报告 3134(约31.34°C),22:01 飙升至 3500(约35°C),而同时段客厅和卧室温度仅约23°C,厨房温度异常偏高约12°C,远超正常范围。", "推理步骤4: 22:06 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认已产生烟雾,火灾风险成立。", "推理步骤5: 对比当天正常用灶模式(06:00、11:03、16:58),每次灶具开启时厨房运动传感器均显示有人(Occupancy=1),且温度传感器报告 None(被灶具高温干扰属正常现象)。而 21:51 这次无人在场却开灶,模式完全异常。", "推理步骤6: 22:06 报警后至日志结束,未见灶具关闭事件,也未见老人起身(卧室/厨房无运动检测),说明老人可能未察觉报警,灶具可能仍在运行。"], "key_evidence": ["21:51 厨房灶具开启,但厨房运动传感器同时报告 Occupancy=0(无人)", "21:56 厨房温度飙升至 3134(~31.3°C),22:01 进一步升至 3500(~35°C),远超同时段其他房间约23°C的正常温度", "22:06 厨房烟雾报警器触发 SmokeAlarm 事件,SmokeState=1", "20:39 老人已进入卧室就寝(关灯、拉窗帘),报警后无任何起身活动记录", "日志中未出现灶具关闭事件,灶具可能持续运行"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除火源", "紧急联系老人或其紧急联系人,确认老人是否安全、是否能自行响应", "如无法联系到老人,立即通知消防和社区服务人员上门查看", "排查灶具无人启动的原因:可能是设备故障、误触或自动化规则错误配置", "建议增加安全规则:厨房无人时自动禁止灶具启动,或灶具开启超时且无人时自动关闭"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.460197687149048, "api_error": null} {"episode_id": "SQ2_TP_D_0252", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0252.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20260881, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-23T22:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在深夜触发报警,且老人已入睡,存在水损和滑倒风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:12 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到实际漏水。\",\n \"推理步骤2: 老人在 20:36 左右完成了睡前流程(关客厅灯、进卫生间、回卧室关灯拉窗帘),20:37 卫生间运动传感器已归零,说明老人已离开卫生间并上床休息。漏水发生在老人入睡约 1.5 小时后,无人在场处理。\",\n \"推理步骤3: 从 22:12 到日志结束的 23:30,长达 1 小时 18 分钟内没有任何卫生间运动传感器触发,说明老人未察觉漏水,水可能持续流出。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,说明该传感器存在间歇性故障,但这是独立问题,不影响漏水判断。\",\n \"推理步骤5: 这是独居老人家庭,夜间漏水若不及时处理,可能导致地面积水引发滑倒(老人起夜时尤其危险)、水渗透造成楼下邻居财产损失,以及电气安全隐患。\"\n ],\n \"key_evidence\": [\n \"22:12 bathroom_water_leak StateValue=True 及 StateChange 事件确认漏水\",\n \"20:37 后卫生间无人活动(occupancy=0),老人已入睡无法自行发现\",\n \"漏水后超过 1 小时无任何人为干预迹象\",\n \"厨房温度传感器在灶具开启期间多次报告 None,存在传感器故障的次要问题\"\n ],\n \"recommended_actions\": [\n \"立即通过紧急联系人(子女或社区看护)电话/短信通知,告知卫生间漏水情况\",\n \"如果家中部署了智能水阀,立即远程关闭卫生间供水总阀\",\n \"通过智能音箱或卧室灯光闪烁等方式尝试唤醒老人(注意避免惊吓)\",\n \"漏水解除后检查卫生间地面积水情况,防止老人起夜滑倒\",\n \"安排维修人员排查漏水原因(可能是水龙头、马桶水箱或管道接头问题)\",\n \"(次要)排查厨房温度传感器间歇性报告 None 的故障原因,确保火灾监测不受影响\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在深夜触发报警,且老人已入睡,存在水损和滑倒风险。", "reasoning": ["推理步骤1: 22:12 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到实际漏水。", "推理步骤2: 老人在 20:36 左右完成了睡前流程(关客厅灯、进卫生间、回卧室关灯拉窗帘),20:37 卫生间运动传感器已归零,说明老人已离开卫生间并上床休息。漏水发生在老人入睡约 1.5 小时后,无人在场处理。", "推理步骤3: 从 22:12 到日志结束的 23:30,长达 1 小时 18 分钟内没有任何卫生间运动传感器触发,说明老人未察觉漏水,水可能持续流出。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,说明该传感器存在间歇性故障,但这是独立问题,不影响漏水判断。", "推理步骤5: 这是独居老人家庭,夜间漏水若不及时处理,可能导致地面积水引发滑倒(老人起夜时尤其危险)、水渗透造成楼下邻居财产损失,以及电气安全隐患。"], "key_evidence": ["22:12 bathroom_water_leak StateValue=True 及 StateChange 事件确认漏水", "20:37 后卫生间无人活动(occupancy=0),老人已入睡无法自行发现", "漏水后超过 1 小时无任何人为干预迹象", "厨房温度传感器在灶具开启期间多次报告 None,存在传感器故障的次要问题"], "recommended_actions": ["立即通过紧急联系人(子女或社区看护)电话/短信通知,告知卫生间漏水情况", "如果家中部署了智能水阀,立即远程关闭卫生间供水总阀", "通过智能音箱或卧室灯光闪烁等方式尝试唤醒老人(注意避免惊吓)", "漏水解除后检查卫生间地面积水情况,防止老人起夜滑倒", "安排维修人员排查漏水原因(可能是水龙头、马桶水箱或管道接头问题)", "(次要)排查厨房温度传感器间歇性报告 None 的故障原因,确保火灾监测不受影响"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.104271411895752, "api_error": null} {"episode_id": "SQ2_TP_D_0254", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0254.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260883, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-22T21:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"老人已于20:43就寝并锁门,21:48有人通过远程方式(OperationSource=8)开锁进入家中,且未开灯,行为高度可疑。\",\n \"reasoning\": [\n \"推理步骤1: 老人全天作息规律——05:24起床、06:54出门晨练、08:40回家、12:34午休、14:02起床、20:43就寝。就寝时确认门锁已上锁(LockState=1),卧室窗帘关闭,灯关闭。\",\n \"推理步骤2: 21:48,入户门锁被解锁,事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/网络操作)、UserIndex=1。这不是手动开锁,也不是自动锁定,而是通过远程指令触发的。\",\n \"推理步骤3: 开锁后门被打开(front_door_contact StateValue=False),玄关和客厅均检测到有人(entrance_occupancy=1, living_room_occupancy=1),但客厅灯保持关闭状态(OnOff=False)。一个正常归家的人不会在黑暗中不开灯行动。\",\n \"推理步骤4: 老人此时已在卧室就寝(20:43进入卧室、关灯、关窗帘),不可能是老人自己开门回家。且老人是独居状态,深夜有人进入极为异常。\",\n \"推理步骤5: 进入者未关门(日志中无 front_door_contact 恢复为 True 的记录),也未重新锁门,进一步说明这不是正常的居住者行为。\"\n ],\n \"key_evidence\": [\n \"21:48 门锁通过远程方式(OperationSource=8)被解锁,老人已于20:43就寝\",\n \"入侵者进入后客厅灯保持关闭(OnOff=False),在黑暗中移动\",\n \"独居老人场景下,深夜出现第二个人体存在极不正常\",\n \"入户门未被关闭和重新上锁\"\n ],\n \"recommended_actions\": [\n \"立即触发安全警报,通知紧急联系人和物业/安保\",\n \"远程锁定门锁防止更多人进入,同时开启所有灯光进行威慑\",\n \"检查门锁远程访问权限,排查是否存在凭证泄露或未授权的远程用户\",\n \"联系老人确认其安全状况,必要时报警\",\n \"审查门锁 UserIndex=1 对应的用户身份及其远程访问授权记录\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "老人已于20:43就寝并锁门,21:48有人通过远程方式(OperationSource=8)开锁进入家中,且未开灯,行为高度可疑。", "reasoning": ["推理步骤1: 老人全天作息规律——05:24起床、06:54出门晨练、08:40回家、12:34午休、14:02起床、20:43就寝。就寝时确认门锁已上锁(LockState=1),卧室窗帘关闭,灯关闭。", "推理步骤2: 21:48,入户门锁被解锁,事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/网络操作)、UserIndex=1。这不是手动开锁,也不是自动锁定,而是通过远程指令触发的。", "推理步骤3: 开锁后门被打开(front_door_contact StateValue=False),玄关和客厅均检测到有人(entrance_occupancy=1, living_room_occupancy=1),但客厅灯保持关闭状态(OnOff=False)。一个正常归家的人不会在黑暗中不开灯行动。", "推理步骤4: 老人此时已在卧室就寝(20:43进入卧室、关灯、关窗帘),不可能是老人自己开门回家。且老人是独居状态,深夜有人进入极为异常。", "推理步骤5: 进入者未关门(日志中无 front_door_contact 恢复为 True 的记录),也未重新锁门,进一步说明这不是正常的居住者行为。"], "key_evidence": ["21:48 门锁通过远程方式(OperationSource=8)被解锁,老人已于20:43就寝", "入侵者进入后客厅灯保持关闭(OnOff=False),在黑暗中移动", "独居老人场景下,深夜出现第二个人体存在极不正常", "入户门未被关闭和重新上锁"], "recommended_actions": ["立即触发安全警报,通知紧急联系人和物业/安保", "远程锁定门锁防止更多人进入,同时开启所有灯光进行威慑", "检查门锁远程访问权限,排查是否存在凭证泄露或未授权的远程用户", "联系老人确认其安全状况,必要时报警", "审查门锁 UserIndex=1 对应的用户身份及其远程访问授权记录"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.23637819290161, "api_error": null} {"episode_id": "SQ2_TP_D_0258", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0258.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20260887, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-11T10:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在安全监控盲区风险\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(05:57、06:31、10:58、11:38、17:06、17:34),说明传感器在灶具使用期间反复失效,无法监测厨房实际温度\",\n \"推理步骤2: 10:31 出现一条异常记录 kitchen_cook_surface | OnOff = True,但此时无人在厨房(kitchen_occupancy 未触发),直到 10:57 才检测到有人进入厨房。这意味着灶具在无人监管的情况下运行了约 26 分钟\",\n \"推理步骤3: 10:41 厨房温度飙升至 29.01°C(2901),相比之前 25.22°C 短时间内上升近 4°C,虽然烟雾报警器 SmokeState=0(未报警),但结合传感器故障,火灾监测能力受损\",\n \"推理步骤4: 厨房烟雾报警器在前一天(6月10日 10:31)已报告 BatteryAlert=1(低电量警告),如果电池耗尽,将失去烟雾检测能力\",\n \"推理步骤5: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器反复故障 + 烟雾报警器电池低 + 灶具无人看管,三者叠加形成严重的安全监控盲区\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 None 值,均发生在灶具使用前后\",\n \"kitchen_smoke_alarm BatteryAlert = 1(电池低电量警告)\",\n \"10:31 灶具开启但直到 10:57 才有人体检测,灶具无人看管约 26 分钟\",\n \"10:41 厨房温度异常飙升至 29.01°C\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾检测能力正常\",\n \"检修或更换厨房温度传感器,排查其在高温环境下反复失效的原因\",\n \"为灶具设置无人看管自动关闭规则(如厨房无人体感应超过 10 分钟则关闭灶具)\",\n \"考虑为独居老人增加灶具使用时长提醒,防止忘记关火\",\n \"通知家属或护理人员关注厨房设备异常情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在安全监控盲区风险", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(05:57、06:31、10:58、11:38、17:06、17:34),说明传感器在灶具使用期间反复失效,无法监测厨房实际温度", "推理步骤2: 10:31 出现一条异常记录 kitchen_cook_surface | OnOff = True,但此时无人在厨房(kitchen_occupancy 未触发),直到 10:57 才检测到有人进入厨房。这意味着灶具在无人监管的情况下运行了约 26 分钟", "推理步骤3: 10:41 厨房温度飙升至 29.01°C(2901),相比之前 25.22°C 短时间内上升近 4°C,虽然烟雾报警器 SmokeState=0(未报警),但结合传感器故障,火灾监测能力受损", "推理步骤4: 厨房烟雾报警器在前一天(6月10日 10:31)已报告 BatteryAlert=1(低电量警告),如果电池耗尽,将失去烟雾检测能力", "推理步骤5: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器反复故障 + 烟雾报警器电池低 + 灶具无人看管,三者叠加形成严重的安全监控盲区"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 None 值,均发生在灶具使用前后", "kitchen_smoke_alarm BatteryAlert = 1(电池低电量警告)", "10:31 灶具开启但直到 10:57 才有人体检测,灶具无人看管约 26 分钟", "10:41 厨房温度异常飙升至 29.01°C"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾检测能力正常", "检修或更换厨房温度传感器,排查其在高温环境下反复失效的原因", "为灶具设置无人看管自动关闭规则(如厨房无人体感应超过 10 分钟则关闭灶具)", "考虑为独居老人增加灶具使用时长提醒,防止忘记关火", "通知家属或护理人员关注厨房设备异常情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.497828722000122, "api_error": null} {"episode_id": "SQ2_TP_D_0262", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0262.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20260891, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-10T09:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房烟雾报警器电池电量低,存在安全监测盲区风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:01、06:21、11:08、11:39、17:08、17:29),说明传感器在高温或灶具工作时反复失效,无法提供有效温度读数。\",\n \"推理步骤2: 2026-06-09T09:42 厨房烟雾报警器报告 BatteryAlert = 1,表示电池电量低。这意味着厨房的两个关键安全传感器(温度+烟雾报警)同时处于不可靠状态。\",\n \"推理步骤3: 09:42 灶具开启后,09:52 厨房温度飙升至 28.45°C(相比之前 24.85°C 骤升约 3.6°C),而烟雾报警器报告 SmokeState = 0(正常)。虽然此次未触发报警,但温度传感器在其他做饭时段完全失效(None),如果发生真正的火灾隐患,系统可能无法及时检测。\",\n \"推理步骤4: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器反复失效 + 烟雾报警器低电量,构成严重的安全监测盲区。\",\n \"推理步骤5: 入户门锁在 07:02 外出后未锁(08:33 回来时通过手动解锁进入,说明门是锁好的),门锁自动上锁功能正常。老人的日常作息(05:31起床、12:38午休、20:41就寝)和出行模式属于正常范围,未发现入侵或健康异常。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None(06:01、06:21、11:08、11:39、17:08、17:29)\",\n \"kitchen_smoke_alarm 于 2026-06-09T09:42 报告 BatteryAlert = 1(电池电量低警告)\",\n \"09:52 厨房温度异常飙升至 28.45°C(短时间内上升约 3.6°C),传感器在其他做饭时段却完全无读数\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾报警功能正常\",\n \"检查或更换厨房温度传感器,排查其在灶具工作时反复报告 None 的故障原因(可能是传感器位置过近导致过热保护,或硬件老化)\",\n \"在传感器修复前,建议老人做饭时保持厨房通风,并设置灶具自动关闭定时器作为额外安全保障\",\n \"考虑为厨房增加冗余温度传感器,避免单点故障导致监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房烟雾报警器电池电量低,存在安全监测盲区风险。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:01、06:21、11:08、11:39、17:08、17:29),说明传感器在高温或灶具工作时反复失效,无法提供有效温度读数。", "推理步骤2: 2026-06-09T09:42 厨房烟雾报警器报告 BatteryAlert = 1,表示电池电量低。这意味着厨房的两个关键安全传感器(温度+烟雾报警)同时处于不可靠状态。", "推理步骤3: 09:42 灶具开启后,09:52 厨房温度飙升至 28.45°C(相比之前 24.85°C 骤升约 3.6°C),而烟雾报警器报告 SmokeState = 0(正常)。虽然此次未触发报警,但温度传感器在其他做饭时段完全失效(None),如果发生真正的火灾隐患,系统可能无法及时检测。", "推理步骤4: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器反复失效 + 烟雾报警器低电量,构成严重的安全监测盲区。", "推理步骤5: 入户门锁在 07:02 外出后未锁(08:33 回来时通过手动解锁进入,说明门是锁好的),门锁自动上锁功能正常。老人的日常作息(05:31起床、12:38午休、20:41就寝)和出行模式属于正常范围,未发现入侵或健康异常。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None(06:01、06:21、11:08、11:39、17:08、17:29)", "kitchen_smoke_alarm 于 2026-06-09T09:42 报告 BatteryAlert = 1(电池电量低警告)", "09:52 厨房温度异常飙升至 28.45°C(短时间内上升约 3.6°C),传感器在其他做饭时段却完全无读数"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾报警功能正常", "检查或更换厨房温度传感器,排查其在灶具工作时反复报告 None 的故障原因(可能是传感器位置过近导致过热保护,或硬件老化)", "在传感器修复前,建议老人做饭时保持厨房通风,并设置灶具自动关闭定时器作为额外安全保障", "考虑为厨房增加冗余温度传感器,避免单点故障导致监测盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.462206840515137, "api_error": null} {"episode_id": "SQ2_TP_D_0263", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0263.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20260892, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-09T08:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 纵观全天日志,整体生活模式正常——老人约05:25起床,06:03做早餐,06:51出门晨练/买菜,08:33回家,12:22午休,14:10起床,16:57做晚餐,20:30洗漱后约20:38就寝,作息规律且符合独居老人习惯。\",\n \"推理步骤2: 入侵方面无异常:08:24的开锁事件使用了 UserIndex=1 的凭证(OperationSource=8,即PIN/指纹等),且随后老人正常进入客厅活动,判断为老人本人回家。门锁在出门和就寝时均自动上锁(LockState=1),安全闭环完整。\",\n \"推理步骤3: 厨房温度传感器在三次灶具使用期间(06:03-06:24、10:55-11:27、16:57-17:25)均报告 MeasuredValue = None,而灶具关闭后的下一个半点整点读数恢复正常。这说明传感器在灶具工作时持续失效。\",\n \"推理步骤4: 该传感器在灶具未使用时(全天其余时段)读数完全正常且与其他房间温度趋势一致,排除传感器完全损坏的可能,更像是受灶具高温或电磁干扰导致的间歇性故障。\",\n \"推理步骤5: 对独居老人而言,厨房温度监控在烹饪时尤为关键——这恰恰是最需要检测异常高温/火灾风险的时段。传感器在此时失效意味着如果发生干烧或火情,系统无法通过温度异常及时预警。\",\n \"推理步骤6: 烟雾报警器(kitchen_smoke_alarm)全天未触发任何事件,说明当天烹饪本身没有产生安全问题,但传感器的监控盲区仍是一个需要修复的隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:04、06:25、10:56、11:28、16:58、17:26)均报告 MeasuredValue = None\",\n \"灶具关闭后传感器恢复正常读数(如06:30读数2409、11:30读数2557、17:30读数2472),说明故障与灶具使用强相关\",\n \"08:24开锁事件使用合法凭证(OperationSource=8, UserIndex=1),非异常入侵\",\n \"全天生活动线连贯合理:卧室→卫生间→厨房→出门→回家→午休→活动→做饭→就寝,无不明活动间隙\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰,建议将其移至距灶具较远但仍能有效监测厨房整体温度的位置\",\n \"检查传感器固件版本,确认是否存在已知的高温环境下读数异常的 bug,必要时更新固件或更换耐高温型号\",\n \"在传感器修复前,考虑增加一条自动化规则:当灶具开启超过30分钟且温度传感器无有效读数时,发送提醒通知给紧急联系人\",\n \"确认厨房烟雾报警器工作正常(建议定期测试),作为温度传感器失效期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 纵观全天日志,整体生活模式正常——老人约05:25起床,06:03做早餐,06:51出门晨练/买菜,08:33回家,12:22午休,14:10起床,16:57做晚餐,20:30洗漱后约20:38就寝,作息规律且符合独居老人习惯。", "推理步骤2: 入侵方面无异常:08:24的开锁事件使用了 UserIndex=1 的凭证(OperationSource=8,即PIN/指纹等),且随后老人正常进入客厅活动,判断为老人本人回家。门锁在出门和就寝时均自动上锁(LockState=1),安全闭环完整。", "推理步骤3: 厨房温度传感器在三次灶具使用期间(06:03-06:24、10:55-11:27、16:57-17:25)均报告 MeasuredValue = None,而灶具关闭后的下一个半点整点读数恢复正常。这说明传感器在灶具工作时持续失效。", "推理步骤4: 该传感器在灶具未使用时(全天其余时段)读数完全正常且与其他房间温度趋势一致,排除传感器完全损坏的可能,更像是受灶具高温或电磁干扰导致的间歇性故障。", "推理步骤5: 对独居老人而言,厨房温度监控在烹饪时尤为关键——这恰恰是最需要检测异常高温/火灾风险的时段。传感器在此时失效意味着如果发生干烧或火情,系统无法通过温度异常及时预警。", "推理步骤6: 烟雾报警器(kitchen_smoke_alarm)全天未触发任何事件,说明当天烹饪本身没有产生安全问题,但传感器的监控盲区仍是一个需要修复的隐患。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:04、06:25、10:56、11:28、16:58、17:26)均报告 MeasuredValue = None", "灶具关闭后传感器恢复正常读数(如06:30读数2409、11:30读数2557、17:30读数2472),说明故障与灶具使用强相关", "08:24开锁事件使用合法凭证(OperationSource=8, UserIndex=1),非异常入侵", "全天生活动线连贯合理:卧室→卫生间→厨房→出门→回家→午休→活动→做饭→就寝,无不明活动间隙"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰,建议将其移至距灶具较远但仍能有效监测厨房整体温度的位置", "检查传感器固件版本,确认是否存在已知的高温环境下读数异常的 bug,必要时更新固件或更换耐高温型号", "在传感器修复前,考虑增加一条自动化规则:当灶具开启超过30分钟且温度传感器无有效读数时,发送提醒通知给紧急联系人", "确认厨房烟雾报警器工作正常(建议定期测试),作为温度传感器失效期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.296242713928223, "api_error": null} {"episode_id": "SQ2_TP_D_0264", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0264.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20260893, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-15T14:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在短时间内遭受4次连续错误密码/凭证尝试,触发了门锁防篡改报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 14:57:00至14:57:40期间,front_door_lock连续产生4次LockOperationError事件,OperationError=1表示凭证/密码错误,OperationSource=3表示来自远程/键盘输入方式,间隔仅10-15秒,属于高频暴力尝试。\",\n \"推理步骤2: 14:57:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3在Matter DoorLock Cluster中对应'Wrong Code Entry Limit'即错误密码次数超限报警,这是门锁自身判定的安全威胁。\",\n \"推理步骤3: 此时老人在家中(08:29回家后一直有室内活动记录,14:06卧室和客厅均有占用),说明这不是老人自己在门外尝试开锁,而是外部第三方的非授权尝试。\",\n \"推理步骤4: 当天老人正常出入门锁的操作均为Manual来源且成功(06:58出门、08:29回家),而此次异常操作来源为OperationSource=3(远程/键盘),与老人日常操作模式不符。\",\n \"推理步骤5: 报警后门锁状态未变为Unlocked(无后续成功解锁记录),说明入侵尝试未成功,但威胁真实存在。\"\n ],\n \"key_evidence\": [\n \"14:57:00-14:57:40 四次连续LockOperationError(OperationError=1, OperationSource=3),间隔极短\",\n \"14:57:50 触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警\",\n \"老人当时在室内(14:06有卧室和客厅活动),排除本人在门外误操作的可能\",\n \"操作来源OperationSource=3与老人日常Manual操作方式不一致\"\n ],\n \"recommended_actions\": [\n \"立即向老人及其紧急联系人/家属推送入侵警报通知\",\n \"通过玄关摄像头(如有)或入户门传感器确认门外是否仍有可疑人员\",\n \"临时提升门锁安全策略:延长错误密码锁定时间,考虑暂时禁用远程/键盘解锁方式\",\n \"检查门锁是否存在被授权的远程访问凭证,清除不明凭证\",\n \"如情况紧急或持续,建议联系物业安保或报警处理\"\n ]\n}\n```\n\n补充说明一个次要发现:厨房温度传感器在灶具开启期间多次报告 `MeasuredValue = None`(05:59、06:24、11:07、11:40、16:59、17:31),这属于设备故障问题。传感器可能因灶具工作时的高温或蒸汽干扰导致读数失效。虽然不构成即时安全威胁(灶具使用时长合理,烟雾报警器未触发),但对于独居老人家庭,厨房温度监测失效会削弱火灾预警能力,建议安排检修或更换该传感器。", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在短时间内遭受4次连续错误密码/凭证尝试,触发了门锁防篡改报警,疑似有人试图非法入侵。", "reasoning": ["推理步骤1: 14:57:00至14:57:40期间,front_door_lock连续产生4次LockOperationError事件,OperationError=1表示凭证/密码错误,OperationSource=3表示来自远程/键盘输入方式,间隔仅10-15秒,属于高频暴力尝试。", "推理步骤2: 14:57:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3在Matter DoorLock Cluster中对应'Wrong Code Entry Limit'即错误密码次数超限报警,这是门锁自身判定的安全威胁。", "推理步骤3: 此时老人在家中(08:29回家后一直有室内活动记录,14:06卧室和客厅均有占用),说明这不是老人自己在门外尝试开锁,而是外部第三方的非授权尝试。", "推理步骤4: 当天老人正常出入门锁的操作均为Manual来源且成功(06:58出门、08:29回家),而此次异常操作来源为OperationSource=3(远程/键盘),与老人日常操作模式不符。", "推理步骤5: 报警后门锁状态未变为Unlocked(无后续成功解锁记录),说明入侵尝试未成功,但威胁真实存在。"], "key_evidence": ["14:57:00-14:57:40 四次连续LockOperationError(OperationError=1, OperationSource=3),间隔极短", "14:57:50 触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警", "老人当时在室内(14:06有卧室和客厅活动),排除本人在门外误操作的可能", "操作来源OperationSource=3与老人日常Manual操作方式不一致"], "recommended_actions": ["立即向老人及其紧急联系人/家属推送入侵警报通知", "通过玄关摄像头(如有)或入户门传感器确认门外是否仍有可疑人员", "临时提升门锁安全策略:延长错误密码锁定时间,考虑暂时禁用远程/键盘解锁方式", "检查门锁是否存在被授权的远程访问凭证,清除不明凭证", "如情况紧急或持续,建议联系物业安保或报警处理"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.16430687904358, "api_error": null} {"episode_id": "SQ2_TP_D_0265", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0265.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-02T00:00:00", "seed": 20260894, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-02T01:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨1:22厨房灶具在无人活动时被开启,厨房温度骤升至30.47°C,且烟雾报警器因电池低电量可能无法正常工作,存在严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨01:22厨房灶具(kitchen_cook_surface)被开启(OnOff=True),但此时全屋无任何运动传感器触发占用状态,说明没有人在厨房操作灶具。独居老人在深夜凌晨时段应在卧室睡眠,这一操作来源不明,极为异常。\",\n \"推理步骤2: 灶具开启后10分钟(01:32),厨房温度从约23°C骤升至30.47°C(MeasuredValue=3047),温升幅度约7.5°C,远超正常环境波动,表明灶具确实在持续加热且无人看管。\",\n \"推理步骤3: 01:32的烟雾报警器读数SmokeState=0表示当时尚未检测到烟雾,但此前(6月1日01:22)该报警器已报告BatteryAlert=1(电池低电量警告),意味着如果火情进一步发展,报警器可能因电量不足而无法及时报警。\",\n \"推理步骤4: 灶具开启后日志中没有记录关闭事件,直到早晨05:56老人起床后再次开启灶具做早餐、06:32才关闭。这意味着灶具可能在无人看管的情况下持续运行了数小时。虽然02:00后厨房温度回落至约23°C,可能是灶具自动进入待机或火焰熄灭,但这段无人监管的时间窗口本身就是重大安全隐患。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:57、06:33、11:11、11:32、17:04、17:26),说明该传感器在高温环境下存在读数异常或故障,进一步削弱了厨房的安全监测能力。\"\n ],\n \"key_evidence\": [\n \"01:22 厨房灶具在深夜无人活动时被开启,无任何运动传感器显示厨房有人\",\n \"01:32 厨房温度从约23°C骤升至30.47°C,10分钟内升温约7.5°C\",\n \"厨房烟雾报警器在前一天(6月1日01:22)已报告电池低电量(BatteryAlert=1)\",\n \"01:32 烟雾报警器SmokeState=0,虽未触发但电池低电量下可靠性存疑\",\n \"厨房温度传感器在灶具使用期间多次返回None,存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具是否存在误触发或远程控制漏洞,排查凌晨无人时灶具自动开启的原因\",\n \"尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保其在紧急情况下能正常报警\",\n \"检修厨房温度传感器(kitchen_temp_sensor),排查多次返回None的故障原因,恢复其正常监测能力\",\n \"为独居老人配置灶具安全规则:深夜时段(23:00-05:00)灶具开启时自动发送告警通知给紧急联系人\",\n \"建议增加灶具自动关闭策略:无人在厨房(occupancy=0)超过一定时间后自动切断灶具电源\",\n \"联系老人或其家属确认凌晨灶具开启是否为老人本人操作(可能存在夜间起身忘记关灶的情况)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨1:22厨房灶具在无人活动时被开启,厨房温度骤升至30.47°C,且烟雾报警器因电池低电量可能无法正常工作,存在严重火灾隐患。", "reasoning": ["推理步骤1: 凌晨01:22厨房灶具(kitchen_cook_surface)被开启(OnOff=True),但此时全屋无任何运动传感器触发占用状态,说明没有人在厨房操作灶具。独居老人在深夜凌晨时段应在卧室睡眠,这一操作来源不明,极为异常。", "推理步骤2: 灶具开启后10分钟(01:32),厨房温度从约23°C骤升至30.47°C(MeasuredValue=3047),温升幅度约7.5°C,远超正常环境波动,表明灶具确实在持续加热且无人看管。", "推理步骤3: 01:32的烟雾报警器读数SmokeState=0表示当时尚未检测到烟雾,但此前(6月1日01:22)该报警器已报告BatteryAlert=1(电池低电量警告),意味着如果火情进一步发展,报警器可能因电量不足而无法及时报警。", "推理步骤4: 灶具开启后日志中没有记录关闭事件,直到早晨05:56老人起床后再次开启灶具做早餐、06:32才关闭。这意味着灶具可能在无人看管的情况下持续运行了数小时。虽然02:00后厨房温度回落至约23°C,可能是灶具自动进入待机或火焰熄灭,但这段无人监管的时间窗口本身就是重大安全隐患。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:57、06:33、11:11、11:32、17:04、17:26),说明该传感器在高温环境下存在读数异常或故障,进一步削弱了厨房的安全监测能力。"], "key_evidence": ["01:22 厨房灶具在深夜无人活动时被开启,无任何运动传感器显示厨房有人", "01:32 厨房温度从约23°C骤升至30.47°C,10分钟内升温约7.5°C", "厨房烟雾报警器在前一天(6月1日01:22)已报告电池低电量(BatteryAlert=1)", "01:32 烟雾报警器SmokeState=0,虽未触发但电池低电量下可靠性存疑", "厨房温度传感器在灶具使用期间多次返回None,存在设备故障"], "recommended_actions": ["立即检查厨房灶具是否存在误触发或远程控制漏洞,排查凌晨无人时灶具自动开启的原因", "尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保其在紧急情况下能正常报警", "检修厨房温度传感器(kitchen_temp_sensor),排查多次返回None的故障原因,恢复其正常监测能力", "为独居老人配置灶具安全规则:深夜时段(23:00-05:00)灶具开启时自动发送告警通知给紧急联系人", "建议增加灶具自动关闭策略:无人在厨房(occupancy=0)超过一定时间后自动切断灶具电源", "联系老人或其家属确认凌晨灶具开启是否为老人本人操作(可能存在夜间起身忘记关灶的情况)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.70975685119629, "api_error": null} {"episode_id": "SQ2_TP_D_0267", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0267.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20260896, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T02:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨持续报警,且厨房温度传感器多次返回 None 值,存在漏水隐患和设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在 02:14、02:24、02:44 连续三次报告 StateValue=True,时间跨度约30分钟,表明这不是瞬间误触,而是持续性漏水。\",\n \"推理步骤2: 漏水发生在凌晨2点,此时老人正在卧室睡觉(卧室无活动事件,卧室灯在 05:38 才开启),说明老人对漏水毫不知情,无法及时处理。\",\n \"推理步骤3: 卫生间在漏水期间无人活动(bathroom_occupancy 无触发),排除了老人正在使用卫生间导致的正常用水溅水情况,进一步确认是管道或设备漏水。\",\n \"推理步骤4: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:07、06:23、11:05、11:40、17:11、17:33),共出现6次。虽然可能是灶具高温导致传感器暂时超量程,但如此频繁的 None 值也可能意味着传感器本身存在故障,影响厨房安全监测能力。\",\n \"推理步骤5: 对于独居老人家庭,漏水若不及时处理可能导致地面湿滑引发跌倒,这是严重的人身安全风险。同时长时间漏水可能造成财产损失和楼下邻居受损。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 02:14、02:24、02:44 连续三次报告 StateValue=True,持续约30分钟\",\n \"漏水发生在凌晨2点,老人在卧室睡眠中,卫生间无人活动(bathroom_occupancy 未触发)\",\n \"kitchen_temp_sensor 在灶具使用期间6次返回 MeasuredValue=None(06:07、06:23、11:05、11:40、17:11、17:33),传感器工作异常\",\n \"08:21 入户门开锁后未关门(front_door_contact 报告 StateValue=False 后无 True 恢复),门可能处于未关闭状态直到 20:36 才确认关闭上锁\"\n ],\n \"recommended_actions\": [\n \"立即通知老人或其紧急联系人检查卫生间漏水情况,必要时关闭卫生间水阀\",\n \"检查卫生间地面是否湿滑,防止老人滑倒受伤\",\n \"安排专业人员检修厨房温度传感器,确认其在灶具使用时能正常工作,避免火灾监测盲区\",\n \"核查入户门状态:08:21 开门后日志中未见关门记录,直到 20:36 才确认门锁上锁,建议确认门是否曾长时间未关\",\n \"考虑为卫生间漏水传感器配置即时推送告警,确保凌晨漏水也能第一时间通知到老人或家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨持续报警,且厨房温度传感器多次返回 None 值,存在漏水隐患和设备故障。", "reasoning": ["推理步骤1: 卫生间漏水传感器在 02:14、02:24、02:44 连续三次报告 StateValue=True,时间跨度约30分钟,表明这不是瞬间误触,而是持续性漏水。", "推理步骤2: 漏水发生在凌晨2点,此时老人正在卧室睡觉(卧室无活动事件,卧室灯在 05:38 才开启),说明老人对漏水毫不知情,无法及时处理。", "推理步骤3: 卫生间在漏水期间无人活动(bathroom_occupancy 无触发),排除了老人正在使用卫生间导致的正常用水溅水情况,进一步确认是管道或设备漏水。", "推理步骤4: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:07、06:23、11:05、11:40、17:11、17:33),共出现6次。虽然可能是灶具高温导致传感器暂时超量程,但如此频繁的 None 值也可能意味着传感器本身存在故障,影响厨房安全监测能力。", "推理步骤5: 对于独居老人家庭,漏水若不及时处理可能导致地面湿滑引发跌倒,这是严重的人身安全风险。同时长时间漏水可能造成财产损失和楼下邻居受损。"], "key_evidence": ["bathroom_water_leak 在 02:14、02:24、02:44 连续三次报告 StateValue=True,持续约30分钟", "漏水发生在凌晨2点,老人在卧室睡眠中,卫生间无人活动(bathroom_occupancy 未触发)", "kitchen_temp_sensor 在灶具使用期间6次返回 MeasuredValue=None(06:07、06:23、11:05、11:40、17:11、17:33),传感器工作异常", "08:21 入户门开锁后未关门(front_door_contact 报告 StateValue=False 后无 True 恢复),门可能处于未关闭状态直到 20:36 才确认关闭上锁"], "recommended_actions": ["立即通知老人或其紧急联系人检查卫生间漏水情况,必要时关闭卫生间水阀", "检查卫生间地面是否湿滑,防止老人滑倒受伤", "安排专业人员检修厨房温度传感器,确认其在灶具使用时能正常工作,避免火灾监测盲区", "核查入户门状态:08:21 开门后日志中未见关门记录,直到 20:36 才确认门锁上锁,建议确认门是否曾长时间未关", "考虑为卫生间漏水传感器配置即时推送告警,确保凌晨漏水也能第一时间通知到老人或家属"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.38563370704651, "api_error": null} {"episode_id": "SQ2_TP_D_0275", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0275.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20260904, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-07T06:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨6:25入户门锁遭受连续4次错误密码尝试并触发防篡改报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在06:25:00至06:25:40的40秒内,入户门锁连续产生4次LockOperationError事件(OperationError=1, OperationSource=3),OperationSource=3通常表示远程/键盘输入来源,说明有人在短时间内反复输入错误凭证。\",\n \"推理步骤2: 紧接着在06:25:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数达到上限后的强制锁定告警,这是门锁自身的防暴力破解机制被触发。\",\n \"推理步骤3: 此时为凌晨6:25,老人在05:23起床后已移动至厨房做饭(05:57厨房有人且灶具开启),老人本人在室内活动,不需要从外部开锁。因此这些错误尝试极大概率来自外部未授权人员。\",\n \"推理步骤4: 门锁在报警后保持锁定状态,入侵者未能成功进入。直到07:05老人从内部手动开锁(OperationSource=Manual)外出,门在关闭后自动上锁,说明门锁物理完整性未被破坏。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None,属于设备故障(次要问题),但不影响入侵威胁的判断。\"\n ],\n \"key_evidence\": [\n \"06:25:00-06:25:40:40秒内连续4次LockOperationError(OperationError=1, OperationSource=3)\",\n \"06:25:50:触发DoorLockAlarm(AlarmCode=3)——错误输入次数超限报警\",\n \"事件发生时老人在厨房内部活动(05:57厨房灯亮、灶具开启),不可能是老人自己在外部尝试开锁\",\n \"凌晨6:25时段属于异常访问时间\"\n ],\n \"recommended_actions\": [\n \"立即通知老人的紧急联系人/家属,告知门锁遭受疑似暴力破解尝试\",\n \"检查门锁操作日志中OperationSource=3对应的具体输入方式(键盘密码/远程指令),确认攻击途径\",\n \"如有入户门摄像头或小区监控,调取06:25前后的视频录像以识别可疑人员\",\n \"考虑临时更换门锁密码,并启用更强的安全策略(如降低错误尝试次数上限、增加锁定时间)\",\n \"排查厨房温度传感器(kitchen_temp_sensor)多次报告None值的故障原因,及时维修或更换,避免在火灾风险场景下失去温度监测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨6:25入户门锁遭受连续4次错误密码尝试并触发防篡改报警,疑似有人试图非法入侵。", "reasoning": ["推理步骤1: 在06:25:00至06:25:40的40秒内,入户门锁连续产生4次LockOperationError事件(OperationError=1, OperationSource=3),OperationSource=3通常表示远程/键盘输入来源,说明有人在短时间内反复输入错误凭证。", "推理步骤2: 紧接着在06:25:50,门锁触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数达到上限后的强制锁定告警,这是门锁自身的防暴力破解机制被触发。", "推理步骤3: 此时为凌晨6:25,老人在05:23起床后已移动至厨房做饭(05:57厨房有人且灶具开启),老人本人在室内活动,不需要从外部开锁。因此这些错误尝试极大概率来自外部未授权人员。", "推理步骤4: 门锁在报警后保持锁定状态,入侵者未能成功进入。直到07:05老人从内部手动开锁(OperationSource=Manual)外出,门在关闭后自动上锁,说明门锁物理完整性未被破坏。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None,属于设备故障(次要问题),但不影响入侵威胁的判断。"], "key_evidence": ["06:25:00-06:25:40:40秒内连续4次LockOperationError(OperationError=1, OperationSource=3)", "06:25:50:触发DoorLockAlarm(AlarmCode=3)——错误输入次数超限报警", "事件发生时老人在厨房内部活动(05:57厨房灯亮、灶具开启),不可能是老人自己在外部尝试开锁", "凌晨6:25时段属于异常访问时间"], "recommended_actions": ["立即通知老人的紧急联系人/家属,告知门锁遭受疑似暴力破解尝试", "检查门锁操作日志中OperationSource=3对应的具体输入方式(键盘密码/远程指令),确认攻击途径", "如有入户门摄像头或小区监控,调取06:25前后的视频录像以识别可疑人员", "考虑临时更换门锁密码,并启用更强的安全策略(如降低错误尝试次数上限、增加锁定时间)", "排查厨房温度传感器(kitchen_temp_sensor)多次报告None值的故障原因,及时维修或更换,避免在火灾风险场景下失去温度监测能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.236438274383545, "api_error": null} {"episode_id": "SQ2_TP_D_0274", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0274.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20260903, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-09T08:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器持续报警超过30分钟,且老人已外出无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 08:09 卫生间漏水传感器首次报告 StateValue=True,随后 08:19 和 08:39 持续报告 True,说明漏水状态至少持续了30分钟且未被解除。\",\n \"推理步骤2: 老人在 06:53 手动开锁出门(LockOperationType=1, OperationSource=Manual),门锁自动上锁,此后家中无人。08:20 有人开锁进入(可能是老人回家),但进入后活动区域在客厅(living_room_occupancy=1),没有任何卫生间活动记录,说明漏水未被察觉或处理。\",\n \"推理步骤3: 从 08:39 之后日志中再无漏水传感器的状态更新。这有两种可能:漏水自行停止,或传感器仍处于报警状态但未产生新的状态变化事件(因为状态未改变)。无论哪种情况,长时间无人处理的漏水都可能已造成积水。\",\n \"推理步骤4: 卫生间在 05:45-05:57 期间有人使用过(occupancy=1,灯亮),可能是老人早起洗漱时水龙头未关紧、马桶溢水或管道渗漏导致。\",\n \"推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:58、06:37、10:53、11:29、16:56、17:28),这是一个设备异常信号,但属于设备故障类问题,与漏水相比紧迫性较低。该传感器可能在高温环境下读数超出量程或出现通信故障。\"\n ],\n \"key_evidence\": [\n \"08:09、08:19、08:39 卫生间漏水传感器连续三次报告 StateValue=True,持续至少30分钟\",\n \"06:53 老人出门后家中无人,08:20 回家后未进入卫生间,漏水未被处理\",\n \"05:45-05:57 老人曾使用卫生间,可能是漏水源头时间窗口\",\n \"厨房温度传感器在灶具使用期间多次报告 None 值,存在设备故障隐患\"\n ],\n \"recommended_actions\": [\n \"立即通知老人或其紧急联系人检查卫生间漏水情况,确认水源是否已关闭\",\n \"如果智能家居系统接入了电磁阀,建议远程关闭卫生间供水总阀以防止进一步水损\",\n \"安排人员检查卫生间地面积水情况,防止老人滑倒(独居老人跌倒风险高)\",\n \"排查厨房温度传感器故障原因——灶具开启时反复报告 None 值,可能是传感器耐温不足或通信异常,建议更换或重新定位传感器\",\n \"考虑为漏水传感器配置自动化规则:检测到漏水时自动推送告警并联动关闭水阀,避免无人在家时水损扩大\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器持续报警超过30分钟,且老人已外出无人处理,存在水损风险。", "reasoning": ["推理步骤1: 08:09 卫生间漏水传感器首次报告 StateValue=True,随后 08:19 和 08:39 持续报告 True,说明漏水状态至少持续了30分钟且未被解除。", "推理步骤2: 老人在 06:53 手动开锁出门(LockOperationType=1, OperationSource=Manual),门锁自动上锁,此后家中无人。08:20 有人开锁进入(可能是老人回家),但进入后活动区域在客厅(living_room_occupancy=1),没有任何卫生间活动记录,说明漏水未被察觉或处理。", "推理步骤3: 从 08:39 之后日志中再无漏水传感器的状态更新。这有两种可能:漏水自行停止,或传感器仍处于报警状态但未产生新的状态变化事件(因为状态未改变)。无论哪种情况,长时间无人处理的漏水都可能已造成积水。", "推理步骤4: 卫生间在 05:45-05:57 期间有人使用过(occupancy=1,灯亮),可能是老人早起洗漱时水龙头未关紧、马桶溢水或管道渗漏导致。", "推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:58、06:37、10:53、11:29、16:56、17:28),这是一个设备异常信号,但属于设备故障类问题,与漏水相比紧迫性较低。该传感器可能在高温环境下读数超出量程或出现通信故障。"], "key_evidence": ["08:09、08:19、08:39 卫生间漏水传感器连续三次报告 StateValue=True,持续至少30分钟", "06:53 老人出门后家中无人,08:20 回家后未进入卫生间,漏水未被处理", "05:45-05:57 老人曾使用卫生间,可能是漏水源头时间窗口", "厨房温度传感器在灶具使用期间多次报告 None 值,存在设备故障隐患"], "recommended_actions": ["立即通知老人或其紧急联系人检查卫生间漏水情况,确认水源是否已关闭", "如果智能家居系统接入了电磁阀,建议远程关闭卫生间供水总阀以防止进一步水损", "安排人员检查卫生间地面积水情况,防止老人滑倒(独居老人跌倒风险高)", "排查厨房温度传感器故障原因——灶具开启时反复报告 None 值,可能是传感器耐温不足或通信异常,建议更换或重新定位传感器", "考虑为漏水传感器配置自动化规则:检测到漏水时自动推送告警并联动关闭水阀,避免无人在家时水损扩大"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.81924605369568, "api_error": null} {"episode_id": "SQ2_TP_D_0279", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0279.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20260908, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-28T06:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"早晨6:22厨房灶具在无人看管状态下持续运行,导致厨房温度急剧飙升至35°C并触发烟雾报警器\",\n \"reasoning\": [\n \"推理步骤1: 06:01老人进入厨房开启灶具,但06:22时厨房运动传感器显示Occupancy=0,说明老人已离开厨房,灶具仍在运行\",\n \"推理步骤2: 06:27厨房温度从正常的约23°C飙升至28.97°C,06:32进一步升至35°C,远超正常烹饪温度范围\",\n \"推理步骤3: 06:35灶具关闭(可能是自动保护或老人返回关闭),但06:37烟雾报警器触发(SmokeState=1, ExpressedState=1),说明已产生烟雾\",\n \"推理步骤4: 这是独居老人场景,灶具无人看管约13分钟(06:22至06:35),存在严重火灾隐患,且老人可能存在健忘问题\"\n ],\n \"key_evidence\": [\n \"06:22 厨房灶具仍开启但运动传感器显示无人(Occupancy=0)\",\n \"06:27 厨房温度异常升至2897(28.97°C),06:32升至3500(35°C)\",\n \"06:37 厨房烟雾报警器触发 SmokeAlarm 事件\",\n \"灶具无人看管持续约13分钟\"\n ],\n \"recommended_actions\": [\n \"立即确认老人安全状况,联系紧急联系人或拨打急救电话\",\n \"检查厨房是否有残留火源或烟雾,确保通风\",\n \"为灶具设置无人自动关闭功能(如运动传感器检测无人超过5分钟自动断气/断电)\",\n \"考虑为老人安装灶具定时器或智能燃气阀门,防止忘记关火\",\n \"将此事件通知老人的家属或护理人员,评估老人是否出现记忆力下降问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "早晨6:22厨房灶具在无人看管状态下持续运行,导致厨房温度急剧飙升至35°C并触发烟雾报警器", "reasoning": ["推理步骤1: 06:01老人进入厨房开启灶具,但06:22时厨房运动传感器显示Occupancy=0,说明老人已离开厨房,灶具仍在运行", "推理步骤2: 06:27厨房温度从正常的约23°C飙升至28.97°C,06:32进一步升至35°C,远超正常烹饪温度范围", "推理步骤3: 06:35灶具关闭(可能是自动保护或老人返回关闭),但06:37烟雾报警器触发(SmokeState=1, ExpressedState=1),说明已产生烟雾", "推理步骤4: 这是独居老人场景,灶具无人看管约13分钟(06:22至06:35),存在严重火灾隐患,且老人可能存在健忘问题"], "key_evidence": ["06:22 厨房灶具仍开启但运动传感器显示无人(Occupancy=0)", "06:27 厨房温度异常升至2897(28.97°C),06:32升至3500(35°C)", "06:37 厨房烟雾报警器触发 SmokeAlarm 事件", "灶具无人看管持续约13分钟"], "recommended_actions": ["立即确认老人安全状况,联系紧急联系人或拨打急救电话", "检查厨房是否有残留火源或烟雾,确保通风", "为灶具设置无人自动关闭功能(如运动传感器检测无人超过5分钟自动断气/断电)", "考虑为老人安装灶具定时器或智能燃气阀门,防止忘记关火", "将此事件通知老人的家属或护理人员,评估老人是否出现记忆力下降问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.461706399917603, "api_error": null} {"episode_id": "SQ2_TP_D_0276", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0276.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20260905, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-03T02:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房一氧化碳报警器在凌晨2:45触发CO警报,且厨房温度传感器多次报告None值,存在一氧化碳泄漏风险和传感器故障隐患。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨02:45,厨房烟雾报警器触发了CO(一氧化碳)警报——COState=1(警告状态)、ExpressedState=2(CO报警激活)、并产生COAlarm事件。此时灶具处于关闭状态,厨房无人活动,不应有CO产生源。\",\n \"推理步骤2: CO报警发生在深夜,独居老人大概率在卧室睡眠中(卧室无任何活动事件,符合熟睡状态)。老人可能未察觉报警,这对独居老人构成严重的生命安全威胁。\",\n \"推理步骤3: 报警后未观察到任何人员响应行为——没有卧室运动传感器触发、没有开灯、没有开门通风等动作,说明老人很可能没有被警报唤醒或无法响应。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:54、06:30、11:11、11:39、17:07、17:24),共出现6次。虽然部分可能与灶具高温有关,但关灶后仍出现None值(06:30灶具06:29已关、11:39灶具11:38已关),提示传感器本身可能存在故障或受到干扰。\",\n \"推理步骤5: CO报警后厨房温度并未出现异常飙升(维持在23°C左右),排除了明火/火灾的可能性,但CO是无色无味气体,温度正常不代表CO浓度安全。CO来源可能是燃气管道微漏、热水器排气不畅或其他非明火源。\",\n \"推理步骤6: 入户门在08:20被手动开锁后,未再上锁(直到20:52才自动上锁),白天长时间门锁处于解锁状态。虽然老人08:20回家后一直在家活动,但这也是一个次要的安全注意点。\"\n ],\n \"key_evidence\": [\n \"02:45 厨房烟雾报警器触发CO警报:COState=1, ExpressedState=2, Event:COAlarm(),此时灶具关闭、厨房无人\",\n \"CO报警后无任何人员响应动作(无运动传感器触发、无开灯、无开门),老人可能未察觉\",\n \"厨房温度传感器全天出现6次MeasuredValue=None,包括灶具关闭后仍出现None值,提示传感器可能故障\",\n \"CO报警发生在凌晨深睡时段,独居老人面临的风险极高\"\n ],\n \"recommended_actions\": [\n \"立即远程联系老人或通知紧急联系人确认老人安全状况,必要时拨打急救电话\",\n \"检查厨房CO报警是否仍处于激活状态,如CO浓度持续偏高应立即开窗通风并撤离\",\n \"安排专业人员检查燃气管道、热水器及所有可能的CO泄漏源\",\n \"对厨房温度传感器进行检修或更换,多次None值报告表明设备工作不稳定\",\n \"建议为独居老人安装联动报警系统:CO报警时自动触发卧室声光警报、推送手机通知给家属、并自动开启通风设备\",\n \"考虑在卧室也安装CO检测器,确保睡眠区域的安全覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房一氧化碳报警器在凌晨2:45触发CO警报,且厨房温度传感器多次报告None值,存在一氧化碳泄漏风险和传感器故障隐患。", "reasoning": ["推理步骤1: 凌晨02:45,厨房烟雾报警器触发了CO(一氧化碳)警报——COState=1(警告状态)、ExpressedState=2(CO报警激活)、并产生COAlarm事件。此时灶具处于关闭状态,厨房无人活动,不应有CO产生源。", "推理步骤2: CO报警发生在深夜,独居老人大概率在卧室睡眠中(卧室无任何活动事件,符合熟睡状态)。老人可能未察觉报警,这对独居老人构成严重的生命安全威胁。", "推理步骤3: 报警后未观察到任何人员响应行为——没有卧室运动传感器触发、没有开灯、没有开门通风等动作,说明老人很可能没有被警报唤醒或无法响应。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:54、06:30、11:11、11:39、17:07、17:24),共出现6次。虽然部分可能与灶具高温有关,但关灶后仍出现None值(06:30灶具06:29已关、11:39灶具11:38已关),提示传感器本身可能存在故障或受到干扰。", "推理步骤5: CO报警后厨房温度并未出现异常飙升(维持在23°C左右),排除了明火/火灾的可能性,但CO是无色无味气体,温度正常不代表CO浓度安全。CO来源可能是燃气管道微漏、热水器排气不畅或其他非明火源。", "推理步骤6: 入户门在08:20被手动开锁后,未再上锁(直到20:52才自动上锁),白天长时间门锁处于解锁状态。虽然老人08:20回家后一直在家活动,但这也是一个次要的安全注意点。"], "key_evidence": ["02:45 厨房烟雾报警器触发CO警报:COState=1, ExpressedState=2, Event:COAlarm(),此时灶具关闭、厨房无人", "CO报警后无任何人员响应动作(无运动传感器触发、无开灯、无开门),老人可能未察觉", "厨房温度传感器全天出现6次MeasuredValue=None,包括灶具关闭后仍出现None值,提示传感器可能故障", "CO报警发生在凌晨深睡时段,独居老人面临的风险极高"], "recommended_actions": ["立即远程联系老人或通知紧急联系人确认老人安全状况,必要时拨打急救电话", "检查厨房CO报警是否仍处于激活状态,如CO浓度持续偏高应立即开窗通风并撤离", "安排专业人员检查燃气管道、热水器及所有可能的CO泄漏源", "对厨房温度传感器进行检修或更换,多次None值报告表明设备工作不稳定", "建议为独居老人安装联动报警系统:CO报警时自动触发卧室声光警报、推送手机通知给家属、并自动开启通风设备", "考虑在卧室也安装CO检测器,确保睡眠区域的安全覆盖"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.987727403640747, "api_error": null} {"episode_id": "SQ2_TP_D_0283", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0283.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20260912, "scenario_id": "INS-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-22T03:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨3:13客厅窗户被打开并检测到移动,独居老人随后在卧室活动,存在入侵或老人异常起夜的可疑情况。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨3:13:00,客厅窗户传感器 StateValue=False 表示窗户被打开,这是深夜异常时段。\",\n \"推理步骤2: 仅5秒后(3:13:05),客厅运动传感器检测到有人活动(Occupancy=1),说明窗户打开与人员出现几乎同时发生。\",\n \"推理步骤3: 紧接着3:13:30卧室运动传感器触发,3:13:45卧室灯打开,说明有人从客厅快速移动到卧室。\",\n \"推理步骤4: 关键疑点——入户门在此期间没有任何开锁/开门记录,说明这个人不是通过正门进入的。如果是老人自己起夜,不应该先触发客厅窗户打开再触发客厅运动传感器。\",\n \"推理步骤5: 整个凌晨0:00-3:13期间,全屋无任何运动传感器触发,说明老人一直在睡觉,客厅窗户的打开不太可能是老人主动操作。\",\n \"推理步骤6: 但也存在另一种可能:老人夜间起来开窗通风(夏季6月,室内约22-23°C),然后回卧室。卧室灯打开可以解释为老人回到卧室后开灯。\",\n \"推理步骤7: 降低为medium置信度的原因:没有后续的异常行为(无门锁被撬、无其他窗户异常),且老人之后的作息完全正常(5:21起床、正常做饭、正常出门),如果是入侵应该会有更多异常痕迹。但客厅窗户打开后整天日志中没有看到窗户关闭的记录,这一点值得关注。\"\n ],\n \"key_evidence\": [\n \"凌晨3:13:00 客厅窗户被打开(living_room_window_contact StateValue=False),且全天日志中未见该窗户关闭记录\",\n \"3:13:05 客厅运动传感器触发,窗户打开与人员出现仅间隔5秒\",\n \"0:00-3:13期间全屋无任何运动传感器活动,老人应处于睡眠状态\",\n \"入户门在此时段无任何开锁/开门事件,排除正门进入的可能\"\n ],\n \"recommended_actions\": [\n \"立即通过摄像头或远程方式确认老人安全状况\",\n \"检查客厅窗户当前状态,确认是否仍处于打开状态\",\n \"联系老人或其紧急联系人,确认凌晨3点是否有主动开窗行为\",\n \"建议为客厅窗户加装限位器或智能窗锁,防止夜间被从外部打开\",\n \"考虑增加窗户区域的安防摄像头,便于事后回溯\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "凌晨3:13客厅窗户被打开并检测到移动,独居老人随后在卧室活动,存在入侵或老人异常起夜的可疑情况。", "reasoning": ["推理步骤1: 凌晨3:13:00,客厅窗户传感器 StateValue=False 表示窗户被打开,这是深夜异常时段。", "推理步骤2: 仅5秒后(3:13:05),客厅运动传感器检测到有人活动(Occupancy=1),说明窗户打开与人员出现几乎同时发生。", "推理步骤3: 紧接着3:13:30卧室运动传感器触发,3:13:45卧室灯打开,说明有人从客厅快速移动到卧室。", "推理步骤4: 关键疑点——入户门在此期间没有任何开锁/开门记录,说明这个人不是通过正门进入的。如果是老人自己起夜,不应该先触发客厅窗户打开再触发客厅运动传感器。", "推理步骤5: 整个凌晨0:00-3:13期间,全屋无任何运动传感器触发,说明老人一直在睡觉,客厅窗户的打开不太可能是老人主动操作。", "推理步骤6: 但也存在另一种可能:老人夜间起来开窗通风(夏季6月,室内约22-23°C),然后回卧室。卧室灯打开可以解释为老人回到卧室后开灯。", "推理步骤7: 降低为medium置信度的原因:没有后续的异常行为(无门锁被撬、无其他窗户异常),且老人之后的作息完全正常(5:21起床、正常做饭、正常出门),如果是入侵应该会有更多异常痕迹。但客厅窗户打开后整天日志中没有看到窗户关闭的记录,这一点值得关注。"], "key_evidence": ["凌晨3:13:00 客厅窗户被打开(living_room_window_contact StateValue=False),且全天日志中未见该窗户关闭记录", "3:13:05 客厅运动传感器触发,窗户打开与人员出现仅间隔5秒", "0:00-3:13期间全屋无任何运动传感器活动,老人应处于睡眠状态", "入户门在此时段无任何开锁/开门事件,排除正门进入的可能"], "recommended_actions": ["立即通过摄像头或远程方式确认老人安全状况", "检查客厅窗户当前状态,确认是否仍处于打开状态", "联系老人或其紧急联系人,确认凌晨3点是否有主动开窗行为", "建议为客厅窗户加装限位器或智能窗锁,防止夜间被从外部打开", "考虑增加窗户区域的安防摄像头,便于事后回溯"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 49.938556432724, "api_error": null} {"episode_id": "SQ2_TP_D_0282", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0282.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20260911, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-01T00:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨00:28灶具在无人活动时段异常开启,厨房温度10分钟内飙升至31.39°C,且烟雾报警器电池低电量叠加传感器故障,构成严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨00:28厨房灶具开启(kitchen_cook_surface OnOff=True),但此时全屋无任何运动传感器触发,老人应处于深睡状态。独居老人在凌晨0点半使用灶具极不寻常,且厨房运动传感器未检测到人员存在,说明灶具可能是误触、故障或遗忘关闭后重新点燃。\",\n \"推理步骤2: 灶具开启后仅10分钟(00:38),厨房温度从约23.07°C骤升至31.39°C(MeasuredValue从2307跳至3139),升幅超过8°C,这是异常剧烈的温升,表明灶具处于高功率无人看管状态。\",\n \"推理步骤3: 00:38烟雾报警器报告SmokeState=0(正常/无烟),但前一天(05-31 00:28)该报警器已报告BatteryAlert=1(低电量警告)。低电量状态下传感器的检测灵敏度和可靠性会下降,SmokeState=0不能完全排除烟雾风险。\",\n \"推理步骤4: 灶具从00:28持续运行,日志中没有任何关闭记录直到01:00温度恢复正常(约22.91°C),说明灶具可能在某个时间点自动关闭或温度自然回落,但整个过程中无人在场监管,持续时间不明确。\",\n \"推理步骤5: 厨房温度传感器在白天灶具使用期间多次报告MeasuredValue=None(06:07、06:29、11:11、11:36、16:51、17:41),说明该传感器存在间歇性故障——在灶具工作时读数丢失,这严重削弱了火灾预警能力。\",\n \"推理步骤6: 20:37入户门锁报告了一次自动上锁事件(LockOperationType=0, OperationSource=Auto),但之前没有对应的开锁记录(08:33老人回家后门锁状态未明确记录为已锁),且门接触传感器显示StateValue=True(门关闭)。结合老人已在卧室准备就寝的行为,这可能是延迟自动锁定,属于正常行为,但需确认门锁工作正常。\"\n ],\n \"key_evidence\": [\n \"00:28 厨房灶具在无人活动(无运动传感器触发)的凌晨时段开启\",\n \"00:38 厨房温度10分钟内从23.07°C飙升至31.39°C(+8.32°C)\",\n \"05-31 00:28 厨房烟雾报警器已处于低电量状态(BatteryAlert=1),检测可靠性存疑\",\n \"厨房温度传感器在灶具工作期间多次返回None值(06:07、11:11、16:51等),存在间歇性故障\",\n \"凌晨灶具开启期间全屋无任何运动传感器检测到人员活动\"\n ],\n \"recommended_actions\": [\n \"【紧急】立即检查厨房灶具是否存在故障或误触风险,考虑为灶具加装自动断气/断电保护装置或定时关闭功能\",\n \"【紧急】立即更换厨房烟雾报警器电池,确保火灾检测能力正常\",\n \"【高优先级】排查厨房温度传感器间歇性返回None的故障原因,必要时更换传感器,确保灶具使用期间温度监控不中断\",\n \"【建议】设置自动化规则:当灶具开启但厨房运动传感器未检测到人员时,发出警报并在一定时间后自动关闭灶具\",\n \"【建议】设置自动化规则:凌晨时段(23:00-05:00)灶具开启时立即向紧急联系人发送通知\",\n \"【建议】考虑为独居老人配置跌倒检测设备或紧急呼叫按钮,提升整体安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨00:28灶具在无人活动时段异常开启,厨房温度10分钟内飙升至31.39°C,且烟雾报警器电池低电量叠加传感器故障,构成严重火灾隐患。", "reasoning": ["推理步骤1: 凌晨00:28厨房灶具开启(kitchen_cook_surface OnOff=True),但此时全屋无任何运动传感器触发,老人应处于深睡状态。独居老人在凌晨0点半使用灶具极不寻常,且厨房运动传感器未检测到人员存在,说明灶具可能是误触、故障或遗忘关闭后重新点燃。", "推理步骤2: 灶具开启后仅10分钟(00:38),厨房温度从约23.07°C骤升至31.39°C(MeasuredValue从2307跳至3139),升幅超过8°C,这是异常剧烈的温升,表明灶具处于高功率无人看管状态。", "推理步骤3: 00:38烟雾报警器报告SmokeState=0(正常/无烟),但前一天(05-31 00:28)该报警器已报告BatteryAlert=1(低电量警告)。低电量状态下传感器的检测灵敏度和可靠性会下降,SmokeState=0不能完全排除烟雾风险。", "推理步骤4: 灶具从00:28持续运行,日志中没有任何关闭记录直到01:00温度恢复正常(约22.91°C),说明灶具可能在某个时间点自动关闭或温度自然回落,但整个过程中无人在场监管,持续时间不明确。", "推理步骤5: 厨房温度传感器在白天灶具使用期间多次报告MeasuredValue=None(06:07、06:29、11:11、11:36、16:51、17:41),说明该传感器存在间歇性故障——在灶具工作时读数丢失,这严重削弱了火灾预警能力。", "推理步骤6: 20:37入户门锁报告了一次自动上锁事件(LockOperationType=0, OperationSource=Auto),但之前没有对应的开锁记录(08:33老人回家后门锁状态未明确记录为已锁),且门接触传感器显示StateValue=True(门关闭)。结合老人已在卧室准备就寝的行为,这可能是延迟自动锁定,属于正常行为,但需确认门锁工作正常。"], "key_evidence": ["00:28 厨房灶具在无人活动(无运动传感器触发)的凌晨时段开启", "00:38 厨房温度10分钟内从23.07°C飙升至31.39°C(+8.32°C)", "05-31 00:28 厨房烟雾报警器已处于低电量状态(BatteryAlert=1),检测可靠性存疑", "厨房温度传感器在灶具工作期间多次返回None值(06:07、11:11、16:51等),存在间歇性故障", "凌晨灶具开启期间全屋无任何运动传感器检测到人员活动"], "recommended_actions": ["【紧急】立即检查厨房灶具是否存在故障或误触风险,考虑为灶具加装自动断气/断电保护装置或定时关闭功能", "【紧急】立即更换厨房烟雾报警器电池,确保火灾检测能力正常", "【高优先级】排查厨房温度传感器间歇性返回None的故障原因,必要时更换传感器,确保灶具使用期间温度监控不中断", "【建议】设置自动化规则:当灶具开启但厨房运动传感器未检测到人员时,发出警报并在一定时间后自动关闭灶具", "【建议】设置自动化规则:凌晨时段(23:00-05:00)灶具开启时立即向紧急联系人发送通知", "【建议】考虑为独居老人配置跌倒检测设备或紧急呼叫按钮,提升整体安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 67.67576575279236, "api_error": null} {"episode_id": "SQ2_TP_D_0285", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0285.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20260914, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-24T23:39:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"深夜23:39卫生间漏水传感器触发报警,老人已入睡,存在水损和滑倒风险。\",\n \"reasoning\": [\n \"推理步骤1: 23:39卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到实际漏水。\",\n \"推理步骤2: 老人在20:50左右已完成洗漱(卫生间灯关闭)、进入卧室关灯就寝,20:51卫生间运动传感器归零,此后近3小时卫生间无人活动,说明漏水并非老人正在用水导致。\",\n \"推理步骤3: 无人使用状态下传感器触发,高度指向管道渗漏、水龙头未关紧或马桶溢水等设备故障,而非正常用水行为。\",\n \"推理步骤4: 独居老人已入睡,无法及时发现漏水。持续漏水可能导致地面积水、地板损坏,更重要的是老人夜间起夜时存在严重滑倒摔伤风险。\"\n ],\n \"key_evidence\": [\n \"[23:39] bathroom_water_leak StateValue=True 及 StateChange 事件确认漏水\",\n \"[20:50-20:51] 卫生间灯关闭、运动传感器归零,此后无人进入卫生间,排除正常用水\",\n \"[20:50] 老人进入卧室关灯就寝,当前处于睡眠状态无法自行处理\"\n ],\n \"recommended_actions\": [\n \"立即向老人或其紧急联系人发送高优先级漏水警报通知\",\n \"如有智能水阀,远程关闭卫生间供水总阀以止损\",\n \"提醒老人或家属尽快检查卫生间漏水源头(水龙头、马桶、管道接口)\",\n \"在漏水未处理前,若老人夜间起夜需提醒注意地面湿滑,可自动开启卫生间灯照明\",\n \"漏水排除后检查传感器状态是否恢复正常,排查是否需要维修\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "深夜23:39卫生间漏水传感器触发报警,老人已入睡,存在水损和滑倒风险。", "reasoning": ["推理步骤1: 23:39卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到实际漏水。", "推理步骤2: 老人在20:50左右已完成洗漱(卫生间灯关闭)、进入卧室关灯就寝,20:51卫生间运动传感器归零,此后近3小时卫生间无人活动,说明漏水并非老人正在用水导致。", "推理步骤3: 无人使用状态下传感器触发,高度指向管道渗漏、水龙头未关紧或马桶溢水等设备故障,而非正常用水行为。", "推理步骤4: 独居老人已入睡,无法及时发现漏水。持续漏水可能导致地面积水、地板损坏,更重要的是老人夜间起夜时存在严重滑倒摔伤风险。"], "key_evidence": ["[23:39] bathroom_water_leak StateValue=True 及 StateChange 事件确认漏水", "[20:50-20:51] 卫生间灯关闭、运动传感器归零,此后无人进入卫生间,排除正常用水", "[20:50] 老人进入卧室关灯就寝,当前处于睡眠状态无法自行处理"], "recommended_actions": ["立即向老人或其紧急联系人发送高优先级漏水警报通知", "如有智能水阀,远程关闭卫生间供水总阀以止损", "提醒老人或家属尽快检查卫生间漏水源头(水龙头、马桶、管道接口)", "在漏水未处理前,若老人夜间起夜需提醒注意地面湿滑,可自动开启卫生间灯照明", "漏水排除后检查传感器状态是否恢复正常,排查是否需要维修"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.034953832626343, "api_error": null} {"episode_id": "SQ2_TP_D_0284", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0284.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20260913, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-20T19:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在短时间内遭受多次连续错误解锁尝试并触发防篡改报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 19:57:00 至 19:57:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 表示远程/无线方式操作,OperationError=1 表示凭证无效,说明有人在用错误凭证反复尝试开锁。\",\n \"推理步骤2: 4 次失败尝试发生在不到 1 分钟内(19:57:00→19:57:15→19:57:25→19:57:40),间隔仅 10-15 秒,呈现典型的暴力破解/试探模式。\",\n \"推理步骤3: 19:57:50 门锁触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应 'Wrong Code Entry Limit' 报警,即错误输入次数超限触发的安全警报,进一步确认这是非授权访问尝试。\",\n \"推理步骤4: 此时老人在家——19:35 客厅运动传感器检测到有人且客厅灯调暗至 Level=12(约 5%亮度),符合晚间在客厅休息的场景。入侵尝试发生时住户在室内,存在人身安全风险。\",\n \"推理步骤5: 当天老人早晨 06:54 和 08:35 的正常出入均通过 Manual 方式操作且成功,门锁状态正常切换,与 19:57 的异常事件形成鲜明对比。\",\n \"推理步骤6: 入侵尝试未成功——之后 20:49 门锁记录显示 LockState=1(已锁定)且门传感器 StateValue=True(门关闭),说明入侵者未能进入,但威胁已经发生。\"\n ],\n \"key_evidence\": [\n \"19:57:00-19:57:40 在 43 秒内连续 4 次 LockOperationError(OperationError=1, OperationSource=3),凭证无效的远程解锁尝试\",\n \"19:57:50 触发 DoorLockAlarm(AlarmCode=3),错误输入次数超限报警\",\n \"操作来源为 OperationSource=3(远程/无线),非住户常用的 Manual 方式\",\n \"住户当时在家(19:35 客厅有活动),存在直接人身安全风险\"\n ],\n \"recommended_actions\": [\n \"立即向老人及其紧急联系人(家属/社区)发送入侵警报通知\",\n \"联系物业安保或报警,请求对入户门周边进行巡查\",\n \"检查门锁远程访问日志,确认尝试来源(蓝牙/Zigbee/网络),排查是否有未授权设备配对\",\n \"临时禁用门锁的远程解锁功能,仅保留物理钥匙和手动操作方式\",\n \"更换或重置门锁访问凭证(PIN码/数字密钥),确保旧凭证失效\",\n \"考虑在入户门区域加装摄像头,便于后续取证和威慑\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在短时间内遭受多次连续错误解锁尝试并触发防篡改报警,疑似有人试图非法入侵。", "reasoning": ["推理步骤1: 19:57:00 至 19:57:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 表示远程/无线方式操作,OperationError=1 表示凭证无效,说明有人在用错误凭证反复尝试开锁。", "推理步骤2: 4 次失败尝试发生在不到 1 分钟内(19:57:00→19:57:15→19:57:25→19:57:40),间隔仅 10-15 秒,呈现典型的暴力破解/试探模式。", "推理步骤3: 19:57:50 门锁触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应 'Wrong Code Entry Limit' 报警,即错误输入次数超限触发的安全警报,进一步确认这是非授权访问尝试。", "推理步骤4: 此时老人在家——19:35 客厅运动传感器检测到有人且客厅灯调暗至 Level=12(约 5%亮度),符合晚间在客厅休息的场景。入侵尝试发生时住户在室内,存在人身安全风险。", "推理步骤5: 当天老人早晨 06:54 和 08:35 的正常出入均通过 Manual 方式操作且成功,门锁状态正常切换,与 19:57 的异常事件形成鲜明对比。", "推理步骤6: 入侵尝试未成功——之后 20:49 门锁记录显示 LockState=1(已锁定)且门传感器 StateValue=True(门关闭),说明入侵者未能进入,但威胁已经发生。"], "key_evidence": ["19:57:00-19:57:40 在 43 秒内连续 4 次 LockOperationError(OperationError=1, OperationSource=3),凭证无效的远程解锁尝试", "19:57:50 触发 DoorLockAlarm(AlarmCode=3),错误输入次数超限报警", "操作来源为 OperationSource=3(远程/无线),非住户常用的 Manual 方式", "住户当时在家(19:35 客厅有活动),存在直接人身安全风险"], "recommended_actions": ["立即向老人及其紧急联系人(家属/社区)发送入侵警报通知", "联系物业安保或报警,请求对入户门周边进行巡查", "检查门锁远程访问日志,确认尝试来源(蓝牙/Zigbee/网络),排查是否有未授权设备配对", "临时禁用门锁的远程解锁功能,仅保留物理钥匙和手动操作方式", "更换或重置门锁访问凭证(PIN码/数字密钥),确保旧凭证失效", "考虑在入户门区域加装摄像头,便于后续取证和威慑"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.01336121559143, "api_error": null} {"episode_id": "SQ2_TP_D_0288", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0288.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20260917, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-21T20:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"老人已就寝后,入户门被远程/密码解锁并打开,有人进入室内但未开灯,高度疑似非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 老人在 20:30 关闭客厅灯,20:30-20:38 完成洗漱,20:38 进入卧室并关灯就寝,符合独居老人的睡前流程。\",\n \"推理步骤2: 20:38:11-12 入户门传感器确认门已关闭(StateValue=True)且门锁自动上锁(LockState=1),说明老人已安全锁门准备入睡。\",\n \"推理步骤3: 仅 10 分钟后(20:48:00),门锁被再次解锁(LockOperationType=1),操作来源为 OperationSource=8(远程/密码/PIN 操作),使用 UserIndex=1。老人此时已在卧室就寝,不太可能自己去开门。\",\n \"推理步骤4: 20:48:03 入户门被打开(StateValue=False),20:48:05 玄关检测到有人,20:48:20 客厅检测到有人移动,但全程没有任何灯被打开——客厅灯在 20:48:25 反而保持关闭状态(OnOff=False)。\",\n \"推理步骤5: 一个正常的访客或老人自己开门,通常会开灯。深夜进入后在黑暗中移动、不开灯的行为模式,与入侵者试图避免被发现的行为高度吻合。\",\n \"推理步骤6: 此后直到日志结束(23:30),没有任何入户门关闭或重新上锁的记录,也没有老人从卧室出来的运动记录,说明老人可能完全不知情。\"\n ],\n \"key_evidence\": [\n \"20:38:12 门锁自动上锁(老人就寝),仅 10 分钟后 20:48:00 门锁被 OperationSource=8(远程/密码)以 UserIndex=1 解锁\",\n \"20:48:03-20:48:20 入户门打开 → 玄关有人 → 客厅有人,全程无任何灯光开启,在黑暗中移动\",\n \"老人 20:38 已在卧室关灯就寝,此后卧室无新的运动事件,说明老人并未起身开门\",\n \"事件发生后入户门未重新关闭或上锁,门处于开放状态\"\n ],\n \"recommended_actions\": [\n \"立即触发紧急警报并联系老人确认安全状况,如无法联系应立即报警\",\n \"远程锁定入户门(如果门已关闭),防止更多人员进入\",\n \"调取门锁 UserIndex=1 对应的用户信息,确认该凭证是否被泄露或盗用\",\n \"检查是否有其他未授权的远程访问记录,考虑重置门锁所有 PIN 码和远程访问凭证\",\n \"建议为老人安装入户门摄像头,并设置就寝后门锁解锁的即时推送告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "老人已就寝后,入户门被远程/密码解锁并打开,有人进入室内但未开灯,高度疑似非法入侵。", "reasoning": ["推理步骤1: 老人在 20:30 关闭客厅灯,20:30-20:38 完成洗漱,20:38 进入卧室并关灯就寝,符合独居老人的睡前流程。", "推理步骤2: 20:38:11-12 入户门传感器确认门已关闭(StateValue=True)且门锁自动上锁(LockState=1),说明老人已安全锁门准备入睡。", "推理步骤3: 仅 10 分钟后(20:48:00),门锁被再次解锁(LockOperationType=1),操作来源为 OperationSource=8(远程/密码/PIN 操作),使用 UserIndex=1。老人此时已在卧室就寝,不太可能自己去开门。", "推理步骤4: 20:48:03 入户门被打开(StateValue=False),20:48:05 玄关检测到有人,20:48:20 客厅检测到有人移动,但全程没有任何灯被打开——客厅灯在 20:48:25 反而保持关闭状态(OnOff=False)。", "推理步骤5: 一个正常的访客或老人自己开门,通常会开灯。深夜进入后在黑暗中移动、不开灯的行为模式,与入侵者试图避免被发现的行为高度吻合。", "推理步骤6: 此后直到日志结束(23:30),没有任何入户门关闭或重新上锁的记录,也没有老人从卧室出来的运动记录,说明老人可能完全不知情。"], "key_evidence": ["20:38:12 门锁自动上锁(老人就寝),仅 10 分钟后 20:48:00 门锁被 OperationSource=8(远程/密码)以 UserIndex=1 解锁", "20:48:03-20:48:20 入户门打开 → 玄关有人 → 客厅有人,全程无任何灯光开启,在黑暗中移动", "老人 20:38 已在卧室关灯就寝,此后卧室无新的运动事件,说明老人并未起身开门", "事件发生后入户门未重新关闭或上锁,门处于开放状态"], "recommended_actions": ["立即触发紧急警报并联系老人确认安全状况,如无法联系应立即报警", "远程锁定入户门(如果门已关闭),防止更多人员进入", "调取门锁 UserIndex=1 对应的用户信息,确认该凭证是否被泄露或盗用", "检查是否有其他未授权的远程访问记录,考虑重置门锁所有 PIN 码和远程访问凭证", "建议为老人安装入户门摄像头,并设置就寝后门锁解锁的即时推送告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.9832866191864, "api_error": null} {"episode_id": "SQ2_TP_D_0290", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0290.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20260919, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T11:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"11:08 入户门锁在短时间内连续4次解锁失败并触发强制入侵报警(AlarmCode=3),疑似有人尝试非法闯入。\",\n \"reasoning\": [\n \"推理步骤1: 在 11:08:00 至 11:08:40 的40秒内,入户门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应远程/无线方式(如错误的PIN码或非法凭证),OperationError=1 表示凭证无效。\",\n \"推理步骤2: 紧接着在 11:08:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中代表\"强制入侵\"或\"多次错误尝试\"报警,这是门锁自身判定的安全告警。\",\n \"推理步骤3: 此时老人在家——08:38 老人从外面回来(手动开锁进门),之后一直在客厅和厨房活动。老人本人不需要反复用错误凭证尝试开锁,因此这些失败尝试极大概率来自外部未授权人员。\",\n \"推理步骤4: 从日志看,门锁在报警后并未被成功打开(LockState 没有变为2/Unlocked),说明入侵尝试未成功,但威胁是真实存在的。\",\n \"推理步骤5: 另外注意到厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:03、06:23、10:52、11:40、16:54、17:23),这属于设备故障问题,虽非安全威胁但需要关注,因为厨房温度监测对独居老人的消防安全至关重要。\"\n ],\n \"key_evidence\": [\n \"11:08:00-11:08:40 连续4次 LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒\",\n \"11:08:50 触发 DoorLockAlarm(AlarmCode=3)——门锁强制入侵/多次错误尝试报警\",\n \"老人08:38已回家在室内,排除本人操作的可能性\",\n \"门锁未被成功打开(无后续 LockState=2 记录),入侵未得逞但意图明确\"\n ],\n \"recommended_actions\": [\n \"立即通知老人的紧急联系人/家属,告知门锁遭到非法尝试开锁\",\n \"检查门锁是否有物理损坏痕迹,查看门口是否安装摄像头并回放11:08前后的录像\",\n \"临时提高门锁安全等级:启用双重验证、更换PIN码、缩短自动锁定时间\",\n \"如果情况紧急或老人感到不安,建议报警处理\",\n \"尽快维修或更换厨房温度传感器(kitchen_temp_sensor),该传感器在灶具使用期间持续报告 None 值,无法有效监测厨房温度异常,对独居老人存在消防隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"11:08 入户门锁在短时间内连续4次解锁失败并触发强制入侵报警(AlarmCode=3),疑似有人尝试非法闯入。\",\n \"reasoning\": [\n \"推理步骤1: 在 11:08:00 至 11:08:40 的40秒内,入户门锁连续报告了4次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应远程/无线方式(如错误的PIN码或非法凭证),OperationError=1 表示凭证无效。\",\n \"推理步骤2: 紧接着在 11:08:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中代表\"强制入侵\"或\"多次错误尝试\"报警,这是门锁自身判定的安全告警。"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 24.14013671875, "api_error": null} {"episode_id": "SQ2_TP_D_0293", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq2\\SQ2_TP_D_0293.json", "metadata": {"sq_type": "SQ2", "sq_name": "单事件安全判断", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20260922, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-04T03:58:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且烟雾报警器电池低电量,同时凌晨 03:58 灶具异常开启伴随温度骤升至 28°C。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具每次开启后约30秒内就报告 MeasuredValue = None(06:08、11:08、17:04),且在灶具关闭后仍然报告 None(06:23、11:33、17:36),说明传感器在受热环境下反复失效,这是一个持续性的设备故障。\",\n \"推理步骤2: 凌晨 03:58 厨房灶具被开启(OnOff = True),但此时全屋无任何运动传感器触发,老人直到 05:31 才在卧室被检测到活动。这意味着灶具在无人操作的情况下运行了至少 1.5 小时,可能是误触、设备故障或老人忘记关闭。\",\n \"推理步骤3: 凌晨 04:08 厨房温度从约 23°C 骤升至 28.03°C(上升约 5°C),与灶具异常开启时间吻合。同一时刻烟雾报警器报告 SmokeState = 0(正常),但该报警器在前一天 03:58 已报告 BatteryAlert = 1(低电量警告),其可靠性存疑。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的关键防线。传感器在灶具使用时反复失效,意味着如果发生真正的厨房火灾或过热,系统将无法及时检测和报警,形成严重的安全盲区。\",\n \"推理步骤5: 烟雾报警器低电量 + 温度传感器故障 = 厨房两道安全防线同时削弱,对独居老人构成显著风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间三次报告 None(06:08、11:08、17:04),灶具关闭后也报告 None(06:23、11:33、17:36),共计 6 次异常读数\",\n \"凌晨 03:58 灶具无人操作时自动开启,全屋运动传感器均无触发,04:08 厨房温度骤升至 28.03°C\",\n \"厨房烟雾报警器于 2026-06-03T03:58 报告 BatteryAlert = 1(低电量)\",\n \"04:08 烟雾报警器报告 SmokeState = 0,但在电池低电量状态下其检测可靠性不确定\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾检测能力恢复正常\",\n \"检修或更换厨房温度传感器,排查其在高温环境下反复报告 None 的故障原因\",\n \"排查凌晨 03:58 灶具无人操作时开启的原因——检查灶具是否存在硬件故障、误触风险或异常的自动化规则\",\n \"为厨房灶具增加安全联动规则:当厨房运动传感器长时间无人时自动关闭灶具,防止干烧或火灾\",\n \"考虑为独居老人增加厨房安全监护措施,如灶具使用超时提醒、远程通知家属等\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且烟雾报警器电池低电量,同时凌晨 03:58 灶具异常开启伴随温度骤升至 28°C。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具每次开启后约30秒内就报告 MeasuredValue = None(06:08、11:08、17:04),且在灶具关闭后仍然报告 None(06:23、11:33、17:36),说明传感器在受热环境下反复失效,这是一个持续性的设备故障。", "推理步骤2: 凌晨 03:58 厨房灶具被开启(OnOff = True),但此时全屋无任何运动传感器触发,老人直到 05:31 才在卧室被检测到活动。这意味着灶具在无人操作的情况下运行了至少 1.5 小时,可能是误触、设备故障或老人忘记关闭。", "推理步骤3: 凌晨 04:08 厨房温度从约 23°C 骤升至 28.03°C(上升约 5°C),与灶具异常开启时间吻合。同一时刻烟雾报警器报告 SmokeState = 0(正常),但该报警器在前一天 03:58 已报告 BatteryAlert = 1(低电量警告),其可靠性存疑。", "推理步骤4: 对于独居老人家庭,厨房温度传感器是火灾预警的关键防线。传感器在灶具使用时反复失效,意味着如果发生真正的厨房火灾或过热,系统将无法及时检测和报警,形成严重的安全盲区。", "推理步骤5: 烟雾报警器低电量 + 温度传感器故障 = 厨房两道安全防线同时削弱,对独居老人构成显著风险。"], "key_evidence": ["厨房温度传感器在灶具使用期间三次报告 None(06:08、11:08、17:04),灶具关闭后也报告 None(06:23、11:33、17:36),共计 6 次异常读数", "凌晨 03:58 灶具无人操作时自动开启,全屋运动传感器均无触发,04:08 厨房温度骤升至 28.03°C", "厨房烟雾报警器于 2026-06-03T03:58 报告 BatteryAlert = 1(低电量)", "04:08 烟雾报警器报告 SmokeState = 0,但在电池低电量状态下其检测可靠性不确定"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾检测能力恢复正常", "检修或更换厨房温度传感器,排查其在高温环境下反复报告 None 的故障原因", "排查凌晨 03:58 灶具无人操作时开启的原因——检查灶具是否存在硬件故障、误触风险或异常的自动化规则", "为厨房灶具增加安全联动规则:当厨房运动传感器长时间无人时自动关闭灶具,防止干烧或火灾", "考虑为独居老人增加厨房安全监护措施,如灶具使用超时提醒、远程通知家属等"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.318273067474365, "api_error": null} {"episode_id": "SQ3_FP_A_0564", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0564.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261193, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bedroom", "injection_time": "2026-06-23T10:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或局部过热隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~2470(24.70°C)跳升至 2854(28.54°C),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.61°C / 23.65°C),单一房间温度骤升约 4°C 极不合理。\",\n \"推理步骤2: 18:30 厨房温度进一步升至 2867(28.67°C),此时灶具尚未开启(灶具 18:51 才打开),排除烹饪导致的正常升温,说明该读数本身就是异常的。\",\n \"推理步骤3: 18:52(灶具刚开启后)和 19:56(灶具关闭后)厨房温度传感器两次报告 MeasuredValue = None,表示传感器无法返回有效测量值,属于设备通信或硬件故障的典型表现。\",\n \"推理步骤4: 19:00 厨房温度突然恢复到 2443(24.43°C),与 18:30 的 2867 相比在 30 分钟内骤降超过 4°C,且中间出现 None 值,进一步印证传感器读数不可靠而非真实温度变化。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发任何事件,说明厨房并未发生真实火灾或烟雾,高温读数更可能是传感器自身问题。\",\n \"推理步骤6: 其余设备行为均符合正常生活模式——住户 18:16 回家开门开灯开空调、18:51 做饭、19:55 关灶开窗通风、20:01 启动洗碗机、21:51 回卧室就寝并锁门,无入侵或其他安全威胁迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.70°C 骤升至 28.54°C,18:30 继续升至 28.67°C,而灶具直到 18:51 才开启,且客厅/卧室温度同期无异常波动\",\n \"18:52 和 19:56 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集失败\",\n \"19:00 温度突然从 None/28.67°C 恢复至 24.43°C,30 分钟内不合理地骤降超过 4°C\",\n \"全天烟雾报警器无任何触发事件,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处)\",\n \"查看传感器固件版本,必要时重置或更换传感器以消除间歇性 None 值故障\",\n \"在传感器修复前,适当提高对厨房烟雾报警器的关注度,因为温度传感器作为辅助火灾预警手段当前不可靠\",\n \"考虑为厨房温度传感器设置异常值过滤规则:当读数在短时间内偏离相邻房间超过 3°C 且无关联设备动作时自动标记告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或局部过热隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~2470(24.70°C)跳升至 2854(28.54°C),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.61°C / 23.65°C),单一房间温度骤升约 4°C 极不合理。", "推理步骤2: 18:30 厨房温度进一步升至 2867(28.67°C),此时灶具尚未开启(灶具 18:51 才打开),排除烹饪导致的正常升温,说明该读数本身就是异常的。", "推理步骤3: 18:52(灶具刚开启后)和 19:56(灶具关闭后)厨房温度传感器两次报告 MeasuredValue = None,表示传感器无法返回有效测量值,属于设备通信或硬件故障的典型表现。", "推理步骤4: 19:00 厨房温度突然恢复到 2443(24.43°C),与 18:30 的 2867 相比在 30 分钟内骤降超过 4°C,且中间出现 None 值,进一步印证传感器读数不可靠而非真实温度变化。", "推理步骤5: 烟雾报警器在整个时段内未触发任何事件,说明厨房并未发生真实火灾或烟雾,高温读数更可能是传感器自身问题。", "推理步骤6: 其余设备行为均符合正常生活模式——住户 18:16 回家开门开灯开空调、18:51 做饭、19:55 关灶开窗通风、20:01 启动洗碗机、21:51 回卧室就寝并锁门,无入侵或其他安全威胁迹象。"], "key_evidence": ["18:00 厨房温度从 ~24.70°C 骤升至 28.54°C,18:30 继续升至 28.67°C,而灶具直到 18:51 才开启,且客厅/卧室温度同期无异常波动", "18:52 和 19:56 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集失败", "19:00 温度突然从 None/28.67°C 恢复至 24.43°C,30 分钟内不合理地骤降超过 4°C", "全天烟雾报警器无任何触发事件,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处)", "查看传感器固件版本,必要时重置或更换传感器以消除间歇性 None 值故障", "在传感器修复前,适当提高对厨房烟雾报警器的关注度,因为温度传感器作为辅助火灾预警手段当前不可靠", "考虑为厨房温度传感器设置异常值过滤规则:当读数在短时间内偏离相邻房间超过 3°C 且无关联设备动作时自动标记告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.0097439289093, "api_error": null} {"episode_id": "SQ3_FP_A_0573", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0573.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261202, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bedroom", "injection_time": "2026-06-02T15:00:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.51°C→突增约4°C),随后在19:00和19:35两次报告None值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:20起床,07:11出门上班(门锁手动开锁→自动回锁),18:02回家(开锁→开灯→开空调),22:06就寝准备,23:00入睡。这是典型的单人上班族作息,无入侵迹象。\",\n \"推理步骤2: 三个区域温度在00:00-17:30期间走势一致:夜间约22-23°C,白天随日照升至25-26°C,符合夏季自然温度变化曲线,无异常热源。\",\n \"推理步骤3: 关键异常——18:00厨房温度传感器突然报告2851(28.51°C),而同一时刻客厅为24.57°C、卧室为23.58°C。厨房相对其他房间高出约4°C,且此时灶具尚未开启(灶具在18:59才打开),住户刚进门还在客厅,厨房不应有突发热源。\",\n \"推理步骤4: 18:30厨房温度仍为28.56°C,持续偏高。但19:00灶具开启后,厨房温度反而回落到24.44°C,这与灶具加热应升温的物理逻辑矛盾,进一步说明18:00-18:30的高温读数是传感器异常而非真实温度。\",\n \"推理步骤5: 19:00和19:35厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了数据丢失或通信故障。结合之前的异常高温读数,传感器很可能处于间歇性故障状态。\",\n \"推理步骤6: 排除火灾风险——厨房烟雾报警器全天无任何触发记录,灶具使用时间合理(18:59开→19:34关,约35分钟做饭),做完饭后开窗通风(19:34:30厨房窗户打开),这些都是正常行为。\",\n \"推理步骤7: 其他设备行为均正常——卫生间灯/运动传感器的短暂交替符合早晨洗漱场景;入户门开关锁操作配对完整;洗碗机在做完饭后启动合理;卧室窗帘早开晚关、灯光渐暗入睡均为正常习惯。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度突增至2851(28.51°C),较前一读数2472(24.72°C)跳升近4°C,同时客厅和卧室温度无对应变化,且此时厨房无任何加热设备运行\",\n \"18:30厨房温度仍为2856(28.56°C),持续异常偏高\",\n \"19:00厨房温度传感器报告MeasuredValue=None(数据丢失),灶具刚开启时温度反而回落至正常值2444\",\n \"19:35厨房温度传感器再次报告MeasuredValue=None(第二次数据丢失)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态(电池电量、安装位置、是否受潮或积灰),必要时更换传感器\",\n \"检查该传感器与Matter网关之间的通信质量,查看是否有信号干扰或连接不稳定的问题\",\n \"在传感器修复前,可适当提高厨房烟雾报警器的监控优先级,避免因温度传感器失效而遗漏真实的高温/火灾预警\",\n \"建议在系统中为温度传感器配置异常值过滤规则(如单次跳变超过3°C自动标记为可疑读数)和None值告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.51°C→突增约4°C),随后在19:00和19:35两次报告None值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:20起床,07:11出门上班(门锁手动开锁→自动回锁),18:02回家(开锁→开灯→开空调),22:06就寝准备,23:00入睡。这是典型的单人上班族作息,无入侵迹象。", "推理步骤2: 三个区域温度在00:00-17:30期间走势一致:夜间约22-23°C,白天随日照升至25-26°C,符合夏季自然温度变化曲线,无异常热源。", "推理步骤3: 关键异常——18:00厨房温度传感器突然报告2851(28.51°C),而同一时刻客厅为24.57°C、卧室为23.58°C。厨房相对其他房间高出约4°C,且此时灶具尚未开启(灶具在18:59才打开),住户刚进门还在客厅,厨房不应有突发热源。", "推理步骤4: 18:30厨房温度仍为28.56°C,持续偏高。但19:00灶具开启后,厨房温度反而回落到24.44°C,这与灶具加热应升温的物理逻辑矛盾,进一步说明18:00-18:30的高温读数是传感器异常而非真实温度。", "推理步骤5: 19:00和19:35厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了数据丢失或通信故障。结合之前的异常高温读数,传感器很可能处于间歇性故障状态。", "推理步骤6: 排除火灾风险——厨房烟雾报警器全天无任何触发记录,灶具使用时间合理(18:59开→19:34关,约35分钟做饭),做完饭后开窗通风(19:34:30厨房窗户打开),这些都是正常行为。", "推理步骤7: 其他设备行为均正常——卫生间灯/运动传感器的短暂交替符合早晨洗漱场景;入户门开关锁操作配对完整;洗碗机在做完饭后启动合理;卧室窗帘早开晚关、灯光渐暗入睡均为正常习惯。"], "key_evidence": ["18:00厨房温度突增至2851(28.51°C),较前一读数2472(24.72°C)跳升近4°C,同时客厅和卧室温度无对应变化,且此时厨房无任何加热设备运行", "18:30厨房温度仍为2856(28.56°C),持续异常偏高", "19:00厨房温度传感器报告MeasuredValue=None(数据丢失),灶具刚开启时温度反而回落至正常值2444", "19:35厨房温度传感器再次报告MeasuredValue=None(第二次数据丢失)"], "recommended_actions": ["检查厨房温度传感器的硬件状态(电池电量、安装位置、是否受潮或积灰),必要时更换传感器", "检查该传感器与Matter网关之间的通信质量,查看是否有信号干扰或连接不稳定的问题", "在传感器修复前,可适当提高厨房烟雾报警器的监控优先级,避免因温度传感器失效而遗漏真实的高温/火灾预警", "建议在系统中为温度传感器配置异常值过滤规则(如单次跳变超过3°C自动标记为可疑读数)和None值告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.166176557540894, "api_error": null} {"episode_id": "SQ3_FP_A_0577", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0577.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261206, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "living_room", "injection_time": "2026-06-26T14:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障;同时存在入户门未关闭和厨房窗户未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约2480(24.8°C)跳升至2865(28.65°C),升幅约4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅24.54°C、卧室23.59°C)。如果是真实环境温升,相邻房间不可能完全无感。\",\n \"推理步骤2: 18:30厨房温度仍为2856(28.56°C),但到18:57灶具开启前的18:58,传感器报告MeasuredValue=None(数据丢失)。19:00恢复为2440(24.40°C),与客厅温度基本一致,说明之前的28°C+读数并非真实环境温度。\",\n \"推理步骤3: 19:41灶具关闭后,19:42传感器再次报告None。两次None出现在灶具操作前后,可能是传感器受热干扰或通信故障。传感器恢复后读数回归正常,进一步佐证之前的高温是传感器异常而非真实火灾风险。\",\n \"推理步骤4: 14:41入户门通过UserIndex=5远程/密码开锁,14:41:03门打开(StateValue=False),但直到18:12住户回家前,日志中没有门关闭(StateValue=True)的记录。门在无人在家期间敞开约3.5小时,存在安全隐患。14:51门锁执行了上锁操作,但门的接触传感器未报告关闭,说明门锁上了但门可能未完全关好,或传感器遗漏了事件。\",\n \"推理步骤5: 19:41:30厨房窗户打开(StateValue=False),之后直到日志结束(23:30)未见关闭记录。住户22:36已关灯就寝,厨房窗户整夜未关,存在安全风险。\",\n \"推理步骤6: 其余行为模式正常——住户06:34起床、07:25出门、门自动上锁、18:12回家、开灯开空调、做饭、21:50转入卧室就寝,符合典型单人一室一厅的生活节奏。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度突升至2865(28.65°C),较前一读数2488(24.88°C)异常跳升近4°C,同时段客厅/卧室温度无对应变化\",\n \"18:58和19:42厨房温度传感器两次报告MeasuredValue=None,数据丢失\",\n \"14:41入户门开锁并打开(StateValue=False),但无对应的关门记录(StateValue=True),直到18:12住户回家重新开门\",\n \"19:41:30厨房窗户打开后至日志结束未关闭,住户已于22:36就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰;清洁传感器或考虑更换/重新定位\",\n \"排查厨房温度传感器的通信稳定性,两次None可能是传感器固件问题或无线信号干扰\",\n \"核实14:41 UserIndex=5的开锁操作是否为授权行为(如家政、快递代收等),确认门是否确实未关好\",\n \"设置自动化规则:就寝模式激活时检查所有窗户传感器状态,若有未关闭的窗户发送提醒\",\n \"设置自动化规则:入户门打开超过一定时间(如5分钟)且无人在家时,推送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障;同时存在入户门未关闭和厨房窗户未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约2480(24.8°C)跳升至2865(28.65°C),升幅约4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅24.54°C、卧室23.59°C)。如果是真实环境温升,相邻房间不可能完全无感。", "推理步骤2: 18:30厨房温度仍为2856(28.56°C),但到18:57灶具开启前的18:58,传感器报告MeasuredValue=None(数据丢失)。19:00恢复为2440(24.40°C),与客厅温度基本一致,说明之前的28°C+读数并非真实环境温度。", "推理步骤3: 19:41灶具关闭后,19:42传感器再次报告None。两次None出现在灶具操作前后,可能是传感器受热干扰或通信故障。传感器恢复后读数回归正常,进一步佐证之前的高温是传感器异常而非真实火灾风险。", "推理步骤4: 14:41入户门通过UserIndex=5远程/密码开锁,14:41:03门打开(StateValue=False),但直到18:12住户回家前,日志中没有门关闭(StateValue=True)的记录。门在无人在家期间敞开约3.5小时,存在安全隐患。14:51门锁执行了上锁操作,但门的接触传感器未报告关闭,说明门锁上了但门可能未完全关好,或传感器遗漏了事件。", "推理步骤5: 19:41:30厨房窗户打开(StateValue=False),之后直到日志结束(23:30)未见关闭记录。住户22:36已关灯就寝,厨房窗户整夜未关,存在安全风险。", "推理步骤6: 其余行为模式正常——住户06:34起床、07:25出门、门自动上锁、18:12回家、开灯开空调、做饭、21:50转入卧室就寝,符合典型单人一室一厅的生活节奏。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。"], "key_evidence": ["18:00厨房温度突升至2865(28.65°C),较前一读数2488(24.88°C)异常跳升近4°C,同时段客厅/卧室温度无对应变化", "18:58和19:42厨房温度传感器两次报告MeasuredValue=None,数据丢失", "14:41入户门开锁并打开(StateValue=False),但无对应的关门记录(StateValue=True),直到18:12住户回家重新开门", "19:41:30厨房窗户打开后至日志结束未关闭,住户已于22:36就寝"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰;清洁传感器或考虑更换/重新定位", "排查厨房温度传感器的通信稳定性,两次None可能是传感器固件问题或无线信号干扰", "核实14:41 UserIndex=5的开锁操作是否为授权行为(如家政、快递代收等),确认门是否确实未关好", "设置自动化规则:就寝模式激活时检查所有窗户传感器状态,若有未关闭的窗户发送提醒", "设置自动化规则:入户门打开超过一定时间(如5分钟)且无人在家时,推送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.001362562179565, "api_error": null} {"episode_id": "SQ3_FP_A_0579", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0579.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261208, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bedroom", "injection_time": "2026-06-15T07:34:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:31 起床、07:29 出门上班、18:01 回家、22:43 入睡,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式,无入侵迹象。\",\n \"推理步骤2: 温度整体趋势合理——夜间 22-23°C,白天随日照升至 25-26°C,傍晚回落,三个房间走势一致,属于夏季正常波动。\",\n \"推理步骤3: 关键异常出现在厨房温度传感器。19:00 时厨房温度突然从 24.60°C(18:30)跳升至 28.45°C,而此时灶具尚未开启(19:12 才开灶)。灶具未工作时出现近 4°C 的瞬间跳升不合常理。\",\n \"推理步骤4: 19:13 和 19:40 厨房温度传感器连续两次报告 MeasuredValue = None,说明传感器在这两个时刻无法返回有效读数。Matter 协议中 MeasuredValue 为 null 通常表示测量失败或传感器离线。\",\n \"推理步骤5: 19:30 传感器恢复后读数为 28.30°C,仍然偏高;但 20:00 回落至 24.08°C,与客厅/卧室温度重新对齐。这种先异常跳高、再丢失数据、再恢复正常的模式,更像传感器自身故障(接触不良、供电不稳或探头受潮)而非真实环境温度变化。\",\n \"推理步骤6: 排除火灾风险——烟雾报警器全天无触发,灶具在 19:12-19:39 正常使用约 27 分钟后关闭,住户随后开窗通风(19:39 厨房窗户打开),行为合理。\",\n \"推理步骤7: 其余设备均正常——入户门 18:01 开门后未关闭(BooleanState 保持 False),直到 21:50 关门并自动上锁,期间住户在家,无安全问题。洗碗机 20:03 启动,漏水传感器无报警。卧室窗帘早晚开合正常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.60°C 异常跳升至 28.45°C,此时灶具尚未开启(19:12 才开),且客厅温度同期在下降(24.34°C),排除环境因素\",\n \"19:13 和 19:40 厨房温度传感器两次报告 MeasuredValue = None,表明传感器测量失败\",\n \"20:00 传感器恢复正常读数 24.08°C,与其他房间温度重新一致,说明之前的高温读数并非真实环境温度\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和供电状态,确认是否存在接触不良、电池电量低或探头受潮等问题\",\n \"观察未来几天厨房温度传感器是否再次出现 None 值或异常跳变,如反复出现建议更换传感器\",\n \"可考虑为厨房温度传感器设置合理性校验规则:当读数与相邻房间偏差超过阈值或出现 None 时自动告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:31 起床、07:29 出门上班、18:01 回家、22:43 入睡,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式,无入侵迹象。", "推理步骤2: 温度整体趋势合理——夜间 22-23°C,白天随日照升至 25-26°C,傍晚回落,三个房间走势一致,属于夏季正常波动。", "推理步骤3: 关键异常出现在厨房温度传感器。19:00 时厨房温度突然从 24.60°C(18:30)跳升至 28.45°C,而此时灶具尚未开启(19:12 才开灶)。灶具未工作时出现近 4°C 的瞬间跳升不合常理。", "推理步骤4: 19:13 和 19:40 厨房温度传感器连续两次报告 MeasuredValue = None,说明传感器在这两个时刻无法返回有效读数。Matter 协议中 MeasuredValue 为 null 通常表示测量失败或传感器离线。", "推理步骤5: 19:30 传感器恢复后读数为 28.30°C,仍然偏高;但 20:00 回落至 24.08°C,与客厅/卧室温度重新对齐。这种先异常跳高、再丢失数据、再恢复正常的模式,更像传感器自身故障(接触不良、供电不稳或探头受潮)而非真实环境温度变化。", "推理步骤6: 排除火灾风险——烟雾报警器全天无触发,灶具在 19:12-19:39 正常使用约 27 分钟后关闭,住户随后开窗通风(19:39 厨房窗户打开),行为合理。", "推理步骤7: 其余设备均正常——入户门 18:01 开门后未关闭(BooleanState 保持 False),直到 21:50 关门并自动上锁,期间住户在家,无安全问题。洗碗机 20:03 启动,漏水传感器无报警。卧室窗帘早晚开合正常。"], "key_evidence": ["19:00 厨房温度从 24.60°C 异常跳升至 28.45°C,此时灶具尚未开启(19:12 才开),且客厅温度同期在下降(24.34°C),排除环境因素", "19:13 和 19:40 厨房温度传感器两次报告 MeasuredValue = None,表明传感器测量失败", "20:00 传感器恢复正常读数 24.08°C,与其他房间温度重新一致,说明之前的高温读数并非真实环境温度"], "recommended_actions": ["检查厨房温度传感器的安装位置和供电状态,确认是否存在接触不良、电池电量低或探头受潮等问题", "观察未来几天厨房温度传感器是否再次出现 None 值或异常跳变,如反复出现建议更换传感器", "可考虑为厨房温度传感器设置合理性校验规则:当读数与相邻房间偏差超过阈值或出现 None 时自动告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.84610891342163, "api_error": null} {"episode_id": "SQ3_FP_A_0599", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0599.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261228, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-01T18:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),可能存在传感器故障或环境异常\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:28起床,07:34出门上班,18:21回家,22:47入睡,符合典型上班族作息\",\n \"推理步骤2: 18:33入户门锁出现一次LockOperationError(错误码1,来源3即远程/键盘),随后同一UserIndex=1成功解锁。单次失败后立即成功,可能是输入密码错误一次,属于正常范围,不构成入侵威胁\",\n \"推理步骤3: 19:00厨房温度传感器突然从约2456跳升至2826(约28.26°C),相比客厅同时刻的2431高出近4°C,且此时灶具尚未开启(19:03才开)。这一跳变缺乏合理的热源解释\",\n \"推理步骤4: 19:04和19:33厨房温度传感器报告MeasuredValue=None,表示传感器读数丢失或通信异常。正常传感器不应出现null值\",\n \"推理步骤5: 19:30厨房温度仍高达2838,但灶具已在19:03开启,做饭期间温度偏高可以部分解释,但19:00时灶具未开就已异常偏高,且出现None值,综合判断传感器工作状态不稳定\",\n \"推理步骤6: 其余设备行为均正常——空调制冷模式开启后室温逐步下降、洗碗机正常启动、门锁自动上锁、窗帘按作息开合,无入侵或漏水迹象\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从2456骤升至2826,此时灶具尚未开启,无合理热源\",\n \"19:04和19:33厨房温度传感器报告MeasuredValue=None,数据丢失\",\n \"18:33门锁出现一次LockOperationError,但随即由UserIndex=1成功解锁,为单次密码输入错误\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换电池,排除传感器故障\",\n \"确认厨房是否存在局部热源(如阳光直射、热水管道)导致传感器在灶具开启前就读数偏高\",\n \"关注门锁错误日志,若后续频繁出现LockOperationError需排查是否有未授权尝试\",\n \"考虑为厨房温度传感器设置异常值告警阈值(如超过28°C且灶具未开时自动通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),可能存在传感器故障或环境异常", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:28起床,07:34出门上班,18:21回家,22:47入睡,符合典型上班族作息", "推理步骤2: 18:33入户门锁出现一次LockOperationError(错误码1,来源3即远程/键盘),随后同一UserIndex=1成功解锁。单次失败后立即成功,可能是输入密码错误一次,属于正常范围,不构成入侵威胁", "推理步骤3: 19:00厨房温度传感器突然从约2456跳升至2826(约28.26°C),相比客厅同时刻的2431高出近4°C,且此时灶具尚未开启(19:03才开)。这一跳变缺乏合理的热源解释", "推理步骤4: 19:04和19:33厨房温度传感器报告MeasuredValue=None,表示传感器读数丢失或通信异常。正常传感器不应出现null值", "推理步骤5: 19:30厨房温度仍高达2838,但灶具已在19:03开启,做饭期间温度偏高可以部分解释,但19:00时灶具未开就已异常偏高,且出现None值,综合判断传感器工作状态不稳定", "推理步骤6: 其余设备行为均正常——空调制冷模式开启后室温逐步下降、洗碗机正常启动、门锁自动上锁、窗帘按作息开合,无入侵或漏水迹象"], "key_evidence": ["19:00厨房温度从2456骤升至2826,此时灶具尚未开启,无合理热源", "19:04和19:33厨房温度传感器报告MeasuredValue=None,数据丢失", "18:33门锁出现一次LockOperationError,但随即由UserIndex=1成功解锁,为单次密码输入错误"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换电池,排除传感器故障", "确认厨房是否存在局部热源(如阳光直射、热水管道)导致传感器在灶具开启前就读数偏高", "关注门锁错误日志,若后续频繁出现LockOperationError需排查是否有未授权尝试", "考虑为厨房温度传感器设置异常值告警阈值(如超过28°C且灶具未开时自动通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.79516911506653, "api_error": null} {"episode_id": "SQ3_FP_A_0600", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0600.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261229, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-29T17:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或局部过热隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:36起床,07:15出门上班(门锁手动开锁→关门→自动上锁),18:21回家,22:57入睡,作息规律,无入侵迹象。\",\n \"推理步骤2: 18:00厨房温度传感器突然从约24.8°C跳升至28.58°C,18:30仍为28.62°C,而同一时段客厅和卧室温度仅在23~24°C范围内正常下降。此时灶具尚未开启(18:56才开),住户刚到家也未进厨房,这一约4°C的突变缺乏合理热源解释。\",\n \"推理步骤3: 18:57(灶具刚开启约30秒)和19:38(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None,表明传感器读数丢失。正常传感器不应在短时间内出现空值,这指向传感器通信故障或硬件异常。\",\n \"推理步骤4: 19:00温度恢复为24.43°C,与客厅温度基本一致,说明18:00~18:30的28.5°C+读数并非真实环境温度,更可能是传感器自身故障产生的虚假高温读数。\",\n \"推理步骤5: 卫生间漏水传感器17:11短暂触发后17:13恢复,同时有人在卫生间(occupancy=1、灯亮),判断为正常用水行为(如洗手、冲水溅水),非持续漏水。\",\n \"推理步骤6: 入户门在07:15出门后至18:21回家期间保持锁定状态(LockState=1),21:59关门后自动上锁,全天无异常开锁事件,安防正常。\",\n \"推理步骤7: 厨房窗户在19:37:30打开(灶具刚关闭后通风),属于正常烹饪后行为,但日志中未见关闭记录,需注意是否遗忘关窗。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从约24.8°C骤升至28.58°C,18:30仍为28.62°C,而此时灶具未开、无人在厨房,客厅/卧室温度正常下降\",\n \"18:57和19:38厨房温度传感器两次报告MeasuredValue=None(数据丢失)\",\n \"19:00温度恢复正常(24.43°C),证明之前的高温读数为异常值而非真实环境温度\",\n \"厨房窗户19:37打开后日志中无关闭记录(可能整夜未关)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器探头,确认安装位置是否受到阳光直射或其他热源干扰\",\n \"如传感器持续出现None读数或异常跳变,建议更换传感器以确保厨房烟雾/火灾预警链路可靠\",\n \"确认厨房窗户是否已关闭,夜间开窗存在安全隐患(一室一厅低楼层尤其需注意)\",\n \"建议为厨房温度传感器设置异常值告警规则:当温度在短时间内变化超过3°C或出现None值时立即通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或局部过热隐患。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:36起床,07:15出门上班(门锁手动开锁→关门→自动上锁),18:21回家,22:57入睡,作息规律,无入侵迹象。", "推理步骤2: 18:00厨房温度传感器突然从约24.8°C跳升至28.58°C,18:30仍为28.62°C,而同一时段客厅和卧室温度仅在23~24°C范围内正常下降。此时灶具尚未开启(18:56才开),住户刚到家也未进厨房,这一约4°C的突变缺乏合理热源解释。", "推理步骤3: 18:57(灶具刚开启约30秒)和19:38(灶具关闭后1分钟)厨房温度传感器两次报告MeasuredValue=None,表明传感器读数丢失。正常传感器不应在短时间内出现空值,这指向传感器通信故障或硬件异常。", "推理步骤4: 19:00温度恢复为24.43°C,与客厅温度基本一致,说明18:00~18:30的28.5°C+读数并非真实环境温度,更可能是传感器自身故障产生的虚假高温读数。", "推理步骤5: 卫生间漏水传感器17:11短暂触发后17:13恢复,同时有人在卫生间(occupancy=1、灯亮),判断为正常用水行为(如洗手、冲水溅水),非持续漏水。", "推理步骤6: 入户门在07:15出门后至18:21回家期间保持锁定状态(LockState=1),21:59关门后自动上锁,全天无异常开锁事件,安防正常。", "推理步骤7: 厨房窗户在19:37:30打开(灶具刚关闭后通风),属于正常烹饪后行为,但日志中未见关闭记录,需注意是否遗忘关窗。"], "key_evidence": ["18:00厨房温度从约24.8°C骤升至28.58°C,18:30仍为28.62°C,而此时灶具未开、无人在厨房,客厅/卧室温度正常下降", "18:57和19:38厨房温度传感器两次报告MeasuredValue=None(数据丢失)", "19:00温度恢复正常(24.43°C),证明之前的高温读数为异常值而非真实环境温度", "厨房窗户19:37打开后日志中无关闭记录(可能整夜未关)"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器探头,确认安装位置是否受到阳光直射或其他热源干扰", "如传感器持续出现None读数或异常跳变,建议更换传感器以确保厨房烟雾/火灾预警链路可靠", "确认厨房窗户是否已关闭,夜间开窗存在安全隐患(一室一厅低楼层尤其需注意)", "建议为厨房温度传感器设置异常值告警规则:当温度在短时间内变化超过3°C或出现None值时立即通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.15874195098877, "api_error": null} {"episode_id": "SQ3_FP_A_0603", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0603.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20261232, "scenario_id": "INS-01", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "kitchen", "injection_time": "2026-06-14T21:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 11:00 出现异常高温读数(29.52°C),疑似传感器故障或间歇性通信失败。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内共 5 次报告 MeasuredValue = None(09:11、09:43、11:48、12:35、18:31),每次都紧跟在灶具开启或厨房窗户打开之后。正常传感器不应因附近设备操作而丢失读数。\",\n \"推理步骤2: 11:00 厨房温度传感器突然从 ~25.2°C 跳升至 29.52°C,而同一时刻客厅仅 25.58°C、卧室 24.56°C。此时灶具并未开启(上一次灶具在 09:42 已关闭,下一次在 11:47 才开启),无合理热源解释这一 4°C 的异常跳变。11:30 仍维持在 29.42°C,之后 12:00 恢复到 25.86°C,说明这不是持续的环境温升,更像传感器读数漂移或短暂故障。\",\n \"推理步骤3: 其余设备行为均符合正常生活模式——住户约 08:31 起床、三餐做饭时间合理(~09:10 早餐、~11:47 午餐、~18:10 晚餐)、23:08 就寝并自动锁门,运动传感器与灯光联动正常,门锁自动上锁,空调制冷模式(SystemMode=3)在夏季合理。无入侵、火灾或漏水迹象。\",\n \"推理步骤4: 厨房窗户传感器在做饭后打开通风(09:42、12:34、18:30 三次 StateValue=False)是正常行为,但日志中未见窗户关闭事件(StateValue=True),可能是日志未记录关闭动作,也可能窗户一直处于开启状态,存在轻微安全隐患。\",\n \"推理步骤5: 21:25 卧室出现一组快速事件序列——运动检测→开灯→窗户传感器触发→关灯→运动消失,整个过程仅 20 秒。这可能是住户短暂进入卧室开窗通风后离开,行为本身不异常,但速度较快,值得留意。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:11、09:43、11:48、12:35、18:31 共 5 次报告 MeasuredValue = None\",\n \"11:00-11:30 厨房温度异常飙升至 ~29.5°C(较客厅高约 4°C),而灶具处于关闭状态,无合理热源\",\n \"厨房窗户三次记录打开事件但日志中无对应关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和供电情况,清洁探头并确认安装位置是否受灶具余热或蒸汽直接影响\",\n \"检查厨房温度传感器与 Matter 网络的通信质量,排查 None 值是否由无线信号干扰或固件 Bug 导致\",\n \"确认厨房窗户当前是否已关闭;如长时间未关闭,建议设置窗户开启超时提醒以防安全隐患\",\n \"考虑为厨房温度传感器设置合理的温度阈值告警(如偏离同区域传感器 ±3°C 时触发),以便及时发现异常读数\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 11:00 出现异常高温读数(29.52°C),疑似传感器故障或间歇性通信失败。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内共 5 次报告 MeasuredValue = None(09:11、09:43、11:48、12:35、18:31),每次都紧跟在灶具开启或厨房窗户打开之后。正常传感器不应因附近设备操作而丢失读数。", "推理步骤2: 11:00 厨房温度传感器突然从 ~25.2°C 跳升至 29.52°C,而同一时刻客厅仅 25.58°C、卧室 24.56°C。此时灶具并未开启(上一次灶具在 09:42 已关闭,下一次在 11:47 才开启),无合理热源解释这一 4°C 的异常跳变。11:30 仍维持在 29.42°C,之后 12:00 恢复到 25.86°C,说明这不是持续的环境温升,更像传感器读数漂移或短暂故障。", "推理步骤3: 其余设备行为均符合正常生活模式——住户约 08:31 起床、三餐做饭时间合理(~09:10 早餐、~11:47 午餐、~18:10 晚餐)、23:08 就寝并自动锁门,运动传感器与灯光联动正常,门锁自动上锁,空调制冷模式(SystemMode=3)在夏季合理。无入侵、火灾或漏水迹象。", "推理步骤4: 厨房窗户传感器在做饭后打开通风(09:42、12:34、18:30 三次 StateValue=False)是正常行为,但日志中未见窗户关闭事件(StateValue=True),可能是日志未记录关闭动作,也可能窗户一直处于开启状态,存在轻微安全隐患。", "推理步骤5: 21:25 卧室出现一组快速事件序列——运动检测→开灯→窗户传感器触发→关灯→运动消失,整个过程仅 20 秒。这可能是住户短暂进入卧室开窗通风后离开,行为本身不异常,但速度较快,值得留意。"], "key_evidence": ["厨房温度传感器在 09:11、09:43、11:48、12:35、18:31 共 5 次报告 MeasuredValue = None", "11:00-11:30 厨房温度异常飙升至 ~29.5°C(较客厅高约 4°C),而灶具处于关闭状态,无合理热源", "厨房窗户三次记录打开事件但日志中无对应关闭事件"], "recommended_actions": ["检查厨房温度传感器的硬件状态和供电情况,清洁探头并确认安装位置是否受灶具余热或蒸汽直接影响", "检查厨房温度传感器与 Matter 网络的通信质量,排查 None 值是否由无线信号干扰或固件 Bug 导致", "确认厨房窗户当前是否已关闭;如长时间未关闭,建议设置窗户开启超时提醒以防安全隐患", "考虑为厨房温度传感器设置合理的温度阈值告警(如偏离同区域传感器 ±3°C 时触发),以便及时发现异常读数"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.965742588043213, "api_error": null} {"episode_id": "SQ3_FP_A_0608", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0608.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261237, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-23T21:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现间歇性异常高温读数和空值报告,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2488 跳升至 2853(28.53°C),而同一时刻客厅和卧室温度正常下降,且灶具尚未开启(18:57 才开),不符合真实环境温升逻辑。\",\n \"推理步骤2: 18:30 厨房温度继续报告 2863,但 18:57 灶具开启后,18:58 传感器报告 None(空值),19:00 恢复正常值 2426。灶具关闭后 19:44 再次报告 None。传感器在使用期间出现两次空值读数,说明设备通信或硬件存在间歇性故障。\",\n \"推理步骤3: 21:17、21:47、22:17、22:47 厨房温度传感器在非定时周期(正常为整点和半点)额外报告了约 2500 的读数,而同时段整点/半点的正常读数为 2339-2390,出现不一致的跳变。这些非周期性报告进一步佐证传感器工作不稳定。\",\n \"推理步骤4: 排除火灾风险——厨房烟雾报警器全天未触发,灶具使用时间合理(18:57-19:43),且住户在家期间正常操作,无持续高温趋势。\",\n \"推理步骤5: 其余设备行为正常——住户早晨 6:34 起床、7:22 出门上锁、18:23 回家开门,作息规律;门锁操作均为手动/自动,无异常入侵迹象;漏水传感器无报警。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~2488 突跳至 2853,灶具未开启,客厅/卧室温度同步下降\",\n \"18:58 和 19:44 厨房温度传感器报告 None(空值),表明设备通信中断\",\n \"21:17、21:47、22:17、22:47 出现非周期性温度报告(约 2500),与同时段整点/半点正常值(2339-2390)不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和接线,确认是否受灶具热辐射直接影响或存在松动\",\n \"查看传感器固件版本,考虑重置或更换该传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"可设置规则:当厨房温度传感器报告 None 或异常跳变时,自动发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现间歇性异常高温读数和空值报告,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2488 跳升至 2853(28.53°C),而同一时刻客厅和卧室温度正常下降,且灶具尚未开启(18:57 才开),不符合真实环境温升逻辑。", "推理步骤2: 18:30 厨房温度继续报告 2863,但 18:57 灶具开启后,18:58 传感器报告 None(空值),19:00 恢复正常值 2426。灶具关闭后 19:44 再次报告 None。传感器在使用期间出现两次空值读数,说明设备通信或硬件存在间歇性故障。", "推理步骤3: 21:17、21:47、22:17、22:47 厨房温度传感器在非定时周期(正常为整点和半点)额外报告了约 2500 的读数,而同时段整点/半点的正常读数为 2339-2390,出现不一致的跳变。这些非周期性报告进一步佐证传感器工作不稳定。", "推理步骤4: 排除火灾风险——厨房烟雾报警器全天未触发,灶具使用时间合理(18:57-19:43),且住户在家期间正常操作,无持续高温趋势。", "推理步骤5: 其余设备行为正常——住户早晨 6:34 起床、7:22 出门上锁、18:23 回家开门,作息规律;门锁操作均为手动/自动,无异常入侵迹象;漏水传感器无报警。"], "key_evidence": ["18:00 厨房温度从 ~2488 突跳至 2853,灶具未开启,客厅/卧室温度同步下降", "18:58 和 19:44 厨房温度传感器报告 None(空值),表明设备通信中断", "21:17、21:47、22:17、22:47 出现非周期性温度报告(约 2500),与同时段整点/半点正常值(2339-2390)不一致"], "recommended_actions": ["检查厨房温度传感器的安装位置和接线,确认是否受灶具热辐射直接影响或存在松动", "查看传感器固件版本,考虑重置或更换该传感器", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "可设置规则:当厨房温度传感器报告 None 或异常跳变时,自动发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.039613485336304, "api_error": null} {"episode_id": "SQ3_FP_A_0613", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0613.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261242, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-04T09:27:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息模式正常——06:35 起床、07:27 出门上班、18:19 回家、22:54 关灯就寝,属于典型单人一室一厅生活节奏。\",\n \"推理步骤2: 入侵排查——全天仅两次开门事件(07:27 出门、18:19 回家),均伴随正常的灯光/空调/运动传感器联动,门锁在无人时段保持锁定(LockState=1),无异常开锁记录。住户外出期间(07:27-18:19)无任何运动传感器触发(09:27/09:32 的卫生间短暂触发可能是宠物或传感器灵敏度问题,未伴随开门事件,不构成入侵证据)。\",\n \"推理步骤3: 厨房温度传感器异常——19:00 时厨房温度从 ~24.5°C 突然跳升至 28.32°C,而此时灶具尚未开启(19:13:30 才开灶)。这意味着温度跳变发生在灶具使用之前约13分钟,不能完全用烹饪解释。\",\n \"推理步骤4: 厨房温度传感器在 19:14 和 19:33 两次报告 MeasuredValue = None,表示传感器读数丢失。正常传感器不应返回 None,这是设备故障或通信异常的典型表现。\",\n \"推理步骤5: 19:30 厨房温度仍高达 28.27°C(灶具 19:32 才关闭),但到 20:00 迅速回落至 24.10°C。结合 None 值和之前的异常跳变,传感器可能在高温环境下工作不稳定。\",\n \"推理步骤6: 火灾风险排查——厨房烟雾报警器全天未触发任何告警,灶具使用时间约18分钟(19:13-19:32)属于正常烹饪时长,烹饪后住户主动开窗通风(19:32:30 窗户打开),行为合理,不构成火灾威胁。\",\n \"推理步骤7: 其他安全项——漏水传感器无告警;入户门在 18:19 回家后一直处于开启状态(contact=False),直到 21:56 才关门上锁,虽然时间较长但住户在家,风险较低;卧室窗户传感器无异常;所有灯光和空调操作均与运动传感器和住户动线吻合。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.5°C 突跳至 28.32°C,此时灶具尚未开启(19:13:30 才开灶),跳变无法用烹饪解释\",\n \"19:14:00 和 19:33:00 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数丢失\",\n \"住户外出期间(07:27-18:19)卫生间运动传感器在 09:27 和 09:32 有两次短暂触发(各约45秒和50秒),但无对应的开门事件,可能是宠物或传感器误触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新定位或更换传感器\",\n \"对厨房温度传感器进行固件检查和校准,排查 None 值的根本原因(通信故障/硬件老化)\",\n \"如家中无宠物,建议关注住户外出时段卫生间运动传感器的短暂触发,可调整传感器灵敏度或检查是否有误报源\",\n \"建议设置入户门长时间未关闭的提醒(如超过30分钟),提升居家安全意识\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 住户作息模式正常——06:35 起床、07:27 出门上班、18:19 回家、22:54 关灯就寝,属于典型单人一室一厅生活节奏。", "推理步骤2: 入侵排查——全天仅两次开门事件(07:27 出门、18:19 回家),均伴随正常的灯光/空调/运动传感器联动,门锁在无人时段保持锁定(LockState=1),无异常开锁记录。住户外出期间(07:27-18:19)无任何运动传感器触发(09:27/09:32 的卫生间短暂触发可能是宠物或传感器灵敏度问题,未伴随开门事件,不构成入侵证据)。", "推理步骤3: 厨房温度传感器异常——19:00 时厨房温度从 ~24.5°C 突然跳升至 28.32°C,而此时灶具尚未开启(19:13:30 才开灶)。这意味着温度跳变发生在灶具使用之前约13分钟,不能完全用烹饪解释。", "推理步骤4: 厨房温度传感器在 19:14 和 19:33 两次报告 MeasuredValue = None,表示传感器读数丢失。正常传感器不应返回 None,这是设备故障或通信异常的典型表现。", "推理步骤5: 19:30 厨房温度仍高达 28.27°C(灶具 19:32 才关闭),但到 20:00 迅速回落至 24.10°C。结合 None 值和之前的异常跳变,传感器可能在高温环境下工作不稳定。", "推理步骤6: 火灾风险排查——厨房烟雾报警器全天未触发任何告警,灶具使用时间约18分钟(19:13-19:32)属于正常烹饪时长,烹饪后住户主动开窗通风(19:32:30 窗户打开),行为合理,不构成火灾威胁。", "推理步骤7: 其他安全项——漏水传感器无告警;入户门在 18:19 回家后一直处于开启状态(contact=False),直到 21:56 才关门上锁,虽然时间较长但住户在家,风险较低;卧室窗户传感器无异常;所有灯光和空调操作均与运动传感器和住户动线吻合。"], "key_evidence": ["19:00 厨房温度从 ~24.5°C 突跳至 28.32°C,此时灶具尚未开启(19:13:30 才开灶),跳变无法用烹饪解释", "19:14:00 和 19:33:00 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数丢失", "住户外出期间(07:27-18:19)卫生间运动传感器在 09:27 和 09:32 有两次短暂触发(各约45秒和50秒),但无对应的开门事件,可能是宠物或传感器误触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新定位或更换传感器", "对厨房温度传感器进行固件检查和校准,排查 None 值的根本原因(通信故障/硬件老化)", "如家中无宠物,建议关注住户外出时段卫生间运动传感器的短暂触发,可调整传感器灵敏度或检查是否有误报源", "建议设置入户门长时间未关闭的提醒(如超过30分钟),提升居家安全意识"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.407760858535767, "api_error": null} {"episode_id": "SQ3_FP_A_0624", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0624.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261253, "scenario_id": "INS-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-22T15:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:41 起床,07:22 出门上班(门锁手动开锁后自动上锁),18:14 回家(开门、开灯、开空调),19:08 做饭,21:54 转入卧室就寝,22:39 关灯入睡。这是典型的单人上班族作息,无入侵迹象。\",\n \"推理步骤2: 入户门安全状况良好。全天仅两次开门事件(07:22 出门、18:14 回家),均为 Manual 操作,且出门后门锁自动上锁(LockState=1),晚间 21:54 门传感器确认关闭并自动上锁。无异常开锁或未授权访问。\",\n \"推理步骤3: 15:50 卧室出现短暂活动(占用→开灯→窗户传感器打开→关灯→占用清除),住户已于 07:22 出门且门锁未记录开门事件。但这可能是窗户传感器因风振动触发,或有同住人短暂进出卧室开窗通风。此事件持续仅 30 秒,无后续异常,暂不判定为入侵。\",\n \"推理步骤4: 关键异常——厨房温度传感器在 19:00 突然从 ~24.7°C 跳升至 28.31°C(跃升约 3.6°C),而此时灶具尚未开启(19:08 才开)。随后 19:09 和 19:55 两次报告 MeasuredValue = None(空值)。到 20:00 恢复为 24.01°C。这种在灶具未使用时的剧烈跳变以及多次 null 读数,不符合正常烹饪升温模式,更像是传感器自身故障或通信异常。\",\n \"推理步骤5: 19:30 厨房温度仍为 28.29°C(灶具已开约 20 分钟),但 19:54 关灶后仅 6 分钟(20:00)温度就降至 24.01°C,降幅超过 4°C,速度异常快,进一步佐证传感器读数不可靠。\",\n \"推理步骤6: 烟雾报警器全天未触发任何告警,排除火灾风险。漏水传感器无报告,排除水患。客厅和卧室温度传感器全天读数平稳,符合夏季日间升温、夜间降温的自然规律,无异常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.7°C 突跳至 28.31°C,此时灶具尚未开启(19:08 才开),跳变无合理热源解释\",\n \"19:09 和 19:55 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数中断\",\n \"19:54 关灶后仅 6 分钟温度从 28.29°C 骤降至 24.01°C,降速不符合物理规律,传感器数据不可信\",\n \"15:50 住户外出期间卧室出现短暂占用和窗户打开事件,但持续极短(约 30 秒)且无门锁开启记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,清理探头或更换设备\",\n \"关注 15:50 卧室窗户打开事件——确认是否有同住人或是否为传感器误触发;如确认无人在家,建议检查卧室窗户传感器并排查是否有未授权进入\",\n \"考虑为厨房温度传感器设置 null 值告警规则,当连续出现空读数时及时通知用户\",\n \"建议在无人在家时段启用安防模式,对卧室占用传感器触发进行即时推送告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次 null 读数,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:41 起床,07:22 出门上班(门锁手动开锁后自动上锁),18:14 回家(开门、开灯、开空调),19:08 做饭,21:54 转入卧室就寝,22:39 关灯入睡。这是典型的单人上班族作息,无入侵迹象。", "推理步骤2: 入户门安全状况良好。全天仅两次开门事件(07:22 出门、18:14 回家),均为 Manual 操作,且出门后门锁自动上锁(LockState=1),晚间 21:54 门传感器确认关闭并自动上锁。无异常开锁或未授权访问。", "推理步骤3: 15:50 卧室出现短暂活动(占用→开灯→窗户传感器打开→关灯→占用清除),住户已于 07:22 出门且门锁未记录开门事件。但这可能是窗户传感器因风振动触发,或有同住人短暂进出卧室开窗通风。此事件持续仅 30 秒,无后续异常,暂不判定为入侵。", "推理步骤4: 关键异常——厨房温度传感器在 19:00 突然从 ~24.7°C 跳升至 28.31°C(跃升约 3.6°C),而此时灶具尚未开启(19:08 才开)。随后 19:09 和 19:55 两次报告 MeasuredValue = None(空值)。到 20:00 恢复为 24.01°C。这种在灶具未使用时的剧烈跳变以及多次 null 读数,不符合正常烹饪升温模式,更像是传感器自身故障或通信异常。", "推理步骤5: 19:30 厨房温度仍为 28.29°C(灶具已开约 20 分钟),但 19:54 关灶后仅 6 分钟(20:00)温度就降至 24.01°C,降幅超过 4°C,速度异常快,进一步佐证传感器读数不可靠。", "推理步骤6: 烟雾报警器全天未触发任何告警,排除火灾风险。漏水传感器无报告,排除水患。客厅和卧室温度传感器全天读数平稳,符合夏季日间升温、夜间降温的自然规律,无异常。"], "key_evidence": ["19:00 厨房温度从 ~24.7°C 突跳至 28.31°C,此时灶具尚未开启(19:08 才开),跳变无合理热源解释", "19:09 和 19:55 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数中断", "19:54 关灶后仅 6 分钟温度从 28.29°C 骤降至 24.01°C,降速不符合物理规律,传感器数据不可信", "15:50 住户外出期间卧室出现短暂占用和窗户打开事件,但持续极短(约 30 秒)且无门锁开启记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,清理探头或更换设备", "关注 15:50 卧室窗户打开事件——确认是否有同住人或是否为传感器误触发;如确认无人在家,建议检查卧室窗户传感器并排查是否有未授权进入", "考虑为厨房温度传感器设置 null 值告警规则,当连续出现空读数时及时通知用户", "建议在无人在家时段启用安防模式,对卧室占用传感器触发进行即时推送告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.254482984542847, "api_error": null} {"episode_id": "SQ3_FP_A_0626", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0626.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261255, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "bedroom", "injection_time": "2026-06-23T22:28:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"22:28 住户已在卧室就寝后,入户门被未知来源远程解锁,有人进入客厅且未关门,存在入侵嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 住户日常作息清晰——06:24起床、07:40出门(手动锁门+自动上锁)、18:27回家(手动开锁),21:55关灯/关空调后进卧室准备就寝,22:16将卧室灯调暗至18%,22:34关灯,22:36卧室运动传感器归零,表明住户已入睡。\",\n \"推理步骤2: 22:28 入户门锁触发解锁事件,OperationSource=3 表示远程操作(Remote),且携带 UserIndex=5,这不同于住户早晚使用的 Manual 方式。住户此时正在卧室且灯已调暗准备入睡,不太可能自己远程开锁。\",\n \"推理步骤3: 解锁后 22:28:05 和 22:28:30 客厅运动传感器连续两次检测到有人(Occupancy=1),说明确实有人进入室内并在客厅活动。\",\n \"推理步骤4: 22:29 客厅主灯被打开,但日志中没有出现 front_door_contact StateValue=True(关门)和 LockOperation LockOperationType=0(重新上锁)的记录,意味着入户门在解锁后一直处于未锁定/未关闭状态。\",\n \"推理步骤5: 22:34 卧室灯关闭、22:36 卧室运动传感器归零,住户似乎并未察觉客厅的活动,进一步说明客厅的活动者不是住户本人。\",\n \"推理步骤6: 厨房温度传感器在 19:04 和 19:47 两次报告 None 值,属于设备故障,但与入侵事件无直接关联,作为次要问题记录。\"\n ],\n \"key_evidence\": [\n \"22:28 入户门通过远程方式(OperationSource=3, UserIndex=5)被解锁,而住户此时已在卧室准备就寝\",\n \"22:28:05 ~ 22:28:30 客厅运动传感器连续检测到人体活动,22:29 客厅灯被打开\",\n \"解锁后日志中无关门(front_door_contact=True)和重新上锁记录,入户门持续处于未锁定状态\",\n \"住户 22:34 关卧室灯、22:36 卧室运动归零,表明住户未前往客厅,客厅活动者为他人\",\n \"(次要)厨房温度传感器 19:04 和 19:47 报告 MeasuredValue=None,存在传感器故障\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送高优先级警报通知住户:入户门于 22:28 被远程解锁,客厅检测到人员活动\",\n \"远程锁定入户门(如系统支持),防止更多未授权人员进入\",\n \"检查门锁 UserIndex=5 对应的用户身份,确认是否为授权用户;如不认识应立即删除该凭证\",\n \"审计门锁所有已注册的远程访问凭证和用户列表,排查是否存在被盗用或未授权添加的账户\",\n \"如住户确认未授权此次开锁,建议立即报警并保留日志作为证据\",\n \"修复厨房温度传感器的 None 值上报问题,检查传感器连接或更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "22:28 住户已在卧室就寝后,入户门被未知来源远程解锁,有人进入客厅且未关门,存在入侵嫌疑。", "reasoning": ["推理步骤1: 住户日常作息清晰——06:24起床、07:40出门(手动锁门+自动上锁)、18:27回家(手动开锁),21:55关灯/关空调后进卧室准备就寝,22:16将卧室灯调暗至18%,22:34关灯,22:36卧室运动传感器归零,表明住户已入睡。", "推理步骤2: 22:28 入户门锁触发解锁事件,OperationSource=3 表示远程操作(Remote),且携带 UserIndex=5,这不同于住户早晚使用的 Manual 方式。住户此时正在卧室且灯已调暗准备入睡,不太可能自己远程开锁。", "推理步骤3: 解锁后 22:28:05 和 22:28:30 客厅运动传感器连续两次检测到有人(Occupancy=1),说明确实有人进入室内并在客厅活动。", "推理步骤4: 22:29 客厅主灯被打开,但日志中没有出现 front_door_contact StateValue=True(关门)和 LockOperation LockOperationType=0(重新上锁)的记录,意味着入户门在解锁后一直处于未锁定/未关闭状态。", "推理步骤5: 22:34 卧室灯关闭、22:36 卧室运动传感器归零,住户似乎并未察觉客厅的活动,进一步说明客厅的活动者不是住户本人。", "推理步骤6: 厨房温度传感器在 19:04 和 19:47 两次报告 None 值,属于设备故障,但与入侵事件无直接关联,作为次要问题记录。"], "key_evidence": ["22:28 入户门通过远程方式(OperationSource=3, UserIndex=5)被解锁,而住户此时已在卧室准备就寝", "22:28:05 ~ 22:28:30 客厅运动传感器连续检测到人体活动,22:29 客厅灯被打开", "解锁后日志中无关门(front_door_contact=True)和重新上锁记录,入户门持续处于未锁定状态", "住户 22:34 关卧室灯、22:36 卧室运动归零,表明住户未前往客厅,客厅活动者为他人", "(次要)厨房温度传感器 19:04 和 19:47 报告 MeasuredValue=None,存在传感器故障"], "recommended_actions": ["立即通过手机推送高优先级警报通知住户:入户门于 22:28 被远程解锁,客厅检测到人员活动", "远程锁定入户门(如系统支持),防止更多未授权人员进入", "检查门锁 UserIndex=5 对应的用户身份,确认是否为授权用户;如不认识应立即删除该凭证", "审计门锁所有已注册的远程访问凭证和用户列表,排查是否存在被盗用或未授权添加的账户", "如住户确认未授权此次开锁,建议立即报警并保留日志作为证据", "修复厨房温度传感器的 None 值上报问题,检查传感器连接或更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.756627321243286, "api_error": null} {"episode_id": "SQ3_FP_A_0636", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0636.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261265, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-04T06:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(18:00–23:30)的整体活动模式。住户18:00回家开门、开灯、开空调,19:07开始做饭,19:37关灶开窗通风,20:10启动洗碗机,22:05转入卧室就寝,22:55关灯入睡——这是一个完全正常的晚间生活流程。\",\n \"推理步骤2: 入侵排查——18:00开锁方式为 Manual(手动),门开关时间间隔合理;22:05门传感器确认关闭后自动上锁。全天无未授权开锁事件,无深夜异常运动检测,排除入侵威胁。\",\n \"推理步骤3: 火灾排查——19:07开灶,19:37关灶,烹饪时长约30分钟属正常范围。烟雾报警器全天未触发。关灶后开窗通风,厨房温度在20:00已回落至24.15°C,排除火灾风险。\",\n \"推理步骤4: 漏水排查——卫生间漏水传感器全天无报警,洗碗机运行期间无异常事件,排除漏水。\",\n \"推理步骤5: 重点异常——厨房温度传感器在19:00突然从约24.7°C跳升至28.36°C(跳变约3.6°C),而此时灶具尚未开启(19:07才开灶)。这个时间差说明要么传感器提前受热源影响,要么读数本身不可靠。\",\n \"推理步骤6: 更关键的是,19:08和19:38两个时间点温度传感器报告了 None 值(MeasuredValue = None),表明传感器在灶具使用前后两次丢失了有效读数。正常传感器即使在高温环境下也应返回数值而非 None。\",\n \"推理步骤7: 19:30厨房温度仍为28.38°C(灶具已运行约23分钟),但到20:00(关灶后23分钟)温度骤降至24.15°C。结合 None 值和异常跳变,该传感器的可靠性存疑。\",\n \"推理步骤8: 其余设备行为均正常——客厅和卧室温度随自然昼夜变化平稳波动,空调开启后客厅温度逐步下降,卧室窗帘晚间关闭,所有灯光操作与人员活动传感器吻合。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.7°C异常跳升至28.36°C,但灶具直到19:07才开启,时序不匹配\",\n \"19:08和19:38厨房温度传感器两次报告 MeasuredValue = None,传感器丢失有效读数\",\n \"烟雾报警器全天未触发,排除真实火灾,指向传感器自身问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰\",\n \"排查传感器硬件状态,两次 None 值可能表明传感器过热保护触发或通信故障,建议重启或更换\",\n \"考虑为厨房增加一个冗余温度传感器,避免单点故障导致烹饪场景下的温度监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 分析过去6小时(18:00–23:30)的整体活动模式。住户18:00回家开门、开灯、开空调,19:07开始做饭,19:37关灶开窗通风,20:10启动洗碗机,22:05转入卧室就寝,22:55关灯入睡——这是一个完全正常的晚间生活流程。", "推理步骤2: 入侵排查——18:00开锁方式为 Manual(手动),门开关时间间隔合理;22:05门传感器确认关闭后自动上锁。全天无未授权开锁事件,无深夜异常运动检测,排除入侵威胁。", "推理步骤3: 火灾排查——19:07开灶,19:37关灶,烹饪时长约30分钟属正常范围。烟雾报警器全天未触发。关灶后开窗通风,厨房温度在20:00已回落至24.15°C,排除火灾风险。", "推理步骤4: 漏水排查——卫生间漏水传感器全天无报警,洗碗机运行期间无异常事件,排除漏水。", "推理步骤5: 重点异常——厨房温度传感器在19:00突然从约24.7°C跳升至28.36°C(跳变约3.6°C),而此时灶具尚未开启(19:07才开灶)。这个时间差说明要么传感器提前受热源影响,要么读数本身不可靠。", "推理步骤6: 更关键的是,19:08和19:38两个时间点温度传感器报告了 None 值(MeasuredValue = None),表明传感器在灶具使用前后两次丢失了有效读数。正常传感器即使在高温环境下也应返回数值而非 None。", "推理步骤7: 19:30厨房温度仍为28.38°C(灶具已运行约23分钟),但到20:00(关灶后23分钟)温度骤降至24.15°C。结合 None 值和异常跳变,该传感器的可靠性存疑。", "推理步骤8: 其余设备行为均正常——客厅和卧室温度随自然昼夜变化平稳波动,空调开启后客厅温度逐步下降,卧室窗帘晚间关闭,所有灯光操作与人员活动传感器吻合。"], "key_evidence": ["19:00厨房温度从约24.7°C异常跳升至28.36°C,但灶具直到19:07才开启,时序不匹配", "19:08和19:38厨房温度传感器两次报告 MeasuredValue = None,传感器丢失有效读数", "烟雾报警器全天未触发,排除真实火灾,指向传感器自身问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰", "排查传感器硬件状态,两次 None 值可能表明传感器过热保护触发或通信故障,建议重启或更换", "考虑为厨房增加一个冗余温度传感器,避免单点故障导致烹饪场景下的温度监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.796501874923706, "api_error": null} {"episode_id": "SQ3_FP_A_0637", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0637.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261266, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-18T17:14:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及数据丢失(None),疑似传感器故障,同时需关注厨房烹饪期间的高温风险。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——住户约06:32起床,07:14出门上班,18:18回家,22:39入睡。门锁均为手动开锁+自动上锁,操作模式正常,无异常入侵迹象。\",\n \"推理步骤2: 温度趋势分析——客厅和卧室温度随昼夜自然波动(夜间约22-23°C,午间峰值约25-26°C),符合夏季一室一厅的正常热力学特征。18:18开启空调(制冷模式SystemMode=3)后温度逐步下降,行为合理。\",\n \"推理步骤3: 厨房温度异常——19:00时厨房温度突然从约24.5°C跳升至28.31°C,而此时灶具尚未开启(19:11才开灶)。这一跳变幅度(约3.8°C)在30分钟内发生且无明显热源,属于异常读数。\",\n \"推理步骤4: 厨房温度传感器数据丢失——19:12和19:50两个时间点,kitchen_temp_sensor报告MeasuredValue=None,表明传感器未能返回有效数据。这在正常运行的Matter设备中不应出现,强烈指向传感器硬件故障或通信异常。\",\n \"推理步骤5: 19:30厨房温度仍为28.26°C(灶具已运行约19分钟),而20:00灶具关闭后温度回落至24.12°C。灶具使用期间温度偏高可以理解,但结合之前的异常跳变和None值,传感器的可靠性存疑。\",\n \"推理步骤6: 卫生间漏水传感器在17:14触发,但仅持续2分钟后恢复,且当时有人在卫生间(occupancy=1),判断为正常用水(如洗手、冲洗地面)导致的短暂触发,非真实漏水。\",\n \"推理步骤7: 入户门在18:18开锁后,直到22:09才关门上锁,期间门处于未关闭状态(front_door_contact.StateValue未恢复为True),持续近4小时。虽然住户在家,但长时间未关门存在一定安全隐患。\",\n \"推理步骤8: 厨房窗户在19:49打开(灶具关闭后通风),之后日志中未见关闭记录,可能整夜处于开启状态,存在轻微安全风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从约24.5°C异常跳升至28.31°C,此时灶具尚未开启\",\n \"19:12 和 19:50 厨房温度传感器返回 MeasuredValue=None,数据丢失\",\n \"入户门从18:18开启到22:09才关闭上锁,敞开近4小时\",\n \"厨房窗户19:49打开后无关闭记录,可能整夜未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障\",\n \"在烟雾报警器正常工作的前提下,为厨房增加温度异常告警规则(如短时间内温升超过3°C自动告警)\",\n \"设置入户门长时间未关闭的提醒(如超过10分钟未关门则推送通知)\",\n \"设置厨房窗户夜间未关闭提醒,避免安全隐患\",\n \"卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发需检查管道\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及数据丢失(None),疑似传感器故障,同时需关注厨房烹饪期间的高温风险。", "reasoning": ["推理步骤1: 整体生活作息分析——住户约06:32起床,07:14出门上班,18:18回家,22:39入睡。门锁均为手动开锁+自动上锁,操作模式正常,无异常入侵迹象。", "推理步骤2: 温度趋势分析——客厅和卧室温度随昼夜自然波动(夜间约22-23°C,午间峰值约25-26°C),符合夏季一室一厅的正常热力学特征。18:18开启空调(制冷模式SystemMode=3)后温度逐步下降,行为合理。", "推理步骤3: 厨房温度异常——19:00时厨房温度突然从约24.5°C跳升至28.31°C,而此时灶具尚未开启(19:11才开灶)。这一跳变幅度(约3.8°C)在30分钟内发生且无明显热源,属于异常读数。", "推理步骤4: 厨房温度传感器数据丢失——19:12和19:50两个时间点,kitchen_temp_sensor报告MeasuredValue=None,表明传感器未能返回有效数据。这在正常运行的Matter设备中不应出现,强烈指向传感器硬件故障或通信异常。", "推理步骤5: 19:30厨房温度仍为28.26°C(灶具已运行约19分钟),而20:00灶具关闭后温度回落至24.12°C。灶具使用期间温度偏高可以理解,但结合之前的异常跳变和None值,传感器的可靠性存疑。", "推理步骤6: 卫生间漏水传感器在17:14触发,但仅持续2分钟后恢复,且当时有人在卫生间(occupancy=1),判断为正常用水(如洗手、冲洗地面)导致的短暂触发,非真实漏水。", "推理步骤7: 入户门在18:18开锁后,直到22:09才关门上锁,期间门处于未关闭状态(front_door_contact.StateValue未恢复为True),持续近4小时。虽然住户在家,但长时间未关门存在一定安全隐患。", "推理步骤8: 厨房窗户在19:49打开(灶具关闭后通风),之后日志中未见关闭记录,可能整夜处于开启状态,存在轻微安全风险。"], "key_evidence": ["19:00 厨房温度从约24.5°C异常跳升至28.31°C,此时灶具尚未开启", "19:12 和 19:50 厨房温度传感器返回 MeasuredValue=None,数据丢失", "入户门从18:18开启到22:09才关闭上锁,敞开近4小时", "厨房窗户19:49打开后无关闭记录,可能整夜未关"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障", "在烟雾报警器正常工作的前提下,为厨房增加温度异常告警规则(如短时间内温升超过3°C自动告警)", "设置入户门长时间未关闭的提醒(如超过10分钟未关门则推送通知)", "设置厨房窗户夜间未关闭提醒,避免安全隐患", "卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发需检查管道"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.85945200920105, "api_error": null} {"episode_id": "SQ3_FP_A_0638", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0638.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261267, "scenario_id": "FG-01", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-27T09:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数(29.82°C),疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 08:35 起床(卧室运动+开灯+开窗帘),08:57 进卫生间,09:25 到厨房做早餐,10:04 在客厅开空调和灯,22:50 关灯锁门入睡,符合一室一厅单人居住的典型日常。\",\n \"推理步骤2: 灶具使用共三次(09:11-09:54 早餐、12:14-12:49 午餐、17:52-18:32 晚餐),每次使用时长 30-40 分钟,关火后均开窗通风(kitchen_window_contact = False),烟雾报警器全天未触发,烹饪行为正常。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:26、09:55、12:15、12:50、17:53、18:33),共计 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器在高温时出现读取失败。\",\n \"推理步骤4: 12:00 的厨房定时温度读数为 2982(29.82°C),而同一时刻客厅为 25.80°C、卧室为 24.87°C。厨房比其他房间高出约 4-5°C,且 12:30 仍为 29.81°C。考虑到灶具 12:14 才开启,12:00 时灶具尚未使用,这个异常高温可能是传感器漂移或故障的表现。\",\n \"推理步骤5: 入户门全天仅在 22:50 有一次自动上锁记录,门传感器显示关闭(StateValue=True),无异常开门事件。卧室窗户传感器和客厅窗户传感器全天无异常触发。漏水传感器无报警。安防层面无入侵迹象。\",\n \"推理步骤6: 温度趋势合理——夜间 22-23°C,白天随日照升至 25-26°C,开空调后客厅温度稳定在 25°C 左右,傍晚后逐步回落。卧室始终比客厅低约 1°C,符合朝向或面积差异。整体温度曲线正常。\",\n \"推理步骤7: 洗碗机在 18:32 晚餐后启动,操作状态切换为运行中(OperationalState=1),属于正常使用。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间 6 次报告 MeasuredValue = None,表明高温环境下传感器读取失败\",\n \"12:00 厨房温度异常跳升至 29.82°C(灶具尚未开启),比同时刻客厅高出 4°C,12:30 仍维持在 29.81°C,疑似传感器漂移\",\n \"烟雾报警器全天未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时读数异常或超出量程\",\n \"对厨房温度传感器进行校准或更换,解决频繁报告 None 值的问题\",\n \"考虑为厨房温度传感器设置耐高温防护罩,或将其迁移至远离灶具的位置以获得更准确的环境温度读数\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数(29.82°C),疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 08:35 起床(卧室运动+开灯+开窗帘),08:57 进卫生间,09:25 到厨房做早餐,10:04 在客厅开空调和灯,22:50 关灯锁门入睡,符合一室一厅单人居住的典型日常。", "推理步骤2: 灶具使用共三次(09:11-09:54 早餐、12:14-12:49 午餐、17:52-18:32 晚餐),每次使用时长 30-40 分钟,关火后均开窗通风(kitchen_window_contact = False),烟雾报警器全天未触发,烹饪行为正常。", "推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:26、09:55、12:15、12:50、17:53、18:33),共计 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器在高温时出现读取失败。", "推理步骤4: 12:00 的厨房定时温度读数为 2982(29.82°C),而同一时刻客厅为 25.80°C、卧室为 24.87°C。厨房比其他房间高出约 4-5°C,且 12:30 仍为 29.81°C。考虑到灶具 12:14 才开启,12:00 时灶具尚未使用,这个异常高温可能是传感器漂移或故障的表现。", "推理步骤5: 入户门全天仅在 22:50 有一次自动上锁记录,门传感器显示关闭(StateValue=True),无异常开门事件。卧室窗户传感器和客厅窗户传感器全天无异常触发。漏水传感器无报警。安防层面无入侵迹象。", "推理步骤6: 温度趋势合理——夜间 22-23°C,白天随日照升至 25-26°C,开空调后客厅温度稳定在 25°C 左右,傍晚后逐步回落。卧室始终比客厅低约 1°C,符合朝向或面积差异。整体温度曲线正常。", "推理步骤7: 洗碗机在 18:32 晚餐后启动,操作状态切换为运行中(OperationalState=1),属于正常使用。"], "key_evidence": ["厨房温度传感器在灶具运行期间 6 次报告 MeasuredValue = None,表明高温环境下传感器读取失败", "12:00 厨房温度异常跳升至 29.82°C(灶具尚未开启),比同时刻客厅高出 4°C,12:30 仍维持在 29.81°C,疑似传感器漂移", "烟雾报警器全天未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时读数异常或超出量程", "对厨房温度传感器进行校准或更换,解决频繁报告 None 值的问题", "考虑为厨房温度传感器设置耐高温防护罩,或将其迁移至远离灶具的位置以获得更准确的环境温度读数"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.163084030151367, "api_error": null} {"episode_id": "SQ3_FP_A_0646", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0646.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261275, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bathroom", "injection_time": "2026-06-22T12:04:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:住户不在家时温度骤升至28.5-28.7°C,随后在灶具使用期间两次报告 None 值,疑似传感器故障或数据异常。\",\n \"reasoning\": [\n \"推理步骤1: 温度基线分析——凌晨0:00至5:30,三个区域温度稳定在22-23°C范围内,属于夏季夜间正常室温。6:00起随日照升温,至12:00-12:30达到峰值(客厅≈25.8°C,厨房≈25.7°C),午后逐步回落,整体趋势合理。\",\n \"推理步骤2: 厨房温度异常跳变——18:00时厨房温度突然从约24.7°C(17:30)跳升至28.5°C,18:30进一步升至28.7°C。同一时段客厅和卧室温度仍在正常下降通道(客厅24.5°C、卧室23.6°C)。此时住户尚未进入厨房(灶具18:57才开启),厨房无任何设备活动,单一房间独立升温约4°C缺乏合理热源解释。\",\n \"推理步骤3: 传感器 None 值异常——18:58(灶具刚开启后)和19:36(灶具关闭后开窗通风时)厨房温度传感器两次报告 MeasuredValue = None。Matter 协议中 None 通常表示传感器无法提供有效读数,属于设备故障或通信异常。正常工作的温度传感器即使在高温环境下也应返回数值而非 None。\",\n \"推理步骤4: 19:00温度恢复正常——在两次 None 之间的19:00,厨房温度突然恢复到24.27°C,与客厅(24.30°C)高度一致,此前的28.7°C异常高温完全消失。这种跳变模式更符合传感器间歇性故障(偶尔返回错误值或无值)而非真实温度变化。\",\n \"推理步骤5: 排除火灾风险——18:00的温度跳升虽然异常,但烟雾报警器全天未触发任何告警,且28.5°C本身不构成火灾温度特征。结合后续温度恢复正常和 None 值出现,判断为传感器故障而非真实高温事件。\",\n \"推理步骤6: 住户行为模式正常——06:34起床、07:39出门(门锁手动开锁后自动上锁)、18:29回家(开门、开灯、开空调)、18:57做饭、19:35关灶开窗、20:10启动洗碗机、21:48转入卧室就寝、22:33关灯睡觉,全天行为链条完整合理,无入侵迹象。\",\n \"推理步骤7: 安防状态正常——入户门全天仅两次开关(出门/回家),均伴随正常的手动解锁和自动上锁流程。住户外出期间(07:39-18:29)无任何门窗开启、运动检测或灯光触发事件,家中处于安全无人状态。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约24.7°C骤升至28.5°C(+3.8°C),18:30进一步升至28.7°C,而同期客厅/卧室温度正常下降,且厨房无任何设备活动\",\n \"18:58 和 19:36 厨房温度传感器两次报告 MeasuredValue = None,表明传感器无法提供有效读数\",\n \"19:00 厨房温度突然恢复至24.27°C(与客厅一致),28.7°C的异常高温瞬间消失,不符合真实物理温度变化规律\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否存在接触不良、受潮或老化问题\",\n \"查看厨房温度传感器的固件版本,考虑进行固件更新或设备重置\",\n \"如传感器持续出现 None 值或异常跳变,建议更换设备以确保厨房高温/火灾监测的可靠性\",\n \"考虑为厨房烟雾报警器增加与温度传感器的联动规则:当温度传感器离线(None)时发送提醒,避免监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:住户不在家时温度骤升至28.5-28.7°C,随后在灶具使用期间两次报告 None 值,疑似传感器故障或数据异常。", "reasoning": ["推理步骤1: 温度基线分析——凌晨0:00至5:30,三个区域温度稳定在22-23°C范围内,属于夏季夜间正常室温。6:00起随日照升温,至12:00-12:30达到峰值(客厅≈25.8°C,厨房≈25.7°C),午后逐步回落,整体趋势合理。", "推理步骤2: 厨房温度异常跳变——18:00时厨房温度突然从约24.7°C(17:30)跳升至28.5°C,18:30进一步升至28.7°C。同一时段客厅和卧室温度仍在正常下降通道(客厅24.5°C、卧室23.6°C)。此时住户尚未进入厨房(灶具18:57才开启),厨房无任何设备活动,单一房间独立升温约4°C缺乏合理热源解释。", "推理步骤3: 传感器 None 值异常——18:58(灶具刚开启后)和19:36(灶具关闭后开窗通风时)厨房温度传感器两次报告 MeasuredValue = None。Matter 协议中 None 通常表示传感器无法提供有效读数,属于设备故障或通信异常。正常工作的温度传感器即使在高温环境下也应返回数值而非 None。", "推理步骤4: 19:00温度恢复正常——在两次 None 之间的19:00,厨房温度突然恢复到24.27°C,与客厅(24.30°C)高度一致,此前的28.7°C异常高温完全消失。这种跳变模式更符合传感器间歇性故障(偶尔返回错误值或无值)而非真实温度变化。", "推理步骤5: 排除火灾风险——18:00的温度跳升虽然异常,但烟雾报警器全天未触发任何告警,且28.5°C本身不构成火灾温度特征。结合后续温度恢复正常和 None 值出现,判断为传感器故障而非真实高温事件。", "推理步骤6: 住户行为模式正常——06:34起床、07:39出门(门锁手动开锁后自动上锁)、18:29回家(开门、开灯、开空调)、18:57做饭、19:35关灶开窗、20:10启动洗碗机、21:48转入卧室就寝、22:33关灯睡觉,全天行为链条完整合理,无入侵迹象。", "推理步骤7: 安防状态正常——入户门全天仅两次开关(出门/回家),均伴随正常的手动解锁和自动上锁流程。住户外出期间(07:39-18:29)无任何门窗开启、运动检测或灯光触发事件,家中处于安全无人状态。"], "key_evidence": ["18:00 厨房温度从约24.7°C骤升至28.5°C(+3.8°C),18:30进一步升至28.7°C,而同期客厅/卧室温度正常下降,且厨房无任何设备活动", "18:58 和 19:36 厨房温度传感器两次报告 MeasuredValue = None,表明传感器无法提供有效读数", "19:00 厨房温度突然恢复至24.27°C(与客厅一致),28.7°C的异常高温瞬间消失,不符合真实物理温度变化规律"], "recommended_actions": ["检查厨房温度传感器的硬件状态和安装位置,确认是否存在接触不良、受潮或老化问题", "查看厨房温度传感器的固件版本,考虑进行固件更新或设备重置", "如传感器持续出现 None 值或异常跳变,建议更换设备以确保厨房高温/火灾监测的可靠性", "考虑为厨房烟雾报警器增加与温度传感器的联动规则:当温度传感器离线(None)时发送提醒,避免监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.04950976371765, "api_error": null} {"episode_id": "SQ3_FP_A_0649", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0649.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261278, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bathroom", "injection_time": "2026-06-16T06:02:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.58°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅 24.56°C,卧室 23.62°C),排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度仍维持在 28.57°C 的异常高位,但此时灶具尚未开启(灶具在 18:51 才打开),说明这次高温不是烹饪导致的,属于不明原因的异常读数。\",\n \"推理步骤3: 18:52 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失),传感器读数中断。19:00 恢复正常读数 24.42°C,说明传感器经历了短暂故障或超量程。\",\n \"推理步骤4: 19:55 灶具关闭后约1分钟(19:56),厨房温度传感器再次报告 None,第二次数据丢失。20:00 恢复为 24.19°C。两次 None 出现在灶具状态切换前后,高度关联。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发,排除火灾风险。但传感器两次丢失数据加上一次不明原因的异常高温,表明该传感器可能存在硬件故障、接线问题或受灶具电磁干扰影响。\",\n \"推理步骤6: 其余设备行为均正常——住户 18:18 回家、开灯开空调、18:51 做饭、19:55 结束烹饪并开窗通风、20:13 启动洗碗机、21:53 转入卧室就寝、22:43 关灯睡觉,符合典型的晚间生活模式。入户门锁操作正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约 24.85°C 骤升至 28.58°C,而灶具直到 18:51 才开启,且客厅/卧室温度同期无异常升高\",\n \"18:52 和 19:56 厨房温度传感器两次报告 MeasuredValue = None,均发生在灶具开/关状态切换附近\",\n \"18:30 灶具未开启时厨房仍维持 28.57°C 异常高温,排除烹饪因素\",\n \"烟雾报警器全程未触发,排除真实火灾\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近或受到热辐射/蒸汽直接影响\",\n \"检查厨房温度传感器的供电和通信连接是否稳定,排除接线松动或电磁干扰导致的间歇性故障\",\n \"持续监控该传感器未来几天的读数,若 None 值或异常跳变反复出现,建议更换传感器\",\n \"考虑在厨房增加一个冗余温度传感器,避免单点故障导致安全监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.58°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅 24.56°C,卧室 23.62°C),排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度仍维持在 28.57°C 的异常高位,但此时灶具尚未开启(灶具在 18:51 才打开),说明这次高温不是烹饪导致的,属于不明原因的异常读数。", "推理步骤3: 18:52 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失),传感器读数中断。19:00 恢复正常读数 24.42°C,说明传感器经历了短暂故障或超量程。", "推理步骤4: 19:55 灶具关闭后约1分钟(19:56),厨房温度传感器再次报告 None,第二次数据丢失。20:00 恢复为 24.19°C。两次 None 出现在灶具状态切换前后,高度关联。", "推理步骤5: 烟雾报警器在整个时段内未触发,排除火灾风险。但传感器两次丢失数据加上一次不明原因的异常高温,表明该传感器可能存在硬件故障、接线问题或受灶具电磁干扰影响。", "推理步骤6: 其余设备行为均正常——住户 18:18 回家、开灯开空调、18:51 做饭、19:55 结束烹饪并开窗通风、20:13 启动洗碗机、21:53 转入卧室就寝、22:43 关灯睡觉,符合典型的晚间生活模式。入户门锁操作正常,无入侵迹象。"], "key_evidence": ["18:00 厨房温度从约 24.85°C 骤升至 28.58°C,而灶具直到 18:51 才开启,且客厅/卧室温度同期无异常升高", "18:52 和 19:56 厨房温度传感器两次报告 MeasuredValue = None,均发生在灶具开/关状态切换附近", "18:30 灶具未开启时厨房仍维持 28.57°C 异常高温,排除烹饪因素", "烟雾报警器全程未触发,排除真实火灾"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近或受到热辐射/蒸汽直接影响", "检查厨房温度传感器的供电和通信连接是否稳定,排除接线松动或电磁干扰导致的间歇性故障", "持续监控该传感器未来几天的读数,若 None 值或异常跳变反复出现,建议更换传感器", "考虑在厨房增加一个冗余温度传感器,避免单点故障导致安全监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.46558666229248, "api_error": null} {"episode_id": "SQ3_FP_A_0657", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0657.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261286, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-19T21:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在周期性异常跳变和数据丢失,疑似传感器故障或线路接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式完全正常——06:36起床、07:35出门、18:08回家、22:30就寝,符合典型上班族作息,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),门锁安全。\",\n \"推理步骤3: 18:00 厨房温度传感器突然从约 2473(24.73°C)跳升至 2854(28.54°C),此时住户刚到家尚未进厨房,灶具未开启,且客厅/卧室温度同期无对应升幅,该跳变缺乏物理解释。\",\n \"推理步骤4: 18:30 厨房温度继续报 2859(28.59°C),但 18:56 灶具开启后,18:57 传感器报值变为 None(数据丢失),正常传感器在灶具工作时应报出更高温度而非空值。\",\n \"推理步骤5: 19:00 传感器恢复正常读数 2434,19:41 灶具关闭后 19:42 再次报 None,说明数据丢失并非偶发,而是重复出现。\",\n \"推理步骤6: 从 21:06 开始,厨房温度传感器出现周期性异常跳变模式:每隔约 30 分钟,在正常的半点/整点读数(约 23-24°C)之间,额外插入一个约 25.0°C 的异常读数(21:06→2500, 21:36→2502, 22:06→2498, 22:36→2501),此时厨房无人活动、灶具已关闭,这种精确周期性跳变不符合任何正常物理温度变化。\",\n \"推理步骤7: 客厅和卧室温度传感器全天读数平稳、符合日间升温夜间降温的自然规律,排除全屋环境异常,问题定位在厨房温度传感器本身。\",\n \"推理步骤8: 厨房窗户在 19:41 被打开后日志中无关闭记录,但这属于通风行为,不构成安全威胁;烟雾报警器全天未触发,排除火灾风险。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 24.73°C 突跳至 28.54°C,同期客厅/卧室无对应变化,灶具未开启\",\n \"18:57 和 19:42 厨房温度传感器两次报 None(数据丢失),分别对应灶具开启后和关闭后\",\n \"21:06/21:36/22:06/22:36 出现周期性约 25.0°C 的异常跳变读数,与正常半小时读数(约 23.5°C)偏差明显,且厨房无任何活动\",\n \"客厅和卧室传感器全天数据正常,排除环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态,包括电池电量、接线端子和安装位置,排除接触不良或受潮\",\n \"确认传感器是否靠近灶具或蒸汽源,必要时调整安装位置避免热源干扰\",\n \"如传感器支持固件更新,尝试重置或升级固件以排除软件故障\",\n \"若问题持续,建议更换厨房温度传感器,并在更换前将厨房烟雾报警器作为主要安全监测手段\",\n \"关注厨房窗户是否仍处于打开状态(19:41 开窗后无关闭记录),夜间建议关闭以确保安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在周期性异常跳变和数据丢失,疑似传感器故障或线路接触不良。", "reasoning": ["推理步骤1: 住户行为模式完全正常——06:36起床、07:35出门、18:08回家、22:30就寝,符合典型上班族作息,无入侵迹象。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),门锁安全。", "推理步骤3: 18:00 厨房温度传感器突然从约 2473(24.73°C)跳升至 2854(28.54°C),此时住户刚到家尚未进厨房,灶具未开启,且客厅/卧室温度同期无对应升幅,该跳变缺乏物理解释。", "推理步骤4: 18:30 厨房温度继续报 2859(28.59°C),但 18:56 灶具开启后,18:57 传感器报值变为 None(数据丢失),正常传感器在灶具工作时应报出更高温度而非空值。", "推理步骤5: 19:00 传感器恢复正常读数 2434,19:41 灶具关闭后 19:42 再次报 None,说明数据丢失并非偶发,而是重复出现。", "推理步骤6: 从 21:06 开始,厨房温度传感器出现周期性异常跳变模式:每隔约 30 分钟,在正常的半点/整点读数(约 23-24°C)之间,额外插入一个约 25.0°C 的异常读数(21:06→2500, 21:36→2502, 22:06→2498, 22:36→2501),此时厨房无人活动、灶具已关闭,这种精确周期性跳变不符合任何正常物理温度变化。", "推理步骤7: 客厅和卧室温度传感器全天读数平稳、符合日间升温夜间降温的自然规律,排除全屋环境异常,问题定位在厨房温度传感器本身。", "推理步骤8: 厨房窗户在 19:41 被打开后日志中无关闭记录,但这属于通风行为,不构成安全威胁;烟雾报警器全天未触发,排除火灾风险。"], "key_evidence": ["18:00 厨房温度从 24.73°C 突跳至 28.54°C,同期客厅/卧室无对应变化,灶具未开启", "18:57 和 19:42 厨房温度传感器两次报 None(数据丢失),分别对应灶具开启后和关闭后", "21:06/21:36/22:06/22:36 出现周期性约 25.0°C 的异常跳变读数,与正常半小时读数(约 23.5°C)偏差明显,且厨房无任何活动", "客厅和卧室传感器全天数据正常,排除环境因素"], "recommended_actions": ["检查厨房温度传感器的硬件状态,包括电池电量、接线端子和安装位置,排除接触不良或受潮", "确认传感器是否靠近灶具或蒸汽源,必要时调整安装位置避免热源干扰", "如传感器支持固件更新,尝试重置或升级固件以排除软件故障", "若问题持续,建议更换厨房温度传感器,并在更换前将厨房烟雾报警器作为主要安全监测手段", "关注厨房窗户是否仍处于打开状态(19:41 开窗后无关闭记录),夜间建议关闭以确保安全"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.525599002838135, "api_error": null} {"episode_id": "SQ3_FP_A_0661", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_A_0661.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261290, "scenario_id": "WD-01", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-06T20:12:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.85°C),疑似传感器故障或间歇性通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中共出现 6 次 MeasuredValue = None 的情况(09:23、09:41、12:13、12:46、17:59、18:50),均发生在灶具开启或关闭前后。虽然灶具使用时传感器读数受热干扰可以理解,但 Matter 协议下 MeasuredValue 报告 None 通常意味着传感器无法完成有效测量,这不是正常的高温读数,而是测量失败。\",\n \"推理步骤2: 更关键的是,12:00 厨房温度传感器报告 2985(即 29.85°C),而此时灶具并未开启(灶具在 12:12 才开启)。同一时刻客厅为 25.88°C、卧室为 24.75°C,厨房比其他房间高出约 4-5°C,且 11:30 时厨房还是 25.56°C,半小时内跳升超过 4°C,没有对应的设备活动来解释这一突变。12:30 仍维持在 29.76°C。这可能是传感器读数漂移或故障的表现。\",\n \"推理步骤3: 其余行为模式均属正常——住户约 08:36 起床,早中晚三次使用灶具做饭,做饭后开窗通风,白天开空调制冷(SystemMode=3),晚间 22:51 关灯锁门就寝,符合独居一室一厅的日常作息。\",\n \"推理步骤4: 卫生间 20:12 的漏水报警持续仅 2 分钟,且当时有人在卫生间(occupancy=1),大概率是洗浴或用水时短暂溅水触发,随即恢复,属于正常误触发,不构成真实漏水威胁。\",\n \"推理步骤5: 入侵风险方面,全天入户门仅在 22:51 有一次关门并自动上锁的记录,窗户传感器仅在做饭后开窗通风时触发,无深夜异常开门/开窗事件,无安全威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None,表明传感器测量失败\",\n \"12:00 厨房温度突然跳升至 29.85°C(前一读数 25.56°C),灶具当时未开启,无合理热源解释该突变\",\n \"12:30 厨房温度仍为 29.76°C,而 13:00 骤降回 25.57°C,读数波动不符合自然温度变化规律\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时测量失败(报告 None)\",\n \"关注 12:00 的异常高温读数是否在后续日志中重复出现,若持续出现无热源情况下的温度突变,建议更换或重新校准该传感器\",\n \"卫生间漏水传感器的短暂触发无需紧急处理,但建议定期检查卫生间管道接口,确保无慢性渗漏\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.85°C),疑似传感器故障或间歇性通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中共出现 6 次 MeasuredValue = None 的情况(09:23、09:41、12:13、12:46、17:59、18:50),均发生在灶具开启或关闭前后。虽然灶具使用时传感器读数受热干扰可以理解,但 Matter 协议下 MeasuredValue 报告 None 通常意味着传感器无法完成有效测量,这不是正常的高温读数,而是测量失败。", "推理步骤2: 更关键的是,12:00 厨房温度传感器报告 2985(即 29.85°C),而此时灶具并未开启(灶具在 12:12 才开启)。同一时刻客厅为 25.88°C、卧室为 24.75°C,厨房比其他房间高出约 4-5°C,且 11:30 时厨房还是 25.56°C,半小时内跳升超过 4°C,没有对应的设备活动来解释这一突变。12:30 仍维持在 29.76°C。这可能是传感器读数漂移或故障的表现。", "推理步骤3: 其余行为模式均属正常——住户约 08:36 起床,早中晚三次使用灶具做饭,做饭后开窗通风,白天开空调制冷(SystemMode=3),晚间 22:51 关灯锁门就寝,符合独居一室一厅的日常作息。", "推理步骤4: 卫生间 20:12 的漏水报警持续仅 2 分钟,且当时有人在卫生间(occupancy=1),大概率是洗浴或用水时短暂溅水触发,随即恢复,属于正常误触发,不构成真实漏水威胁。", "推理步骤5: 入侵风险方面,全天入户门仅在 22:51 有一次关门并自动上锁的记录,窗户传感器仅在做饭后开窗通风时触发,无深夜异常开门/开窗事件,无安全威胁。"], "key_evidence": ["厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None,表明传感器测量失败", "12:00 厨房温度突然跳升至 29.85°C(前一读数 25.56°C),灶具当时未开启,无合理热源解释该突变", "12:30 厨房温度仍为 29.76°C,而 13:00 骤降回 25.57°C,读数波动不符合自然温度变化规律"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时测量失败(报告 None)", "关注 12:00 的异常高温读数是否在后续日志中重复出现,若持续出现无热源情况下的温度突变,建议更换或重新校准该传感器", "卫生间漏水传感器的短暂触发无需紧急处理,但建议定期检查卫生间管道接口,确保无慢性渗漏"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.425194025039673, "api_error": null} {"episode_id": "SQ3_FP_B_0560", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0560.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261189, "scenario_id": "DF-03", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-24T16:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.58°C),随后两次报告null值,疑似传感器故障;同时次卧在无人期间出现间歇性运动检测。\",\n \"reasoning\": [\n \"推理步骤1: 分析全天温度趋势——所有房间从凌晨约23°C逐步升至中午约25.8°C,下午回落,符合夏季自然温度变化曲线,各房间温度高度一致。\",\n \"推理步骤2: 18:00厨房温度传感器突然报告2858(28.58°C),而同一时刻其他三个房间均在24.5°C左右,厨房温度比其他房间高出约4°C,且此时灶具尚未开启(灶具18:45才开),排除烹饪导致的正常升温。\",\n \"推理步骤3: 18:30厨房温度仍为2850(28.50°C),持续异常高。但18:46和19:27两次报告MeasuredValue=None(空值),说明传感器出现了读数故障。19:00恢复正常值2437后,后续读数回归正常趋势。\",\n \"推理步骤4: 综合来看,18:00的异常高温更可能是传感器故障的前兆表现(漂移/误读),而非真实的环境温度突变。如果厨房真的达到28.5°C,烟雾报警器未触发、其他房间温度无连带变化,进一步佐证这是传感器自身问题。\",\n \"推理步骤5: 次卧在16:13-16:19出现两次短暂运动检测(每次不到1分钟),但全天无人开灯、无门锁活动表明住户07:15已出门、18:09才回家。空房期间的短暂运动信号可能是宠物、窗帘飘动或传感器误触发,威胁等级较低。\",\n \"推理步骤6: 入侵风险排查——07:15住户手动开锁出门,门自动上锁;18:09手动开锁回家,21:54门关闭自动上锁。全天入户门锁状态正常,无未授权开锁事件。\",\n \"推理步骤7: 其他安全项均正常:烟雾报警器未触发、漏水传感器未报警、灶具使用时长约40分钟属合理范围、洗碗机正常启动。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器读数2858,比同时刻其他房间高约400个单位(约4°C),且灶具尚未开启\",\n \"18:30厨房温度仍为2850,持续异常偏高\",\n \"18:46和19:27厨房温度传感器两次报告MeasuredValue=None,表明传感器存在故障\",\n \"19:00之后厨房温度恢复正常值并与其他房间趋势一致,说明异常为暂时性故障\",\n \"16:13-16:19次卧在住户外出期间出现两次短暂运动检测(45秒和50秒)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或重新校准,必要时更换传感器\",\n \"关注厨房温度传感器后续是否再次出现null值或异常跳变,如频繁发生应立即更换\",\n \"排查次卧运动传感器误触发原因(确认是否有宠物、检查传感器灵敏度设置、排除窗帘等干扰源)\",\n \"如家中无宠物且次卧窗户关闭,建议调取次卧运动传感器历史记录,确认是否为周期性误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.58°C),随后两次报告null值,疑似传感器故障;同时次卧在无人期间出现间歇性运动检测。", "reasoning": ["推理步骤1: 分析全天温度趋势——所有房间从凌晨约23°C逐步升至中午约25.8°C,下午回落,符合夏季自然温度变化曲线,各房间温度高度一致。", "推理步骤2: 18:00厨房温度传感器突然报告2858(28.58°C),而同一时刻其他三个房间均在24.5°C左右,厨房温度比其他房间高出约4°C,且此时灶具尚未开启(灶具18:45才开),排除烹饪导致的正常升温。", "推理步骤3: 18:30厨房温度仍为2850(28.50°C),持续异常高。但18:46和19:27两次报告MeasuredValue=None(空值),说明传感器出现了读数故障。19:00恢复正常值2437后,后续读数回归正常趋势。", "推理步骤4: 综合来看,18:00的异常高温更可能是传感器故障的前兆表现(漂移/误读),而非真实的环境温度突变。如果厨房真的达到28.5°C,烟雾报警器未触发、其他房间温度无连带变化,进一步佐证这是传感器自身问题。", "推理步骤5: 次卧在16:13-16:19出现两次短暂运动检测(每次不到1分钟),但全天无人开灯、无门锁活动表明住户07:15已出门、18:09才回家。空房期间的短暂运动信号可能是宠物、窗帘飘动或传感器误触发,威胁等级较低。", "推理步骤6: 入侵风险排查——07:15住户手动开锁出门,门自动上锁;18:09手动开锁回家,21:54门关闭自动上锁。全天入户门锁状态正常,无未授权开锁事件。", "推理步骤7: 其他安全项均正常:烟雾报警器未触发、漏水传感器未报警、灶具使用时长约40分钟属合理范围、洗碗机正常启动。"], "key_evidence": ["18:00厨房温度传感器读数2858,比同时刻其他房间高约400个单位(约4°C),且灶具尚未开启", "18:30厨房温度仍为2850,持续异常偏高", "18:46和19:27厨房温度传感器两次报告MeasuredValue=None,表明传感器存在故障", "19:00之后厨房温度恢复正常值并与其他房间趋势一致,说明异常为暂时性故障", "16:13-16:19次卧在住户外出期间出现两次短暂运动检测(45秒和50秒)"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或重新校准,必要时更换传感器", "关注厨房温度传感器后续是否再次出现null值或异常跳变,如频繁发生应立即更换", "排查次卧运动传感器误触发原因(确认是否有宠物、检查传感器灵敏度设置、排除窗帘等干扰源)", "如家中无宠物且次卧窗户关闭,建议调取次卧运动传感器历史记录,确认是否为周期性误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.202647924423218, "api_error": null} {"episode_id": "SQ3_FP_B_0562", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0562.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261191, "scenario_id": "DF-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-16T13:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时主卧空调在无人在家期间被远程开启,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 梳理住户作息——06:06 主卧检测到人,06:32 开始做早餐,07:33 关灯、手动开锁出门、自动上锁,判断住户约 07:33 离家上班。16:32 手动开锁回家但未关门(无 StateValue=True 记录),18:00 再次开锁进门(可能是家庭第二位成员到家),22:32 关灯、关门上锁、进主卧就寝。\",\n \"推理步骤2: 厨房温度传感器在 06:33、07:14、18:30、19:09 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久。虽然灶具使用可能导致传感器短暂受热干扰,但正常传感器应报告数值而非 None。连续多次出现 None 表明传感器可能存在固件缺陷或硬件故障,在高温环境下读数溢出或通信中断。\",\n \"推理步骤3: 13:22 主卧空调被开启(制冷模式 SystemMode=3),但住户 07:33 已离家,家中无人(无任何运动传感器触发、无门锁操作)。这说明空调是通过远程/定时方式开启的。虽然这可能是住户通过手机远程预冷房间的正常行为,但也需确认是否为未授权的远程访问。\",\n \"推理步骤4: 16:32 入户门被手动开锁、门打开、玄关检测到人,但之后没有记录门关闭(BooleanState.StateValue = True)的事件,直到 22:32 才记录关门。这意味着入户门可能从 16:32 到 22:32 长时间处于未关闭状态,存在安全隐患。\",\n \"推理步骤5: 厨房窗户在 07:13:30 和 19:08:30 两次打开(StateValue=False),但日志中没有记录关闭事件。做饭后开窗通风是合理行为,但如果窗户一直未关(尤其是夜间离开厨房后),存在一定安全风险。\",\n \"推理步骤6: 温度趋势整体正常——凌晨约 22.9-23.1°C,白天逐步升至 25-26°C 峰值,傍晚回落。18:00 开启客厅空调后客厅温度从约 24.7°C 降至 23.7°C 左右,符合制冷预期。无异常温升,烟雾报警器未触发,排除火灾风险。\",\n \"推理步骤7: 门锁操作均为手动开锁/自动上锁,未出现异常的远程解锁或暴力开锁事件,排除入侵风险。漏水传感器无报警,排除水患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:33、07:14、18:30、19:09 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"13:22 主卧空调远程开启(制冷模式),此时家中无人(07:33 已离家,16:32 才有人回来)\",\n \"16:32 入户门开锁后无关门记录,直到 22:32 才记录门关闭,门可能长时间敞开\",\n \"厨房窗户两次打开后均无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否需要更换或升级固件,重点排查高温环境下的读数异常\",\n \"确认 13:22 主卧空调的开启是否为住户本人的远程/定时操作,若非本人操作则检查智能家居账户安全(修改密码、启用双因素认证)\",\n \"建议为入户门设置「开门超时未关」的自动提醒规则,避免长时间门户大开\",\n \"建议为厨房窗户增加「睡前未关窗」的自动提醒,或在安防布防时检查所有窗户状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时主卧空调在无人在家期间被远程开启,需关注。", "reasoning": ["推理步骤1: 梳理住户作息——06:06 主卧检测到人,06:32 开始做早餐,07:33 关灯、手动开锁出门、自动上锁,判断住户约 07:33 离家上班。16:32 手动开锁回家但未关门(无 StateValue=True 记录),18:00 再次开锁进门(可能是家庭第二位成员到家),22:32 关灯、关门上锁、进主卧就寝。", "推理步骤2: 厨房温度传感器在 06:33、07:14、18:30、19:09 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久。虽然灶具使用可能导致传感器短暂受热干扰,但正常传感器应报告数值而非 None。连续多次出现 None 表明传感器可能存在固件缺陷或硬件故障,在高温环境下读数溢出或通信中断。", "推理步骤3: 13:22 主卧空调被开启(制冷模式 SystemMode=3),但住户 07:33 已离家,家中无人(无任何运动传感器触发、无门锁操作)。这说明空调是通过远程/定时方式开启的。虽然这可能是住户通过手机远程预冷房间的正常行为,但也需确认是否为未授权的远程访问。", "推理步骤4: 16:32 入户门被手动开锁、门打开、玄关检测到人,但之后没有记录门关闭(BooleanState.StateValue = True)的事件,直到 22:32 才记录关门。这意味着入户门可能从 16:32 到 22:32 长时间处于未关闭状态,存在安全隐患。", "推理步骤5: 厨房窗户在 07:13:30 和 19:08:30 两次打开(StateValue=False),但日志中没有记录关闭事件。做饭后开窗通风是合理行为,但如果窗户一直未关(尤其是夜间离开厨房后),存在一定安全风险。", "推理步骤6: 温度趋势整体正常——凌晨约 22.9-23.1°C,白天逐步升至 25-26°C 峰值,傍晚回落。18:00 开启客厅空调后客厅温度从约 24.7°C 降至 23.7°C 左右,符合制冷预期。无异常温升,烟雾报警器未触发,排除火灾风险。", "推理步骤7: 门锁操作均为手动开锁/自动上锁,未出现异常的远程解锁或暴力开锁事件,排除入侵风险。漏水传感器无报警,排除水患。"], "key_evidence": ["厨房温度传感器在 06:33、07:14、18:30、19:09 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "13:22 主卧空调远程开启(制冷模式),此时家中无人(07:33 已离家,16:32 才有人回来)", "16:32 入户门开锁后无关门记录,直到 22:32 才记录门关闭,门可能长时间敞开", "厨房窗户两次打开后均无关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否需要更换或升级固件,重点排查高温环境下的读数异常", "确认 13:22 主卧空调的开启是否为住户本人的远程/定时操作,若非本人操作则检查智能家居账户安全(修改密码、启用双因素认证)", "建议为入户门设置「开门超时未关」的自动提醒规则,避免长时间门户大开", "建议为厨房窗户增加「睡前未关窗」的自动提醒,或在安防布防时检查所有窗户状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.48908042907715, "api_error": null} {"episode_id": "SQ3_FP_B_0563", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0563.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261192, "scenario_id": "DF-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-21T09:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"过去24小时内所有设备状态正常,温度变化符合夏季昼夜自然规律,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器的周期性读数(每30分钟)和一次主卧空调开启事件,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。\",\n \"推理步骤2: 温度变化呈现典型的夏季昼夜曲线——凌晨最低约22.9°C,中午峰值约25.8°C,傍晚逐步回落至23.3°C,四个房间温度走势高度一致,无单一房间异常升温或骤降。\",\n \"推理步骤3: 主卧空调在09:32开启,当时主卧温度已达25.0°C,属于合理的降温操作。开启后主卧温度在整点读数与其他房间同步上升的同时,中间时刻(xx:02)出现额外的较低读数(25.02→24.98→25.01),说明空调在持续工作并有效控温,行为完全正常。\",\n \"推理步骤4: 全天没有出现任何入侵指标(门锁异常开启、深夜运动检测)、火灾指标(厨房温度骤升、烟雾报警)、漏水报警或设备故障信号。\"\n ],\n \"key_evidence\": [\n \"四个房间温度传感器全天走势一致,符合夏季自然昼夜温差曲线(约22.9°C~25.8°C)\",\n \"主卧空调09:32开启后,主卧温度在后续中间时刻读数(25.02/24.98/25.01°C)显示空调正常制冷工作\",\n \"全天无门锁、门窗传感器、运动传感器、烟雾/漏水报警器的异常事件记录\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,家庭设备运行正常。\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "过去24小时内所有设备状态正常,温度变化符合夏季昼夜自然规律,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器的周期性读数(每30分钟)和一次主卧空调开启事件,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。", "推理步骤2: 温度变化呈现典型的夏季昼夜曲线——凌晨最低约22.9°C,中午峰值约25.8°C,傍晚逐步回落至23.3°C,四个房间温度走势高度一致,无单一房间异常升温或骤降。", "推理步骤3: 主卧空调在09:32开启,当时主卧温度已达25.0°C,属于合理的降温操作。开启后主卧温度在整点读数与其他房间同步上升的同时,中间时刻(xx:02)出现额外的较低读数(25.02→24.98→25.01),说明空调在持续工作并有效控温,行为完全正常。", "推理步骤4: 全天没有出现任何入侵指标(门锁异常开启、深夜运动检测)、火灾指标(厨房温度骤升、烟雾报警)、漏水报警或设备故障信号。"], "key_evidence": ["四个房间温度传感器全天走势一致,符合夏季自然昼夜温差曲线(约22.9°C~25.8°C)", "主卧空调09:32开启后,主卧温度在后续中间时刻读数(25.02/24.98/25.01°C)显示空调正常制冷工作", "全天无门锁、门窗传感器、运动传感器、烟雾/漏水报警器的异常事件记录"], "recommended_actions": ["无需采取任何措施,家庭设备运行正常。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.435903072357178, "api_error": null} {"episode_id": "SQ3_FP_B_0572", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0572.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261201, "scenario_id": "DF-03", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "master_bedroom", "injection_time": "2026-06-28T13:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在12:00出现异常高温读数(29.82°C),疑似传感器故障或灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30-23:30)的整体活动模式——住户在家做晚饭(18:02开灶,18:44关灶),之后启动洗碗机,晚间22:57关灯、关空调、锁门入睡,属于正常生活作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(08:58、09:36、12:11、12:53、18:03、18:45),说明传感器在灶具工作期间或关闭后短暂失效,这在一天内反复出现共6次。\",\n \"推理步骤3: 12:00时厨房温度传感器报告2982(29.82°C),而同一时刻其他房间温度约25.7-25.9°C,厨房比其他房间高出约4°C。虽然灶具在12:10才开启,但该读数出现在灶具开启前,存在异常跳变。\",\n \"推理步骤4: 12:30时厨房温度仍为2977(29.77°C),灶具已开启20分钟,此时高温可解释为烹饪导致。但12:00的异常高温无明确热源解释,可能是传感器受热残留影响或传感器本身存在间歇性故障。\",\n \"推理步骤5: 安全方面——门锁在22:57自动上锁、入户门关闭,无异常开锁事件;烟雾报警器未触发;漏水传感器未报警;主卧短暂的运动检测(13:09-13:15)符合午间活动模式。整体无入侵或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内6次报告 None 值(均在灶具开启/关闭前后)\",\n \"12:00厨房温度异常跳至2982(29.82°C),灶具尚未开启(12:10才开),与其他房间温差约4°C\",\n \"12:30厨房温度仍为2977,持续异常高温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致热辐射干扰和读数异常\",\n \"排查传感器硬件状态,多次 None 值可能表明传感器连接不稳定或需要更换\",\n \"考虑为厨房温度传感器设置合理阈值告警,当温度异常偏高且灶具未开启时主动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在12:00出现异常高温读数(29.82°C),疑似传感器故障或灶具热辐射干扰。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30-23:30)的整体活动模式——住户在家做晚饭(18:02开灶,18:44关灶),之后启动洗碗机,晚间22:57关灯、关空调、锁门入睡,属于正常生活作息。", "推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(08:58、09:36、12:11、12:53、18:03、18:45),说明传感器在灶具工作期间或关闭后短暂失效,这在一天内反复出现共6次。", "推理步骤3: 12:00时厨房温度传感器报告2982(29.82°C),而同一时刻其他房间温度约25.7-25.9°C,厨房比其他房间高出约4°C。虽然灶具在12:10才开启,但该读数出现在灶具开启前,存在异常跳变。", "推理步骤4: 12:30时厨房温度仍为2977(29.77°C),灶具已开启20分钟,此时高温可解释为烹饪导致。但12:00的异常高温无明确热源解释,可能是传感器受热残留影响或传感器本身存在间歇性故障。", "推理步骤5: 安全方面——门锁在22:57自动上锁、入户门关闭,无异常开锁事件;烟雾报警器未触发;漏水传感器未报警;主卧短暂的运动检测(13:09-13:15)符合午间活动模式。整体无入侵或火灾迹象。"], "key_evidence": ["厨房温度传感器一天内6次报告 None 值(均在灶具开启/关闭前后)", "12:00厨房温度异常跳至2982(29.82°C),灶具尚未开启(12:10才开),与其他房间温差约4°C", "12:30厨房温度仍为2977,持续异常高温"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距灶具过近导致热辐射干扰和读数异常", "排查传感器硬件状态,多次 None 值可能表明传感器连接不稳定或需要更换", "考虑为厨房温度传感器设置合理阈值告警,当温度异常偏高且灶具未开启时主动通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.21379518508911, "api_error": null} {"episode_id": "SQ3_FP_B_0575", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0575.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261204, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-08T06:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时 16:07 入户门开锁后门未关闭/未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时窗口(约17:30–23:30)。17:50 有人通过手动方式开锁进门,随后客厅灯、空调开启(制冷模式 SystemMode=3),这是正常的下班回家行为。\",\n \"推理步骤2: 18:11 厨房灯和灶具开启,18:12 厨房温度传感器报告 MeasuredValue=None。19:26 灶具关闭、厨房窗户打开通风,19:27 温度传感器再次报告 None。这是当天第二次出现同样的模式(早晨 06:41–06:52 也出现过),说明厨房温度传感器在灶具使用期间会持续失效,可能是高温超出量程或传感器本身存在故障。\",\n \"推理步骤3: 但 18:30 和 19:30 的定时温度读数又恢复了正常值(2461、2440),说明传感器并非完全损坏,而是在灶具刚开启和刚关闭时出现短暂的读数丢失。这种间歇性 None 值会导致烟雾/火灾监测出现盲区。\",\n \"推理步骤4: 回看 16:07 的事件——入户门通过手动方式解锁(LockState=2 即 Unlocked),门传感器显示门被打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:13:28 门才关闭并自动上锁。这意味着从 16:07 到 17:50(约1小时43分钟)入户门处于开启未锁状态,且期间无人在家(07:21 已出门)。虽然 17:50 住户回家后门最终在 22:13 关闭上锁,但 16:07 的开门事件来源不明。\",\n \"推理步骤5: 22:13 的就寝流程正常:客厅灯关闭、空调关闭、主卧窗帘关闭(100%)、入户门关闭上锁、主卧灯关闭。温度从傍晚约24.6°C 逐步下降到夜间约23.3°C,符合夏季自然降温规律。\",\n \"推理步骤6: 洗碗机 19:58 启动(OperationalState=1 即运行中),属于晚餐后正常使用。厨房窗户在做饭后打开通风也是合理行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 18:12 和 19:27 报告 MeasuredValue=None,与早晨 06:42、06:52 的模式一致,表明传感器在灶具使用前后存在反复性读数丢失\",\n \"16:07 入户门手动解锁并打开,但无对应的用户身份信息(OperationSource=Manual,无 UserIndex),且门持续开启近1小时43分钟直到住户 17:50 回家\",\n \"16:07 开门时家中无人(07:21 全员出门,所有运动传感器在此期间无触发记录),该开门事件来源可疑\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置\",\n \"排查 16:07 入户门手动开锁事件的来源——确认是否为家庭成员操作(如快递、家政人员),若无法确认则建议检查门锁是否存在物理安全隐患\",\n \"建议设置离家模式下的入户门开启告警,确保无人在家时任何开门事件都能即时推送通知\",\n \"考虑为厨房增加独立的高温报警机制,避免温度传感器失效时出现火灾监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时 16:07 入户门开锁后门未关闭/未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 分析过去6小时窗口(约17:30–23:30)。17:50 有人通过手动方式开锁进门,随后客厅灯、空调开启(制冷模式 SystemMode=3),这是正常的下班回家行为。", "推理步骤2: 18:11 厨房灯和灶具开启,18:12 厨房温度传感器报告 MeasuredValue=None。19:26 灶具关闭、厨房窗户打开通风,19:27 温度传感器再次报告 None。这是当天第二次出现同样的模式(早晨 06:41–06:52 也出现过),说明厨房温度传感器在灶具使用期间会持续失效,可能是高温超出量程或传感器本身存在故障。", "推理步骤3: 但 18:30 和 19:30 的定时温度读数又恢复了正常值(2461、2440),说明传感器并非完全损坏,而是在灶具刚开启和刚关闭时出现短暂的读数丢失。这种间歇性 None 值会导致烟雾/火灾监测出现盲区。", "推理步骤4: 回看 16:07 的事件——入户门通过手动方式解锁(LockState=2 即 Unlocked),门传感器显示门被打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:13:28 门才关闭并自动上锁。这意味着从 16:07 到 17:50(约1小时43分钟)入户门处于开启未锁状态,且期间无人在家(07:21 已出门)。虽然 17:50 住户回家后门最终在 22:13 关闭上锁,但 16:07 的开门事件来源不明。", "推理步骤5: 22:13 的就寝流程正常:客厅灯关闭、空调关闭、主卧窗帘关闭(100%)、入户门关闭上锁、主卧灯关闭。温度从傍晚约24.6°C 逐步下降到夜间约23.3°C,符合夏季自然降温规律。", "推理步骤6: 洗碗机 19:58 启动(OperationalState=1 即运行中),属于晚餐后正常使用。厨房窗户在做饭后打开通风也是合理行为。"], "key_evidence": ["厨房温度传感器在 18:12 和 19:27 报告 MeasuredValue=None,与早晨 06:42、06:52 的模式一致,表明传感器在灶具使用前后存在反复性读数丢失", "16:07 入户门手动解锁并打开,但无对应的用户身份信息(OperationSource=Manual,无 UserIndex),且门持续开启近1小时43分钟直到住户 17:50 回家", "16:07 开门时家中无人(07:21 全员出门,所有运动传感器在此期间无触发记录),该开门事件来源可疑"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置", "排查 16:07 入户门手动开锁事件的来源——确认是否为家庭成员操作(如快递、家政人员),若无法确认则建议检查门锁是否存在物理安全隐患", "建议设置离家模式下的入户门开启告警,确保无人在家时任何开门事件都能即时推送通知", "考虑为厨房增加独立的高温报警机制,避免温度传感器失效时出现火灾监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.643305778503418, "api_error": null} {"episode_id": "SQ3_FP_B_0576", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0576.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261205, "scenario_id": "BA-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "living_room", "injection_time": "2026-06-11T19:39:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.56°C~28.60°C),随后在做饭期间两次报告null值,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 18:00时所有房间温度在24.50°C~24.60°C范围内,但厨房温度传感器突然跳升至28.56°C,比其他房间高出约4°C,且此时灶具尚未开启(灶具在18:55才打开),不存在合理的热源解释这一跳变。\",\n \"推理步骤2: 18:30时厨房温度继续维持在28.60°C的异常高位,而其他房间温度正常波动在24.63°C~24.70°C,进一步排除了全屋升温的可能性,说明这是厨房传感器的局部异常。\",\n \"推理步骤3: 18:56和19:27两个时间点,厨房温度传感器报告MeasuredValue=None(空值),这发生在灶具使用期间(18:55~19:26)。传感器在高温环境下连续出现null读数,表明传感器可能因过热或硬件故障导致读数失效。\",\n \"推理步骤4: 19:00时厨房温度突然恢复到24.27°C的正常水平,与其他房间一致,此后读数恢复正常。这种从28.6°C骤降到24.27°C的跳变不符合物理降温规律,进一步佐证了传感器故障而非真实温度变化。\",\n \"推理步骤5: 其他方面均正常——住户早晨7:36出门(手动开锁、开门、关门、自动上锁),傍晚18:00回家(开锁、进门、开灯、开空调),22:01关灯关空调就寝,入户门自动上锁,属于典型的上班族单人作息模式,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器读数2856(28.56°C),比同时刻其他房间高约4°C,且灶具未开启\",\n \"18:30厨房温度传感器读数2860(28.60°C),异常高温持续\",\n \"18:56和19:27厨房温度传感器报告MeasuredValue=None,传感器读数丢失\",\n \"19:00厨房温度从28.60°C骤降至24.27°C,不符合正常物理降温曲线\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具或其他热源过近,必要时重新安置\",\n \"对厨房温度传感器进行硬件诊断或固件更新,排查null读数和异常跳变的根因\",\n \"如传感器持续出现异常读数,建议更换传感器,因为厨房温度监测对烟雾/火灾预警联动至关重要\",\n \"考虑为厨房温度传感器设置合理的异常阈值告警(如与其他房间温差超过3°C时触发提醒),以便及时发现类似故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.56°C~28.60°C),随后在做饭期间两次报告null值,疑似传感器故障。", "reasoning": ["推理步骤1: 18:00时所有房间温度在24.50°C~24.60°C范围内,但厨房温度传感器突然跳升至28.56°C,比其他房间高出约4°C,且此时灶具尚未开启(灶具在18:55才打开),不存在合理的热源解释这一跳变。", "推理步骤2: 18:30时厨房温度继续维持在28.60°C的异常高位,而其他房间温度正常波动在24.63°C~24.70°C,进一步排除了全屋升温的可能性,说明这是厨房传感器的局部异常。", "推理步骤3: 18:56和19:27两个时间点,厨房温度传感器报告MeasuredValue=None(空值),这发生在灶具使用期间(18:55~19:26)。传感器在高温环境下连续出现null读数,表明传感器可能因过热或硬件故障导致读数失效。", "推理步骤4: 19:00时厨房温度突然恢复到24.27°C的正常水平,与其他房间一致,此后读数恢复正常。这种从28.6°C骤降到24.27°C的跳变不符合物理降温规律,进一步佐证了传感器故障而非真实温度变化。", "推理步骤5: 其他方面均正常——住户早晨7:36出门(手动开锁、开门、关门、自动上锁),傍晚18:00回家(开锁、进门、开灯、开空调),22:01关灯关空调就寝,入户门自动上锁,属于典型的上班族单人作息模式,无入侵迹象。"], "key_evidence": ["18:00厨房温度传感器读数2856(28.56°C),比同时刻其他房间高约4°C,且灶具未开启", "18:30厨房温度传感器读数2860(28.60°C),异常高温持续", "18:56和19:27厨房温度传感器报告MeasuredValue=None,传感器读数丢失", "19:00厨房温度从28.60°C骤降至24.27°C,不符合正常物理降温曲线"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具或其他热源过近,必要时重新安置", "对厨房温度传感器进行硬件诊断或固件更新,排查null读数和异常跳变的根因", "如传感器持续出现异常读数,建议更换传感器,因为厨房温度监测对烟雾/火灾预警联动至关重要", "考虑为厨房温度传感器设置合理的异常阈值告警(如与其他房间温差超过3°C时触发提醒),以便及时发现类似故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.726134777069092, "api_error": null} {"episode_id": "SQ3_FP_B_0582", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0582.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261211, "scenario_id": "DF-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-12T10:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次空值,疑似传感器故障,同时存在做饭后厨房窗户未关闭的安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.54°C,而同一时刻其他三个房间温度均在 24.5°C 左右,温差接近 4°C,这不符合正常的环境温度变化规律。\",\n \"推理步骤2: 18:30 厨房温度传感器继续上报 28.69°C,此时灶具尚未开启(灶具在 18:56 才开启),排除了烹饪导致升温的可能,说明该高温读数是传感器自身异常。\",\n \"推理步骤3: 18:57 和 19:50 厨房温度传感器两次上报 MeasuredValue = None(空值),正常传感器不应产生空值读数,进一步印证传感器存在故障。\",\n \"推理步骤4: 19:00 厨房温度传感器恢复上报 24.31°C,与其他房间温度一致,说明异常是间歇性的,符合传感器接触不良或硬件老化的特征。\",\n \"推理步骤5: 19:49 做饭结束后厨房窗户被打开(kitchen_window_contact StateValue=False),但直到日志结束(23:30)都没有关闭记录。住户 21:51 已关灯锁门离开/就寝,厨房窗户仍处于开启状态,存在安全隐患。\",\n \"推理步骤6: 其他方面均正常——早晨 07:25 手动开锁出门、自动回锁,傍晚 18:04 回家开锁、开灯开空调,21:51 关灯关空调锁门,符合单人上班族的日常作息。入户门锁操作均为合法方式(Manual/Auto),无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数 2854(28.54°C),较其他房间高出约 4°C,且灶具未开启\",\n \"18:30 厨房温度传感器读数 2869(28.69°C),持续异常高温\",\n \"18:57 和 19:50 厨房温度传感器两次上报 MeasuredValue = None\",\n \"19:49 厨房窗户打开后至日志结束未见关闭记录,住户已于 21:51 就寝/离开\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除接触不良和老化问题\",\n \"关闭厨房窗户,或设置自动化规则:当住户就寝/离家时检测未关闭的窗户并发出提醒\",\n \"为厨房温度传感器设置异常值告警规则:当读数突变超过 3°C 或出现空值时立即通知用户\",\n \"考虑将厨房烟雾报警器与温度传感器联动,当温度传感器失效时提升烟雾报警器的灵敏度作为补偿\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次空值,疑似传感器故障,同时存在做饭后厨房窗户未关闭的安全隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.54°C,而同一时刻其他三个房间温度均在 24.5°C 左右,温差接近 4°C,这不符合正常的环境温度变化规律。", "推理步骤2: 18:30 厨房温度传感器继续上报 28.69°C,此时灶具尚未开启(灶具在 18:56 才开启),排除了烹饪导致升温的可能,说明该高温读数是传感器自身异常。", "推理步骤3: 18:57 和 19:50 厨房温度传感器两次上报 MeasuredValue = None(空值),正常传感器不应产生空值读数,进一步印证传感器存在故障。", "推理步骤4: 19:00 厨房温度传感器恢复上报 24.31°C,与其他房间温度一致,说明异常是间歇性的,符合传感器接触不良或硬件老化的特征。", "推理步骤5: 19:49 做饭结束后厨房窗户被打开(kitchen_window_contact StateValue=False),但直到日志结束(23:30)都没有关闭记录。住户 21:51 已关灯锁门离开/就寝,厨房窗户仍处于开启状态,存在安全隐患。", "推理步骤6: 其他方面均正常——早晨 07:25 手动开锁出门、自动回锁,傍晚 18:04 回家开锁、开灯开空调,21:51 关灯关空调锁门,符合单人上班族的日常作息。入户门锁操作均为合法方式(Manual/Auto),无异常入侵迹象。"], "key_evidence": ["18:00 厨房温度传感器读数 2854(28.54°C),较其他房间高出约 4°C,且灶具未开启", "18:30 厨房温度传感器读数 2869(28.69°C),持续异常高温", "18:57 和 19:50 厨房温度传感器两次上报 MeasuredValue = None", "19:49 厨房窗户打开后至日志结束未见关闭记录,住户已于 21:51 就寝/离开"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除接触不良和老化问题", "关闭厨房窗户,或设置自动化规则:当住户就寝/离家时检测未关闭的窗户并发出提醒", "为厨房温度传感器设置异常值告警规则:当读数突变超过 3°C 或出现空值时立即通知用户", "考虑将厨房烟雾报警器与温度传感器联动,当温度传感器失效时提升烟雾报警器的灵敏度作为补偿"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.86128282546997, "api_error": null} {"episode_id": "SQ3_FP_B_0580", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0580.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261209, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "second_bedroom", "injection_time": "2026-06-02T17:26:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间出现异常高温读数及两次 null 值,疑似传感器故障或安装位置不当,同时厨房窗户在做饭结束后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 全屋温度整体趋势正常——凌晨约23°C,午间升至约25.9°C,晚间回落至约23.3°C,符合夏季自然昼夜温差规律。客厅、主卧、次卧三个传感器始终保持高度一致,无异常。\",\n \"推理步骤2: 厨房温度传感器在17:26灶具开启后出现剧烈飙升:17:30读数2475→17:31骤升至2700(+2.25°C/1分钟)→17:56达2750→18:00达2862(28.62°C),而同时段其他房间温度仅约24.6°C。厨房比其他房间高出约4°C是合理的,但在1分钟内跳升2.25°C、且峰值达28.62°C(比其他房间高约4°C)的幅度偏大,说明传感器可能距灶具过近,受到直接热辐射影响。\",\n \"推理步骤3: 更关键的是,厨房温度传感器在18:54和19:39两次报告 MeasuredValue = None(空值)。Matter协议下温度传感器返回null通常意味着传感器读数超出量程、通信故障或硬件异常。第一次null出现在18:53灶具二次开启后1分钟,第二次null出现在19:38灶具关闭后1分钟。两次null都与灶具状态切换高度相关,暗示传感器可能受灶具电磁干扰或热冲击影响。\",\n \"推理步骤4: 19:00厨房温度恢复正常读数2441,说明传感器并非永久损坏,而是间歇性故障。但这种间歇性null值会导致依赖温度数据的安全自动化(如高温报警、灶具自动关断)在关键时刻失效,存在安全隐患。\",\n \"推理步骤5: 19:38灶具关闭后,19:38:30厨房窗户被打开(StateValue=False),但直到日志结束(23:30)都没有关闭记录。夜间住户已入睡(22:13关灯锁门),厨房窗户整夜敞开存在安全风险。\",\n \"推理步骤6: 其他行为均属正常——早晨06:48起床如厕、07:06去厨房、07:17出门上班(手动开锁→开关门→自动上锁),傍晚18:22回家(开锁进门→开灯开空调),22:13就寝(关灯关空调→确认门锁)。入户门锁操作源和时序合理,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:54和19:39两次报告 MeasuredValue = None,与灶具开关操作高度相关\",\n \"厨房温度在17:30→17:31一分钟内从2475跳升至2700(+2.25°C),17:56达2750,18:00达2862,升温速率和峰值异常\",\n \"18:30厨房温度仍高达2851(28.51°C),而其他房间仅约24.6°C,温差超过4°C\",\n \"厨房窗户19:38:30打开后至日志结束(23:30)未关闭,住户22:13已就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确保其远离灶具直接热辐射和电磁干扰范围,建议距灶具至少1米以上\",\n \"排查厨房温度传感器硬件状态,重点关注间歇性null值问题,必要时更换传感器\",\n \"设置自动化规则:当厨房温度传感器返回null值时立即告警,避免安全监测盲区\",\n \"添加厨房窗户未关闭提醒:当就寝模式激活(如全屋灯关闭+门锁上锁)时,检查所有窗户状态并提醒住户关闭\",\n \"考虑为灶具添加使用时长上限自动关断规则,防止温度传感器故障时无法触发高温保护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间出现异常高温读数及两次 null 值,疑似传感器故障或安装位置不当,同时厨房窗户在做饭结束后未关闭。", "reasoning": ["推理步骤1: 全屋温度整体趋势正常——凌晨约23°C,午间升至约25.9°C,晚间回落至约23.3°C,符合夏季自然昼夜温差规律。客厅、主卧、次卧三个传感器始终保持高度一致,无异常。", "推理步骤2: 厨房温度传感器在17:26灶具开启后出现剧烈飙升:17:30读数2475→17:31骤升至2700(+2.25°C/1分钟)→17:56达2750→18:00达2862(28.62°C),而同时段其他房间温度仅约24.6°C。厨房比其他房间高出约4°C是合理的,但在1分钟内跳升2.25°C、且峰值达28.62°C(比其他房间高约4°C)的幅度偏大,说明传感器可能距灶具过近,受到直接热辐射影响。", "推理步骤3: 更关键的是,厨房温度传感器在18:54和19:39两次报告 MeasuredValue = None(空值)。Matter协议下温度传感器返回null通常意味着传感器读数超出量程、通信故障或硬件异常。第一次null出现在18:53灶具二次开启后1分钟,第二次null出现在19:38灶具关闭后1分钟。两次null都与灶具状态切换高度相关,暗示传感器可能受灶具电磁干扰或热冲击影响。", "推理步骤4: 19:00厨房温度恢复正常读数2441,说明传感器并非永久损坏,而是间歇性故障。但这种间歇性null值会导致依赖温度数据的安全自动化(如高温报警、灶具自动关断)在关键时刻失效,存在安全隐患。", "推理步骤5: 19:38灶具关闭后,19:38:30厨房窗户被打开(StateValue=False),但直到日志结束(23:30)都没有关闭记录。夜间住户已入睡(22:13关灯锁门),厨房窗户整夜敞开存在安全风险。", "推理步骤6: 其他行为均属正常——早晨06:48起床如厕、07:06去厨房、07:17出门上班(手动开锁→开关门→自动上锁),傍晚18:22回家(开锁进门→开灯开空调),22:13就寝(关灯关空调→确认门锁)。入户门锁操作源和时序合理,无入侵迹象。"], "key_evidence": ["厨房温度传感器在18:54和19:39两次报告 MeasuredValue = None,与灶具开关操作高度相关", "厨房温度在17:30→17:31一分钟内从2475跳升至2700(+2.25°C),17:56达2750,18:00达2862,升温速率和峰值异常", "18:30厨房温度仍高达2851(28.51°C),而其他房间仅约24.6°C,温差超过4°C", "厨房窗户19:38:30打开后至日志结束(23:30)未关闭,住户22:13已就寝"], "recommended_actions": ["检查厨房温度传感器的安装位置,确保其远离灶具直接热辐射和电磁干扰范围,建议距灶具至少1米以上", "排查厨房温度传感器硬件状态,重点关注间歇性null值问题,必要时更换传感器", "设置自动化规则:当厨房温度传感器返回null值时立即告警,避免安全监测盲区", "添加厨房窗户未关闭提醒:当就寝模式激活(如全屋灯关闭+门锁上锁)时,检查所有窗户状态并提醒住户关闭", "考虑为灶具添加使用时长上限自动关断规则,防止温度传感器故障时无法触发高温保护"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 48.5964457988739, "api_error": null} {"episode_id": "SQ3_FP_B_0583", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0583.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261212, "scenario_id": "WD-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-06T15:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"过去6小时内所有设备行为均属正常,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 分析时间范围。任务要求分析过去6小时,日志截止时间为23:30,因此重点关注17:30~23:30的数据。\",\n \"推理步骤2: 温度趋势分析。17:30至23:30期间,所有四个房间的温度从约24.7~24.8°C逐步下降至约23.2~23.4°C,降幅约1.5°C,符合夏季傍晚到深夜的自然降温规律,各房间温度走势高度一致,无单一房间异常升温的迹象。\",\n \"推理步骤3: 漏水事件回顾。15:18发生的卫生间漏水告警(StateValue=True)在15:20即恢复(StateValue=False),持续仅2分钟,且当时卫生间有人(Occupancy=1)、灯已开启,说明住户正在使用卫生间,短暂溅水触发传感器后迅速恢复,属于正常使用场景,不构成漏水威胁。此事件发生在约8小时前,不在最近6小时窗口内。\",\n \"推理步骤4: 安防设备检查。过去6小时内,入户门锁、入户门传感器、各窗户传感器、阳台门传感器均无状态变化事件,说明门窗保持关闭/锁定状态,无入侵迹象。\",\n \"推理步骤5: 烟雾/火灾风险检查。厨房烟雾报警器在整个日志期间无任何告警事件,厨房温度与其他房间同步下降,无异常升温,排除火灾风险。\",\n \"推理步骤6: 运动传感器检查。过去6小时内无运动传感器触发记录,结合深夜时段(17:30后逐渐入夜),住户可能外出或已就寝,属于合理状态。\"\n ],\n \"key_evidence\": [\n \"17:30~23:30所有房间温度同步平稳下降约1.5°C,符合自然降温曲线\",\n \"过去6小时内无门锁、门窗传感器、烟雾报警器、漏水传感器的异常事件\",\n \"15:18的卫生间漏水告警仅持续2分钟且伴随人员在场,属正常使用误触发,且不在分析时间窗口内\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,家庭安全状态良好\",\n \"建议持续监控,保持传感器正常工作即可\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "过去6小时内所有设备行为均属正常,未发现安全威胁。", "reasoning": ["推理步骤1: 分析时间范围。任务要求分析过去6小时,日志截止时间为23:30,因此重点关注17:30~23:30的数据。", "推理步骤2: 温度趋势分析。17:30至23:30期间,所有四个房间的温度从约24.7~24.8°C逐步下降至约23.2~23.4°C,降幅约1.5°C,符合夏季傍晚到深夜的自然降温规律,各房间温度走势高度一致,无单一房间异常升温的迹象。", "推理步骤3: 漏水事件回顾。15:18发生的卫生间漏水告警(StateValue=True)在15:20即恢复(StateValue=False),持续仅2分钟,且当时卫生间有人(Occupancy=1)、灯已开启,说明住户正在使用卫生间,短暂溅水触发传感器后迅速恢复,属于正常使用场景,不构成漏水威胁。此事件发生在约8小时前,不在最近6小时窗口内。", "推理步骤4: 安防设备检查。过去6小时内,入户门锁、入户门传感器、各窗户传感器、阳台门传感器均无状态变化事件,说明门窗保持关闭/锁定状态,无入侵迹象。", "推理步骤5: 烟雾/火灾风险检查。厨房烟雾报警器在整个日志期间无任何告警事件,厨房温度与其他房间同步下降,无异常升温,排除火灾风险。", "推理步骤6: 运动传感器检查。过去6小时内无运动传感器触发记录,结合深夜时段(17:30后逐渐入夜),住户可能外出或已就寝,属于合理状态。"], "key_evidence": ["17:30~23:30所有房间温度同步平稳下降约1.5°C,符合自然降温曲线", "过去6小时内无门锁、门窗传感器、烟雾报警器、漏水传感器的异常事件", "15:18的卫生间漏水告警仅持续2分钟且伴随人员在场,属正常使用误触发,且不在分析时间窗口内"], "recommended_actions": ["无需采取任何措施,家庭安全状态良好", "建议持续监控,保持传感器正常工作即可"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.21465253829956, "api_error": null} {"episode_id": "SQ3_FP_B_0589", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0589.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261218, "scenario_id": "BA-05", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "kitchen", "injection_time": "2026-06-05T06:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰损坏\",\n \"reasoning\": [\n \"推理步骤1: 全屋温度趋势分析 — 00:00~05:30 各房间温度在 22.9~23.1°C 范围内平稳波动,06:00 起随日照升温,12:00~12:30 达到峰值约 25.8~25.9°C,之后逐步回落,符合夏季自然温度曲线,整体正常。\",\n \"推理步骤2: 厨房温度传感器异常跳变 — 19:00 时客厅/主卧/次卧温度均在 24.3~24.4°C,但厨房温度突然跳至 28.25°C,偏离其他房间约 4°C。虽然 19:09 灶具开启可解释部分升温,但该读数出现在灶具开启之前(19:00 vs 19:09),说明要么传感器在灶具开启前就已受到异常热源影响,要么传感器本身出现读数漂移。\",\n \"推理步骤3: 传感器两次报 null — 19:10 和 19:32 厨房温度传感器连续两次返回 MeasuredValue = None,表明传感器无法正常采集数据。其他三个温度传感器在同一时段均正常上报,排除系统性通信故障。\",\n \"推理步骤4: 灶具关闭后传感器恢复 — 19:31 灶具关闭,19:31:30 厨房窗户打开通风,到 20:00 厨房温度回落至 24.17°C 与其他房间一致,传感器恢复正常上报。这说明传感器可能在灶具运行期间因高温超出量程或受干扰导致暂时失效。\",\n \"推理步骤5: 入侵风险排除 — 06:54 门锁通过密码/凭证(OperationSource=3)由 UserIndex=5 解锁,07:04 上锁,07:25 手动开门后自动上锁,时间序列和操作方式符合住户早晨出门模式。18:09 手动开锁回家,开灯、开空调(制冷模式 SystemMode=3),21:57 关灯关空调、确认门关闭并自动上锁,完全符合单人住户的日常作息。\",\n \"推理步骤6: 其他安全项正常 — 烟雾报警器全天无触发;卫生间漏水传感器无报警;洗碗机 20:01 启动运行状态正常;所有门窗传感器状态变化均有合理的人为操作对应。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至 2825(28.25°C),比同时刻其他房间高出约 4°C,且此时灶具尚未开启\",\n \"19:10 和 19:32 厨房温度传感器连续两次返回 MeasuredValue = None,其他传感器同期正常\",\n \"灶具 19:31 关闭、窗户 19:31:30 打开通风后,20:00 传感器恢复正常读数 2417(24.17°C)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近,必要时重新安装到远离热源的位置\",\n \"对厨房温度传感器进行校准测试,确认其在高温环境下的量程和稳定性是否达标\",\n \"考虑为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或返回 null 时,触发设备健康告警\",\n \"持续观察后续几天灶具使用期间该传感器的表现,如果 null 值反复出现则建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰损坏", "reasoning": ["推理步骤1: 全屋温度趋势分析 — 00:00~05:30 各房间温度在 22.9~23.1°C 范围内平稳波动,06:00 起随日照升温,12:00~12:30 达到峰值约 25.8~25.9°C,之后逐步回落,符合夏季自然温度曲线,整体正常。", "推理步骤2: 厨房温度传感器异常跳变 — 19:00 时客厅/主卧/次卧温度均在 24.3~24.4°C,但厨房温度突然跳至 28.25°C,偏离其他房间约 4°C。虽然 19:09 灶具开启可解释部分升温,但该读数出现在灶具开启之前(19:00 vs 19:09),说明要么传感器在灶具开启前就已受到异常热源影响,要么传感器本身出现读数漂移。", "推理步骤3: 传感器两次报 null — 19:10 和 19:32 厨房温度传感器连续两次返回 MeasuredValue = None,表明传感器无法正常采集数据。其他三个温度传感器在同一时段均正常上报,排除系统性通信故障。", "推理步骤4: 灶具关闭后传感器恢复 — 19:31 灶具关闭,19:31:30 厨房窗户打开通风,到 20:00 厨房温度回落至 24.17°C 与其他房间一致,传感器恢复正常上报。这说明传感器可能在灶具运行期间因高温超出量程或受干扰导致暂时失效。", "推理步骤5: 入侵风险排除 — 06:54 门锁通过密码/凭证(OperationSource=3)由 UserIndex=5 解锁,07:04 上锁,07:25 手动开门后自动上锁,时间序列和操作方式符合住户早晨出门模式。18:09 手动开锁回家,开灯、开空调(制冷模式 SystemMode=3),21:57 关灯关空调、确认门关闭并自动上锁,完全符合单人住户的日常作息。", "推理步骤6: 其他安全项正常 — 烟雾报警器全天无触发;卫生间漏水传感器无报警;洗碗机 20:01 启动运行状态正常;所有门窗传感器状态变化均有合理的人为操作对应。"], "key_evidence": ["19:00 厨房温度突跳至 2825(28.25°C),比同时刻其他房间高出约 4°C,且此时灶具尚未开启", "19:10 和 19:32 厨房温度传感器连续两次返回 MeasuredValue = None,其他传感器同期正常", "灶具 19:31 关闭、窗户 19:31:30 打开通风后,20:00 传感器恢复正常读数 2417(24.17°C)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近,必要时重新安装到远离热源的位置", "对厨房温度传感器进行校准测试,确认其在高温环境下的量程和稳定性是否达标", "考虑为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或返回 null 时,触发设备健康告警", "持续观察后续几天灶具使用期间该传感器的表现,如果 null 值反复出现则建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.693216800689697, "api_error": null} {"episode_id": "SQ3_FP_B_0590", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0590.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261219, "scenario_id": "BA-03", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "bathroom", "injection_time": "2026-06-23T17:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障,同时客厅主灯在无人归家时段出现快速闪烁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从 ~24.5°C 跳升至 28.39°C,而同一时刻其他三个房间温度均在 24.3°C 左右,温差接近 4°C,且此时灶具尚未开启(19:11:30 才开启),排除烹饪导致的正常升温。\",\n \"推理步骤2: 厨房温度传感器在 19:12 和 19:56 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null。这表明传感器可能存在硬件故障或通信异常。\",\n \"推理步骤3: 19:30 厨房温度传感器仍报告 28.34°C 的高温,但到 20:00 突然恢复到 24.04°C(与其他房间一致),这种在灶具关闭后仅 5 分钟就从 28°C 骤降到 24°C 的变化不符合物理散热规律,进一步佐证传感器读数不可靠。\",\n \"推理步骤4: 客厅主灯在 17:55:02 至 17:55:08 的 6 秒内快速开关 4 次(开→关→开→关),此时住户尚未回家(18:10 才开门进入),且客厅运动传感器在 17:55 报告了占用状态(来自 living_room_light_1 的 OccupancySensing 事件)。这可能是灯具固件异常、电气接触不良,或传感器误触发导致的自动化规则反复执行。\",\n \"推理步骤5: 其余行为模式均属正常——凌晨全屋安静无活动;06:35 起床如厕后做早餐;07:25 出门并自动锁门;18:10 回家开灯开空调;19:11 做饭至 19:55 关灶开窗通风;20:03 启动洗碗机;22:00 关灯关空调就寝,门锁自动上锁。整体符合单人上班族的日常作息。\",\n \"推理步骤6: 入户门锁操作均为 Manual 解锁 + Auto 上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。烟雾报警器和漏水传感器全天无告警,排除火灾和水患风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2839(28.39°C),较其他房间高出约 4°C,且灶具尚未开启\",\n \"19:12 和 19:56 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 厨房温度仍为 2834(28.34°C),但 20:00 骤降至 2404(24.04°C),不符合正常散热曲线\",\n \"17:55:02-17:55:08 客厅主灯在 6 秒内快速开关 4 次,此时住户不在家\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和电池电量,必要时重新配对或更换传感器\",\n \"检查客厅主灯的固件版本并尝试升级,排查是否存在与运动传感器联动的自动化规则导致快速开关\",\n \"在厨房温度传感器修复前,避免将其读数用于烟雾/火灾联动判断的依据,防止误报或漏报\",\n \"检查客厅运动传感器灵敏度设置,确认 17:55 的占用事件是否为误触发(如宠物、光线变化等)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障,同时客厅主灯在无人归家时段出现快速闪烁。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从 ~24.5°C 跳升至 28.39°C,而同一时刻其他三个房间温度均在 24.3°C 左右,温差接近 4°C,且此时灶具尚未开启(19:11:30 才开启),排除烹饪导致的正常升温。", "推理步骤2: 厨房温度传感器在 19:12 和 19:56 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null。这表明传感器可能存在硬件故障或通信异常。", "推理步骤3: 19:30 厨房温度传感器仍报告 28.34°C 的高温,但到 20:00 突然恢复到 24.04°C(与其他房间一致),这种在灶具关闭后仅 5 分钟就从 28°C 骤降到 24°C 的变化不符合物理散热规律,进一步佐证传感器读数不可靠。", "推理步骤4: 客厅主灯在 17:55:02 至 17:55:08 的 6 秒内快速开关 4 次(开→关→开→关),此时住户尚未回家(18:10 才开门进入),且客厅运动传感器在 17:55 报告了占用状态(来自 living_room_light_1 的 OccupancySensing 事件)。这可能是灯具固件异常、电气接触不良,或传感器误触发导致的自动化规则反复执行。", "推理步骤5: 其余行为模式均属正常——凌晨全屋安静无活动;06:35 起床如厕后做早餐;07:25 出门并自动锁门;18:10 回家开灯开空调;19:11 做饭至 19:55 关灶开窗通风;20:03 启动洗碗机;22:00 关灯关空调就寝,门锁自动上锁。整体符合单人上班族的日常作息。", "推理步骤6: 入户门锁操作均为 Manual 解锁 + Auto 上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。烟雾报警器和漏水传感器全天无告警,排除火灾和水患风险。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2839(28.39°C),较其他房间高出约 4°C,且灶具尚未开启", "19:12 和 19:56 厨房温度传感器两次报告 MeasuredValue = None", "19:30 厨房温度仍为 2834(28.34°C),但 20:00 骤降至 2404(24.04°C),不符合正常散热曲线", "17:55:02-17:55:08 客厅主灯在 6 秒内快速开关 4 次,此时住户不在家"], "recommended_actions": ["检查厨房温度传感器的硬件状态和电池电量,必要时重新配对或更换传感器", "检查客厅主灯的固件版本并尝试升级,排查是否存在与运动传感器联动的自动化规则导致快速开关", "在厨房温度传感器修复前,避免将其读数用于烟雾/火灾联动判断的依据,防止误报或漏报", "检查客厅运动传感器灵敏度设置,确认 17:55 的占用事件是否为误触发(如宠物、光线变化等)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.93684697151184, "api_error": null} {"episode_id": "SQ3_FP_B_0594", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0594.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20261223, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-03T22:42:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭结束后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约18:00–23:30)的温度数据。18:00时厨房温度传感器突然报告2860(28.60°C),而同一时刻其他房间温度均在24.5°C左右,厨房温度比其他房间高出约4°C,且相比17:30的2472(24.72°C)在30分钟内跳升近4°C,这一跳变幅度异常。\",\n \"推理步骤2: 18:30时厨房温度仍为2858(28.58°C),持续偏高。但18:55灶具开启后,18:56厨房温度传感器报告None(空值),这是一次数据丢失。19:00时温度恢复为2435,与其他房间一致,说明之前的高温读数并非真实环境温度。\",\n \"推理步骤3: 19:47灶具关闭、19:47:30厨房窗户打开通风,19:48厨房温度传感器再次报告None(第二次数据丢失)。两次None出现在灶具状态变化前后,可能是传感器受热或电磁干扰导致读数异常和数据中断。\",\n \"推理步骤4: 19:00之后厨房温度恢复正常并与其他房间趋势一致,说明18:00–18:30的高温读数大概率是传感器故障或受干扰所致,而非真实的环境高温或火灾风险。烟雾报警器全天无触发,进一步排除火灾可能。\",\n \"推理步骤5: 检查安防事件——22:15住户关灯、关空调,门锁自动上锁(离家或就寝)。22:42门锁被UserIndex=5通过OperationSource=3(远程/密码)解锁,随后玄关和客厅检测到有人,客厅灯打开。这可能是家庭成员回家,属于正常行为,但需确认UserIndex=5是否为已知授权用户。\",\n \"推理步骤6: 厨房窗户在19:47:30打开后,日志中直到23:30结束都未见关闭记录。夜间窗户持续开启存在一定安全隐患(入侵风险、雨水等),值得提醒用户。\"\n ],\n \"key_evidence\": [\n \"18:00和18:30厨房温度传感器读数2860/2858,比其他房间高约4°C,且相比前一时段跳升近4°C\",\n \"18:56和19:48厨房温度传感器两次报告None(数据丢失),均发生在灶具状态变化前后\",\n \"烟雾报警器全天未触发,排除真实火灾\",\n \"19:00后厨房温度恢复正常,与其他房间一致\",\n \"厨房窗户19:47:30打开后至日志结束未见关闭\",\n \"22:42门锁由UserIndex=5远程解锁,需确认是否为授权用户\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具或热源,考虑重新校准或更换传感器\",\n \"排查温度传感器两次报告None的原因,检查设备固件版本和通信稳定性\",\n \"确认门锁UserIndex=5是否为已知家庭成员,如非授权用户应立即修改门锁密码\",\n \"提醒用户厨房窗户仍处于打开状态,夜间建议关闭以确保安全\",\n \"考虑为灶具设置使用时长提醒或与烟雾报警器联动的自动化规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做饭结束后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 分析过去6小时(约18:00–23:30)的温度数据。18:00时厨房温度传感器突然报告2860(28.60°C),而同一时刻其他房间温度均在24.5°C左右,厨房温度比其他房间高出约4°C,且相比17:30的2472(24.72°C)在30分钟内跳升近4°C,这一跳变幅度异常。", "推理步骤2: 18:30时厨房温度仍为2858(28.58°C),持续偏高。但18:55灶具开启后,18:56厨房温度传感器报告None(空值),这是一次数据丢失。19:00时温度恢复为2435,与其他房间一致,说明之前的高温读数并非真实环境温度。", "推理步骤3: 19:47灶具关闭、19:47:30厨房窗户打开通风,19:48厨房温度传感器再次报告None(第二次数据丢失)。两次None出现在灶具状态变化前后,可能是传感器受热或电磁干扰导致读数异常和数据中断。", "推理步骤4: 19:00之后厨房温度恢复正常并与其他房间趋势一致,说明18:00–18:30的高温读数大概率是传感器故障或受干扰所致,而非真实的环境高温或火灾风险。烟雾报警器全天无触发,进一步排除火灾可能。", "推理步骤5: 检查安防事件——22:15住户关灯、关空调,门锁自动上锁(离家或就寝)。22:42门锁被UserIndex=5通过OperationSource=3(远程/密码)解锁,随后玄关和客厅检测到有人,客厅灯打开。这可能是家庭成员回家,属于正常行为,但需确认UserIndex=5是否为已知授权用户。", "推理步骤6: 厨房窗户在19:47:30打开后,日志中直到23:30结束都未见关闭记录。夜间窗户持续开启存在一定安全隐患(入侵风险、雨水等),值得提醒用户。"], "key_evidence": ["18:00和18:30厨房温度传感器读数2860/2858,比其他房间高约4°C,且相比前一时段跳升近4°C", "18:56和19:48厨房温度传感器两次报告None(数据丢失),均发生在灶具状态变化前后", "烟雾报警器全天未触发,排除真实火灾", "19:00后厨房温度恢复正常,与其他房间一致", "厨房窗户19:47:30打开后至日志结束未见关闭", "22:42门锁由UserIndex=5远程解锁,需确认是否为授权用户"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具或热源,考虑重新校准或更换传感器", "排查温度传感器两次报告None的原因,检查设备固件版本和通信稳定性", "确认门锁UserIndex=5是否为已知家庭成员,如非授权用户应立即修改门锁密码", "提醒用户厨房窗户仍处于打开状态,夜间建议关闭以确保安全", "考虑为灶具设置使用时长提醒或与烟雾报警器联动的自动化规则"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.256805419921875, "api_error": null} {"episode_id": "SQ3_FP_B_0597", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0597.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261226, "scenario_id": "INS-03", "total_events": 233, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-10T09:27:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2460(24.6°C)跳升至 2844(28.44°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差高达约 4°C,且此时灶具尚未开启(19:02:30 才开启),排除烹饪导致的正常升温\",\n \"推理步骤2: 19:03 和 19:43 厨房温度传感器连续两次报告 MeasuredValue = None(空值),Matter 协议中温度传感器返回 null 通常表示测量失败或传感器通信异常,这在整天其他传感器的日志中从未出现过\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2835(28.35°C),仍然异常偏高,但 19:42 灶具关闭、窗户打开通风后,20:00 读数回落至 2404(24.04°C),与其他房间一致。这说明传感器在 19:00-19:43 期间工作不稳定,可能受热源干扰或自身出现间歇性故障\",\n \"推理步骤4: 其余设备行为均属正常模式——早晨 7:29 手动开锁出门并自动回锁、9:27/9:32 两位用户远程解锁(可能是家政/快递)、18:29 回家开灯开空调、19:02 做饭、22:15 关灯锁门就寝,符合典型双人家庭作息\",\n \"推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警;入户门锁操作均有合理来源(Manual/Auto/远程用户),无入侵迹象\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数从约 2460 骤升至 2844(+3.8°C),此时灶具尚未开启\",\n \"19:03 和 19:43 厨房温度传感器两次报告 MeasuredValue = None,表明测量失败\",\n \"19:30 传感器读数 2835 仍异常偏高,与其他房间偏差约 4°C\",\n \"20:00 之后传感器恢复正常读数 2404,与全屋温度一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热辐射干扰\",\n \"检查该传感器的供电和通信连接是否松动,null 值可能源于间歇性断连\",\n \"观察未来几天该传感器是否再次出现 null 值或异常跳变,若反复出现建议更换传感器\",\n \"考虑将厨房温度传感器迁移至远离热源的位置,以获得更准确的环境温度读数\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2460(24.6°C)跳升至 2844(28.44°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差高达约 4°C,且此时灶具尚未开启(19:02:30 才开启),排除烹饪导致的正常升温", "推理步骤2: 19:03 和 19:43 厨房温度传感器连续两次报告 MeasuredValue = None(空值),Matter 协议中温度传感器返回 null 通常表示测量失败或传感器通信异常,这在整天其他传感器的日志中从未出现过", "推理步骤3: 19:30 传感器恢复后读数为 2835(28.35°C),仍然异常偏高,但 19:42 灶具关闭、窗户打开通风后,20:00 读数回落至 2404(24.04°C),与其他房间一致。这说明传感器在 19:00-19:43 期间工作不稳定,可能受热源干扰或自身出现间歇性故障", "推理步骤4: 其余设备行为均属正常模式——早晨 7:29 手动开锁出门并自动回锁、9:27/9:32 两位用户远程解锁(可能是家政/快递)、18:29 回家开灯开空调、19:02 做饭、22:15 关灯锁门就寝,符合典型双人家庭作息", "推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警;入户门锁操作均有合理来源(Manual/Auto/远程用户),无入侵迹象"], "key_evidence": ["19:00 厨房温度传感器读数从约 2460 骤升至 2844(+3.8°C),此时灶具尚未开启", "19:03 和 19:43 厨房温度传感器两次报告 MeasuredValue = None,表明测量失败", "19:30 传感器读数 2835 仍异常偏高,与其他房间偏差约 4°C", "20:00 之后传感器恢复正常读数 2404,与全屋温度一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热辐射干扰", "检查该传感器的供电和通信连接是否松动,null 值可能源于间歇性断连", "观察未来几天该传感器是否再次出现 null 值或异常跳变,若反复出现建议更换传感器", "考虑将厨房温度传感器迁移至远离热源的位置,以获得更准确的环境温度读数"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.209686279296875, "api_error": null} {"episode_id": "SQ3_FP_B_0618", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0618.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261247, "scenario_id": "BA-03", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "second_bedroom", "injection_time": "2026-06-21T10:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30期间报告异常高温(约29.5°C),与其他房间温差达4°C,且该传感器多次报告None值,存在传感器故障风险;同时客厅主灯出现快速闪烁现象,可能存在设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 分析厨房温度传感器数据——在11:00和11:30,厨房温度分别飙升至2948(29.48°C)和2953(29.53°C),而同一时刻客厅/主卧/次卧温度仅约25.5°C,厨房与其他房间温差高达约4°C,远超正常范围。\",\n \"推理步骤2: 排查火灾风险——11:00时灶具处于关闭状态(09:40已关闭,11:51才再次开启),烟雾报警器未触发,因此异常高温并非灶具使用或真实火情导致,更可能是传感器读数异常。\",\n \"推理步骤3: 厨房温度传感器多次报告None值(09:00:06、09:41、11:52、12:26、18:03、18:28),共出现6次。None值通常表示传感器读取失败或通信中断,结合异常高温读数,强烈指向该传感器存在硬件故障或连接不稳定。\",\n \"推理步骤4: 客厅主灯在10:19出现快速开关闪烁(2秒间隔连续开关4次:True→False→True→False),这不符合正常人为操作模式,可能是设备固件异常、通信干扰或电气接触不良。\",\n \"推理步骤5: 卫生间灯在08:59同一秒内记录了开和关两个事件(OnOff=True紧接OnOff=False),虽然可能是人快速开关,但也可能是传感器联动逻辑异常或设备响应故障。\",\n \"推理步骤6: 其余设备行为基本正常——早晨起床做饭、中午做饭、傍晚做饭后开洗碗机、晚间关灯锁门,符合典型的日常生活模式。温度整体呈现夏季白天升高夜间降低的合理曲线。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在11:00读数2948、11:30读数2953,比同时刻其他房间高出约400个单位(4°C),且灶具当时处于关闭状态\",\n \"厨房温度传感器全天出现6次MeasuredValue=None的异常读数(09:00:06、09:41、11:52、12:26、18:03、18:28)\",\n \"客厅主灯在10:19:04至10:19:08期间以2秒间隔快速开关闪烁4次(True→False→True→False)\"\n ],\n \"recommended_actions\": [\n \"优先检查厨房温度传感器:清洁传感器探头、检查电池电量和无线信号强度,必要时更换传感器\",\n \"检查客厅主灯的固件版本并尝试更新,排查是否存在电气接线松动或智能开关故障\",\n \"在厨房温度传感器修复前,加强对烟雾报警器的依赖,确保其电池和功能正常,避免因温度传感器失效而遗漏真实高温预警\",\n \"检查卫生间灯的联动自动化规则,确认是否存在与运动传感器的逻辑冲突\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30期间报告异常高温(约29.5°C),与其他房间温差达4°C,且该传感器多次报告None值,存在传感器故障风险;同时客厅主灯出现快速闪烁现象,可能存在设备故障。", "reasoning": ["推理步骤1: 分析厨房温度传感器数据——在11:00和11:30,厨房温度分别飙升至2948(29.48°C)和2953(29.53°C),而同一时刻客厅/主卧/次卧温度仅约25.5°C,厨房与其他房间温差高达约4°C,远超正常范围。", "推理步骤2: 排查火灾风险——11:00时灶具处于关闭状态(09:40已关闭,11:51才再次开启),烟雾报警器未触发,因此异常高温并非灶具使用或真实火情导致,更可能是传感器读数异常。", "推理步骤3: 厨房温度传感器多次报告None值(09:00:06、09:41、11:52、12:26、18:03、18:28),共出现6次。None值通常表示传感器读取失败或通信中断,结合异常高温读数,强烈指向该传感器存在硬件故障或连接不稳定。", "推理步骤4: 客厅主灯在10:19出现快速开关闪烁(2秒间隔连续开关4次:True→False→True→False),这不符合正常人为操作模式,可能是设备固件异常、通信干扰或电气接触不良。", "推理步骤5: 卫生间灯在08:59同一秒内记录了开和关两个事件(OnOff=True紧接OnOff=False),虽然可能是人快速开关,但也可能是传感器联动逻辑异常或设备响应故障。", "推理步骤6: 其余设备行为基本正常——早晨起床做饭、中午做饭、傍晚做饭后开洗碗机、晚间关灯锁门,符合典型的日常生活模式。温度整体呈现夏季白天升高夜间降低的合理曲线。"], "key_evidence": ["厨房温度传感器在11:00读数2948、11:30读数2953,比同时刻其他房间高出约400个单位(4°C),且灶具当时处于关闭状态", "厨房温度传感器全天出现6次MeasuredValue=None的异常读数(09:00:06、09:41、11:52、12:26、18:03、18:28)", "客厅主灯在10:19:04至10:19:08期间以2秒间隔快速开关闪烁4次(True→False→True→False)"], "recommended_actions": ["优先检查厨房温度传感器:清洁传感器探头、检查电池电量和无线信号强度,必要时更换传感器", "检查客厅主灯的固件版本并尝试更新,排查是否存在电气接线松动或智能开关故障", "在厨房温度传感器修复前,加强对烟雾报警器的依赖,确保其电池和功能正常,避免因温度传感器失效而遗漏真实高温预警", "检查卫生间灯的联动自动化规则,确认是否存在与运动传感器的逻辑冲突"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.781641006469727, "api_error": null} {"episode_id": "SQ3_FP_B_0605", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0605.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261234, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-16T06:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房窗户在做饭后开启但日志中未见关闭事件,存在设备异常和安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:07/06:12 两位住户通过密码/指纹解锁入户门(UserIndex=1 和 2),07:42 出门并自动上锁,16:20 和 17:44 分别回家,22:42 关灯锁门就寝,符合两人上班族的日常作息。\",\n \"推理步骤2: 入侵风险排查——所有门锁操作均通过合法方式(OperationSource=3 即密码/凭证,Manual 即手动,Auto 即自动),无异常解锁尝试;入户门在出门和就寝时均确认上锁(LockState=1),无未授权进入迹象。\",\n \"推理步骤3: 温度趋势合理——全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。17:44 开启客厅空调(制冷模式 SystemMode=3)后,客厅温度从约 24.5°C 降至 23.5°C,空调工作正常。\",\n \"推理步骤4: 厨房温度传感器异常——在 06:39、07:14、18:14、18:56 四个时间点报告 MeasuredValue = None。虽然其中两次与灶具开启/关闭时间接近,可能受热源干扰,但正常传感器不应返回 None(应返回具体数值或超量程值)。这表明传感器可能存在故障或通信问题。\",\n \"推理步骤5: 厨房窗户状态异常——07:13:30 做完早餐后厨房窗户打开(StateValue=False 表示未闭合),18:55:30 晚餐后再次打开,但整个日志中未见任何窗户关闭事件(StateValue=True)。如果窗户在无人在家期间(07:42-16:20)一直保持开启状态,存在安全隐患。\",\n \"推理步骤6: 烟雾报警器和漏水传感器全天无告警,灶具使用时长合理(早餐约35分钟、晚餐约42分钟),洗碗机正常启动,无火灾或水灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:39、07:14、18:14、18:56 四次报告 MeasuredValue = None,正常传感器不应出现空值\",\n \"厨房窗户在 07:13:30 和 18:55:30 被打开(BooleanState.StateValue = False),但全天日志中无对应的关闭事件\",\n \"住户 07:42 出门至 16:20 回家期间(约8.5小时),厨房窗户可能一直处于开启状态且家中无人\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,确认是否存在硬件故障或与灶具的电磁干扰问题,必要时更换或重新校准\",\n \"确认厨房窗户当前的实际开关状态,如果窗户传感器漏报了关闭事件,需检查传感器电池或信号连接\",\n \"建议设置离家自动化规则:出门锁门后自动检查所有窗户状态,若有未关闭的窗户则发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房窗户在做饭后开启但日志中未见关闭事件,存在设备异常和安全隐患。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:07/06:12 两位住户通过密码/指纹解锁入户门(UserIndex=1 和 2),07:42 出门并自动上锁,16:20 和 17:44 分别回家,22:42 关灯锁门就寝,符合两人上班族的日常作息。", "推理步骤2: 入侵风险排查——所有门锁操作均通过合法方式(OperationSource=3 即密码/凭证,Manual 即手动,Auto 即自动),无异常解锁尝试;入户门在出门和就寝时均确认上锁(LockState=1),无未授权进入迹象。", "推理步骤3: 温度趋势合理——全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。17:44 开启客厅空调(制冷模式 SystemMode=3)后,客厅温度从约 24.5°C 降至 23.5°C,空调工作正常。", "推理步骤4: 厨房温度传感器异常——在 06:39、07:14、18:14、18:56 四个时间点报告 MeasuredValue = None。虽然其中两次与灶具开启/关闭时间接近,可能受热源干扰,但正常传感器不应返回 None(应返回具体数值或超量程值)。这表明传感器可能存在故障或通信问题。", "推理步骤5: 厨房窗户状态异常——07:13:30 做完早餐后厨房窗户打开(StateValue=False 表示未闭合),18:55:30 晚餐后再次打开,但整个日志中未见任何窗户关闭事件(StateValue=True)。如果窗户在无人在家期间(07:42-16:20)一直保持开启状态,存在安全隐患。", "推理步骤6: 烟雾报警器和漏水传感器全天无告警,灶具使用时长合理(早餐约35分钟、晚餐约42分钟),洗碗机正常启动,无火灾或水灾风险。"], "key_evidence": ["厨房温度传感器在 06:39、07:14、18:14、18:56 四次报告 MeasuredValue = None,正常传感器不应出现空值", "厨房窗户在 07:13:30 和 18:55:30 被打开(BooleanState.StateValue = False),但全天日志中无对应的关闭事件", "住户 07:42 出门至 16:20 回家期间(约8.5小时),厨房窗户可能一直处于开启状态且家中无人"], "recommended_actions": ["检查厨房温度传感器的工作状态,确认是否存在硬件故障或与灶具的电磁干扰问题,必要时更换或重新校准", "确认厨房窗户当前的实际开关状态,如果窗户传感器漏报了关闭事件,需检查传感器电池或信号连接", "建议设置离家自动化规则:出门锁门后自动检查所有窗户状态,若有未关闭的窗户则发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.865042686462402, "api_error": null} {"episode_id": "SQ3_FP_B_0630", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0630.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261259, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "second_bedroom", "injection_time": "2026-06-19T17:34:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00和18:30出现异常高温读数(约28.5°C),且在18:58和19:44两次报告null值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的日志。整体温度趋势合理——夏季傍晚各房间温度从约24.7°C逐步下降至约23.3°C,符合日落后自然降温规律。\",\n \"推理步骤2: 厨房温度传感器在18:00和18:30报告了2854和2852(约28.5°C),而同一时段其他房间温度均在24.5–24.7°C范围内,厨房温度比其他房间高出约4°C。虽然此时住户尚未开始做饭(灶具18:57才开启),但厨房温度已异常偏高。\",\n \"推理步骤3: 更关键的是,厨房温度传感器在18:58和19:44两次报告MeasuredValue=None(空值)。第一次发生在灶具刚开启时,第二次发生在灶具关闭、厨房窗户打开后。传感器不应在正常工况下返回null,这强烈暗示传感器本身存在间歇性故障。\",\n \"推理步骤4: 结合18:00/18:30的异常高温读数和两次null值,最合理的解释是传感器在故障前产生了偏高的错误读数,随后完全失效返回null,之后又恢复正常(19:00读数2426回归合理范围)。这是典型的间歇性传感器故障模式。\",\n \"推理步骤5: 其他活动均属正常——17:34住户通过密码(UserIndex=5)开锁回家、开灯开空调;18:10另一人手动开锁进门;18:57开始做饭、19:43结束并开窗通风;20:06启动洗碗机;21:50关灯关空调、门锁自动上锁,符合典型的晚间居家作息。\",\n \"推理步骤6: 烟雾报警器全天未触发,排除火灾风险。但厨房温度传感器的不可靠性意味着如果真的发生厨房过热,系统可能无法及时检测到,这构成安全隐患。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度2854(28.5°C),18:30为2852(28.5°C),同时段其他房间均在24.5°C左右,偏差约4°C且灶具尚未开启\",\n \"18:58和19:44厨房温度传感器两次报告MeasuredValue=None,正常传感器不应返回空值\",\n \"19:00传感器恢复正常读数2426(24.3°C),与其他房间一致,说明是传感器间歇性故障而非真实环境温度异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态(电池电量、连接稳定性、是否受油烟污染),考虑清洁或更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其工作正常,作为厨房安全的备用检测手段\",\n \"设置告警规则:当任何温度传感器返回null值或读数偏离其他房间超过3°C时,立即推送通知提醒住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00和18:30出现异常高温读数(约28.5°C),且在18:58和19:44两次报告null值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的日志。整体温度趋势合理——夏季傍晚各房间温度从约24.7°C逐步下降至约23.3°C,符合日落后自然降温规律。", "推理步骤2: 厨房温度传感器在18:00和18:30报告了2854和2852(约28.5°C),而同一时段其他房间温度均在24.5–24.7°C范围内,厨房温度比其他房间高出约4°C。虽然此时住户尚未开始做饭(灶具18:57才开启),但厨房温度已异常偏高。", "推理步骤3: 更关键的是,厨房温度传感器在18:58和19:44两次报告MeasuredValue=None(空值)。第一次发生在灶具刚开启时,第二次发生在灶具关闭、厨房窗户打开后。传感器不应在正常工况下返回null,这强烈暗示传感器本身存在间歇性故障。", "推理步骤4: 结合18:00/18:30的异常高温读数和两次null值,最合理的解释是传感器在故障前产生了偏高的错误读数,随后完全失效返回null,之后又恢复正常(19:00读数2426回归合理范围)。这是典型的间歇性传感器故障模式。", "推理步骤5: 其他活动均属正常——17:34住户通过密码(UserIndex=5)开锁回家、开灯开空调;18:10另一人手动开锁进门;18:57开始做饭、19:43结束并开窗通风;20:06启动洗碗机;21:50关灯关空调、门锁自动上锁,符合典型的晚间居家作息。", "推理步骤6: 烟雾报警器全天未触发,排除火灾风险。但厨房温度传感器的不可靠性意味着如果真的发生厨房过热,系统可能无法及时检测到,这构成安全隐患。"], "key_evidence": ["18:00厨房温度2854(28.5°C),18:30为2852(28.5°C),同时段其他房间均在24.5°C左右,偏差约4°C且灶具尚未开启", "18:58和19:44厨房温度传感器两次报告MeasuredValue=None,正常传感器不应返回空值", "19:00传感器恢复正常读数2426(24.3°C),与其他房间一致,说明是传感器间歇性故障而非真实环境温度异常"], "recommended_actions": ["检查厨房温度传感器的硬件状态(电池电量、连接稳定性、是否受油烟污染),考虑清洁或更换传感器", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其工作正常,作为厨房安全的备用检测手段", "设置告警规则:当任何温度传感器返回null值或读数偏离其他房间超过3°C时,立即推送通知提醒住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.894943952560425, "api_error": null} {"episode_id": "SQ3_FP_B_0635", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0635.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261264, "scenario_id": "DF-01", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-21T13:05:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在异常读数和频繁离线,12:00 时出现约 29.8°C 的突增读数(其他房间约 25.8°C),且做饭期间传感器多次报告 None 值。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的整体温度趋势,各房间温度从约24.8°C逐步下降至约23.4°C,符合夏季傍晚到夜间的自然降温规律,属正常。\",\n \"推理步骤2: 17:50 开启灶具做饭,18:35 关闭灶具、启动洗碗机、开窗通风,这是典型的晚餐准备流程,行为模式正常。\",\n \"推理步骤3: 但厨房温度传感器在灶具开启后(17:51、18:36)多次报告 MeasuredValue = None,说明传感器在高温环境下反复离线或读数失效。回溯全天日志,09:07、09:47、12:02、12:30 也出现了同样的 None 值,每次都与灶具使用时间高度吻合。\",\n \"推理步骤4: 更关键的是,12:00 的定时读数中厨房温度传感器报告 2977(约29.8°C),而同一时刻客厅 25.8°C、主卧 25.7°C、次卧 25.8°C。厨房比其他房间高出约 4°C,且灶具是在 12:01 才开启的,说明这个异常高温出现在做饭之前。12:30 再次报告 2986(约29.9°C),进一步偏离。\",\n \"推理步骤5: 这种模式表明厨房温度传感器可能存在硬件故障——在高温或特定条件下读数漂移(偏高约4°C),且频繁返回 None 值。传感器不可靠会影响烟雾报警和温控联动的准确性,构成安全隐患。\",\n \"推理步骤6: 23:05 入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),结合客厅灯和空调关闭,属于住户睡前锁门的正常行为。\",\n \"推理步骤7: 主卧空调在 13:05 开启后,13:05/13:35/14:05/14:35 出现了额外的温度上报(约25.0°C),与定时读数(约25.4-25.5°C)存在约0.4-0.5°C的偏差,可能是空调附近局部温度不同导致的额外采样,暂不构成严重问题但值得关注。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 12:00 报告 2977(29.8°C),12:30 报告 2986(29.9°C),而同时刻其他房间仅约 25.7-25.8°C,偏差达 4°C,且 12:00 的异常读数出现在灶具 12:01 开启之前\",\n \"厨房温度传感器全天共 6 次报告 MeasuredValue = None(09:07、09:47、12:02、12:30、17:51、18:36),均与灶具使用时段吻合,表明传感器在受热时反复失效\",\n \"其他房间温度传感器全天无 None 值、无异常跳变,排除系统性问题,故障定位于厨房传感器本身\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热异常,必要时重新安装到远离热源的位置\",\n \"对厨房温度传感器进行校准测试或更换,确保读数准确且不会在高温环境下频繁离线\",\n \"在传感器修复前,避免将厨房温度传感器的数据用于烟雾报警或自动化联动的判断依据,防止误报或漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在异常读数和频繁离线,12:00 时出现约 29.8°C 的突增读数(其他房间约 25.8°C),且做饭期间传感器多次报告 None 值。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的整体温度趋势,各房间温度从约24.8°C逐步下降至约23.4°C,符合夏季傍晚到夜间的自然降温规律,属正常。", "推理步骤2: 17:50 开启灶具做饭,18:35 关闭灶具、启动洗碗机、开窗通风,这是典型的晚餐准备流程,行为模式正常。", "推理步骤3: 但厨房温度传感器在灶具开启后(17:51、18:36)多次报告 MeasuredValue = None,说明传感器在高温环境下反复离线或读数失效。回溯全天日志,09:07、09:47、12:02、12:30 也出现了同样的 None 值,每次都与灶具使用时间高度吻合。", "推理步骤4: 更关键的是,12:00 的定时读数中厨房温度传感器报告 2977(约29.8°C),而同一时刻客厅 25.8°C、主卧 25.7°C、次卧 25.8°C。厨房比其他房间高出约 4°C,且灶具是在 12:01 才开启的,说明这个异常高温出现在做饭之前。12:30 再次报告 2986(约29.9°C),进一步偏离。", "推理步骤5: 这种模式表明厨房温度传感器可能存在硬件故障——在高温或特定条件下读数漂移(偏高约4°C),且频繁返回 None 值。传感器不可靠会影响烟雾报警和温控联动的准确性,构成安全隐患。", "推理步骤6: 23:05 入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),结合客厅灯和空调关闭,属于住户睡前锁门的正常行为。", "推理步骤7: 主卧空调在 13:05 开启后,13:05/13:35/14:05/14:35 出现了额外的温度上报(约25.0°C),与定时读数(约25.4-25.5°C)存在约0.4-0.5°C的偏差,可能是空调附近局部温度不同导致的额外采样,暂不构成严重问题但值得关注。"], "key_evidence": ["厨房温度传感器在 12:00 报告 2977(29.8°C),12:30 报告 2986(29.9°C),而同时刻其他房间仅约 25.7-25.8°C,偏差达 4°C,且 12:00 的异常读数出现在灶具 12:01 开启之前", "厨房温度传感器全天共 6 次报告 MeasuredValue = None(09:07、09:47、12:02、12:30、17:51、18:36),均与灶具使用时段吻合,表明传感器在受热时反复失效", "其他房间温度传感器全天无 None 值、无异常跳变,排除系统性问题,故障定位于厨房传感器本身"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热异常,必要时重新安装到远离热源的位置", "对厨房温度传感器进行校准测试或更换,确保读数准确且不会在高温环境下频繁离线", "在传感器修复前,避免将厨房温度传感器的数据用于烟雾报警或自动化联动的判断依据,防止误报或漏报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.666715621948242, "api_error": null} {"episode_id": "SQ3_FP_B_0640", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0640.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261269, "scenario_id": "BA-05", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "balcony", "injection_time": "2026-06-24T22:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 分析时间范围为过去6小时,即 2026-06-24T17:30:00 至 23:30:00。\",\n \"推理步骤2: 17:52 住户回家,开门锁、开客厅灯和空调(制冷模式 SystemMode=3),属于正常下班回家行为。\",\n \"推理步骤3: 18:49 开厨房灯和灶具做饭,18:56 关灶具并开窗通风(kitchen_window_contact=False),19:21 启动洗碗机,这是一套完整且合理的做饭-收拾流程。\",\n \"推理步骤4: 但在 18:50 和 18:57,厨房温度传感器连续两次报告 MeasuredValue=None。回溯早晨日志发现 06:41 和 07:13 也出现了同样的 None 值,均与灶具使用时间高度重合。\",\n \"推理步骤5: 其他三个温度传感器在同一时段均正常上报数值,排除系统级通信故障,问题定位在厨房温度传感器本身。\",\n \"推理步骤6: 厨房温度传感器在灶具开启期间失效是一个安全隐患——如果发生灶具异常高温或火灾,该传感器无法提供有效温度数据进行预警。\",\n \"推理步骤7: 22:06 入户门通过 UserIndex=5 远程/密码开锁,22:16 再次上锁,22:46 住户关灯关空调进卧室就寝并锁门。UserIndex=5 可能是家庭成员或已授权用户,门开放时间约10分钟且有玄关运动检测,行为模式合理,暂不判定为入侵。\",\n \"推理步骤8: 22:46 入户门关闭后自动上锁(OperationSource=Auto),主卧窗帘关闭(100%),主卧灯关闭,属于正常就寝流程。\",\n \"推理步骤9: 温度趋势方面,全屋从18:00的约24.6°C逐步降至23:3°C左右,符合夏季傍晚到夜间的自然降温规律,客厅空调制冷也加速了降温,无异常。\",\n \"推理步骤10: 16:17 有一次开锁但未见关门/上锁记录,直到 17:52 再次开锁——推测 16:17 可能是外卖/快递短暂开门,但入户门在此期间处于未关闭状态约1.5小时,存在一定安全隐患,不过这属于次要问题。\"\n ],\n \"key_evidence\": [\n \"18:50 和 18:57 厨房温度传感器报告 MeasuredValue=None,与灶具使用时段完全重合\",\n \"同一天早晨 06:41 和 07:13 也出现相同的 None 值故障,说明问题可复现且与灶具使用强相关\",\n \"其他房间温度传感器在相同时段均正常工作,排除系统性故障\",\n \"16:17 开锁后至 17:52 期间(约1.5小时)未见入户门关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,可能距灶具过近导致高温时传感器超量程或热保护断连\",\n \"对厨房温度传感器进行固件更新或硬件更换,确保灶具使用期间能持续提供温度数据\",\n \"在传感器修复前,建议灶具使用时加强人工关注,避免依赖自动温度报警\",\n \"确认 UserIndex=5 是否为已知授权用户,定期审查门锁用户列表\",\n \"检查 16:17 至 17:52 期间入户门是否确实处于未关闭状态,如是,建议设置门未关闭超时提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾预警失效。", "reasoning": ["推理步骤1: 分析时间范围为过去6小时,即 2026-06-24T17:30:00 至 23:30:00。", "推理步骤2: 17:52 住户回家,开门锁、开客厅灯和空调(制冷模式 SystemMode=3),属于正常下班回家行为。", "推理步骤3: 18:49 开厨房灯和灶具做饭,18:56 关灶具并开窗通风(kitchen_window_contact=False),19:21 启动洗碗机,这是一套完整且合理的做饭-收拾流程。", "推理步骤4: 但在 18:50 和 18:57,厨房温度传感器连续两次报告 MeasuredValue=None。回溯早晨日志发现 06:41 和 07:13 也出现了同样的 None 值,均与灶具使用时间高度重合。", "推理步骤5: 其他三个温度传感器在同一时段均正常上报数值,排除系统级通信故障,问题定位在厨房温度传感器本身。", "推理步骤6: 厨房温度传感器在灶具开启期间失效是一个安全隐患——如果发生灶具异常高温或火灾,该传感器无法提供有效温度数据进行预警。", "推理步骤7: 22:06 入户门通过 UserIndex=5 远程/密码开锁,22:16 再次上锁,22:46 住户关灯关空调进卧室就寝并锁门。UserIndex=5 可能是家庭成员或已授权用户,门开放时间约10分钟且有玄关运动检测,行为模式合理,暂不判定为入侵。", "推理步骤8: 22:46 入户门关闭后自动上锁(OperationSource=Auto),主卧窗帘关闭(100%),主卧灯关闭,属于正常就寝流程。", "推理步骤9: 温度趋势方面,全屋从18:00的约24.6°C逐步降至23:3°C左右,符合夏季傍晚到夜间的自然降温规律,客厅空调制冷也加速了降温,无异常。", "推理步骤10: 16:17 有一次开锁但未见关门/上锁记录,直到 17:52 再次开锁——推测 16:17 可能是外卖/快递短暂开门,但入户门在此期间处于未关闭状态约1.5小时,存在一定安全隐患,不过这属于次要问题。"], "key_evidence": ["18:50 和 18:57 厨房温度传感器报告 MeasuredValue=None,与灶具使用时段完全重合", "同一天早晨 06:41 和 07:13 也出现相同的 None 值故障,说明问题可复现且与灶具使用强相关", "其他房间温度传感器在相同时段均正常工作,排除系统性故障", "16:17 开锁后至 17:52 期间(约1.5小时)未见入户门关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,可能距灶具过近导致高温时传感器超量程或热保护断连", "对厨房温度传感器进行固件更新或硬件更换,确保灶具使用期间能持续提供温度数据", "在传感器修复前,建议灶具使用时加强人工关注,避免依赖自动温度报警", "确认 UserIndex=5 是否为已知授权用户,定期审查门锁用户列表", "检查 16:17 至 17:52 期间入户门是否确实处于未关闭状态,如是,建议设置门未关闭超时提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 10, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.367217779159546, "api_error": null} {"episode_id": "SQ3_FP_B_0648", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0648.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261277, "scenario_id": "DF-03", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "second_bedroom", "injection_time": "2026-06-19T20:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;此外入户门在16:29开锁进入后长时间未关门/未上锁,直到22:44才确认关门上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的活动。住户于17:47通过手动开锁进入家中,玄关和客厅运动传感器依次触发,随后开灯、开空调,行为链条完整合理。\",\n \"推理步骤2: 18:25开始做饭(厨房灯亮、灶具开启),18:26厨房温度传感器报告 MeasuredValue = None。19:24灶具关闭后开窗通风,19:25再次报告 None。结合早晨06:47和07:17也出现同样的 None 值,厨房温度传感器在灶具使用前后反复出现空值,说明该传感器可能存在故障,或在高温/温度骤变环境下无法正常工作。\",\n \"推理步骤3: 16:29入户门被手动开锁(LockState=2 解锁),门传感器显示门被打开(StateValue=False),但此后直到22:44才记录到门关闭(StateValue=True)和自动上锁(LockState=1)。中间超过6小时门处于开启/未锁状态。虽然17:47有第二次开门记录(住户回家),但16:29的第一次开门身份不明,且长时间未关门异常。\",\n \"推理步骤4: 次卧在20:19和20:24出现两次短暂的运动检测(每次不到1分钟),但次卧灯未开启。这可能是住户短暂进出(如拿东西),也可能是宠物活动,单独来看不构成威胁,但结合16:29的不明开门事件需要留意。\",\n \"推理步骤5: 22:44住户关闭客厅灯和空调,进入主卧,关闭窗帘,确认前门关闭上锁,随后关灯就寝,这一系列睡前操作完全正常。\",\n \"推理步骤6: 温度趋势方面,各房间从18:00的约24.6°C逐步降至23:30的约23.3°C,符合夏季傍晚到夜间的自然降温规律,无异常温升,不存在火灾风险。厨房窗户在做饭后打开通风属正常行为。\",\n \"推理步骤7: 洗碗机19:49启动运行,属于晚饭后的正常使用。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:26和19:25两次报告 MeasuredValue = None(加上早晨的06:47和07:17,全天共4次),表明传感器工作异常\",\n \"16:29入户门手动开锁并打开,直到22:44才关闭上锁,中间超过6小时门未确认关闭,且16:29开门时无对应的室内活动(客厅运动传感器直到17:47才触发)\",\n \"次卧20:19和20:24出现两次短暂运动检测(持续不到1分钟),未伴随开灯等操作\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如传感器本身故障,建议更换或重新校准\",\n \"核实16:29的开门事件是否为家庭成员操作(如另一位住户短暂回家取物后外出),若无法确认身份,建议查看门口监控或增加门锁的用户身份识别功能\",\n \"建议为入户门设置「长时间未关闭」的自动告警规则(如超过10分钟未关门即推送提醒),避免门户长时间敞开\",\n \"关注次卧的短暂运动检测是否持续出现,如家中无宠物且无人使用次卧,可能需要排查传感器误报或其他原因\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;此外入户门在16:29开锁进入后长时间未关门/未上锁,直到22:44才确认关门上锁,存在安全隐患。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的活动。住户于17:47通过手动开锁进入家中,玄关和客厅运动传感器依次触发,随后开灯、开空调,行为链条完整合理。", "推理步骤2: 18:25开始做饭(厨房灯亮、灶具开启),18:26厨房温度传感器报告 MeasuredValue = None。19:24灶具关闭后开窗通风,19:25再次报告 None。结合早晨06:47和07:17也出现同样的 None 值,厨房温度传感器在灶具使用前后反复出现空值,说明该传感器可能存在故障,或在高温/温度骤变环境下无法正常工作。", "推理步骤3: 16:29入户门被手动开锁(LockState=2 解锁),门传感器显示门被打开(StateValue=False),但此后直到22:44才记录到门关闭(StateValue=True)和自动上锁(LockState=1)。中间超过6小时门处于开启/未锁状态。虽然17:47有第二次开门记录(住户回家),但16:29的第一次开门身份不明,且长时间未关门异常。", "推理步骤4: 次卧在20:19和20:24出现两次短暂的运动检测(每次不到1分钟),但次卧灯未开启。这可能是住户短暂进出(如拿东西),也可能是宠物活动,单独来看不构成威胁,但结合16:29的不明开门事件需要留意。", "推理步骤5: 22:44住户关闭客厅灯和空调,进入主卧,关闭窗帘,确认前门关闭上锁,随后关灯就寝,这一系列睡前操作完全正常。", "推理步骤6: 温度趋势方面,各房间从18:00的约24.6°C逐步降至23:30的约23.3°C,符合夏季傍晚到夜间的自然降温规律,无异常温升,不存在火灾风险。厨房窗户在做饭后打开通风属正常行为。", "推理步骤7: 洗碗机19:49启动运行,属于晚饭后的正常使用。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。"], "key_evidence": ["厨房温度传感器在18:26和19:25两次报告 MeasuredValue = None(加上早晨的06:47和07:17,全天共4次),表明传感器工作异常", "16:29入户门手动开锁并打开,直到22:44才关闭上锁,中间超过6小时门未确认关闭,且16:29开门时无对应的室内活动(客厅运动传感器直到17:47才触发)", "次卧20:19和20:24出现两次短暂运动检测(持续不到1分钟),未伴随开灯等操作"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如传感器本身故障,建议更换或重新校准", "核实16:29的开门事件是否为家庭成员操作(如另一位住户短暂回家取物后外出),若无法确认身份,建议查看门口监控或增加门锁的用户身份识别功能", "建议为入户门设置「长时间未关闭」的自动告警规则(如超过10分钟未关门即推送提醒),避免门户长时间敞开", "关注次卧的短暂运动检测是否持续出现,如家中无宠物且无人使用次卧,可能需要排查传感器误报或其他原因"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.869717597961426, "api_error": null} {"episode_id": "SQ3_FP_B_0650", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0650.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261279, "scenario_id": "WD-01", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-18T22:15:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时需关注入户门在16:25开锁后长时间未关闭/未上锁的安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:11、07:16、18:49、19:25 共4次报告 MeasuredValue = None。前两次与早晨灶具使用时间重合,后两次与晚间灶具使用时间重合。虽然灶具工作时传感器可能因高温超量程而返回 None,但正常的温度传感器应有明确的超量程指示而非 None,这提示传感器可能存在故障或通信异常。\",\n \"推理步骤2: 16:25 入户门通过手动方式解锁并打开(BooleanState=False 表示门开),但在日志中直到 22:11:18 才出现 front_door_contact StateValue=True(门关闭)和随后的自动上锁。这意味着入户门在近6小时内处于未关闭或未上锁状态。虽然住户在家时可能不锁门,但这段时间内(16:25-17:42)还有第二次开门事件,说明有人进出,门长期未锁存在安全风险。\",\n \"推理步骤3: 22:15 卫生间漏水传感器触发(StateValue=True),2分钟后恢复(StateValue=False)。同时卫生间有人体存在(Occupancy=1)且灯亮,说明住户在使用卫生间,短暂的水溅到地面触发传感器属于正常使用场景,非真实漏水。\",\n \"推理步骤4: 整体生活模式合理——凌晨无活动(深夜睡眠),05:57 主卧检测到人起床开灯,07:10 厨房做早餐,07:15 关灯锁门出门上班,17:42 回家开灯开空调,18:48 做晚饭,19:49 开洗碗机,22:11 关灯睡觉。这是典型的单人上班族作息。\",\n \"推理步骤5: 温度趋势正常——夜间约22.9-23.1°C,白天随气温升高至中午峰值约25.8°C,下午逐渐回落,符合夏季自然温度变化曲线。客厅空调17:42开启制冷(SystemMode=3)后温度逐步下降,表现正常。\",\n \"推理步骤6: 所有门锁操作均为 Manual 或 Auto 来源,无异常的远程解锁或未知方式解锁,不存在入侵迹象。烟雾报警器全天无触发,无火灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:11、07:16、18:49、19:25 四次报告 MeasuredValue = None,与灶具使用高度相关但仍属异常读数\",\n \"入户门 16:25 开锁后,直到 22:11 才记录到门关闭和自动上锁,中间约6小时门可能未锁\",\n \"卫生间漏水传感器 22:15 短暂触发2分钟后恢复,伴随人体存在和灯光,属正常用水场景\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器本身故障,建议更换或重新校准\",\n \"建议设置入户门未锁超时提醒(如超过30分钟未上锁则推送通知),提升居家安全性\",\n \"卫生间漏水传感器目前工作正常,建议保持定期检查,无需立即处理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时需关注入户门在16:25开锁后长时间未关闭/未上锁的安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:11、07:16、18:49、19:25 共4次报告 MeasuredValue = None。前两次与早晨灶具使用时间重合,后两次与晚间灶具使用时间重合。虽然灶具工作时传感器可能因高温超量程而返回 None,但正常的温度传感器应有明确的超量程指示而非 None,这提示传感器可能存在故障或通信异常。", "推理步骤2: 16:25 入户门通过手动方式解锁并打开(BooleanState=False 表示门开),但在日志中直到 22:11:18 才出现 front_door_contact StateValue=True(门关闭)和随后的自动上锁。这意味着入户门在近6小时内处于未关闭或未上锁状态。虽然住户在家时可能不锁门,但这段时间内(16:25-17:42)还有第二次开门事件,说明有人进出,门长期未锁存在安全风险。", "推理步骤3: 22:15 卫生间漏水传感器触发(StateValue=True),2分钟后恢复(StateValue=False)。同时卫生间有人体存在(Occupancy=1)且灯亮,说明住户在使用卫生间,短暂的水溅到地面触发传感器属于正常使用场景,非真实漏水。", "推理步骤4: 整体生活模式合理——凌晨无活动(深夜睡眠),05:57 主卧检测到人起床开灯,07:10 厨房做早餐,07:15 关灯锁门出门上班,17:42 回家开灯开空调,18:48 做晚饭,19:49 开洗碗机,22:11 关灯睡觉。这是典型的单人上班族作息。", "推理步骤5: 温度趋势正常——夜间约22.9-23.1°C,白天随气温升高至中午峰值约25.8°C,下午逐渐回落,符合夏季自然温度变化曲线。客厅空调17:42开启制冷(SystemMode=3)后温度逐步下降,表现正常。", "推理步骤6: 所有门锁操作均为 Manual 或 Auto 来源,无异常的远程解锁或未知方式解锁,不存在入侵迹象。烟雾报警器全天无触发,无火灾风险。"], "key_evidence": ["厨房温度传感器在 07:11、07:16、18:49、19:25 四次报告 MeasuredValue = None,与灶具使用高度相关但仍属异常读数", "入户门 16:25 开锁后,直到 22:11 才记录到门关闭和自动上锁,中间约6小时门可能未锁", "卫生间漏水传感器 22:15 短暂触发2分钟后恢复,伴随人体存在和灯光,属正常用水场景"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器本身故障,建议更换或重新校准", "建议设置入户门未锁超时提醒(如超过30分钟未上锁则推送通知),提升居家安全性", "卫生间漏水传感器目前工作正常,建议保持定期检查,无需立即处理"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.869912147521973, "api_error": null} {"episode_id": "SQ3_FP_B_0660", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0660.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261289, "scenario_id": "INS-01", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-20T10:16:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在12:00和12:30出现异常高温读数(约29.8°C),与同时段其他房间温度偏差约4°C,且该传感器多次报告None值,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约18:00-23:30)的设备活动,整体温度从约24.5°C平稳下降至约23.3°C,各房间温度走势一致,属于夜间正常降温,无异常。\",\n \"推理步骤2: 回溯全天日志发现,12:00时厨房温度传感器报告2981(29.81°C),而同时刻客厅25.81°C、主卧25.89°C、次卧25.87°C,厨房比其他房间高出约4°C。12:30时厨房再次报告2986(29.86°C),偏差持续存在。\",\n \"推理步骤3: 12:15灶具才开启,但12:00时灶具尚未工作,厨房温度就已异常飙升至29.8°C,无法用烹饪解释。且12:25灶具关闭后,12:30温度仍为29.86°C未回落,而到13:00突然恢复至25.51°C(与其他房间一致),这种跳变不符合物理规律。\",\n \"推理步骤4: 厨房温度传感器在全天多个时段报告MeasuredValue=None(09:10、09:53、12:16、12:26、18:07、18:26),共6次。这些None值均出现在灶具开启或关闭前后,说明传感器在特定条件下工作不稳定。\",\n \"推理步骤5: 10:16前后出现一组缺少Cluster前缀的事件(如Occupancy=1而非OccupancySensing.Occupancy=1),可能是日志格式问题,但客厅在5秒内从有人到无人(10:16:03灯亮→10:16:15灯灭→10:16:20无人),时间极短,可能是传感器误触发,属于低风险。\",\n \"推理步骤6: 22:46入户门关闭并自动上锁、客厅灯和空调关闭,符合住户晚间离家或就寝的正常模式。18:06-18:25的厨房烹饪及洗碗机启动也属于正常晚餐活动。\"\n ],\n \"key_evidence\": [\n \"12:00厨房温度2981(29.81°C),同时刻其他房间均在25.8-25.9°C范围,偏差约4°C\",\n \"12:30厨房温度2986(29.86°C),13:00突然回落至2551(25.51°C),跳变幅度不合理\",\n \"厨房温度传感器全天6次报告MeasuredValue=None,表明传感器工作状态不稳定\",\n \"12:00的异常高温发生在灶具开启(12:15)之前,排除烹饪导致的正常升温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,清洁探头或更换传感器\",\n \"排查传感器频繁报告None值的原因,可能是供电不稳、无线信号干扰或固件缺陷\",\n \"在传感器修复前,为厨房烟雾报警器设置更敏感的阈值作为补偿监控手段\",\n \"关注客厅运动传感器10:16的短暂误触发,如频繁出现建议调整灵敏度或检查是否有宠物等干扰源\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在12:00和12:30出现异常高温读数(约29.8°C),与同时段其他房间温度偏差约4°C,且该传感器多次报告None值,疑似传感器故障。", "reasoning": ["推理步骤1: 分析过去6小时(约18:00-23:30)的设备活动,整体温度从约24.5°C平稳下降至约23.3°C,各房间温度走势一致,属于夜间正常降温,无异常。", "推理步骤2: 回溯全天日志发现,12:00时厨房温度传感器报告2981(29.81°C),而同时刻客厅25.81°C、主卧25.89°C、次卧25.87°C,厨房比其他房间高出约4°C。12:30时厨房再次报告2986(29.86°C),偏差持续存在。", "推理步骤3: 12:15灶具才开启,但12:00时灶具尚未工作,厨房温度就已异常飙升至29.8°C,无法用烹饪解释。且12:25灶具关闭后,12:30温度仍为29.86°C未回落,而到13:00突然恢复至25.51°C(与其他房间一致),这种跳变不符合物理规律。", "推理步骤4: 厨房温度传感器在全天多个时段报告MeasuredValue=None(09:10、09:53、12:16、12:26、18:07、18:26),共6次。这些None值均出现在灶具开启或关闭前后,说明传感器在特定条件下工作不稳定。", "推理步骤5: 10:16前后出现一组缺少Cluster前缀的事件(如Occupancy=1而非OccupancySensing.Occupancy=1),可能是日志格式问题,但客厅在5秒内从有人到无人(10:16:03灯亮→10:16:15灯灭→10:16:20无人),时间极短,可能是传感器误触发,属于低风险。", "推理步骤6: 22:46入户门关闭并自动上锁、客厅灯和空调关闭,符合住户晚间离家或就寝的正常模式。18:06-18:25的厨房烹饪及洗碗机启动也属于正常晚餐活动。"], "key_evidence": ["12:00厨房温度2981(29.81°C),同时刻其他房间均在25.8-25.9°C范围,偏差约4°C", "12:30厨房温度2986(29.86°C),13:00突然回落至2551(25.51°C),跳变幅度不合理", "厨房温度传感器全天6次报告MeasuredValue=None,表明传感器工作状态不稳定", "12:00的异常高温发生在灶具开启(12:15)之前,排除烹饪导致的正常升温"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,清洁探头或更换传感器", "排查传感器频繁报告None值的原因,可能是供电不稳、无线信号干扰或固件缺陷", "在传感器修复前,为厨房烟雾报警器设置更敏感的阈值作为补偿监控手段", "关注客厅运动传感器10:16的短暂误触发,如频繁出现建议调整灵敏度或检查是否有宠物等干扰源"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.01739001274109, "api_error": null} {"episode_id": "SQ3_FP_C_0561", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0561.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261190, "scenario_id": "BA-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "balcony", "injection_time": "2026-06-29T15:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 在过去24小时日志中,厨房温度传感器(kitchen_temp_sensor)在 06:34、07:29、18:24、19:14 四个时间点报告 MeasuredValue = None,而其他三个温度传感器始终正常上报数值。\",\n \"推理步骤2: 这四次 None 值均出现在灶具(kitchen_cook_surface)开启期间或刚关闭后不久——06:33 灶具开启→06:34 None;07:28 灶具关闭→07:29 None;18:23 灶具开启→18:24 None;19:13 灶具关闭→19:14 None。这说明灶具运行可能对传感器产生电磁干扰或热冲击,导致读数丢失。\",\n \"推理步骤3: 虽然每次 None 之后传感器在下一个30分钟周期恢复了正常数值,但厨房是火灾高风险区域,温度传感器的间歇性失效意味着在灶具使用的关键时段恰好失去温度监控,存在安全盲区。\",\n \"推理步骤4: 其余设备行为均属正常——早晨起床、做早餐、出门上锁、下午/傍晚回家、晚餐、睡前关灯锁门,符合典型三口之家(含儿童)的作息模式。入户门锁的开关操作均为 Manual/Auto 且伴随正常的门磁和运动传感器联动,无入侵迹象。\",\n \"推理步骤5: 15:09 儿童房灯在6秒内被快速开关两次,结合儿童房运动传感器触发,判断为儿童玩耍行为,不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:34、07:29、18:24、19:14 四次报告 MeasuredValue = None\",\n \"四次 None 均与 kitchen_cook_surface 的开启/关闭时间高度关联(灶具状态变化后约30秒至1分钟内出现)\",\n \"其他三个温度传感器(客厅、主卧、儿童房)在相同时段均正常上报,排除系统性网络故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰,必要时重新选址安装\",\n \"检查传感器固件版本并更新,排除软件层面的间歇性通信bug\",\n \"在传感器修复前,考虑为厨房烟雾报警器(kitchen_smoke_alarm)增加灵敏度或增设备用温度监测手段,弥补灶具使用期间的监控盲区\",\n \"持续观察该传感器在非灶具使用时段是否也出现 None 值,以进一步定位故障根因\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障或通信异常。", "reasoning": ["推理步骤1: 在过去24小时日志中,厨房温度传感器(kitchen_temp_sensor)在 06:34、07:29、18:24、19:14 四个时间点报告 MeasuredValue = None,而其他三个温度传感器始终正常上报数值。", "推理步骤2: 这四次 None 值均出现在灶具(kitchen_cook_surface)开启期间或刚关闭后不久——06:33 灶具开启→06:34 None;07:28 灶具关闭→07:29 None;18:23 灶具开启→18:24 None;19:13 灶具关闭→19:14 None。这说明灶具运行可能对传感器产生电磁干扰或热冲击,导致读数丢失。", "推理步骤3: 虽然每次 None 之后传感器在下一个30分钟周期恢复了正常数值,但厨房是火灾高风险区域,温度传感器的间歇性失效意味着在灶具使用的关键时段恰好失去温度监控,存在安全盲区。", "推理步骤4: 其余设备行为均属正常——早晨起床、做早餐、出门上锁、下午/傍晚回家、晚餐、睡前关灯锁门,符合典型三口之家(含儿童)的作息模式。入户门锁的开关操作均为 Manual/Auto 且伴随正常的门磁和运动传感器联动,无入侵迹象。", "推理步骤5: 15:09 儿童房灯在6秒内被快速开关两次,结合儿童房运动传感器触发,判断为儿童玩耍行为,不构成安全威胁。"], "key_evidence": ["kitchen_temp_sensor 在 06:34、07:29、18:24、19:14 四次报告 MeasuredValue = None", "四次 None 均与 kitchen_cook_surface 的开启/关闭时间高度关联(灶具状态变化后约30秒至1分钟内出现)", "其他三个温度传感器(客厅、主卧、儿童房)在相同时段均正常上报,排除系统性网络故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰,必要时重新选址安装", "检查传感器固件版本并更新,排除软件层面的间歇性通信bug", "在传感器修复前,考虑为厨房烟雾报警器(kitchen_smoke_alarm)增加灵敏度或增设备用温度监测手段,弥补灶具使用期间的监控盲区", "持续观察该传感器在非灶具使用时段是否也出现 None 值,以进一步定位故障根因"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.77594304084778, "api_error": null} {"episode_id": "SQ3_FP_B_0664", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_B_0664.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261293, "scenario_id": "INS-02", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "master_bedroom", "injection_time": "2026-06-22T18:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在住户外出期间处于未关闭状态长达约2小时,且18:06出现一次门锁操作错误。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:06起床,07:19出门上班,18:06-18:07回家,22:17就寝,符合单人居住的工作日作息。\",\n \"推理步骤2: 厨房温度传感器在07:11、07:16、18:28、19:09四个时间点报告 MeasuredValue = None。虽然灶具使用期间传感器可能因高温超量程而返回 None,但07:16时灶具已于07:15关闭,19:09时灶具也已于19:08关闭,关火后仍然读不到温度值,说明传感器可能存在间歇性故障或响应延迟异常。\",\n \"推理步骤3: 16:07住户开锁进门(入户门传感器显示门打开),但直到18:07才再次出现开门记录,而在此期间没有关门(StateValue=True)的日志。这意味着入户门可能在16:07至18:07之间一直处于未关闭状态,约2小时敞开,存在安全隐患。\",\n \"推理步骤4: 18:06出现一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),20秒后以 UserIndex=1 成功开锁。单次失败可能是输入错误,但结合门长时间未关的情况,值得关注。\",\n \"推理步骤5: 厨房窗户在07:15:30打开后,整天没有关闭记录。住户外出期间窗户保持打开,虽非严重威胁,但增加了安全风险。\",\n \"推理步骤6: 温度趋势正常——夜间约22.9°C,白天峰值约25.9°C,符合6月夏季昼夜温差规律。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在07:11、07:16、18:28、19:09四次报告 MeasuredValue = None,其中两次发生在灶具已关闭之后\",\n \"16:07入户门打开后无对应关门记录,直到18:07才有下一次开门事件,门可能敞开约2小时\",\n \"18:06出现一次门锁操作错误 LockOperationError(OperationError=1, OperationSource=3)\",\n \"厨房窗户07:15:30打开后全天无关闭记录,住户外出期间窗户持续敞开\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,确认是否存在硬件故障或需要校准/更换\",\n \"排查入户门传感器是否存在漏报问题,确认16:07至18:07期间门是否确实未关闭;如确认门未关,建议设置外出后门未关闭的自动提醒\",\n \"关注门锁操作错误的来源(OperationSource=3 为远程操作),确认是否为住户本人操作失误,排除未授权访问尝试\",\n \"建议设置离家模式自动检查:外出时自动确认门窗关闭状态,未关闭则推送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在住户外出期间处于未关闭状态长达约2小时,且18:06出现一次门锁操作错误。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:06起床,07:19出门上班,18:06-18:07回家,22:17就寝,符合单人居住的工作日作息。", "推理步骤2: 厨房温度传感器在07:11、07:16、18:28、19:09四个时间点报告 MeasuredValue = None。虽然灶具使用期间传感器可能因高温超量程而返回 None,但07:16时灶具已于07:15关闭,19:09时灶具也已于19:08关闭,关火后仍然读不到温度值,说明传感器可能存在间歇性故障或响应延迟异常。", "推理步骤3: 16:07住户开锁进门(入户门传感器显示门打开),但直到18:07才再次出现开门记录,而在此期间没有关门(StateValue=True)的日志。这意味着入户门可能在16:07至18:07之间一直处于未关闭状态,约2小时敞开,存在安全隐患。", "推理步骤4: 18:06出现一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),20秒后以 UserIndex=1 成功开锁。单次失败可能是输入错误,但结合门长时间未关的情况,值得关注。", "推理步骤5: 厨房窗户在07:15:30打开后,整天没有关闭记录。住户外出期间窗户保持打开,虽非严重威胁,但增加了安全风险。", "推理步骤6: 温度趋势正常——夜间约22.9°C,白天峰值约25.9°C,符合6月夏季昼夜温差规律。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。"], "key_evidence": ["厨房温度传感器在07:11、07:16、18:28、19:09四次报告 MeasuredValue = None,其中两次发生在灶具已关闭之后", "16:07入户门打开后无对应关门记录,直到18:07才有下一次开门事件,门可能敞开约2小时", "18:06出现一次门锁操作错误 LockOperationError(OperationError=1, OperationSource=3)", "厨房窗户07:15:30打开后全天无关闭记录,住户外出期间窗户持续敞开"], "recommended_actions": ["检查厨房温度传感器的工作状态,确认是否存在硬件故障或需要校准/更换", "排查入户门传感器是否存在漏报问题,确认16:07至18:07期间门是否确实未关闭;如确认门未关,建议设置外出后门未关闭的自动提醒", "关注门锁操作错误的来源(OperationSource=3 为远程操作),确认是否为住户本人操作失误,排除未授权访问尝试", "建议设置离家模式自动检查:外出时自动确认门窗关闭状态,未关闭则推送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.864248514175415, "api_error": null} {"episode_id": "SQ3_FP_C_0567", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0567.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261196, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kids_room", "injection_time": "2026-06-04T20:51:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房温度传感器出现间歇性异常高温跳变,厨房温度传感器多次报告 None 值,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约18:00–23:30)的温度数据,客厅、主卧、厨房的温度从约24.5°C平稳下降至约23.3°C,符合夏季傍晚到夜间的自然降温趋势,属于正常。\",\n \"推理步骤2: 儿童房温度传感器在整体下降趋势中出现多次异常跳变——20:51报告2500(25.00°C),21:21报告2502,21:51报告2498,22:21报告2501,而同一时段的整点/半点正常读数为23.5–23.8°C。这些跳变值比周围正常读数高出约1.2°C,且以约30分钟为周期反复出现,与其他房间的温度走势完全不一致。\",\n \"推理步骤3: 21:03儿童房灯已关闭、窗帘已完全关闭,孩子应已入睡,房间内无活动热源。在这种条件下温度不应出现周期性跳升,排除人为活动导致的可能。\",\n \"推理步骤4: 厨房温度传感器在06:50、06:56(早晨做饭期间)以及18:36、18:52(晚间做饭期间)共4次报告 MeasuredValue = None。虽然做饭时灶具开启可能导致传感器短暂受干扰,但 None 值意味着传感器未能返回有效读数,属于设备通信或硬件异常。\",\n \"推理步骤5: 其余设备行为均正常——入户门在16:00和17:57两次开锁后均正常关门上锁,22:43睡前确认门锁闭合;客厅空调17:57开启制冷、22:43关闭;洗碗机19:57启动运行;各运动传感器与灯光联动合理,符合家庭日常作息。\",\n \"推理步骤6: 16:00开门后未见关门/上锁记录,直到22:43才出现 front_door_contact = True 和自动上锁。这段时间入户门可能处于未关闭状态,但17:57有第二次开锁事件,说明门在此前已被关上(否则无需再开锁),因此门的状态变化日志可能存在遗漏,不构成实际安全威胁。\"\n ],\n \"key_evidence\": [\n \"儿童房温度传感器在20:51、21:21、21:51、22:21出现4次异常跳变至约25.00°C,而同时段正常读数为23.5–23.8°C,与其他房间趋势不一致\",\n \"厨房温度传感器在06:50、06:56、18:36、18:52共4次报告 MeasuredValue = None,无法返回有效温度值\",\n \"儿童房异常跳变发生在灯关闭、窗帘关闭后的无人活动时段,排除人为因素\"\n ],\n \"recommended_actions\": [\n \"检查儿童房温度传感器(kids_room_temp_sensor)的硬件状态和固件版本,可能存在间歇性读数漂移或传感器老化问题,建议重启或更换\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置是否距灶具过近,以及设备通信链路是否稳定,必要时重新校准或更换\",\n \"在传感器修复前,可考虑为儿童房增加一个备用温度传感器进行交叉验证,避免因单点故障导致温控自动化失效\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "儿童房温度传感器出现间歇性异常高温跳变,厨房温度传感器多次报告 None 值,存在设备故障风险。", "reasoning": ["推理步骤1: 分析过去6小时(约18:00–23:30)的温度数据,客厅、主卧、厨房的温度从约24.5°C平稳下降至约23.3°C,符合夏季傍晚到夜间的自然降温趋势,属于正常。", "推理步骤2: 儿童房温度传感器在整体下降趋势中出现多次异常跳变——20:51报告2500(25.00°C),21:21报告2502,21:51报告2498,22:21报告2501,而同一时段的整点/半点正常读数为23.5–23.8°C。这些跳变值比周围正常读数高出约1.2°C,且以约30分钟为周期反复出现,与其他房间的温度走势完全不一致。", "推理步骤3: 21:03儿童房灯已关闭、窗帘已完全关闭,孩子应已入睡,房间内无活动热源。在这种条件下温度不应出现周期性跳升,排除人为活动导致的可能。", "推理步骤4: 厨房温度传感器在06:50、06:56(早晨做饭期间)以及18:36、18:52(晚间做饭期间)共4次报告 MeasuredValue = None。虽然做饭时灶具开启可能导致传感器短暂受干扰,但 None 值意味着传感器未能返回有效读数,属于设备通信或硬件异常。", "推理步骤5: 其余设备行为均正常——入户门在16:00和17:57两次开锁后均正常关门上锁,22:43睡前确认门锁闭合;客厅空调17:57开启制冷、22:43关闭;洗碗机19:57启动运行;各运动传感器与灯光联动合理,符合家庭日常作息。", "推理步骤6: 16:00开门后未见关门/上锁记录,直到22:43才出现 front_door_contact = True 和自动上锁。这段时间入户门可能处于未关闭状态,但17:57有第二次开锁事件,说明门在此前已被关上(否则无需再开锁),因此门的状态变化日志可能存在遗漏,不构成实际安全威胁。"], "key_evidence": ["儿童房温度传感器在20:51、21:21、21:51、22:21出现4次异常跳变至约25.00°C,而同时段正常读数为23.5–23.8°C,与其他房间趋势不一致", "厨房温度传感器在06:50、06:56、18:36、18:52共4次报告 MeasuredValue = None,无法返回有效温度值", "儿童房异常跳变发生在灯关闭、窗帘关闭后的无人活动时段,排除人为因素"], "recommended_actions": ["检查儿童房温度传感器(kids_room_temp_sensor)的硬件状态和固件版本,可能存在间歇性读数漂移或传感器老化问题,建议重启或更换", "检查厨房温度传感器(kitchen_temp_sensor)的安装位置是否距灶具过近,以及设备通信链路是否稳定,必要时重新校准或更换", "在传感器修复前,可考虑为儿童房增加一个备用温度传感器进行交叉验证,避免因单点故障导致温控自动化失效"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.931949138641357, "api_error": null} {"episode_id": "SQ3_FP_C_0568", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0568.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261197, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-10T18:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或受灶具干扰;同时入户门在16:08开锁进入后未关门/未重新上锁。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的核心活动。17:54 有人通过手动开锁进入,随后客厅灯和空调开启(Thermostat.SystemMode=3 为制冷模式),属于正常归家行为。\",\n \"推理步骤2: 18:17 厨房灯和灶具开启,18:18 厨房温度传感器报告 MeasuredValue=None。19:24 灶具关闭后,19:25 再次报告 None。加上早晨 07:01 和 07:20 也出现过 None 值,说明该传感器在灶具使用期间/前后反复出现读数丢失,共计4次。这不是偶发现象,而是一个持续性的设备异常模式。\",\n \"推理步骤3: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合使用可检测火灾风险。如果传感器在灶具工作时恰好失效,将无法通过温度异常升高来预警潜在的火灾或过热情况,形成安全监控盲区。\",\n \"推理步骤4: 16:08 入户门开锁(LockOperationType=1 即解锁),门传感器显示门打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:18:36 才记录到门关闭并自动上锁。这意味着入户门在约6小时内处于未关闭/未上锁状态,存在一定安全隐患。\",\n \"推理步骤5: 18:41 和 18:46 出现两次 LockOperationType=1(解锁)且 OperationSource=3(远程/PIN),UserIndex 分别为1和2,结合当时家中已有人的情况,推测是其他家庭成员到家,属于正常行为。\",\n \"推理步骤6: 其余活动均符合正常家庭作息:晚餐后洗碗机运行、21:12 儿童房关灯拉窗帘(孩子就寝)、22:18 客厅灯和空调关闭后主卧活动(大人就寝)、温度随夜间自然下降,无异常温度突变。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间多次报告 None:18:18、19:25(以及早间 07:01、07:20),共4次读数丢失\",\n \"16:08 入户门解锁并打开后,直到 22:18:36 才有门关闭记录,期间约6小时门可能处于未关状态\",\n \"厨房温度传感器失效时间与灶具运行时间高度相关,提示传感器可能受热源干扰或存在硬件问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否因距离灶具过近导致高温下读数异常,考虑更换或重新定位传感器\",\n \"在厨房温度传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"检查入户门自动关门/上锁机制,建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)\",\n \"确认 16:08 进入的人员身份(该次开锁无 UserIndex 信息,且进入后直奔儿童房),如为孩子放学回家属正常,建议为其分配独立的门锁用户编号以便追踪\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或受灶具干扰;同时入户门在16:08开锁进入后未关门/未重新上锁。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的核心活动。17:54 有人通过手动开锁进入,随后客厅灯和空调开启(Thermostat.SystemMode=3 为制冷模式),属于正常归家行为。", "推理步骤2: 18:17 厨房灯和灶具开启,18:18 厨房温度传感器报告 MeasuredValue=None。19:24 灶具关闭后,19:25 再次报告 None。加上早晨 07:01 和 07:20 也出现过 None 值,说明该传感器在灶具使用期间/前后反复出现读数丢失,共计4次。这不是偶发现象,而是一个持续性的设备异常模式。", "推理步骤3: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合使用可检测火灾风险。如果传感器在灶具工作时恰好失效,将无法通过温度异常升高来预警潜在的火灾或过热情况,形成安全监控盲区。", "推理步骤4: 16:08 入户门开锁(LockOperationType=1 即解锁),门传感器显示门打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:18:36 才记录到门关闭并自动上锁。这意味着入户门在约6小时内处于未关闭/未上锁状态,存在一定安全隐患。", "推理步骤5: 18:41 和 18:46 出现两次 LockOperationType=1(解锁)且 OperationSource=3(远程/PIN),UserIndex 分别为1和2,结合当时家中已有人的情况,推测是其他家庭成员到家,属于正常行为。", "推理步骤6: 其余活动均符合正常家庭作息:晚餐后洗碗机运行、21:12 儿童房关灯拉窗帘(孩子就寝)、22:18 客厅灯和空调关闭后主卧活动(大人就寝)、温度随夜间自然下降,无异常温度突变。"], "key_evidence": ["厨房温度传感器在灶具使用期间多次报告 None:18:18、19:25(以及早间 07:01、07:20),共4次读数丢失", "16:08 入户门解锁并打开后,直到 22:18:36 才有门关闭记录,期间约6小时门可能处于未关状态", "厨房温度传感器失效时间与灶具运行时间高度相关,提示传感器可能受热源干扰或存在硬件问题"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否因距离灶具过近导致高温下读数异常,考虑更换或重新定位传感器", "在厨房温度传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "检查入户门自动关门/上锁机制,建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)", "确认 16:08 进入的人员身份(该次开锁无 UserIndex 信息,且进入后直奔儿童房),如为孩子放学回家属正常,建议为其分配独立的门锁用户编号以便追踪"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.064612865447998, "api_error": null} {"episode_id": "SQ3_FP_C_0570", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0570.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261199, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "second_bedroom", "injection_time": "2026-06-20T10:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备状态正常,温度变化符合自然昼夜规律,无安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志覆盖2026-06-20全天24小时,主要内容为四个温度传感器每30分钟的温度上报,以及10:32和10:37两次门锁操作事件\",\n \"推理步骤2: 温度变化分析——凌晨(00:00-05:30)各房间温度稳定在22.9-23.1°C,日出后(06:00起)逐步升温,中午12:00-12:30达到峰值约25.7-25.9°C,午后逐渐降温,至23:30回落到23.3-23.5°C。这完全符合夏季自然昼夜温度变化曲线\",\n \"推理步骤3: 各房间温度高度一致,没有出现单个房间温度异常升高(排除火灾风险)或异常降低(排除门窗异常打开)的情况\",\n \"推理步骤4: 门锁事件分析——10:32 UserIndex=1 和 10:37 UserIndex=2 通过 OperationSource=3(远程/密码)解锁,两次操作间隔5分钟,均为已注册用户,时间在上午正常活动时段,符合家庭成员先后出门的场景(LockOperationType=1为解锁)\",\n \"推理步骤5: 未检测到任何烟雾报警、漏水报警、异常运动传感器触发、未授权门锁操作或设备离线等异常事件\"\n ],\n \"key_evidence\": [\n \"全天温度在22.9°C至25.9°C之间平稳波动,各房间温差始终在2°C以内,符合自然昼夜变化\",\n \"门锁解锁操作来自已注册用户(UserIndex 1和2),操作源为合法渠道(OperationSource=3),时间为上午正常时段\"\n ],\n \"recommended_actions\": [\n \"系统运行正常,无需采取措施\",\n \"建议确认当天是否为夏季高温天气,中午室温接近26°C,如有需要可设置空调自动开启阈值\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备状态正常,温度变化符合自然昼夜规律,无安全威胁", "reasoning": ["推理步骤1: 日志覆盖2026-06-20全天24小时,主要内容为四个温度传感器每30分钟的温度上报,以及10:32和10:37两次门锁操作事件", "推理步骤2: 温度变化分析——凌晨(00:00-05:30)各房间温度稳定在22.9-23.1°C,日出后(06:00起)逐步升温,中午12:00-12:30达到峰值约25.7-25.9°C,午后逐渐降温,至23:30回落到23.3-23.5°C。这完全符合夏季自然昼夜温度变化曲线", "推理步骤3: 各房间温度高度一致,没有出现单个房间温度异常升高(排除火灾风险)或异常降低(排除门窗异常打开)的情况", "推理步骤4: 门锁事件分析——10:32 UserIndex=1 和 10:37 UserIndex=2 通过 OperationSource=3(远程/密码)解锁,两次操作间隔5分钟,均为已注册用户,时间在上午正常活动时段,符合家庭成员先后出门的场景(LockOperationType=1为解锁)", "推理步骤5: 未检测到任何烟雾报警、漏水报警、异常运动传感器触发、未授权门锁操作或设备离线等异常事件"], "key_evidence": ["全天温度在22.9°C至25.9°C之间平稳波动,各房间温差始终在2°C以内,符合自然昼夜变化", "门锁解锁操作来自已注册用户(UserIndex 1和2),操作源为合法渠道(OperationSource=3),时间为上午正常时段"], "recommended_actions": ["系统运行正常,无需采取措施", "建议确认当天是否为夏季高温天气,中午室温接近26°C,如有需要可设置空调自动开启阈值"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.079426050186157, "api_error": null} {"episode_id": "SQ3_FP_C_0578", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0578.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261207, "scenario_id": "BA-05", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "master_bedroom", "injection_time": "2026-06-16T09:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无人活动,06:04 主卧起床、06:19 儿童房起床、06:30 洗漱、06:39 做早餐、07:18 全家出门并自动锁门,符合典型工作日晨间模式。\",\n \"推理步骤2: 09:59 有 UserIndex=5 通过 OperationSource=3(远程/密码)开锁,10:09 再次上锁,停留约10分钟,期间无异常设备操作。结合白天时段和使用已注册用户凭证,推断为保洁/保姆等授权人员短暂到访,属正常行为。\",\n \"推理步骤3: 16:11 有人回家(手动开锁),孩子直接进入儿童房开灯,符合放学回家场景。18:19 另一人回家,开客厅灯和空调(制冷模式 SystemMode=3),符合下班回家场景。\",\n \"推理步骤4: 厨房温度传感器在 06:40、06:51、18:50、19:27 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明灶具工作时传感器读数异常。虽然可能是高温超出量程导致的暂时性 null,但正常传感器应返回量程上限值而非 None,这表明传感器可能存在故障或通信异常。\",\n \"推理步骤5: 厨房窗户传感器在 06:50:30 报告 StateValue=False(窗户打开),之后日志中未见对应的关闭事件(StateValue=True)。19:26:30 再次报告 StateValue=False(再次打开或仍然打开)。整个24小时日志中厨房窗户从未记录关闭,若家中无人时段窗户持续敞开,存在安全风险。\",\n \"推理步骤6: 温度趋势方面,各房间温度从凌晨约23°C逐步升至中午约25.8°C,下午回落,晚间降至约23.3°C,符合夏季自然温度变化曲线,无异常高温或骤变。\",\n \"推理步骤7: 入户门在 22:50:18 确认关闭(StateValue=True)并自动上锁(LockState=1),夜间安防状态正常。22:50 主卧有人进入、关窗帘、关灯,进入睡眠状态。\",\n \"推理步骤8: 所有烟雾报警器、漏水传感器在整个周期内均无触发事件,无火灾或水患迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:40、06:51、18:50、19:27 四次返回 MeasuredValue = None,均与灶具使用时段重合\",\n \"厨房窗户传感器在 06:50:30 和 19:26:30 两次报告打开(StateValue=False),但全天日志中无任何关闭记录(StateValue=True)\",\n \"07:18~16:11 家中无人期间厨房窗户可能处于敞开状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如传感器本身故障,建议更换或重新配对\",\n \"确认厨房窗户当前实际状态,若确实未关闭请及时关闭;考虑设置离家自动化规则,在全家出门时检查并提醒关闭厨房窗户\",\n \"建议为 UserIndex=5 的门锁用户设置访问时间限制和到访通知,以便更好地追踪非家庭成员的进出记录\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无人活动,06:04 主卧起床、06:19 儿童房起床、06:30 洗漱、06:39 做早餐、07:18 全家出门并自动锁门,符合典型工作日晨间模式。", "推理步骤2: 09:59 有 UserIndex=5 通过 OperationSource=3(远程/密码)开锁,10:09 再次上锁,停留约10分钟,期间无异常设备操作。结合白天时段和使用已注册用户凭证,推断为保洁/保姆等授权人员短暂到访,属正常行为。", "推理步骤3: 16:11 有人回家(手动开锁),孩子直接进入儿童房开灯,符合放学回家场景。18:19 另一人回家,开客厅灯和空调(制冷模式 SystemMode=3),符合下班回家场景。", "推理步骤4: 厨房温度传感器在 06:40、06:51、18:50、19:27 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明灶具工作时传感器读数异常。虽然可能是高温超出量程导致的暂时性 null,但正常传感器应返回量程上限值而非 None,这表明传感器可能存在故障或通信异常。", "推理步骤5: 厨房窗户传感器在 06:50:30 报告 StateValue=False(窗户打开),之后日志中未见对应的关闭事件(StateValue=True)。19:26:30 再次报告 StateValue=False(再次打开或仍然打开)。整个24小时日志中厨房窗户从未记录关闭,若家中无人时段窗户持续敞开,存在安全风险。", "推理步骤6: 温度趋势方面,各房间温度从凌晨约23°C逐步升至中午约25.8°C,下午回落,晚间降至约23.3°C,符合夏季自然温度变化曲线,无异常高温或骤变。", "推理步骤7: 入户门在 22:50:18 确认关闭(StateValue=True)并自动上锁(LockState=1),夜间安防状态正常。22:50 主卧有人进入、关窗帘、关灯,进入睡眠状态。", "推理步骤8: 所有烟雾报警器、漏水传感器在整个周期内均无触发事件,无火灾或水患迹象。"], "key_evidence": ["厨房温度传感器在 06:40、06:51、18:50、19:27 四次返回 MeasuredValue = None,均与灶具使用时段重合", "厨房窗户传感器在 06:50:30 和 19:26:30 两次报告打开(StateValue=False),但全天日志中无任何关闭记录(StateValue=True)", "07:18~16:11 家中无人期间厨房窗户可能处于敞开状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如传感器本身故障,建议更换或重新配对", "确认厨房窗户当前实际状态,若确实未关闭请及时关闭;考虑设置离家自动化规则,在全家出门时检查并提醒关闭厨房窗户", "建议为 UserIndex=5 的门锁用户设置访问时间限制和到访通知,以便更好地追踪非家庭成员的进出记录"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.407591819763184, "api_error": null} {"episode_id": "SQ3_FP_C_0581", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0581.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261210, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-02T15:30:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时玄关在无人开门的情况下多次检测到运动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:25、18:13、19:15 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,排除系统级通信故障,问题定位在该传感器本身。\",\n \"推理步骤2: 观察 None 值出现的时间规律——均发生在灶具开启后不久(07:04 灶具开启 → 07:05 None;18:12 灶具开启 → 18:13 None)以及灶具关闭后(07:24 灶具关闭 → 07:25 None;19:14 灶具关闭 → 19:15 None)。这说明传感器可能受灶具工作产生的高温或电磁干扰影响而暂时失效。\",\n \"推理步骤3: 厨房温度传感器对于火灾预警和灶具安全监控至关重要。如果传感器在灶具使用期间持续失效,将无法及时检测到异常高温,存在安全盲区。\",\n \"推理步骤4: 15:30 和 15:35 玄关运动传感器两次检测到有人活动(各持续约45秒和50秒),但入户门锁和门磁均无开门/解锁记录,直到 15:55 才有正式的开锁开门事件。这两次运动可能是门外经过的人触发了传感器,属于低风险事件,但值得留意。\",\n \"推理步骤5: 其余行为模式均正常——早晨 06:30 起床、07:14 出门上班/上学并自动锁门、15:55 孩子放学回家、18:07 大人下班回家、做饭用餐、20:46 孩子就寝、22:38 大人就寝并锁门,符合典型三口之家的作息规律。\",\n \"推理步骤6: 入户门在出门(07:14)和睡前(22:38)均自动上锁,门磁确认关闭,安防状态良好。18:07 回家后门未立即锁上,但 22:38 睡前已确认锁定,属于合理行为。\",\n \"推理步骤7: 温度整体趋势合理——夜间约 22.9°C,白天随气温升高至峰值约 25.8°C(12:00-12:30),傍晚逐步回落,无异常温升。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:05、07:25、18:13、19:15 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"15:30:00 和 15:35:20 玄关运动传感器检测到活动,但无对应的门锁/门磁事件,直到 15:55 才有正式开门记录\",\n \"其他三个温度传感器在相同时段均正常工作,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰,建议适当调整安装位置或增加隔热防护\",\n \"如传感器位置无法调整,考虑更换为耐高温型号或增加一个冗余温度传感器,确保灶具使用期间的温度监控不中断\",\n \"检查玄关运动传感器的探测范围,确认是否会被门外走廊的活动误触发,必要时调整灵敏度或探测角度\",\n \"建议设置自动化规则:当灶具处于开启状态且厨房温度传感器报告 None 时,触发告警通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时玄关在无人开门的情况下多次检测到运动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:25、18:13、19:15 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,排除系统级通信故障,问题定位在该传感器本身。", "推理步骤2: 观察 None 值出现的时间规律——均发生在灶具开启后不久(07:04 灶具开启 → 07:05 None;18:12 灶具开启 → 18:13 None)以及灶具关闭后(07:24 灶具关闭 → 07:25 None;19:14 灶具关闭 → 19:15 None)。这说明传感器可能受灶具工作产生的高温或电磁干扰影响而暂时失效。", "推理步骤3: 厨房温度传感器对于火灾预警和灶具安全监控至关重要。如果传感器在灶具使用期间持续失效,将无法及时检测到异常高温,存在安全盲区。", "推理步骤4: 15:30 和 15:35 玄关运动传感器两次检测到有人活动(各持续约45秒和50秒),但入户门锁和门磁均无开门/解锁记录,直到 15:55 才有正式的开锁开门事件。这两次运动可能是门外经过的人触发了传感器,属于低风险事件,但值得留意。", "推理步骤5: 其余行为模式均正常——早晨 06:30 起床、07:14 出门上班/上学并自动锁门、15:55 孩子放学回家、18:07 大人下班回家、做饭用餐、20:46 孩子就寝、22:38 大人就寝并锁门,符合典型三口之家的作息规律。", "推理步骤6: 入户门在出门(07:14)和睡前(22:38)均自动上锁,门磁确认关闭,安防状态良好。18:07 回家后门未立即锁上,但 22:38 睡前已确认锁定,属于合理行为。", "推理步骤7: 温度整体趋势合理——夜间约 22.9°C,白天随气温升高至峰值约 25.8°C(12:00-12:30),傍晚逐步回落,无异常温升。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 07:05、07:25、18:13、19:15 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "15:30:00 和 15:35:20 玄关运动传感器检测到活动,但无对应的门锁/门磁事件,直到 15:55 才有正式开门记录", "其他三个温度传感器在相同时段均正常工作,排除系统性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰,建议适当调整安装位置或增加隔热防护", "如传感器位置无法调整,考虑更换为耐高温型号或增加一个冗余温度传感器,确保灶具使用期间的温度监控不中断", "检查玄关运动传感器的探测范围,确认是否会被门外走廊的活动误触发,必要时调整灵敏度或探测角度", "建议设置自动化规则:当灶具处于开启状态且厨房温度传感器报告 None 时,触发告警通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.78116464614868, "api_error": null} {"episode_id": "SQ3_FP_C_0587", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0587.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261216, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "dining_room", "injection_time": "2026-06-01T20:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——早晨6点起床、7:18出门上班、16:29孩子放学回家、17:46大人下班回家、22:32就寝,符合典型三口之家作息\",\n \"推理步骤2: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),入侵风险排除\",\n \"推理步骤3: 厨房温度传感器在 07:00:06、07:11:00、18:35:00、19:14:00 四次报告 MeasuredValue = None,而同时段其他三个温度传感器均正常上报数据\",\n \"推理步骤4: None 值出现的时间点与灶具使用相关(07:00 和 18:34 灶具开启前后),可能是灶具产生的热量或蒸汽干扰了传感器,也可能是传感器本身间歇性故障\",\n \"推理步骤5: 厨房窗户在做完饭后打开通风(07:10:30 和 19:13:30),属于正常行为;烟雾报警器未触发,排除火灾风险\",\n \"推理步骤6: 温度整体趋势合理——夜间约23°C,午间峰值约25.9°C,傍晚逐步回落,无异常温升\",\n \"推理步骤7: 所有漏水传感器、烟雾报警器均未触发,无水灾或火灾迹象\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:06、07:11:00、18:35:00、19:14:00 四次报告 MeasuredValue = None\",\n \"同时段其他温度传感器(客厅、主卧、儿童房)均正常上报有效数值\",\n \"None 值均出现在灶具使用期间或刚关闭后,存在环境干扰可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰\",\n \"清洁传感器探头,排除油污或水汽覆盖导致的读数异常\",\n \"如问题持续出现,考虑更换传感器或将其移至远离灶具的位置\",\n \"在传感器恢复正常前,可依赖厨房烟雾报警器作为安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常", "reasoning": ["推理步骤1: 整体生活模式正常——早晨6点起床、7:18出门上班、16:29孩子放学回家、17:46大人下班回家、22:32就寝,符合典型三口之家作息", "推理步骤2: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),入侵风险排除", "推理步骤3: 厨房温度传感器在 07:00:06、07:11:00、18:35:00、19:14:00 四次报告 MeasuredValue = None,而同时段其他三个温度传感器均正常上报数据", "推理步骤4: None 值出现的时间点与灶具使用相关(07:00 和 18:34 灶具开启前后),可能是灶具产生的热量或蒸汽干扰了传感器,也可能是传感器本身间歇性故障", "推理步骤5: 厨房窗户在做完饭后打开通风(07:10:30 和 19:13:30),属于正常行为;烟雾报警器未触发,排除火灾风险", "推理步骤6: 温度整体趋势合理——夜间约23°C,午间峰值约25.9°C,傍晚逐步回落,无异常温升", "推理步骤7: 所有漏水传感器、烟雾报警器均未触发,无水灾或火灾迹象"], "key_evidence": ["kitchen_temp_sensor 在 07:00:06、07:11:00、18:35:00、19:14:00 四次报告 MeasuredValue = None", "同时段其他温度传感器(客厅、主卧、儿童房)均正常上报有效数值", "None 值均出现在灶具使用期间或刚关闭后,存在环境干扰可能"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或蒸汽干扰", "清洁传感器探头,排除油污或水汽覆盖导致的读数异常", "如问题持续出现,考虑更换传感器或将其移至远离灶具的位置", "在传感器恢复正常前,可依赖厨房烟雾报警器作为安全兜底"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.040846586227417, "api_error": null} {"episode_id": "SQ3_FP_C_0588", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0588.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261217, "scenario_id": "BA-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "dining_room", "injection_time": "2026-06-29T16:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:54、07:25、18:45、18:56 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: None 值出现的时间与灶具开启/关闭时间高度相关(06:53 灶具开启 → 06:54 None;18:44 灶具开启 → 18:45 None),可能是灶具产生的热量或电磁干扰导致传感器暂时失效。\",\n \"推理步骤3: 其余家庭活动模式正常——早晨 6:00 起床、7:17 出门上班/上学、16:06 孩子放学回家、17:55 大人回家、22:13 就寝,符合典型三口之家作息。\",\n \"推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。所有门窗传感器状态变化均有合理上下文。\",\n \"推理步骤5: 16:25 儿童房灯快速开关闪烁(2秒间隔连续切换4次)属于轻微异常,但结合孩子刚回家的时间点,更可能是儿童玩耍行为而非设备故障或入侵。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:54、07:25、18:45、18:56 报告 MeasuredValue = None\",\n \"None 值与 kitchen_cook_surface 开启时间强相关\",\n \"16:25 kids_room_light 在 6 秒内被开关 4 次\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数\",\n \"如传感器持续出现 None 值,考虑更换设备或调整安装位置\",\n \"可对儿童房灯设置防频繁开关保护,避免儿童反复操作损坏灯具或开关\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:54、07:25、18:45、18:56 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: None 值出现的时间与灶具开启/关闭时间高度相关(06:53 灶具开启 → 06:54 None;18:44 灶具开启 → 18:45 None),可能是灶具产生的热量或电磁干扰导致传感器暂时失效。", "推理步骤3: 其余家庭活动模式正常——早晨 6:00 起床、7:17 出门上班/上学、16:06 孩子放学回家、17:55 大人回家、22:13 就寝,符合典型三口之家作息。", "推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。所有门窗传感器状态变化均有合理上下文。", "推理步骤5: 16:25 儿童房灯快速开关闪烁(2秒间隔连续切换4次)属于轻微异常,但结合孩子刚回家的时间点,更可能是儿童玩耍行为而非设备故障或入侵。"], "key_evidence": ["kitchen_temp_sensor 在 06:54、07:25、18:45、18:56 报告 MeasuredValue = None", "None 值与 kitchen_cook_surface 开启时间强相关", "16:25 kids_room_light 在 6 秒内被开关 4 次"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数", "如传感器持续出现 None 值,考虑更换设备或调整安装位置", "可对儿童房灯设置防频繁开关保护,避免儿童反复操作损坏灯具或开关"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.04151439666748, "api_error": null} {"episode_id": "SQ3_FP_C_0591", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0591.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261220, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "dining_room", "injection_time": "2026-06-23T09:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:09、18:42、19:03 共四次报告 MeasuredValue = None。其他三个温度传感器(客厅、主卧、儿童房)在整个24小时内从未出现 None 值,说明这不是系统级问题,而是厨房传感器自身的问题。\",\n \"推理步骤2: 四次 None 值均出现在灶具使用前后——06:51 灶具关闭后 06:52 出现 None,07:08 灶具开启后 07:09 出现 None,18:41 灶具开启后 18:42 出现 None,19:02 灶具关闭后 19:03 出现 None。这表明传感器可能受灶具工作状态切换的干扰(电磁干扰、温度骤变或通信冲突)。\",\n \"推理步骤3: 值得注意的是,09:18 灶具再次开启时,09:23 和 09:48 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),而同时段其他房间温度约为 24.8-25.0°C。这一异常高温读数可能是传感器在故障边缘的不稳定表现,也可能反映灶具附近的真实局部高温,但与其他时段灶具使用时的表现不一致(07:30 灶具运行中厨房温度为 24.22°C,反而偏低),进一步说明传感器读数不可靠。\",\n \"推理步骤4: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全手段。传感器频繁失效会削弱对厨房异常升温的早期预警能力。\",\n \"推理步骤5: 除传感器问题外,其余设备行为均属正常——早晨 06:16 儿童起床、06:33 大人起床、07:40 全家出门并自动锁门、16:10 孩子放学回家、17:54 大人回家开空调、18:41 做饭、19:22 洗碗机启动、20:52 孩子就寝、22:39 大人就寝并锁门,符合典型三口之家的作息规律。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:52、07:09、18:42、19:03 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联\",\n \"09:23 和 09:48 厨房温度异常读数 2700/2750,显著高于同时段其他房间约 200 个单位(约 2°C),且与其他灶具使用时段的厨房温度表现不一致\",\n \"其他三个温度传感器全天无任何 None 值或异常波动,排除系统性问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰\",\n \"检查该传感器的固件版本和电池电量(如为电池供电),考虑更新固件或更换设备\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其工作正常,并考虑增加一个备用温度传感器\",\n \"排查传感器与网关之间的通信链路,确认是否存在 Zigbee/Thread 信号干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:09、18:42、19:03 共四次报告 MeasuredValue = None。其他三个温度传感器(客厅、主卧、儿童房)在整个24小时内从未出现 None 值,说明这不是系统级问题,而是厨房传感器自身的问题。", "推理步骤2: 四次 None 值均出现在灶具使用前后——06:51 灶具关闭后 06:52 出现 None,07:08 灶具开启后 07:09 出现 None,18:41 灶具开启后 18:42 出现 None,19:02 灶具关闭后 19:03 出现 None。这表明传感器可能受灶具工作状态切换的干扰(电磁干扰、温度骤变或通信冲突)。", "推理步骤3: 值得注意的是,09:18 灶具再次开启时,09:23 和 09:48 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),而同时段其他房间温度约为 24.8-25.0°C。这一异常高温读数可能是传感器在故障边缘的不稳定表现,也可能反映灶具附近的真实局部高温,但与其他时段灶具使用时的表现不一致(07:30 灶具运行中厨房温度为 24.22°C,反而偏低),进一步说明传感器读数不可靠。", "推理步骤4: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助安全手段。传感器频繁失效会削弱对厨房异常升温的早期预警能力。", "推理步骤5: 除传感器问题外,其余设备行为均属正常——早晨 06:16 儿童起床、06:33 大人起床、07:40 全家出门并自动锁门、16:10 孩子放学回家、17:54 大人回家开空调、18:41 做饭、19:22 洗碗机启动、20:52 孩子就寝、22:39 大人就寝并锁门,符合典型三口之家的作息规律。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。"], "key_evidence": ["厨房温度传感器在 06:52、07:09、18:42、19:03 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联", "09:23 和 09:48 厨房温度异常读数 2700/2750,显著高于同时段其他房间约 200 个单位(约 2°C),且与其他灶具使用时段的厨房温度表现不一致", "其他三个温度传感器全天无任何 None 值或异常波动,排除系统性问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰", "检查该传感器的固件版本和电池电量(如为电池供电),考虑更新固件或更换设备", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其工作正常,并考虑增加一个备用温度传感器", "排查传感器与网关之间的通信链路,确认是否存在 Zigbee/Thread 信号干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.004148960113525, "api_error": null} {"episode_id": "SQ3_FP_C_0592", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0592.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261221, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-11T08:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具在无人在家期间曾处于开启状态,存在一定安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:00、07:03、18:47、19:10 四次报告 MeasuredValue = None,说明传感器出现间歇性读数丢失。这不是正常行为——其他三个温度传感器在同一时段均正常上报数值。\",\n \"推理步骤2: 观察 None 值出现的时间规律,发现均与灶具操作高度相关(07:00/07:03 紧邻灶具 07:02:35 开启;18:47/19:10 紧邻灶具 18:46:30 开启和 19:09 关闭)。可能原因包括:灶具产生的高温或电磁干扰导致传感器暂时失效,或传感器本身存在硬件老化问题。\",\n \"推理步骤3: 08:43 灶具状态显示 OnOff = True,但此时住户已于 07:50 出门(关灯、锁门、门锁自动上锁)。灶具在无人在家时处于开启状态。随后 08:48 和 09:13 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),相比同时段其他房间高出约 2-2.5°C,进一步印证灶具确实在工作。\",\n \"推理步骤4: 不过 08:43 的日志格式略有异常(缺少 Cluster 前缀,写作 OnOff = True 而非 OnOff.OnOff = True),且 09:03 客厅检测到有人(Occupancy = 1)。存在两种可能:一是有人在 09:03 前后回家但未触发门锁/门磁事件(如通过阳台门),二是日志格式不一致属于系统记录问题。无论哪种情况,灶具在 08:43-至少09:13 期间无明确人员看管的记录值得关注。\",\n \"推理步骤5: 其余行为模式均属正常:凌晨无活动、05:58 起床、06:23 洗漱、06:45 儿童起床、07:02 做早餐、07:50 全家出门上锁、16:22 孩子放学回家、17:49 大人回家开空调、18:46 做晚餐、19:40 洗碗机运行、20:49 孩子关灯睡觉、22:41 大人关灯锁门就寝。入户门锁均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤6: 16:22 入户门开锁后未记录到关门/上锁事件,直到 22:41 才记录门磁关闭和自动上锁。这段时间门可能处于未锁状态,但考虑到家中有人,属于正常生活场景,不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:00、07:03、18:47、19:10 四次报告 MeasuredValue = None,且均与灶具操作时间高度吻合\",\n \"08:43 灶具显示开启状态,但住户已于 07:50 出门并锁门;08:48 和 09:13 厨房温度异常升高至 2700/2750,高于其他房间约 2-2.5°C\",\n \"08:43 和 09:03/09:13 的日志格式与其他条目不一致(缺少 Cluster 前缀),可能存在系统记录异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器或更换设备,排除灶具高温/电磁干扰导致的间歇性故障\",\n \"核实 08:43 灶具开启事件的真实性——检查是否存在定时任务或远程操控记录;如确认灶具在无人时被开启,应排查是否有未授权的自动化规则\",\n \"建议设置安全规则:当所有住户离家(门锁上锁且无运动检测)时,若灶具开启则自动关闭并发送告警通知\",\n \"关注日志格式不一致的问题(部分条目缺少 Cluster 前缀),排查是否为固件版本差异或通信协议兼容性问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具在无人在家期间曾处于开启状态,存在一定安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:00、07:03、18:47、19:10 四次报告 MeasuredValue = None,说明传感器出现间歇性读数丢失。这不是正常行为——其他三个温度传感器在同一时段均正常上报数值。", "推理步骤2: 观察 None 值出现的时间规律,发现均与灶具操作高度相关(07:00/07:03 紧邻灶具 07:02:35 开启;18:47/19:10 紧邻灶具 18:46:30 开启和 19:09 关闭)。可能原因包括:灶具产生的高温或电磁干扰导致传感器暂时失效,或传感器本身存在硬件老化问题。", "推理步骤3: 08:43 灶具状态显示 OnOff = True,但此时住户已于 07:50 出门(关灯、锁门、门锁自动上锁)。灶具在无人在家时处于开启状态。随后 08:48 和 09:13 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),相比同时段其他房间高出约 2-2.5°C,进一步印证灶具确实在工作。", "推理步骤4: 不过 08:43 的日志格式略有异常(缺少 Cluster 前缀,写作 OnOff = True 而非 OnOff.OnOff = True),且 09:03 客厅检测到有人(Occupancy = 1)。存在两种可能:一是有人在 09:03 前后回家但未触发门锁/门磁事件(如通过阳台门),二是日志格式不一致属于系统记录问题。无论哪种情况,灶具在 08:43-至少09:13 期间无明确人员看管的记录值得关注。", "推理步骤5: 其余行为模式均属正常:凌晨无活动、05:58 起床、06:23 洗漱、06:45 儿童起床、07:02 做早餐、07:50 全家出门上锁、16:22 孩子放学回家、17:49 大人回家开空调、18:46 做晚餐、19:40 洗碗机运行、20:49 孩子关灯睡觉、22:41 大人关灯锁门就寝。入户门锁均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤6: 16:22 入户门开锁后未记录到关门/上锁事件,直到 22:41 才记录门磁关闭和自动上锁。这段时间门可能处于未锁状态,但考虑到家中有人,属于正常生活场景,不构成安全威胁。"], "key_evidence": ["厨房温度传感器在 07:00、07:03、18:47、19:10 四次报告 MeasuredValue = None,且均与灶具操作时间高度吻合", "08:43 灶具显示开启状态,但住户已于 07:50 出门并锁门;08:48 和 09:13 厨房温度异常升高至 2700/2750,高于其他房间约 2-2.5°C", "08:43 和 09:03/09:13 的日志格式与其他条目不一致(缺少 Cluster 前缀),可能存在系统记录异常"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器或更换设备,排除灶具高温/电磁干扰导致的间歇性故障", "核实 08:43 灶具开启事件的真实性——检查是否存在定时任务或远程操控记录;如确认灶具在无人时被开启,应排查是否有未授权的自动化规则", "建议设置安全规则:当所有住户离家(门锁上锁且无运动检测)时,若灶具开启则自动关闭并发送告警通知", "关注日志格式不一致的问题(部分条目缺少 Cluster 前缀),排查是否为固件版本差异或通信协议兼容性问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.199217081069946, "api_error": null} {"episode_id": "SQ3_FP_C_0593", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0593.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261222, "scenario_id": "CH-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01-FP", "scenario_name": "CH-01-FP: 孩子生病请假在家(家长陪护)", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "家长也在家(多个房间有活动),不只是儿童房,说明有成人陪护", "target_room": "second_bathroom", "injection_time": "2026-06-27T12:05:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"全屋温度在午间峰值达到约25.8°C,且全天无空调启动记录,结合夏季高温日存在居住舒适性和健康隐患;同时整个24小时内几乎无人类活动事件,家中疑似长时间无人。\",\n \"reasoning\": [\n \"推理步骤1: 温度趋势分析——Matter协议中 MeasuredValue 单位为0.01°C。凌晨各房间温度约22.9~23.1°C,从06:00起快速攀升,12:00前后达到峰值约25.7~25.8°C,之后缓慢回落,至23:30回到约23.4°C。这是典型的夏季自然昼夜温度曲线,四个传感器高度一致,无局部异常升温。\",\n \"推理步骤2: 空调未启动——日志中没有任何一台空调(living_room_ac、master_bedroom_ac、second_bedroom_ac)的状态变化记录。6月底午间室温升至近26°C,如果家中有人居住(尤其有儿童),长时间不开空调存在舒适性问题,但也可能说明家中无人。\",\n \"推理步骤3: 人员活动极度稀少——24小时内仅在12:05出现儿童房运动检测和开灯,12:15主卧运动检测,12:25客厅运动检测,之后再无任何运动传感器、灯光、门锁、门窗传感器的事件。这三次事件间隔约10分钟、从儿童房→主卧→客厅的移动轨迹看起来像一个人短暂经过,但此后整个下午和晚上完全没有活动记录,非常不寻常。\",\n \"推理步骤4: 入户门锁和门窗传感器全天无事件——没有开门/关门、上锁/解锁记录,说明这24小时内可能没有人进出。12:05的短暂活动可能是已在家中的人短暂移动后又静止(如午睡),但之后直到次日凌晨完全无活动,如果家中确实有人,这种长时间无活动值得关注。\",\n \"推理步骤5: 儿童房灯在12:05开启后无关闭记录——灯可能一直亮到日志结束,属于轻微的能耗浪费,也侧面说明无人回来关灯。\",\n \"推理步骤6: 无火灾/漏水/入侵迹象——烟雾报警器未触发,漏水传感器未报警,温度曲线平滑无突变,门窗传感器无异常开合,排除火灾、漏水和入侵风险。\"\n ],\n \"key_evidence\": [\n \"全天仅12:05~12:25出现三次运动检测事件,此后超过11小时无任何人体活动记录\",\n \"三台空调在6月底全天未启动,室温峰值达25.8°C\",\n \"入户门锁和所有门窗传感器24小时内零事件,无人进出记录\",\n \"儿童房灯12:05开启后无关闭记录,疑似无人管理\",\n \"四个房间温度传感器曲线高度一致,呈自然昼夜波动,无局部异常\"\n ],\n \"recommended_actions\": [\n \"确认家中是否有人——如有老人或儿童独自在家,长时间无活动可能存在健康风险(如跌倒、身体不适),建议立即联系家庭成员确认安全\",\n \"如家中无人属正常情况(如外出旅行),建议启用离家模式,关闭不必要的灯光(儿童房灯仍亮着)以节能\",\n \"考虑设置高温自动开启空调的联动规则,避免夏季室温过高损坏家具或影响宠物/植物\",\n \"建议配置长时间无活动告警规则,例如白天连续6小时无运动检测时推送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "health_concern", "threat_description": "全屋温度在午间峰值达到约25.8°C,且全天无空调启动记录,结合夏季高温日存在居住舒适性和健康隐患;同时整个24小时内几乎无人类活动事件,家中疑似长时间无人。", "reasoning": ["推理步骤1: 温度趋势分析——Matter协议中 MeasuredValue 单位为0.01°C。凌晨各房间温度约22.9~23.1°C,从06:00起快速攀升,12:00前后达到峰值约25.7~25.8°C,之后缓慢回落,至23:30回到约23.4°C。这是典型的夏季自然昼夜温度曲线,四个传感器高度一致,无局部异常升温。", "推理步骤2: 空调未启动——日志中没有任何一台空调(living_room_ac、master_bedroom_ac、second_bedroom_ac)的状态变化记录。6月底午间室温升至近26°C,如果家中有人居住(尤其有儿童),长时间不开空调存在舒适性问题,但也可能说明家中无人。", "推理步骤3: 人员活动极度稀少——24小时内仅在12:05出现儿童房运动检测和开灯,12:15主卧运动检测,12:25客厅运动检测,之后再无任何运动传感器、灯光、门锁、门窗传感器的事件。这三次事件间隔约10分钟、从儿童房→主卧→客厅的移动轨迹看起来像一个人短暂经过,但此后整个下午和晚上完全没有活动记录,非常不寻常。", "推理步骤4: 入户门锁和门窗传感器全天无事件——没有开门/关门、上锁/解锁记录,说明这24小时内可能没有人进出。12:05的短暂活动可能是已在家中的人短暂移动后又静止(如午睡),但之后直到次日凌晨完全无活动,如果家中确实有人,这种长时间无活动值得关注。", "推理步骤5: 儿童房灯在12:05开启后无关闭记录——灯可能一直亮到日志结束,属于轻微的能耗浪费,也侧面说明无人回来关灯。", "推理步骤6: 无火灾/漏水/入侵迹象——烟雾报警器未触发,漏水传感器未报警,温度曲线平滑无突变,门窗传感器无异常开合,排除火灾、漏水和入侵风险。"], "key_evidence": ["全天仅12:05~12:25出现三次运动检测事件,此后超过11小时无任何人体活动记录", "三台空调在6月底全天未启动,室温峰值达25.8°C", "入户门锁和所有门窗传感器24小时内零事件,无人进出记录", "儿童房灯12:05开启后无关闭记录,疑似无人管理", "四个房间温度传感器曲线高度一致,呈自然昼夜波动,无局部异常"], "recommended_actions": ["确认家中是否有人——如有老人或儿童独自在家,长时间无活动可能存在健康风险(如跌倒、身体不适),建议立即联系家庭成员确认安全", "如家中无人属正常情况(如外出旅行),建议启用离家模式,关闭不必要的灯光(儿童房灯仍亮着)以节能", "考虑设置高温自动开启空调的联动规则,避免夏季室温过高损坏家具或影响宠物/植物", "建议配置长时间无活动告警规则,例如白天连续6小时无运动检测时推送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.569680213928223, "api_error": null} {"episode_id": "SQ3_FP_C_0595", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0595.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261224, "scenario_id": "INS-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-14T18:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备行为均在正常范围内,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析 — 全屋四个温度传感器在24小时内呈现一致的日变化曲线:凌晨最低约22.9°C,中午峰值约25.8°C,傍晚逐步回落至23.3°C。各房间温差始终在2°C以内,无任何单点异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 入户门锁事件分析 — 18:54:00 出现一次 LockOperationError(OperationError=1, OperationSource=3,即密码/PIN输入错误),仅20秒后同一来源(OperationSource=3)由 UserIndex=1(户主)成功解锁(LockOperationType=1)。单次密码输入错误后立即成功解锁,属于日常使用中的正常误操作。\",\n \"推理步骤3: 入户门与玄关联动验证 — 解锁成功后2秒门磁传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1)。时序紧密且符合'解锁→开门→进入'的正常回家流程。\",\n \"推理步骤4: 时间合理性判断 — 18:54 属于傍晚正常回家时段,与住户下班回家的生活习惯高度吻合。\",\n \"推理步骤5: 无其他异常信号 — 整个日志中烟雾报警器、漏水传感器、窗户传感器均无触发事件;无深夜异常开门/开窗记录;无设备离线或故障报告。\"\n ],\n \"key_evidence\": [\n \"18:54:00 门锁密码错误仅1次,20秒后户主(UserIndex=1)即成功解锁,不符合暴力破解的多次连续失败模式\",\n \"解锁→开门→玄关检测到人的时序链完整且间隔合理(共约25秒),符合正常进门行为\",\n \"全屋温度曲线平滑一致,无异常热源,所有安全类传感器(烟雾、漏水、窗户)全天无告警\"\n ],\n \"recommended_actions\": [\n \"可保持现有安全配置不变,当前系统运行正常\",\n \"建议设置门锁连续错误阈值告警(如5分钟内错误3次以上触发通知),以便在真正的暴力尝试时及时预警\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备行为均在正常范围内,未发现安全威胁。", "reasoning": ["推理步骤1: 温度数据分析 — 全屋四个温度传感器在24小时内呈现一致的日变化曲线:凌晨最低约22.9°C,中午峰值约25.8°C,傍晚逐步回落至23.3°C。各房间温差始终在2°C以内,无任何单点异常升温,排除火灾或设备过热风险。", "推理步骤2: 入户门锁事件分析 — 18:54:00 出现一次 LockOperationError(OperationError=1, OperationSource=3,即密码/PIN输入错误),仅20秒后同一来源(OperationSource=3)由 UserIndex=1(户主)成功解锁(LockOperationType=1)。单次密码输入错误后立即成功解锁,属于日常使用中的正常误操作。", "推理步骤3: 入户门与玄关联动验证 — 解锁成功后2秒门磁传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1)。时序紧密且符合'解锁→开门→进入'的正常回家流程。", "推理步骤4: 时间合理性判断 — 18:54 属于傍晚正常回家时段,与住户下班回家的生活习惯高度吻合。", "推理步骤5: 无其他异常信号 — 整个日志中烟雾报警器、漏水传感器、窗户传感器均无触发事件;无深夜异常开门/开窗记录;无设备离线或故障报告。"], "key_evidence": ["18:54:00 门锁密码错误仅1次,20秒后户主(UserIndex=1)即成功解锁,不符合暴力破解的多次连续失败模式", "解锁→开门→玄关检测到人的时序链完整且间隔合理(共约25秒),符合正常进门行为", "全屋温度曲线平滑一致,无异常热源,所有安全类传感器(烟雾、漏水、窗户)全天无告警"], "recommended_actions": ["可保持现有安全配置不变,当前系统运行正常", "建议设置门锁连续错误阈值告警(如5分钟内错误3次以上触发通知),以便在真正的暴力尝试时及时预警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.92400860786438, "api_error": null} {"episode_id": "SQ3_FP_C_0596", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0596.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261225, "scenario_id": "CH-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "CH-03-FP", "scenario_name": "CH-03-FP: 孩子起夜上厕所", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "路径是 儿童房→卫生间→儿童房,直来直去没有去其他地方,持续时间短", "target_room": "master_bathroom", "injection_time": "2026-06-29T08:16:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约18:00-23:30)的事件日志,整体生活模式正常——18:14有人回家开灯开空调,18:40做饭,19:53开洗碗机,20:59儿童房关灯拉窗帘(孩子睡觉),22:41大人关灯锁门就寝。\",\n \"推理步骤2: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,且伴随正常的运动传感器触发和灯光操作,无异常入侵迹象。\",\n \"推理步骤3: 厨房温度传感器在18:41和18:54连续报告 MeasuredValue = None。结合早晨06:57和07:06也出现同样问题,该传感器在灶具使用期间/之后反复丢失读数,可能是高温导致传感器通信中断或设备本身故障。\",\n \"推理步骤4: 厨房窗户在做饭结束后打开(18:53:30),属于通风的正常操作。但窗户传感器只记录了打开(StateValue=False),未记录关闭,结合入睡时间已过,厨房窗户可能仍处于打开状态,存在轻微安全隐患。\",\n \"推理步骤5: 其他传感器(烟雾报警器、漏水传感器)无告警,温度变化趋势平稳合理,无火灾或漏水风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 18:41 和 18:54 报告 MeasuredValue = None(当天已累计出现4次)\",\n \"厨房窗户 18:53:30 打开后至日志结束(23:30)未记录关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换或重新定位传感器\",\n \"确认厨房窗户当前状态,夜间建议关闭窗户并锁好,避免安全隐患\",\n \"考虑设置自动化规则:当温度传感器连续报告 None 时触发告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 分析过去6小时(约18:00-23:30)的事件日志,整体生活模式正常——18:14有人回家开灯开空调,18:40做饭,19:53开洗碗机,20:59儿童房关灯拉窗帘(孩子睡觉),22:41大人关灯锁门就寝。", "推理步骤2: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,且伴随正常的运动传感器触发和灯光操作,无异常入侵迹象。", "推理步骤3: 厨房温度传感器在18:41和18:54连续报告 MeasuredValue = None。结合早晨06:57和07:06也出现同样问题,该传感器在灶具使用期间/之后反复丢失读数,可能是高温导致传感器通信中断或设备本身故障。", "推理步骤4: 厨房窗户在做饭结束后打开(18:53:30),属于通风的正常操作。但窗户传感器只记录了打开(StateValue=False),未记录关闭,结合入睡时间已过,厨房窗户可能仍处于打开状态,存在轻微安全隐患。", "推理步骤5: 其他传感器(烟雾报警器、漏水传感器)无告警,温度变化趋势平稳合理,无火灾或漏水风险。"], "key_evidence": ["kitchen_temp_sensor 在 18:41 和 18:54 报告 MeasuredValue = None(当天已累计出现4次)", "厨房窗户 18:53:30 打开后至日志结束(23:30)未记录关闭事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换或重新定位传感器", "确认厨房窗户当前状态,夜间建议关闭窗户并锁好,避免安全隐患", "考虑设置自动化规则:当温度传感器连续报告 None 时触发告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.21877956390381, "api_error": null} {"episode_id": "SQ3_FP_C_0606", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0606.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261235, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kids_room", "injection_time": "2026-06-05T17:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:14开锁进入后未关闭/上锁,直到22:27才确认关门上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:53、07:31、18:11、19:20四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是厨房温度传感器自身的故障。\",\n \"推理步骤2: 观察 None 值出现的时间点——06:52灶具开启后06:53出现None,07:30灶具关闭后07:31出现None,18:10灶具开启后18:11出现None,19:19灶具关闭后19:20出现None。每次灶具状态变化后约1分钟传感器就报None,高度相关,可能是灶具运行产生的热量或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 16:14入户门解锁开门(front_door_contact = False),有人进入后直奔儿童房(符合放学回家的模式),但日志中未见16:14之后的关门(StateValue = True)和上锁记录,直到22:27才出现 front_door_contact = True 和自动上锁。这意味着入户门可能有超过6小时处于未关闭或未上锁状态。\",\n \"推理步骤4: 其余行为模式均属正常——06:32起床、07:37出门上锁、16:14放学回家、18:17大人回家、21:03儿童房关灯睡觉、22:27大人就寝锁门,符合典型的三口之家作息。温度曲线呈现正常的日间升温夜间降温趋势(约23°C~26°C),无火灾或异常高温迹象。\",\n \"推理步骤5: 厨房窗户在07:30和19:30各打开一次(StateValue = False),均在做饭后通风,属正常行为,但日志中未见关闭记录,可能是窗户一直保持开启状态,夜间存在一定安全风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:53、07:31、18:11、19:20四次报告 MeasuredValue = None,且均与灶具开关操作高度关联\",\n \"16:14入户门解锁开门后,直到22:27(约6小时后)才记录到关门上锁,期间入户门可能处于未锁定状态\",\n \"厨房窗户在07:30开启后日志中无关闭记录,可能整天保持开启\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数,必要时更换或重新定位传感器\",\n \"设置入户门未关闭/未上锁超时告警(建议阈值5~10分钟),避免长时间门户大开的安全隐患\",\n \"为厨房窗户添加夜间未关闭提醒,防止夜间开窗带来的安全和天气风险\",\n \"检查厨房温度传感器固件版本,考虑升级固件或联系厂商确认是否存在已知的读数异常问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:14开锁进入后未关闭/上锁,直到22:27才确认关门上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在06:53、07:31、18:11、19:20四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是厨房温度传感器自身的故障。", "推理步骤2: 观察 None 值出现的时间点——06:52灶具开启后06:53出现None,07:30灶具关闭后07:31出现None,18:10灶具开启后18:11出现None,19:19灶具关闭后19:20出现None。每次灶具状态变化后约1分钟传感器就报None,高度相关,可能是灶具运行产生的热量或电磁干扰导致传感器读数异常。", "推理步骤3: 16:14入户门解锁开门(front_door_contact = False),有人进入后直奔儿童房(符合放学回家的模式),但日志中未见16:14之后的关门(StateValue = True)和上锁记录,直到22:27才出现 front_door_contact = True 和自动上锁。这意味着入户门可能有超过6小时处于未关闭或未上锁状态。", "推理步骤4: 其余行为模式均属正常——06:32起床、07:37出门上锁、16:14放学回家、18:17大人回家、21:03儿童房关灯睡觉、22:27大人就寝锁门,符合典型的三口之家作息。温度曲线呈现正常的日间升温夜间降温趋势(约23°C~26°C),无火灾或异常高温迹象。", "推理步骤5: 厨房窗户在07:30和19:30各打开一次(StateValue = False),均在做饭后通风,属正常行为,但日志中未见关闭记录,可能是窗户一直保持开启状态,夜间存在一定安全风险。"], "key_evidence": ["厨房温度传感器在06:53、07:31、18:11、19:20四次报告 MeasuredValue = None,且均与灶具开关操作高度关联", "16:14入户门解锁开门后,直到22:27(约6小时后)才记录到关门上锁,期间入户门可能处于未锁定状态", "厨房窗户在07:30开启后日志中无关闭记录,可能整天保持开启"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数,必要时更换或重新定位传感器", "设置入户门未关闭/未上锁超时告警(建议阈值5~10分钟),避免长时间门户大开的安全隐患", "为厨房窗户添加夜间未关闭提醒,防止夜间开窗带来的安全和天气风险", "检查厨房温度传感器固件版本,考虑升级固件或联系厂商确认是否存在已知的读数异常问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.96985173225403, "api_error": null} {"episode_id": "SQ3_FP_C_0601", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0601.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261230, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "balcony", "injection_time": "2026-06-03T12:36:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门锁在中午出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无人活动,06:07 主卧起床、06:20 儿童房起床,07:39 全家出门并自动锁门,16:01 有人(孩子)回家,18:04 大人回家,21:10 孩子就寝,22:10 大人就寝。这是典型的工作日三口之家作息,无入侵迹象。\",\n \"推理步骤2: 温度数据整体合理,呈现夏季日间升温、夜间降温的自然曲线(凌晨约 22.9-23.1°C,正午峰值约 25.9°C,晚间回落至 23.3°C)。06:00 时各房间温度从约 23°C 跳升至约 24°C,幅度约 1°C/30min,属于夏季日出后正常升温。\",\n \"推理步骤3: 厨房温度传感器在 07:06:09、07:07:00、18:33:00、19:25:00 四次报告 MeasuredValue = None。这些时间点均与灶具使用相关(07:05 开灶/07:06 关灶,18:32 开灶/19:24 关灶),但传感器不应因灶具操作而丢失读数。07:30 和 19:30 的定时读数又恢复正常,说明传感器存在间歇性故障,可能是高温环境下通信不稳定或传感器本身老化。\",\n \"推理步骤4: 12:36:00 入户门锁报告 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/密码开锁,错误码 1 表示凭证无效。20 秒后 UserIndex=1 成功开锁,说明是合法用户首次输入错误后重试成功(可能是中午回家取东西)。单次失败不构成入侵威胁,但值得记录。\",\n \"推理步骤5: 灶具使用时间合理(早餐约 30 秒快速加热、晚餐约 52 分钟),且厨房烟雾报警器全天未触发,无火灾风险。厨房窗户在做饭后打开通风(07:06:30 和 19:24:30),属正常操作。\",\n \"推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,无水患风险。客厅和厨房烟雾报警器全天无触发,无火灾/CO 风险。\",\n \"推理步骤7: 次卫灯在 06:39 开启但日志中未见关闭记录,可能是遗忘关灯或日志截断,属轻微能耗浪费,非安全威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:06:09、07:07:00、18:33:00、19:25:00 四次报告 MeasuredValue = None,均与灶具使用时段重合,表明传感器在高温或电磁干扰环境下间歇性失效\",\n \"12:36:00 入户门锁报告 LockOperationError(OperationError=1, OperationSource=3),远程/密码开锁失败一次,20 秒后 UserIndex=1 成功开锁\",\n \"次卫灯 06:39 开启后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;考虑更换传感器或调整安装位置,确保在灶具使用期间仍能正常读数,这对厨房火灾预警至关重要\",\n \"检查入户门锁的密码/凭证列表,确认 OperationSource=3 对应的开锁方式(密码/远程),排查是否有过期或错误的凭证需要清理\",\n \"确认次卫灯是否仍处于开启状态,如是则关闭以节能;可考虑为次卫增加运动传感器实现自动关灯\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门锁在中午出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无人活动,06:07 主卧起床、06:20 儿童房起床,07:39 全家出门并自动锁门,16:01 有人(孩子)回家,18:04 大人回家,21:10 孩子就寝,22:10 大人就寝。这是典型的工作日三口之家作息,无入侵迹象。", "推理步骤2: 温度数据整体合理,呈现夏季日间升温、夜间降温的自然曲线(凌晨约 22.9-23.1°C,正午峰值约 25.9°C,晚间回落至 23.3°C)。06:00 时各房间温度从约 23°C 跳升至约 24°C,幅度约 1°C/30min,属于夏季日出后正常升温。", "推理步骤3: 厨房温度传感器在 07:06:09、07:07:00、18:33:00、19:25:00 四次报告 MeasuredValue = None。这些时间点均与灶具使用相关(07:05 开灶/07:06 关灶,18:32 开灶/19:24 关灶),但传感器不应因灶具操作而丢失读数。07:30 和 19:30 的定时读数又恢复正常,说明传感器存在间歇性故障,可能是高温环境下通信不稳定或传感器本身老化。", "推理步骤4: 12:36:00 入户门锁报告 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/密码开锁,错误码 1 表示凭证无效。20 秒后 UserIndex=1 成功开锁,说明是合法用户首次输入错误后重试成功(可能是中午回家取东西)。单次失败不构成入侵威胁,但值得记录。", "推理步骤5: 灶具使用时间合理(早餐约 30 秒快速加热、晚餐约 52 分钟),且厨房烟雾报警器全天未触发,无火灾风险。厨房窗户在做饭后打开通风(07:06:30 和 19:24:30),属正常操作。", "推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,无水患风险。客厅和厨房烟雾报警器全天无触发,无火灾/CO 风险。", "推理步骤7: 次卫灯在 06:39 开启但日志中未见关闭记录,可能是遗忘关灯或日志截断,属轻微能耗浪费,非安全威胁。"], "key_evidence": ["厨房温度传感器在 07:06:09、07:07:00、18:33:00、19:25:00 四次报告 MeasuredValue = None,均与灶具使用时段重合,表明传感器在高温或电磁干扰环境下间歇性失效", "12:36:00 入户门锁报告 LockOperationError(OperationError=1, OperationSource=3),远程/密码开锁失败一次,20 秒后 UserIndex=1 成功开锁", "次卫灯 06:39 开启后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;考虑更换传感器或调整安装位置,确保在灶具使用期间仍能正常读数,这对厨房火灾预警至关重要", "检查入户门锁的密码/凭证列表,确认 OperationSource=3 对应的开锁方式(密码/远程),排查是否有过期或错误的凭证需要清理", "确认次卫灯是否仍处于开启状态,如是则关闭以节能;可考虑为次卫增加运动传感器实现自动关灯"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.975017309188843, "api_error": null} {"episode_id": "SQ3_FP_C_0611", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0611.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261240, "scenario_id": "DF-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-21T14:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"过去6小时内所有设备状态正常,未发现安全威胁或异常行为模式。\",\n \"reasoning\": [\n \"推理步骤1: 确定分析时间窗口为过去6小时,即 2026-06-21 17:30 至 23:30。在此期间,日志中仅有四个温度传感器的周期性读数上报,无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的事件。\",\n \"推理步骤2: 分析温度变化趋势——四个房间的温度从 17:30 的约 24.7-24.9°C 持续平稳下降至 23:30 的约 23.3°C,符合夏季傍晚至深夜的自然降温规律,下降幅度约 1.4-1.6°C/6h,速率均匀,无突变。\",\n \"推理步骤3: 各房间温度高度一致且同步变化,不存在某个房间温度异常偏高或偏低的情况,排除了局部火灾风险(温度骤升)或窗户异常打开(某房间温度骤降)的可能。\",\n \"推理步骤4: 厨房温度传感器在此时间段内未出现异常升温,且无烟雾报警器触发事件,排除厨房火灾或灶具遗忘关闭的风险。\",\n \"推理步骤5: 无入户门锁解锁/上锁事件、无门窗传感器开合事件、无运动传感器触发事件,说明该时段内家庭处于平静状态,无入侵迹象。\",\n \"推理步骤6: 无漏水传感器报警,无烟雾/CO报警器触发,所有安防类传感器均保持静默,属于正常状态。\"\n ],\n \"key_evidence\": [\n \"17:30-23:30期间四个房间温度从约24.7-24.9°C平稳下降至约23.3°C,变化趋势一致且符合自然降温规律\",\n \"该时段内无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备事件触发\",\n \"温度传感器每30分钟规律上报一次,无异常上报频率或数据跳变\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "过去6小时内所有设备状态正常,未发现安全威胁或异常行为模式。", "reasoning": ["推理步骤1: 确定分析时间窗口为过去6小时,即 2026-06-21 17:30 至 23:30。在此期间,日志中仅有四个温度传感器的周期性读数上报,无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的事件。", "推理步骤2: 分析温度变化趋势——四个房间的温度从 17:30 的约 24.7-24.9°C 持续平稳下降至 23:30 的约 23.3°C,符合夏季傍晚至深夜的自然降温规律,下降幅度约 1.4-1.6°C/6h,速率均匀,无突变。", "推理步骤3: 各房间温度高度一致且同步变化,不存在某个房间温度异常偏高或偏低的情况,排除了局部火灾风险(温度骤升)或窗户异常打开(某房间温度骤降)的可能。", "推理步骤4: 厨房温度传感器在此时间段内未出现异常升温,且无烟雾报警器触发事件,排除厨房火灾或灶具遗忘关闭的风险。", "推理步骤5: 无入户门锁解锁/上锁事件、无门窗传感器开合事件、无运动传感器触发事件,说明该时段内家庭处于平静状态,无入侵迹象。", "推理步骤6: 无漏水传感器报警,无烟雾/CO报警器触发,所有安防类传感器均保持静默,属于正常状态。"], "key_evidence": ["17:30-23:30期间四个房间温度从约24.7-24.9°C平稳下降至约23.3°C,变化趋势一致且符合自然降温规律", "该时段内无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备事件触发", "温度传感器每30分钟规律上报一次,无异常上报频率或数据跳变"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.19894003868103, "api_error": null} {"episode_id": "SQ3_FP_C_0607", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0607.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261236, "scenario_id": "INS-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "master_bedroom", "injection_time": "2026-06-20T08:28:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"家中疑似无人居住的全天中,08:28 出现短暂的客厅活动并关闭窗帘,行为模式异常。\",\n \"reasoning\": [\n \"推理步骤1: 日志覆盖完整的 24 小时(00:00–23:30),除 08:28 的一组事件外,全天仅有温度传感器的周期性上报,无任何运动、开门、开灯等人类活动痕迹,说明住户大概率全天不在家。\",\n \"推理步骤2: 08:28:00 客厅运动传感器触发(Occupancy=1),3 秒后客厅主灯打开,10 秒后客厅窗帘关闭(StateValue=False),15 秒后灯关闭,20 秒后运动传感器恢复(Occupancy=0)。整个过程仅持续 20 秒,动作极为迅速且有明确目的性。\",\n \"推理步骤3: 入户门锁(front_door_lock)和入户门传感器(front_door_contact)在整个时间段内没有任何事件记录,意味着没有人通过正门进出。如果是住户回家,正常应先触发入户门锁/门传感器和玄关运动传感器,但这些均未触发。\",\n \"推理步骤4: 该活动没有触发玄关、餐厅或任何其他房间的运动传感器,说明活动者直接出现在客厅区域,未经过正常入户路径,可能通过阳台或窗户进入。\",\n \"推理步骤5: 关闭窗帘的行为在入侵场景中具有典型意义——遮挡外部视线。灯亮后迅速关闭也符合快速查看环境后避免暴露的模式。\",\n \"推理步骤6: 温度数据方面,全天各房间温度走势一致(夜间约 22.9–23.1°C,午间峰值约 25.7–25.9°C),无空调运行痕迹,无厨房异常升温,排除火灾和设备故障的可能。\"\n ],\n \"key_evidence\": [\n \"08:28:00–08:28:20 客厅出现 20 秒的短暂活动序列:运动检测→开灯→关窗帘→关灯→运动消失\",\n \"全天 24 小时入户门锁和入户门传感器无任何事件,玄关运动传感器也未触发,无人通过正门进出\",\n \"除此 20 秒外,全天无任何房间的运动、灯光、门窗等人类活动事件,住户大概率不在家\",\n \"活动者未经过玄关/餐厅等正常入户路径,直接出现在客厅\"\n ],\n \"recommended_actions\": [\n \"立即查看客厅区域的监控录像(如有),确认 08:28 前后是否有陌生人进入\",\n \"检查阳台门传感器(balcony_door_contact)和客厅窗户传感器的历史状态,确认是否有非正门的进入路径\",\n \"远程确认入户门锁状态是否正常上锁,必要时远程锁定\",\n \"联系住户确认是否有家人、保姆或维修人员在该时段进入\",\n \"如无法确认合法进入者,建议通知物业或报警处理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "家中疑似无人居住的全天中,08:28 出现短暂的客厅活动并关闭窗帘,行为模式异常。", "reasoning": ["推理步骤1: 日志覆盖完整的 24 小时(00:00–23:30),除 08:28 的一组事件外,全天仅有温度传感器的周期性上报,无任何运动、开门、开灯等人类活动痕迹,说明住户大概率全天不在家。", "推理步骤2: 08:28:00 客厅运动传感器触发(Occupancy=1),3 秒后客厅主灯打开,10 秒后客厅窗帘关闭(StateValue=False),15 秒后灯关闭,20 秒后运动传感器恢复(Occupancy=0)。整个过程仅持续 20 秒,动作极为迅速且有明确目的性。", "推理步骤3: 入户门锁(front_door_lock)和入户门传感器(front_door_contact)在整个时间段内没有任何事件记录,意味着没有人通过正门进出。如果是住户回家,正常应先触发入户门锁/门传感器和玄关运动传感器,但这些均未触发。", "推理步骤4: 该活动没有触发玄关、餐厅或任何其他房间的运动传感器,说明活动者直接出现在客厅区域,未经过正常入户路径,可能通过阳台或窗户进入。", "推理步骤5: 关闭窗帘的行为在入侵场景中具有典型意义——遮挡外部视线。灯亮后迅速关闭也符合快速查看环境后避免暴露的模式。", "推理步骤6: 温度数据方面,全天各房间温度走势一致(夜间约 22.9–23.1°C,午间峰值约 25.7–25.9°C),无空调运行痕迹,无厨房异常升温,排除火灾和设备故障的可能。"], "key_evidence": ["08:28:00–08:28:20 客厅出现 20 秒的短暂活动序列:运动检测→开灯→关窗帘→关灯→运动消失", "全天 24 小时入户门锁和入户门传感器无任何事件,玄关运动传感器也未触发,无人通过正门进出", "除此 20 秒外,全天无任何房间的运动、灯光、门窗等人类活动事件,住户大概率不在家", "活动者未经过玄关/餐厅等正常入户路径,直接出现在客厅"], "recommended_actions": ["立即查看客厅区域的监控录像(如有),确认 08:28 前后是否有陌生人进入", "检查阳台门传感器(balcony_door_contact)和客厅窗户传感器的历史状态,确认是否有非正门的进入路径", "远程确认入户门锁状态是否正常上锁,必要时远程锁定", "联系住户确认是否有家人、保姆或维修人员在该时段进入", "如无法确认合法进入者,建议通知物业或报警处理"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.960920810699463, "api_error": null} {"episode_id": "SQ3_FP_C_0612", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0612.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261241, "scenario_id": "BA-05", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "dining_room", "injection_time": "2026-06-11T10:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:32、07:30、18:51、19:02 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关(06:31 灶具开启 → 06:32 None;18:50 灶具开启 → 18:51 None;19:01 灶具关闭 → 19:02 None),可能是灶具工作时产生的热量或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 整体生活模式正常——早晨约6点起床、7:13出门上班/上学、10:55有访客短暂到访(UserIndex=5,远程开锁)、16:16孩子放学回家、17:43大人下班回家、22:25就寝锁门,符合三口之家的典型作息。\",\n \"推理步骤4: 入户门锁操作均有合理来源(Manual手动、Auto自动上锁、UserIndex=5远程/密码开锁),未出现未授权开锁或暴力破解事件。\",\n \"推理步骤5: 温度整体趋势合理(夜间22-23°C,午间峰值约25.9°C),无异常高温指示火灾风险;烟雾报警器和漏水传感器均未触发。\",\n \"推理步骤6: 虽然不构成安全威胁,但传感器反复报告 None 值属于设备异常,可能导致在真正发生厨房高温/火灾时无法及时预警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:32、07:30、18:51、19:02 报告 MeasuredValue = None\",\n \"None 值出现时间与 kitchen_cook_surface 开关操作强相关\",\n \"其他温度传感器同时段读数正常,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热干扰或电磁干扰\",\n \"考虑将传感器重新定位或增加隔热防护,确保灶具工作时仍能正常采集温度\",\n \"如问题持续,更换传感器或检查其固件版本是否需要升级\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:32、07:30、18:51、19:02 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关(06:31 灶具开启 → 06:32 None;18:50 灶具开启 → 18:51 None;19:01 灶具关闭 → 19:02 None),可能是灶具工作时产生的热量或电磁干扰导致传感器读数异常。", "推理步骤3: 整体生活模式正常——早晨约6点起床、7:13出门上班/上学、10:55有访客短暂到访(UserIndex=5,远程开锁)、16:16孩子放学回家、17:43大人下班回家、22:25就寝锁门,符合三口之家的典型作息。", "推理步骤4: 入户门锁操作均有合理来源(Manual手动、Auto自动上锁、UserIndex=5远程/密码开锁),未出现未授权开锁或暴力破解事件。", "推理步骤5: 温度整体趋势合理(夜间22-23°C,午间峰值约25.9°C),无异常高温指示火灾风险;烟雾报警器和漏水传感器均未触发。", "推理步骤6: 虽然不构成安全威胁,但传感器反复报告 None 值属于设备异常,可能导致在真正发生厨房高温/火灾时无法及时预警。"], "key_evidence": ["kitchen_temp_sensor 在 06:32、07:30、18:51、19:02 报告 MeasuredValue = None", "None 值出现时间与 kitchen_cook_surface 开关操作强相关", "其他温度传感器同时段读数正常,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热干扰或电磁干扰", "考虑将传感器重新定位或增加隔热防护,确保灶具工作时仍能正常采集温度", "如问题持续,更换传感器或检查其固件版本是否需要升级"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.811567306518555, "api_error": null} {"episode_id": "SQ3_FP_C_0614", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0614.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261243, "scenario_id": "BA-03", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "dining_room", "injection_time": "2026-06-06T22:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房灯在深夜22:57出现快速反复开关(2秒间隔闪烁4次),疑似设备故障或儿童误操作。\",\n \"reasoning\": [\n \"推理步骤1: 分析时间范围——任务要求过去6小时,即6月6日约17:30至23:30。在此期间,温度数据呈现正常的夜间降温趋势,各房间温度同步下降,无异常温差。\",\n \"推理步骤2: 在22:57:00,儿童房运动传感器检测到有人(Occupancy=1),随后22:57:02至22:57:08期间,儿童房灯以精确2秒间隔被反复开关4次(开→关→开→关),最终停留在关闭状态。\",\n \"推理步骤3: 这种快速、规律的2秒间隔闪烁模式不符合正常的人为操作习惯。正常开关灯不会以如此精确的节奏反复切换。可能的原因包括:(a) 智能开关或灯具固件故障导致状态抖动;(b) 自动化规则冲突(如运动触发开灯与夜间模式关灯规则互相矛盾);(c) 儿童在深夜反复按压开关玩耍。\",\n \"推理步骤4: 时间点为深夜近23点,如果家中有儿童,此时应已入睡。儿童房出现运动检测和灯光闪烁,可能意味着儿童夜间醒来活动,也需要关注。\",\n \"推理步骤5: 排除入侵可能——入户门锁和入户门传感器在此期间无任何事件,所有窗户传感器也无变化,不存在外部入侵迹象。排除火灾/漏水——烟雾报警器和漏水传感器均无触发,温度曲线正常。\"\n ],\n \"key_evidence\": [\n \"22:57:02-22:57:08 儿童房灯在6秒内被开关4次,呈精确的2秒间隔规律闪烁(True→False→True→False)\",\n \"22:57:00 儿童房运动传感器触发(Occupancy=1),深夜时段儿童房出现活动\",\n \"整个时间窗口内除儿童房灯闪烁外,无其他设备状态变化事件(门锁、门窗传感器、报警器均静默)\"\n ],\n \"recommended_actions\": [\n \"检查儿童房灯具及智能开关的固件版本,排查是否存在已知的状态抖动bug,必要时更新固件\",\n \"检查是否存在冲突的自动化规则(如运动感应开灯与夜间定时关灯规则同时生效),如有则调整规则优先级或添加互斥条件\",\n \"确认儿童夜间是否安全,考虑为儿童房设置夜间运动提醒,以便家长及时知晓孩子夜间起身情况\",\n \"如问题反复出现,建议更换灯具或开关模块以排除硬件故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "儿童房灯在深夜22:57出现快速反复开关(2秒间隔闪烁4次),疑似设备故障或儿童误操作。", "reasoning": ["推理步骤1: 分析时间范围——任务要求过去6小时,即6月6日约17:30至23:30。在此期间,温度数据呈现正常的夜间降温趋势,各房间温度同步下降,无异常温差。", "推理步骤2: 在22:57:00,儿童房运动传感器检测到有人(Occupancy=1),随后22:57:02至22:57:08期间,儿童房灯以精确2秒间隔被反复开关4次(开→关→开→关),最终停留在关闭状态。", "推理步骤3: 这种快速、规律的2秒间隔闪烁模式不符合正常的人为操作习惯。正常开关灯不会以如此精确的节奏反复切换。可能的原因包括:(a) 智能开关或灯具固件故障导致状态抖动;(b) 自动化规则冲突(如运动触发开灯与夜间模式关灯规则互相矛盾);(c) 儿童在深夜反复按压开关玩耍。", "推理步骤4: 时间点为深夜近23点,如果家中有儿童,此时应已入睡。儿童房出现运动检测和灯光闪烁,可能意味着儿童夜间醒来活动,也需要关注。", "推理步骤5: 排除入侵可能——入户门锁和入户门传感器在此期间无任何事件,所有窗户传感器也无变化,不存在外部入侵迹象。排除火灾/漏水——烟雾报警器和漏水传感器均无触发,温度曲线正常。"], "key_evidence": ["22:57:02-22:57:08 儿童房灯在6秒内被开关4次,呈精确的2秒间隔规律闪烁(True→False→True→False)", "22:57:00 儿童房运动传感器触发(Occupancy=1),深夜时段儿童房出现活动", "整个时间窗口内除儿童房灯闪烁外,无其他设备状态变化事件(门锁、门窗传感器、报警器均静默)"], "recommended_actions": ["检查儿童房灯具及智能开关的固件版本,排查是否存在已知的状态抖动bug,必要时更新固件", "检查是否存在冲突的自动化规则(如运动感应开灯与夜间定时关灯规则同时生效),如有则调整规则优先级或添加互斥条件", "确认儿童夜间是否安全,考虑为儿童房设置夜间运动提醒,以便家长及时知晓孩子夜间起身情况", "如问题反复出现,建议更换灯具或开关模块以排除硬件故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.07471489906311, "api_error": null} {"episode_id": "SQ3_FP_C_0617", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0617.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261246, "scenario_id": "FG-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-07T22:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"深夜22:24厨房灶具被开启,厨房温度在5分钟内从23.67°C飙升至27°C并持续上升至27.5°C,但无人在厨房附近活动,存在无人看管的火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:24厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时已是深夜,属于非常规烹饪时间。\",\n \"推理步骤2: 同一时刻客厅运动传感器显示Occupancy=0,说明客厅无人。直到22:44客厅才检测到有人,中间有20分钟灶具处于无人关注状态。\",\n \"推理步骤3: 22:29厨房温度传感器报告2700(27.0°C),相比22:00的2367(23.67°C)在5分钟内急剧上升约3.3°C,这是异常的局部温升。\",\n \"推理步骤4: 22:54厨房温度进一步升至2750(27.5°C),说明灶具持续工作超过30分钟且温度仍在上升。\",\n \"推理步骤5: 然而22:30和23:00的定时温度报告显示厨房温度分别为23.69°C和23.34°C,与22:29/22:54的异常高温读数矛盾。这可能表明灶具附近局部高温,或传感器在不同采样周期捕获了不同状态。\",\n \"推理步骤6: 整个日志中未见灶具关闭(OnOff=False)的记录,说明截至日志结束时灶具可能仍处于开启状态,存在长时间无人看管的风险。\"\n ],\n \"key_evidence\": [\n \"22:24 深夜时段厨房灶具被开启(OnOff=True),且日志中无关闭记录\",\n \"22:29 厨房温度从23.67°C骤升至27.0°C,22:54进一步升至27.5°C\",\n \"灶具开启时客厅无人(Occupancy=0),20分钟后才有人出现在客厅\",\n \"厨房烟雾报警器未触发,但温度异常上升趋势明显\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具是否仍在工作状态,如无人使用应远程关闭\",\n \"检查厨房是否有食物在灶上无人看管,防止干烧引发火灾\",\n \"建议设置自动化规则:深夜时段灶具开启超过15分钟且厨房无运动检测时自动发出警报\",\n \"考虑为厨房增加运动传感器,以便更准确判断是否有人在厨房操作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "深夜22:24厨房灶具被开启,厨房温度在5分钟内从23.67°C飙升至27°C并持续上升至27.5°C,但无人在厨房附近活动,存在无人看管的火灾风险。", "reasoning": ["推理步骤1: 22:24厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时已是深夜,属于非常规烹饪时间。", "推理步骤2: 同一时刻客厅运动传感器显示Occupancy=0,说明客厅无人。直到22:44客厅才检测到有人,中间有20分钟灶具处于无人关注状态。", "推理步骤3: 22:29厨房温度传感器报告2700(27.0°C),相比22:00的2367(23.67°C)在5分钟内急剧上升约3.3°C,这是异常的局部温升。", "推理步骤4: 22:54厨房温度进一步升至2750(27.5°C),说明灶具持续工作超过30分钟且温度仍在上升。", "推理步骤5: 然而22:30和23:00的定时温度报告显示厨房温度分别为23.69°C和23.34°C,与22:29/22:54的异常高温读数矛盾。这可能表明灶具附近局部高温,或传感器在不同采样周期捕获了不同状态。", "推理步骤6: 整个日志中未见灶具关闭(OnOff=False)的记录,说明截至日志结束时灶具可能仍处于开启状态,存在长时间无人看管的风险。"], "key_evidence": ["22:24 深夜时段厨房灶具被开启(OnOff=True),且日志中无关闭记录", "22:29 厨房温度从23.67°C骤升至27.0°C,22:54进一步升至27.5°C", "灶具开启时客厅无人(Occupancy=0),20分钟后才有人出现在客厅", "厨房烟雾报警器未触发,但温度异常上升趋势明显"], "recommended_actions": ["立即确认厨房灶具是否仍在工作状态,如无人使用应远程关闭", "检查厨房是否有食物在灶上无人看管,防止干烧引发火灾", "建议设置自动化规则:深夜时段灶具开启超过15分钟且厨房无运动检测时自动发出警报", "考虑为厨房增加运动传感器,以便更准确判断是否有人在厨房操作"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.25925374031067, "api_error": null} {"episode_id": "SQ3_FP_C_0616", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0616.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261245, "scenario_id": "INS-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "kids_room", "injection_time": "2026-06-30T17:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具关闭后未关闭厨房窗户和灯存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55、07:07、18:23、19:04 共四次报告 MeasuredValue = None。每次都发生在灶具状态变化前后(灶具关闭或开启时),其他三个温度传感器在同一时刻均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。\",\n \"推理步骤2: 分析 None 出现的规律——06:54 灶具 Off → 06:55 None;07:06 灶具 On → 07:07 None;18:22 灶具 On → 18:23 None;19:03 灶具 Off → 19:04 None。每次灶具开关操作后约1分钟内传感器就丢失读数,高度怀疑灶具工作产生的电磁干扰或热冲击导致传感器短暂失效。\",\n \"推理步骤3: 虽然 None 值在下一个30分钟周期恢复了正常读数,但如果传感器在灶具使用期间持续不可靠,可能在真正发生厨房过热或火灾风险时无法及时报警,这是一个安全盲区。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 06:22 起床、07:11 出门上锁、16:25 孩子放学回家、17:51 大人回家开空调做饭、21:20 孩子关灯睡觉、22:17 大人关灯锁门睡觉,符合典型三口之家的作息规律。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:25 开门后未立即上锁(门锁日志中无对应 Lock 事件),但 22:17 睡前确认了门已关闭并自动上锁,整体安防状态正常。\",\n \"推理步骤6: 17:24 客厅出现一次短暂活动(灯开→窗帘动作→灯关→无人),持续不到1分钟,可能是有人经过客厅开窗通风,行为本身不构成入侵威胁,因为发生在16:25有人通过前门正常进入之后。\",\n \"推理步骤7: 温度趋势正常,呈现夏季典型日变化曲线:凌晨约23°C → 正午峰值约25.8°C → 夜间回落至23.3°C,各房间温差在合理范围内,无异常热源迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:55、07:07、18:23、19:04 四次报告 MeasuredValue = None,均与灶具开关操作高度关联(间隔约1分钟内)\",\n \"同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数据,排除系统级故障\",\n \"16:25 开门进入后,入户门锁日志中未见对应的上锁事件,直到 22:17 才确认门锁关闭\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到热冲击或电磁干扰影响,必要时重新定位或更换传感器\",\n \"检查厨房温度传感器的固件版本,确认是否有已知的间歇性读数丢失问题,考虑升级固件\",\n \"建议为入户门锁配置自动上锁超时策略(如开门后5分钟未手动上锁则自动锁定),避免长时间处于未锁状态\",\n \"考虑为厨房增加一个冗余温度传感器,确保灶具使用期间始终有可靠的温度监测覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时灶具关闭后未关闭厨房窗户和灯存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55、07:07、18:23、19:04 共四次报告 MeasuredValue = None。每次都发生在灶具状态变化前后(灶具关闭或开启时),其他三个温度传感器在同一时刻均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。", "推理步骤2: 分析 None 出现的规律——06:54 灶具 Off → 06:55 None;07:06 灶具 On → 07:07 None;18:22 灶具 On → 18:23 None;19:03 灶具 Off → 19:04 None。每次灶具开关操作后约1分钟内传感器就丢失读数,高度怀疑灶具工作产生的电磁干扰或热冲击导致传感器短暂失效。", "推理步骤3: 虽然 None 值在下一个30分钟周期恢复了正常读数,但如果传感器在灶具使用期间持续不可靠,可能在真正发生厨房过热或火灾风险时无法及时报警,这是一个安全盲区。", "推理步骤4: 其余行为模式均属正常——早晨 06:22 起床、07:11 出门上锁、16:25 孩子放学回家、17:51 大人回家开空调做饭、21:20 孩子关灯睡觉、22:17 大人关灯锁门睡觉,符合典型三口之家的作息规律。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:25 开门后未立即上锁(门锁日志中无对应 Lock 事件),但 22:17 睡前确认了门已关闭并自动上锁,整体安防状态正常。", "推理步骤6: 17:24 客厅出现一次短暂活动(灯开→窗帘动作→灯关→无人),持续不到1分钟,可能是有人经过客厅开窗通风,行为本身不构成入侵威胁,因为发生在16:25有人通过前门正常进入之后。", "推理步骤7: 温度趋势正常,呈现夏季典型日变化曲线:凌晨约23°C → 正午峰值约25.8°C → 夜间回落至23.3°C,各房间温差在合理范围内,无异常热源迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:55、07:07、18:23、19:04 四次报告 MeasuredValue = None,均与灶具开关操作高度关联(间隔约1分钟内)", "同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数据,排除系统级故障", "16:25 开门进入后,入户门锁日志中未见对应的上锁事件,直到 22:17 才确认门锁关闭"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到热冲击或电磁干扰影响,必要时重新定位或更换传感器", "检查厨房温度传感器的固件版本,确认是否有已知的间歇性读数丢失问题,考虑升级固件", "建议为入户门锁配置自动上锁超时策略(如开门后5分钟未手动上锁则自动锁定),避免长时间处于未锁状态", "考虑为厨房增加一个冗余温度传感器,确保灶具使用期间始终有可靠的温度监测覆盖"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.85528326034546, "api_error": null} {"episode_id": "SQ3_FP_C_0628", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0628.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261257, "scenario_id": "DF-03", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "dining_room", "injection_time": "2026-06-13T07:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备状态正常,未发现安全威胁或异常行为模式\",\n \"reasoning\": [\n \"推理步骤1: 日志时间跨度为 2026-06-13 全天(00:00~23:30),任务要求分析过去6小时,即约 17:30~23:30 时段。该时段内仅有温度传感器的周期性上报数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。\",\n \"推理步骤2: 温度变化趋势完全符合夏季(6月)自然昼夜温度规律——凌晨最低约 22.9°C,午间峰值约 25.8°C,傍晚至夜间逐步回落至 23.3°C。四个房间的温度高度一致,无单一房间异常升温或骤降的情况,排除火灾隐患或空调故障。\",\n \"推理步骤3: 过去6小时(17:30~23:30)内,所有房间温度从约 24.7°C 平稳下降至约 23.4°C,每30分钟降幅约 0.2~0.4°C,变化平缓且各传感器读数一致,不存在异常温升(火灾风险)或异常温降(门窗被破坏导致冷风灌入)的迹象。\",\n \"推理步骤4: 该时段内无任何运动传感器触发(入户门、客厅、卧室等区域均无人体活动上报),无门锁状态变化,无门窗开合事件,符合住户外出或已入睡的正常场景。早间 07:37~07:43 的餐厅运动传感器短暂触发属于正常晨间活动,不在分析时段内。\",\n \"推理步骤5: 烟雾报警器、漏水传感器、CO 报警器在整个日志周期内均未触发,无火灾、燃气泄漏或水管破裂风险。\"\n ],\n \"key_evidence\": [\n \"过去6小时(17:30~23:30)四个温度传感器读数从约 2472~2487 平稳下降至 2332~2344(即 24.7°C → 23.3°C),变化均匀一致,符合自然降温规律\",\n \"该时段内无任何安全类传感器(门锁、门窗接触传感器、运动传感器、烟雾报警器、漏水传感器)触发事件\",\n \"所有温度传感器之间的读数差异始终在 1°C 以内,无单点异常\"\n ],\n \"recommended_actions\": [\n \"系统运行正常,无需采取特别措施\",\n \"建议确认住户是否在家——过去6小时无任何运动传感器触发,如住户应在家但无活动记录,可主动确认住户安全状态\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备状态正常,未发现安全威胁或异常行为模式", "reasoning": ["推理步骤1: 日志时间跨度为 2026-06-13 全天(00:00~23:30),任务要求分析过去6小时,即约 17:30~23:30 时段。该时段内仅有温度传感器的周期性上报数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。", "推理步骤2: 温度变化趋势完全符合夏季(6月)自然昼夜温度规律——凌晨最低约 22.9°C,午间峰值约 25.8°C,傍晚至夜间逐步回落至 23.3°C。四个房间的温度高度一致,无单一房间异常升温或骤降的情况,排除火灾隐患或空调故障。", "推理步骤3: 过去6小时(17:30~23:30)内,所有房间温度从约 24.7°C 平稳下降至约 23.4°C,每30分钟降幅约 0.2~0.4°C,变化平缓且各传感器读数一致,不存在异常温升(火灾风险)或异常温降(门窗被破坏导致冷风灌入)的迹象。", "推理步骤4: 该时段内无任何运动传感器触发(入户门、客厅、卧室等区域均无人体活动上报),无门锁状态变化,无门窗开合事件,符合住户外出或已入睡的正常场景。早间 07:37~07:43 的餐厅运动传感器短暂触发属于正常晨间活动,不在分析时段内。", "推理步骤5: 烟雾报警器、漏水传感器、CO 报警器在整个日志周期内均未触发,无火灾、燃气泄漏或水管破裂风险。"], "key_evidence": ["过去6小时(17:30~23:30)四个温度传感器读数从约 2472~2487 平稳下降至 2332~2344(即 24.7°C → 23.3°C),变化均匀一致,符合自然降温规律", "该时段内无任何安全类传感器(门锁、门窗接触传感器、运动传感器、烟雾报警器、漏水传感器)触发事件", "所有温度传感器之间的读数差异始终在 1°C 以内,无单点异常"], "recommended_actions": ["系统运行正常,无需采取特别措施", "建议确认住户是否在家——过去6小时无任何运动传感器触发,如住户应在家但无活动记录,可主动确认住户安全状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.045642137527466, "api_error": null} {"episode_id": "SQ3_FP_C_0622", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0622.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261251, "scenario_id": "FG-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "balcony", "injection_time": "2026-06-20T22:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"深夜22:58厨房灶具在无人活动区域被开启,随后厨房温度出现异常飙升,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:58厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时已接近深夜23点,属于非常规烹饪时间。\",\n \"推理步骤2: 同一时刻22:58,客厅运动传感器显示Occupancy=0,说明公共区域无人活动。日志中整天没有厨房或入户区域的运动传感器触发记录,无法确认是否有人在厨房操作灶具。\",\n \"推理步骤3: 灶具开启后仅5分钟(23:03),厨房温度从23:00的2342(23.42°C)骤升至2700(27.00°C),升幅约3.6°C,远超当日正常的半小时波动幅度(通常<0.15°C)。\",\n \"推理步骤4: 23:28厨房温度进一步升至2750(27.50°C),持续上升趋势明显。而同时段其他房间温度保持在23.2-23.3°C的正常范围,排除了全屋温度波动的可能。\",\n \"推理步骤5: 23:30的定时温度报告显示厨房温度回落至2325(23.25°C),与23:28的2750存在矛盾。可能是灶具已关闭温度回落,也可能是传感器报告存在时序差异。但23:03和23:28两次异常高温读数已经确认了灶具开启期间的温度异常。\",\n \"推理步骤6: 整个24小时日志中,厨房烟雾报警器(kitchen_smoke_alarm)未触发,说明尚未达到烟雾报警阈值,但温度异常升高已构成早期火灾风险信号。\",\n \"推理步骤7: 23:18客厅出现人员活动(Occupancy=1),可能是住户察觉异常后前往查看,但灶具开启时(22:58-23:18)至少有20分钟处于无人监管状态。\"\n ],\n \"key_evidence\": [\n \"22:58 厨房灶具开启(OnOff=True),同时客厅运动传感器显示无人(Occupancy=0)\",\n \"23:03 厨房温度从23.42°C骤升至27.00°C,5分钟内升幅3.6°C,远超正常波动\",\n \"23:28 厨房温度继续升至27.50°C,而同时段其他房间温度正常(23.2-23.3°C)\",\n \"深夜近23点开启灶具属于非常规时间,且灶具至少在无人监管状态下运行了约20分钟\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,若仍在开启状态应远程关闭或提醒住户关闭\",\n \"向住户发送高优先级告警通知,提示深夜灶具开启及厨房温度异常\",\n \"设置自动化规则:灶具开启超过一定时间且厨房无运动检测时,自动发出警告或关闭灶具\",\n \"建议在厨房增设运动传感器,以便更准确判断灶具使用时是否有人在场\",\n \"持续监控厨房烟雾报警器和温度传感器状态,若温度持续上升应触发紧急响应\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "深夜22:58厨房灶具在无人活动区域被开启,随后厨房温度出现异常飙升,存在火灾风险。", "reasoning": ["推理步骤1: 22:58厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时已接近深夜23点,属于非常规烹饪时间。", "推理步骤2: 同一时刻22:58,客厅运动传感器显示Occupancy=0,说明公共区域无人活动。日志中整天没有厨房或入户区域的运动传感器触发记录,无法确认是否有人在厨房操作灶具。", "推理步骤3: 灶具开启后仅5分钟(23:03),厨房温度从23:00的2342(23.42°C)骤升至2700(27.00°C),升幅约3.6°C,远超当日正常的半小时波动幅度(通常<0.15°C)。", "推理步骤4: 23:28厨房温度进一步升至2750(27.50°C),持续上升趋势明显。而同时段其他房间温度保持在23.2-23.3°C的正常范围,排除了全屋温度波动的可能。", "推理步骤5: 23:30的定时温度报告显示厨房温度回落至2325(23.25°C),与23:28的2750存在矛盾。可能是灶具已关闭温度回落,也可能是传感器报告存在时序差异。但23:03和23:28两次异常高温读数已经确认了灶具开启期间的温度异常。", "推理步骤6: 整个24小时日志中,厨房烟雾报警器(kitchen_smoke_alarm)未触发,说明尚未达到烟雾报警阈值,但温度异常升高已构成早期火灾风险信号。", "推理步骤7: 23:18客厅出现人员活动(Occupancy=1),可能是住户察觉异常后前往查看,但灶具开启时(22:58-23:18)至少有20分钟处于无人监管状态。"], "key_evidence": ["22:58 厨房灶具开启(OnOff=True),同时客厅运动传感器显示无人(Occupancy=0)", "23:03 厨房温度从23.42°C骤升至27.00°C,5分钟内升幅3.6°C,远超正常波动", "23:28 厨房温度继续升至27.50°C,而同时段其他房间温度正常(23.2-23.3°C)", "深夜近23点开启灶具属于非常规时间,且灶具至少在无人监管状态下运行了约20分钟"], "recommended_actions": ["立即确认厨房灶具当前状态,若仍在开启状态应远程关闭或提醒住户关闭", "向住户发送高优先级告警通知,提示深夜灶具开启及厨房温度异常", "设置自动化规则:灶具开启超过一定时间且厨房无运动检测时,自动发出警告或关闭灶具", "建议在厨房增设运动传感器,以便更准确判断灶具使用时是否有人在场", "持续监控厨房烟雾报警器和温度传感器状态,若温度持续上升应触发紧急响应"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.042744398117065, "api_error": null} {"episode_id": "SQ3_FP_C_0633", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0633.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261262, "scenario_id": "INS-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "balcony", "injection_time": "2026-06-26T07:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中无关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无活动,05:57 主卧起床,06:35 做早餐,07:38 全家出门并自动锁门,16:33 孩子放学回家,18:04 大人回家,22:13 就寝锁门,符合三口之家的典型作息。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常的远程解锁、暴力开锁或未授权操作,排除入侵风险。\",\n \"推理步骤3: 厨房温度传感器在 06:36、06:54、18:24、19:28 共 4 次报告 MeasuredValue = None。虽然其中部分时段灶具正在使用(可能因高温超量程),但 06:54 灶具已于 06:53 关闭后仍报 None,且 19:28 灶具也已于 19:27 关闭后仍报 None,说明传感器恢复存在延迟或间歇性故障。\",\n \"推理步骤4: 厨房窗户传感器在 06:53:30 和 19:27:30 两次记录 StateValue = False(窗户打开),但整个日志中没有对应的 StateValue = True(窗户关闭)事件。考虑到全家 07:38 出门时窗户可能仍处于开启状态,这在无人看管时存在安全隐患。\",\n \"推理步骤5: 各房间温度走势合理——夜间约 23°C,午间峰值约 25.8°C,傍晚开空调后逐步降温,无异常温升,排除火灾风险。烟雾报警器全天无触发。\",\n \"推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,排除水患。\",\n \"推理步骤7: 07:25 客厅出现一次短暂的运动检测→开灯→窗户打开→关灯→运动消失序列(仅 15 秒),时间点在全家出门前,推测是出门前顺手开窗通风,行为虽快但在合理范围内。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None 值:06:36、06:54、18:24、19:28,其中灶具关闭后仍出现 None\",\n \"厨房窗户 06:53:30 开启后,07:38 全家出门时日志中无关闭记录,无人在家期间窗户可能持续敞开\",\n \"厨房窗户 19:27:30 再次开启,至日志结束(23:30)仍无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁探头或更换设备,确认是否因灶具高温导致超量程或存在通信故障\",\n \"确认厨房窗户当前状态,如仍开启请及时关闭;建议设置自动化规则:离家模式触发时检查所有窗户并发送提醒\",\n \"建议为厨房温度传感器设置 None 值告警,连续出现时自动通知用户排查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中无关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无活动,05:57 主卧起床,06:35 做早餐,07:38 全家出门并自动锁门,16:33 孩子放学回家,18:04 大人回家,22:13 就寝锁门,符合三口之家的典型作息。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常的远程解锁、暴力开锁或未授权操作,排除入侵风险。", "推理步骤3: 厨房温度传感器在 06:36、06:54、18:24、19:28 共 4 次报告 MeasuredValue = None。虽然其中部分时段灶具正在使用(可能因高温超量程),但 06:54 灶具已于 06:53 关闭后仍报 None,且 19:28 灶具也已于 19:27 关闭后仍报 None,说明传感器恢复存在延迟或间歇性故障。", "推理步骤4: 厨房窗户传感器在 06:53:30 和 19:27:30 两次记录 StateValue = False(窗户打开),但整个日志中没有对应的 StateValue = True(窗户关闭)事件。考虑到全家 07:38 出门时窗户可能仍处于开启状态,这在无人看管时存在安全隐患。", "推理步骤5: 各房间温度走势合理——夜间约 23°C,午间峰值约 25.8°C,傍晚开空调后逐步降温,无异常温升,排除火灾风险。烟雾报警器全天无触发。", "推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,排除水患。", "推理步骤7: 07:25 客厅出现一次短暂的运动检测→开灯→窗户打开→关灯→运动消失序列(仅 15 秒),时间点在全家出门前,推测是出门前顺手开窗通风,行为虽快但在合理范围内。"], "key_evidence": ["厨房温度传感器 4 次报告 None 值:06:36、06:54、18:24、19:28,其中灶具关闭后仍出现 None", "厨房窗户 06:53:30 开启后,07:38 全家出门时日志中无关闭记录,无人在家期间窗户可能持续敞开", "厨房窗户 19:27:30 再次开启,至日志结束(23:30)仍无关闭记录"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁探头或更换设备,确认是否因灶具高温导致超量程或存在通信故障", "确认厨房窗户当前状态,如仍开启请及时关闭;建议设置自动化规则:离家模式触发时检查所有窗户并发送提醒", "建议为厨房温度传感器设置 None 值告警,连续出现时自动通知用户排查"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.937058687210083, "api_error": null} {"episode_id": "SQ3_FP_C_0643", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0643.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261272, "scenario_id": "CH-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "CH-03-FP", "scenario_name": "CH-03-FP: 孩子起夜上厕所", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "路径是 儿童房→卫生间→儿童房,直来直去没有去其他地方,持续时间短", "target_room": "dining_room", "injection_time": "2026-06-04T07:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:22开锁进入后未关闭/重新上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——早晨6:00主卧起床、6:13儿童房起床、7:00做早餐、7:42全家出门并自动上锁,符合典型工作日家庭作息。\",\n \"推理步骤2: 16:22有人开锁进入后直奔儿童房(可能是孩子放学回家),17:54再次开锁进入后去客厅开灯开空调(大人下班回家),这些进出模式合理。\",\n \"推理步骤3: 厨房温度传感器在07:01:02、07:02:00、18:18:00、18:55:00共4次报告 MeasuredValue = None。虽然前两次与灶具使用时间接近,但传感器不应因灶具开关而丢失读数。18:55的None发生在灶具已关闭后,更不合理。其他三个温度传感器全天无此问题,说明这是该设备特有的故障。\",\n \"推理步骤4: 16:22开锁进入时,front_door_contact 报告 StateValue=False(门打开),但之后日志中没有门关闭(StateValue=True)和重新上锁的记录,直到22:36才出现门关闭并自动上锁。这意味着从16:22到22:36长达6小时14分钟,入户门可能处于未关闭或未上锁状态。\",\n \"推理步骤5: 17:54第二次进入时同样只有开锁和开门记录,没有关门记录,与16:22的情况一致,进一步印证入户门在此期间未正确关闭。\",\n \"推理步骤6: 厨房窗户在07:01:30打开后,全天没有关闭记录(无 StateValue=True),18:54:30又触发了一次打开事件(可能是传感器重复报告),说明厨房窗户整天处于打开状态。虽然夏天开窗通风可以理解,但家中无人时段(07:42-16:22)窗户持续开启存在一定安全风险。\",\n \"推理步骤7: 温度趋势方面,各房间从凌晨约23°C逐步升至中午约25.8°C再回落,符合夏季自然温度变化规律,无异常热源迹象。烟雾报警器和漏水传感器全天无告警,排除火灾和水患风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:01:02、07:02:00、18:18:00、18:55:00 四次报告 MeasuredValue = None,其他温度传感器全天正常\",\n \"16:22:02 front_door_contact 报告门打开(StateValue=False),直到 22:36:26 才记录门关闭(StateValue=True),中间超过6小时无关门记录\",\n \"17:54:02 front_door_contact 再次报告门打开,同样无后续关门记录\",\n \"kitchen_window_contact 在 07:01:30 报告窗户打开,全天无关闭记录,家中无人时段窗户持续开启\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和网络连接,必要时重置或更换设备,该传感器对厨房火灾预警至关重要\",\n \"检查入户门锁和门磁传感器是否正常工作,确认门是否能在关闭后自动上锁,考虑设置离家后门未关闭的超时告警\",\n \"建议设置自动化规则:当全家外出(所有房间无人)时,若门窗处于打开状态则发送提醒通知\",\n \"建议为入户门设置开门超时告警(如开门超过5分钟未关闭则推送通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:22开锁进入后未关闭/重新上锁,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活模式正常——早晨6:00主卧起床、6:13儿童房起床、7:00做早餐、7:42全家出门并自动上锁,符合典型工作日家庭作息。", "推理步骤2: 16:22有人开锁进入后直奔儿童房(可能是孩子放学回家),17:54再次开锁进入后去客厅开灯开空调(大人下班回家),这些进出模式合理。", "推理步骤3: 厨房温度传感器在07:01:02、07:02:00、18:18:00、18:55:00共4次报告 MeasuredValue = None。虽然前两次与灶具使用时间接近,但传感器不应因灶具开关而丢失读数。18:55的None发生在灶具已关闭后,更不合理。其他三个温度传感器全天无此问题,说明这是该设备特有的故障。", "推理步骤4: 16:22开锁进入时,front_door_contact 报告 StateValue=False(门打开),但之后日志中没有门关闭(StateValue=True)和重新上锁的记录,直到22:36才出现门关闭并自动上锁。这意味着从16:22到22:36长达6小时14分钟,入户门可能处于未关闭或未上锁状态。", "推理步骤5: 17:54第二次进入时同样只有开锁和开门记录,没有关门记录,与16:22的情况一致,进一步印证入户门在此期间未正确关闭。", "推理步骤6: 厨房窗户在07:01:30打开后,全天没有关闭记录(无 StateValue=True),18:54:30又触发了一次打开事件(可能是传感器重复报告),说明厨房窗户整天处于打开状态。虽然夏天开窗通风可以理解,但家中无人时段(07:42-16:22)窗户持续开启存在一定安全风险。", "推理步骤7: 温度趋势方面,各房间从凌晨约23°C逐步升至中午约25.8°C再回落,符合夏季自然温度变化规律,无异常热源迹象。烟雾报警器和漏水传感器全天无告警,排除火灾和水患风险。"], "key_evidence": ["kitchen_temp_sensor 在 07:01:02、07:02:00、18:18:00、18:55:00 四次报告 MeasuredValue = None,其他温度传感器全天正常", "16:22:02 front_door_contact 报告门打开(StateValue=False),直到 22:36:26 才记录门关闭(StateValue=True),中间超过6小时无关门记录", "17:54:02 front_door_contact 再次报告门打开,同样无后续关门记录", "kitchen_window_contact 在 07:01:30 报告窗户打开,全天无关闭记录,家中无人时段窗户持续开启"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和网络连接,必要时重置或更换设备,该传感器对厨房火灾预警至关重要", "检查入户门锁和门磁传感器是否正常工作,确认门是否能在关闭后自动上锁,考虑设置离家后门未关闭的超时告警", "建议设置自动化规则:当全家外出(所有房间无人)时,若门窗处于打开状态则发送提醒通知", "建议为入户门设置开门超时告警(如开门超过5分钟未关闭则推送通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.409587144851685, "api_error": null} {"episode_id": "SQ3_FP_C_0645", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0645.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261274, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "master_bedroom", "injection_time": "2026-06-29T16:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:41、07:12、18:12、18:58 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的故障。\",\n \"推理步骤2: 四次 None 值均出现在灶具使用期间或刚关闭后(06:40 灶具开启 → 06:41 None;07:11 灶具关闭 → 07:12 None;18:11 灶具开启 → 18:12 None;18:57 灶具关闭 → 18:58 None)。这表明传感器可能受灶具高温或油烟影响导致读数异常,存在硬件退化或安装位置不当的风险。\",\n \"推理步骤3: 16:18 入户门锁触发了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式开锁失败),20秒后同一来源(UserIndex=1)成功开锁。单次失败可能是输入错误,但需要留意是否有后续重复失败模式。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 06:10 起床、07:43 出门并自动上锁、15:58 孩子先回家、16:18 家长回家、18:05 另一位家庭成员回家、做饭就餐、22:35 睡前关灯锁门。温度曲线呈现夏季典型日变化(夜间约 22.9°C,午间峰值约 25.9°C),空调 18:05 开启后客厅温度从 24.6°C 逐步降至 23.6°C,均合理。\",\n \"推理步骤5: 厨房窗户在灶具关闭后打开(07:11:30 和 18:57:30)属于正常通风行为。洗碗机 19:25 启动、儿童房 20:47 关灯拉窗帘均为正常生活节奏。未发现入侵、火灾、漏水等安全威胁迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:41、07:12、18:12、18:58 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"front_door_lock 在 16:18 触发 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近;清洁传感器探头,排除油烟积累导致的读数异常\",\n \"如厨房温度传感器持续出现 None 值,建议更换传感器或调整安装位置,避免在灶具使用时出现监测盲区(此时恰恰是最需要温度监测的时段)\",\n \"查看门锁 16:18 开锁失败的详细日志,确认是否为密码输入错误;如近期多次出现类似失败,建议更换电池或检查锁体机械部件\",\n \"考虑为厨房温度传感器设置 None 值告警规则,确保烹饪期间温度监测不中断,与烟雾报警器形成互补\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:41、07:12、18:12、18:58 共四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的故障。", "推理步骤2: 四次 None 值均出现在灶具使用期间或刚关闭后(06:40 灶具开启 → 06:41 None;07:11 灶具关闭 → 07:12 None;18:11 灶具开启 → 18:12 None;18:57 灶具关闭 → 18:58 None)。这表明传感器可能受灶具高温或油烟影响导致读数异常,存在硬件退化或安装位置不当的风险。", "推理步骤3: 16:18 入户门锁触发了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式开锁失败),20秒后同一来源(UserIndex=1)成功开锁。单次失败可能是输入错误,但需要留意是否有后续重复失败模式。", "推理步骤4: 其余行为模式均属正常——早晨 06:10 起床、07:43 出门并自动上锁、15:58 孩子先回家、16:18 家长回家、18:05 另一位家庭成员回家、做饭就餐、22:35 睡前关灯锁门。温度曲线呈现夏季典型日变化(夜间约 22.9°C,午间峰值约 25.9°C),空调 18:05 开启后客厅温度从 24.6°C 逐步降至 23.6°C,均合理。", "推理步骤5: 厨房窗户在灶具关闭后打开(07:11:30 和 18:57:30)属于正常通风行为。洗碗机 19:25 启动、儿童房 20:47 关灯拉窗帘均为正常生活节奏。未发现入侵、火灾、漏水等安全威胁迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:41、07:12、18:12、18:58 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "front_door_lock 在 16:18 触发 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近;清洁传感器探头,排除油烟积累导致的读数异常", "如厨房温度传感器持续出现 None 值,建议更换传感器或调整安装位置,避免在灶具使用时出现监测盲区(此时恰恰是最需要温度监测的时段)", "查看门锁 16:18 开锁失败的详细日志,确认是否为密码输入错误;如近期多次出现类似失败,建议更换电池或检查锁体机械部件", "考虑为厨房温度传感器设置 None 值告警规则,确保烹饪期间温度监测不中断,与烟雾报警器形成互补"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.65666961669922, "api_error": null} {"episode_id": "SQ3_FP_C_0644", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0644.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261273, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-26T18:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,以及入户门在16:17进入时未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 分析整体生活模式——06:09主卧有人起床,06:49儿童房有人起床,06:58开始做早餐,07:14全家出门并自动锁门,16:17有人回家(孩子放学),17:49另一人回家(大人下班),22:14就寝锁门。这是典型的三口之家工作日作息,整体行为模式正常。\",\n \"推理步骤2: 厨房温度传感器在06:59、07:08、18:29、19:28四次报告 MeasuredValue = None。这发生在灶具开启期间或刚关闭后,其他时段传感器正常工作。可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然不是紧急威胁,但温度传感器是厨房安全监控的关键环节,失效会导致火灾风险无法被及时发现。\",\n \"推理步骤3: 厨房窗户传感器在07:07:30报告 StateValue=False(窗户打开),之后日志中未见关闭事件。19:27:30再次报告 StateValue=False(再次打开或仍然打开)。整个24小时内没有 StateValue=True(关闭)的记录。家中无人期间(07:14-16:17)厨房窗户持续开启,存在一定的入侵风险,但考虑到入户门已锁且无其他异常活动,风险较低。\",\n \"推理步骤4: 16:17入户门解锁、开门、有人进入,但日志中没有后续的锁门或关门事件,直到22:14才记录到门关闭并自动上锁。这意味着入户门可能在16:17至17:49之间处于未锁状态(17:49再次解锁说明此前可能已关门但未确认)。不过17:49的解锁事件暗示门在此前已处于某种关闭状态,这段时间的安全风险有限。\",\n \"推理步骤5: 18:10厨房漏水传感器触发(StateValue=True),但2分钟后恢复(18:12 StateValue=False)。短暂触发可能是洗菜溅水等正常厨房活动导致,不构成持续漏水威胁。\",\n \"推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(夜间约22.9°C,午间峰值约25.8°C),各房间温度一致,无异常高温或骤变,排除火灾风险。烟雾报警器全天无触发,进一步确认无火灾事件。\",\n \"推理步骤7: 综合判断——最值得关注的是厨房温度传感器的间歇性 None 值故障,这会削弱厨房的安全监控能力。其余事件(短暂漏水、窗户未关)属于低风险的生活疏忽。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:59、07:08、18:29、19:28 四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"厨房窗户 07:07 打开后全天未见关闭记录,家中无人时段(07:14-16:17)窗户持续开启\",\n \"18:10 厨房漏水传感器短暂触发,2分钟后自动恢复\",\n \"16:17 入户门开启后未见立即锁门记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor):清洁传感器探头,确认安装位置是否距灶具过近导致读数异常,必要时更换设备\",\n \"设置自动化规则:当厨房温度传感器报告 None 值时,立即发送告警通知,避免安全监控盲区\",\n \"设置离家模式自动检查:出门锁门时自动检测所有窗户状态,若有未关窗户则发送提醒\",\n \"确认入户门自动锁功能:建议设置门关闭后自动上锁的延时规则(如关门30秒后自动锁定),避免忘记锁门\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,以及入户门在16:17进入时未上锁。", "reasoning": ["推理步骤1: 分析整体生活模式——06:09主卧有人起床,06:49儿童房有人起床,06:58开始做早餐,07:14全家出门并自动锁门,16:17有人回家(孩子放学),17:49另一人回家(大人下班),22:14就寝锁门。这是典型的三口之家工作日作息,整体行为模式正常。", "推理步骤2: 厨房温度传感器在06:59、07:08、18:29、19:28四次报告 MeasuredValue = None。这发生在灶具开启期间或刚关闭后,其他时段传感器正常工作。可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然不是紧急威胁,但温度传感器是厨房安全监控的关键环节,失效会导致火灾风险无法被及时发现。", "推理步骤3: 厨房窗户传感器在07:07:30报告 StateValue=False(窗户打开),之后日志中未见关闭事件。19:27:30再次报告 StateValue=False(再次打开或仍然打开)。整个24小时内没有 StateValue=True(关闭)的记录。家中无人期间(07:14-16:17)厨房窗户持续开启,存在一定的入侵风险,但考虑到入户门已锁且无其他异常活动,风险较低。", "推理步骤4: 16:17入户门解锁、开门、有人进入,但日志中没有后续的锁门或关门事件,直到22:14才记录到门关闭并自动上锁。这意味着入户门可能在16:17至17:49之间处于未锁状态(17:49再次解锁说明此前可能已关门但未确认)。不过17:49的解锁事件暗示门在此前已处于某种关闭状态,这段时间的安全风险有限。", "推理步骤5: 18:10厨房漏水传感器触发(StateValue=True),但2分钟后恢复(18:12 StateValue=False)。短暂触发可能是洗菜溅水等正常厨房活动导致,不构成持续漏水威胁。", "推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(夜间约22.9°C,午间峰值约25.8°C),各房间温度一致,无异常高温或骤变,排除火灾风险。烟雾报警器全天无触发,进一步确认无火灾事件。", "推理步骤7: 综合判断——最值得关注的是厨房温度传感器的间歇性 None 值故障,这会削弱厨房的安全监控能力。其余事件(短暂漏水、窗户未关)属于低风险的生活疏忽。"], "key_evidence": ["厨房温度传感器在 06:59、07:08、18:29、19:28 四次报告 MeasuredValue = None,均与灶具使用时段相关", "厨房窗户 07:07 打开后全天未见关闭记录,家中无人时段(07:14-16:17)窗户持续开启", "18:10 厨房漏水传感器短暂触发,2分钟后自动恢复", "16:17 入户门开启后未见立即锁门记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor):清洁传感器探头,确认安装位置是否距灶具过近导致读数异常,必要时更换设备", "设置自动化规则:当厨房温度传感器报告 None 值时,立即发送告警通知,避免安全监控盲区", "设置离家模式自动检查:出门锁门时自动检测所有窗户状态,若有未关窗户则发送提醒", "确认入户门自动锁功能:建议设置门关闭后自动上锁的延时规则(如关门30秒后自动锁定),避免忘记锁门"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.52426242828369, "api_error": null} {"episode_id": "SQ3_FP_C_0647", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0647.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261276, "scenario_id": "CH-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "CH-03-FP", "scenario_name": "CH-03-FP: 孩子起夜上厕所", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "路径是 儿童房→卫生间→儿童房,直来直去没有去其他地方,持续时间短", "target_room": "master_bedroom", "injection_time": "2026-06-24T08:52:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:35开锁后长时间未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 梳理整体生活节奏——06:30起床、07:36全家出门并锁门、16:35有人(孩子)回家、18:00大人回家、22:25就寝锁门。这是典型的工作日三口之家作息,整体行为模式正常。\",\n \"推理步骤2: 厨房温度传感器在07:02、07:10、18:31、19:29四次报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重叠,但其他房间的温度传感器从未出现 None 值。正常的温度传感器即使在高温环境下也应报告数值(哪怕超出量程),持续返回 None 更可能是传感器故障、通信中断或供电问题。\",\n \"推理步骤3: 16:35入户门解锁(LockOperationType=1)并打开(StateValue=False),但直到18:00才有下一条入户门相关事件(再次解锁)。在这近1.5小时内,没有关门(StateValue=True)或锁门的记录。结合16:35仅检测到儿童房有人活动,推测是孩子放学回家后未关好入户门,存在一定安全隐患。\",\n \"推理步骤4: 温度趋势方面,凌晨约22.9°C,白天升至约25.8°C峰值(12:00-12:30),傍晚逐步回落,符合夏季自然温度变化曲线。18:00开启客厅空调(制冷模式SystemMode=3)后温度持续下降,22:25关闭空调就寝,一切合理。\",\n \"推理步骤5: 门锁操作均为手动开锁+自动上锁,无异常凭证或远程操作记录。烟雾报警器和漏水传感器全天无告警。洗碗机在晚餐后启动,厨房窗户在做饭后打开通风,均为正常家务行为。\",\n \"推理步骤6: 综合判断,不存在入侵、火灾、漏水等高危威胁,但厨房温度传感器的反复 None 值属于设备异常,需要关注和排查。入户门长时间未关闭虽非设备故障,但属于安全管理上的风险点。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:02、07:10、18:31、19:29 四次报告 MeasuredValue = None,其他传感器全天无此现象\",\n \"16:35 入户门解锁并打开后,直到 22:25 才出现关门(StateValue=True)和锁门记录,中间约5小时50分钟无关门事件\",\n \"18:00 入户门再次解锁时没有先出现关门记录,说明门在此前一直处于开启或未锁状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的供电和网络连接状态,确认是否存在硬件故障或信号干扰,必要时更换传感器\",\n \"设置入户门长时间未关闭的告警规则(如超过5分钟未检测到关门事件则推送提醒),避免门户敞开带来的安全风险\",\n \"考虑为厨房温度传感器设置 None 值告警,以便在传感器失效时及时发现,避免在灶具使用期间失去温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:35开锁后长时间未关闭。", "reasoning": ["推理步骤1: 梳理整体生活节奏——06:30起床、07:36全家出门并锁门、16:35有人(孩子)回家、18:00大人回家、22:25就寝锁门。这是典型的工作日三口之家作息,整体行为模式正常。", "推理步骤2: 厨房温度传感器在07:02、07:10、18:31、19:29四次报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重叠,但其他房间的温度传感器从未出现 None 值。正常的温度传感器即使在高温环境下也应报告数值(哪怕超出量程),持续返回 None 更可能是传感器故障、通信中断或供电问题。", "推理步骤3: 16:35入户门解锁(LockOperationType=1)并打开(StateValue=False),但直到18:00才有下一条入户门相关事件(再次解锁)。在这近1.5小时内,没有关门(StateValue=True)或锁门的记录。结合16:35仅检测到儿童房有人活动,推测是孩子放学回家后未关好入户门,存在一定安全隐患。", "推理步骤4: 温度趋势方面,凌晨约22.9°C,白天升至约25.8°C峰值(12:00-12:30),傍晚逐步回落,符合夏季自然温度变化曲线。18:00开启客厅空调(制冷模式SystemMode=3)后温度持续下降,22:25关闭空调就寝,一切合理。", "推理步骤5: 门锁操作均为手动开锁+自动上锁,无异常凭证或远程操作记录。烟雾报警器和漏水传感器全天无告警。洗碗机在晚餐后启动,厨房窗户在做饭后打开通风,均为正常家务行为。", "推理步骤6: 综合判断,不存在入侵、火灾、漏水等高危威胁,但厨房温度传感器的反复 None 值属于设备异常,需要关注和排查。入户门长时间未关闭虽非设备故障,但属于安全管理上的风险点。"], "key_evidence": ["kitchen_temp_sensor 在 07:02、07:10、18:31、19:29 四次报告 MeasuredValue = None,其他传感器全天无此现象", "16:35 入户门解锁并打开后,直到 22:25 才出现关门(StateValue=True)和锁门记录,中间约5小时50分钟无关门事件", "18:00 入户门再次解锁时没有先出现关门记录,说明门在此前一直处于开启或未锁状态"], "recommended_actions": ["检查厨房温度传感器的供电和网络连接状态,确认是否存在硬件故障或信号干扰,必要时更换传感器", "设置入户门长时间未关闭的告警规则(如超过5分钟未检测到关门事件则推送提醒),避免门户敞开带来的安全风险", "考虑为厨房温度传感器设置 None 值告警,以便在传感器失效时及时发现,避免在灶具使用期间失去温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.6640682220459, "api_error": null} {"episode_id": "SQ3_FP_C_0651", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0651.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261280, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "master_bathroom", "injection_time": "2026-06-23T11:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;厨房窗户在做饭后未关闭,且入户门在16:11开锁进入后长时间未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度数据 — 各房间温度在凌晨约22.9~23.1°C,白天逐步升至25.8°C左右,晚间回落至23.3°C,符合夏季自然温度变化曲线,无异常高温或骤变。\",\n \"推理步骤2: 厨房温度传感器异常 — 在06:50、06:52、18:19、19:27四个时间点报告 MeasuredValue = None。前两次发生在早晨灶具使用期间,后两次发生在晚间灶具使用期间。灶具开启/关闭时传感器丢失读数,可能是高温干扰、通信中断或传感器本身故障。其他三个温度传感器在同一时段均正常上报数据,说明问题局限于厨房传感器。\",\n \"推理步骤3: 生活模式分析 — 06:26主卧有人起床,06:28儿童房和主卫有活动,06:49进厨房做早餐,07:27全家关灯出门、门锁上锁,符合工作日早晨出门模式。16:11有人开门回家直奔儿童房(可能是孩子放学),17:58另一人回家开客厅灯和空调,18:18开始做晚饭,19:26做完饭去餐厅吃饭,20:44儿童房关灯拉窗帘(孩子睡觉),22:44大人关灯锁门就寝。整体生活节奏正常。\",\n \"推理步骤4: 门锁与入侵分析 — 07:27出门时门锁手动开锁(LockOperationType=1)后6秒内关门并自动上锁(LockOperationType=0),正常。16:11开门进入后,日志中直到17:58第二次开门之间没有关门/上锁记录,但17:58再次开门说明门在此期间是关闭状态,可能是门传感器事件被省略或门关了但未上锁。22:44确认门关闭并自动上锁。无陌生开锁方式,无异常入侵迹象。\",\n \"推理步骤5: 厨房窗户状态 — 06:51:30厨房窗户打开(StateValue=False),19:26:30再次出现打开事件,但整个日志中没有厨房窗户关闭(StateValue=True)的记录。做饭时开窗通风合理,但做完饭后窗户可能一直处于打开状态直到深夜,存在安全隐患。\",\n \"推理步骤6: 漏水传感器 — 11:08厨房漏水传感器触发(StateValue=True),11:10恢复(StateValue=False),持续仅2分钟。此时家中无人(07:27已出门,16:11才回来),短暂触发后自动恢复,可能是洗碗机残留水滴或传感器误报,但无人在家时发生值得关注。\",\n \"推理步骤7: 次卫灯异常 — 06:56次卫灯打开,但日志中没有对应的运动传感器触发,也没有关灯记录。可能是自动化规则触发或遗漏事件,但如果灯一直亮到现在则属于资源浪费。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:50、06:52、18:19、19:27四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"厨房窗户在06:51:30和19:26:30两次打开,但全天日志中无关闭记录\",\n \"11:08厨房漏水传感器在无人在家时短暂触发2分钟后恢复\",\n \"16:11入户门开锁进入后无明确的关门上锁记录,直到22:44才确认上锁\",\n \"06:56次卫灯开启后无对应关灯记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:该传感器在灶具使用期间反复丢失数据,建议检查其安装位置是否离灶具过近导致高温干扰,或检查设备固件和通信连接是否正常\",\n \"确认厨房窗户状态:日志显示窗户可能整天处于打开状态,夜间无人看管时存在安全风险,建议添加自动化规则在就寝时检查并提醒关窗\",\n \"关注厨房漏水传感器:虽然本次为短暂触发,但建议检查洗碗机接口和厨房水管是否有渗漏迹象,避免小问题演变为水损\",\n \"优化门锁自动化:建议设置入户门在关闭后一定时间内自动上锁,避免长时间处于未锁定状态\",\n \"检查次卫灯状态:确认是否仍在亮着,考虑添加无人自动关灯规则以节能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;厨房窗户在做饭后未关闭,且入户门在16:11开锁进入后长时间未上锁。", "reasoning": ["推理步骤1: 分析温度数据 — 各房间温度在凌晨约22.9~23.1°C,白天逐步升至25.8°C左右,晚间回落至23.3°C,符合夏季自然温度变化曲线,无异常高温或骤变。", "推理步骤2: 厨房温度传感器异常 — 在06:50、06:52、18:19、19:27四个时间点报告 MeasuredValue = None。前两次发生在早晨灶具使用期间,后两次发生在晚间灶具使用期间。灶具开启/关闭时传感器丢失读数,可能是高温干扰、通信中断或传感器本身故障。其他三个温度传感器在同一时段均正常上报数据,说明问题局限于厨房传感器。", "推理步骤3: 生活模式分析 — 06:26主卧有人起床,06:28儿童房和主卫有活动,06:49进厨房做早餐,07:27全家关灯出门、门锁上锁,符合工作日早晨出门模式。16:11有人开门回家直奔儿童房(可能是孩子放学),17:58另一人回家开客厅灯和空调,18:18开始做晚饭,19:26做完饭去餐厅吃饭,20:44儿童房关灯拉窗帘(孩子睡觉),22:44大人关灯锁门就寝。整体生活节奏正常。", "推理步骤4: 门锁与入侵分析 — 07:27出门时门锁手动开锁(LockOperationType=1)后6秒内关门并自动上锁(LockOperationType=0),正常。16:11开门进入后,日志中直到17:58第二次开门之间没有关门/上锁记录,但17:58再次开门说明门在此期间是关闭状态,可能是门传感器事件被省略或门关了但未上锁。22:44确认门关闭并自动上锁。无陌生开锁方式,无异常入侵迹象。", "推理步骤5: 厨房窗户状态 — 06:51:30厨房窗户打开(StateValue=False),19:26:30再次出现打开事件,但整个日志中没有厨房窗户关闭(StateValue=True)的记录。做饭时开窗通风合理,但做完饭后窗户可能一直处于打开状态直到深夜,存在安全隐患。", "推理步骤6: 漏水传感器 — 11:08厨房漏水传感器触发(StateValue=True),11:10恢复(StateValue=False),持续仅2分钟。此时家中无人(07:27已出门,16:11才回来),短暂触发后自动恢复,可能是洗碗机残留水滴或传感器误报,但无人在家时发生值得关注。", "推理步骤7: 次卫灯异常 — 06:56次卫灯打开,但日志中没有对应的运动传感器触发,也没有关灯记录。可能是自动化规则触发或遗漏事件,但如果灯一直亮到现在则属于资源浪费。"], "key_evidence": ["厨房温度传感器在06:50、06:52、18:19、19:27四次报告 MeasuredValue = None,均与灶具使用时段相关", "厨房窗户在06:51:30和19:26:30两次打开,但全天日志中无关闭记录", "11:08厨房漏水传感器在无人在家时短暂触发2分钟后恢复", "16:11入户门开锁进入后无明确的关门上锁记录,直到22:44才确认上锁", "06:56次卫灯开启后无对应关灯记录"], "recommended_actions": ["检查厨房温度传感器:该传感器在灶具使用期间反复丢失数据,建议检查其安装位置是否离灶具过近导致高温干扰,或检查设备固件和通信连接是否正常", "确认厨房窗户状态:日志显示窗户可能整天处于打开状态,夜间无人看管时存在安全风险,建议添加自动化规则在就寝时检查并提醒关窗", "关注厨房漏水传感器:虽然本次为短暂触发,但建议检查洗碗机接口和厨房水管是否有渗漏迹象,避免小问题演变为水损", "优化门锁自动化:建议设置入户门在关闭后一定时间内自动上锁,避免长时间处于未锁定状态", "检查次卫灯状态:确认是否仍在亮着,考虑添加无人自动关灯规则以节能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 36.801628828048706, "api_error": null} {"episode_id": "SQ3_FP_C_0655", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0655.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261284, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kids_room", "injection_time": "2026-06-09T06:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且儿童房温度传感器出现与全屋趋势不一致的异常跳变。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:11、07:19、18:44、18:51 四次报告 MeasuredValue = None,表明传感器读数丢失。虽然两次发生在灶具使用期间,但正常传感器不应返回 None,这可能是传感器受热干扰或硬件故障。\",\n \"推理步骤2: 儿童房温度传感器在 06:50 突然从 ~2404 跳至 2500(约升高 1°C),随后在 07:20 报 2502、07:50 报 2498、08:20 报 2501,而同一时段全屋其他传感器读数为 2420-2470 范围。这些异常高值与其他房间趋势明显不一致,到 07:30 的整点读数又回落到 2420,说明存在间歇性异常跳变。\",\n \"推理步骤3: 其余设备行为均属正常——早晨 06:18 起床、07:14 出门上班/上学(关灯、锁门)、16:12 孩子放学回家、17:52 大人下班回家开空调、18:43 做饭、21:14 孩子睡觉、22:47 大人睡觉锁门,生活节奏合理无入侵迹象。\",\n \"推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,时间点与运动传感器、灯光操作吻合,无未授权开锁事件。\",\n \"推理步骤5: 厨房窗户在做饭后打开通风(07:18:30 和 18:50:30),属于正常行为,但厨房温度传感器的 None 值仍需关注,可能影响烟雾/火灾预警的辅助判断能力。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:11、07:19、18:44、18:51 报告 MeasuredValue = None\",\n \"kids_room_temp_sensor 在 06:50、07:20、07:50、08:20 出现 2498-2502 的异常高值,偏离同时段全屋均值约 40-80 个单位(0.4-0.8°C)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常,或传感器本身存在硬件故障需要更换\",\n \"检查儿童房温度传感器是否被阳光直射、靠近电器热源或存在接触不良,必要时重新校准或更换\",\n \"在厨房温度传感器修复前,确保烟雾报警器独立工作正常,不依赖温度传感器数据进行火灾判断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且儿童房温度传感器出现与全屋趋势不一致的异常跳变。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:11、07:19、18:44、18:51 四次报告 MeasuredValue = None,表明传感器读数丢失。虽然两次发生在灶具使用期间,但正常传感器不应返回 None,这可能是传感器受热干扰或硬件故障。", "推理步骤2: 儿童房温度传感器在 06:50 突然从 ~2404 跳至 2500(约升高 1°C),随后在 07:20 报 2502、07:50 报 2498、08:20 报 2501,而同一时段全屋其他传感器读数为 2420-2470 范围。这些异常高值与其他房间趋势明显不一致,到 07:30 的整点读数又回落到 2420,说明存在间歇性异常跳变。", "推理步骤3: 其余设备行为均属正常——早晨 06:18 起床、07:14 出门上班/上学(关灯、锁门)、16:12 孩子放学回家、17:52 大人下班回家开空调、18:43 做饭、21:14 孩子睡觉、22:47 大人睡觉锁门,生活节奏合理无入侵迹象。", "推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,时间点与运动传感器、灯光操作吻合,无未授权开锁事件。", "推理步骤5: 厨房窗户在做饭后打开通风(07:18:30 和 18:50:30),属于正常行为,但厨房温度传感器的 None 值仍需关注,可能影响烟雾/火灾预警的辅助判断能力。"], "key_evidence": ["kitchen_temp_sensor 在 07:11、07:19、18:44、18:51 报告 MeasuredValue = None", "kids_room_temp_sensor 在 06:50、07:20、07:50、08:20 出现 2498-2502 的异常高值,偏离同时段全屋均值约 40-80 个单位(0.4-0.8°C)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常,或传感器本身存在硬件故障需要更换", "检查儿童房温度传感器是否被阳光直射、靠近电器热源或存在接触不良,必要时重新校准或更换", "在厨房温度传感器修复前,确保烟雾报警器独立工作正常,不依赖温度传感器数据进行火灾判断"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.414633989334106, "api_error": null} {"episode_id": "SQ3_FP_C_0652", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0652.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261281, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kids_room", "injection_time": "2026-06-30T12:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时儿童房温度传感器在中午时段出现周期性骤降,疑似传感器间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、07:26、18:18、18:51 共四次报告 MeasuredValue = None。前两次发生在灶具使用前后(06:46 灶具开启后1分钟、07:25 灶具关闭后1分钟),后两次同样与晚间灶具使用时段吻合(18:17 灶具开启后1分钟、18:50 灶具关闭后1分钟)。这说明每次灶具操作都会触发传感器读数丢失,可能是灶具产生的热量/电磁干扰导致传感器暂时失效,或传感器与灶具存在电路/通信冲突。\",\n \"推理步骤2: 儿童房温度传感器在 12:40(2500)、13:10(2502)、13:40(2498)、14:10(2501)出现了四次异常骤降,每次间隔约30分钟,从正常的 ~2560-2570 骤降约 60-70 个单位(约 6-7°C),而同时段其他房间温度均无类似波动。这种周期性、幅度一致的骤降不符合物理环境变化规律(没有空调开启、窗户开关等事件),更像是传感器间歇性故障或数据采集异常。且在正常的半小时整点采样中读数恢复正常,说明故障是短暂的。\",\n \"推理步骤3: 排查入侵风险——07:26 出门时门锁手动解锁→开门→关门→自动上锁,15:59 和 17:51 两次回家同样是手动解锁进入,22:14 确认门已关闭并自动上锁,全天门锁操作均为 Manual/Auto 来源,无异常远程解锁或未授权操作。\",\n \"推理步骤4: 排查火灾风险——灶具两次使用时长分别约39分钟(06:46-07:25)和33分钟(18:17-18:50),属于正常烹饪时长;烟雾报警器全天未触发;厨房窗户在烹饪后打开通风(07:25、18:50),属于合理行为。\",\n \"推理步骤5: 排查漏水风险——厨房、主卫、次卫的漏水传感器全天无任何报警事件。洗碗机 19:33 正常启动运行。\",\n \"推理步骤6: 整体生活模式合理——凌晨无人活动,06:11 主卧起床,06:39-06:46 洗漱,06:46 做早餐,07:26 全家出门,15:59 有人(可能是孩子)先回家直奔儿童房,17:51 大人回家开客厅灯和空调,18:17 做晚餐,18:50 晚餐,21:00 孩子关灯睡觉,22:14 大人就寝。这是典型的三口之家工作日作息。\",\n \"推理步骤7: 厨房窗户在 07:25 和 18:50 打开后,日志中未记录关闭事件(BooleanState.StateValue 未恢复为 True)。虽然可能是日志截断,但如果窗户确实未关闭,在夜间无人区域存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:47、07:26、18:18、18:51 四次报告 MeasuredValue = None,均与灶具开关操作高度关联\",\n \"儿童房温度传感器在 12:40、13:10、13:40、14:10 出现四次周期性骤降(从 ~2560 降至 ~2500),其他房间同时段无类似现象\",\n \"厨房窗户两次打开(07:25:30 和 18:50:30)后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和供电线路,确认是否受灶具电磁干扰影响,必要时更换位置或加装屏蔽\",\n \"检查儿童房温度传感器硬件状态,清洁探头或更换电池,观察是否继续出现周期性读数骤降\",\n \"确认厨房窗户当前是否已关闭,如未关闭建议及时关闭并上锁,避免夜间安全隐患\",\n \"考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知用户,避免在灶具使用期间丧失温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时儿童房温度传感器在中午时段出现周期性骤降,疑似传感器间歇性故障。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、07:26、18:18、18:51 共四次报告 MeasuredValue = None。前两次发生在灶具使用前后(06:46 灶具开启后1分钟、07:25 灶具关闭后1分钟),后两次同样与晚间灶具使用时段吻合(18:17 灶具开启后1分钟、18:50 灶具关闭后1分钟)。这说明每次灶具操作都会触发传感器读数丢失,可能是灶具产生的热量/电磁干扰导致传感器暂时失效,或传感器与灶具存在电路/通信冲突。", "推理步骤2: 儿童房温度传感器在 12:40(2500)、13:10(2502)、13:40(2498)、14:10(2501)出现了四次异常骤降,每次间隔约30分钟,从正常的 ~2560-2570 骤降约 60-70 个单位(约 6-7°C),而同时段其他房间温度均无类似波动。这种周期性、幅度一致的骤降不符合物理环境变化规律(没有空调开启、窗户开关等事件),更像是传感器间歇性故障或数据采集异常。且在正常的半小时整点采样中读数恢复正常,说明故障是短暂的。", "推理步骤3: 排查入侵风险——07:26 出门时门锁手动解锁→开门→关门→自动上锁,15:59 和 17:51 两次回家同样是手动解锁进入,22:14 确认门已关闭并自动上锁,全天门锁操作均为 Manual/Auto 来源,无异常远程解锁或未授权操作。", "推理步骤4: 排查火灾风险——灶具两次使用时长分别约39分钟(06:46-07:25)和33分钟(18:17-18:50),属于正常烹饪时长;烟雾报警器全天未触发;厨房窗户在烹饪后打开通风(07:25、18:50),属于合理行为。", "推理步骤5: 排查漏水风险——厨房、主卫、次卫的漏水传感器全天无任何报警事件。洗碗机 19:33 正常启动运行。", "推理步骤6: 整体生活模式合理——凌晨无人活动,06:11 主卧起床,06:39-06:46 洗漱,06:46 做早餐,07:26 全家出门,15:59 有人(可能是孩子)先回家直奔儿童房,17:51 大人回家开客厅灯和空调,18:17 做晚餐,18:50 晚餐,21:00 孩子关灯睡觉,22:14 大人就寝。这是典型的三口之家工作日作息。", "推理步骤7: 厨房窗户在 07:25 和 18:50 打开后,日志中未记录关闭事件(BooleanState.StateValue 未恢复为 True)。虽然可能是日志截断,但如果窗户确实未关闭,在夜间无人区域存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在 06:47、07:26、18:18、18:51 四次报告 MeasuredValue = None,均与灶具开关操作高度关联", "儿童房温度传感器在 12:40、13:10、13:40、14:10 出现四次周期性骤降(从 ~2560 降至 ~2500),其他房间同时段无类似现象", "厨房窗户两次打开(07:25:30 和 18:50:30)后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和供电线路,确认是否受灶具电磁干扰影响,必要时更换位置或加装屏蔽", "检查儿童房温度传感器硬件状态,清洁探头或更换电池,观察是否继续出现周期性读数骤降", "确认厨房窗户当前是否已关闭,如未关闭建议及时关闭并上锁,避免夜间安全隐患", "考虑为厨房温度传感器设置 None 值告警规则,在传感器失效时及时通知用户,避免在灶具使用期间丧失温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.15746307373047, "api_error": null} {"episode_id": "SQ3_FP_C_0656", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0656.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261285, "scenario_id": "CH-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01-FP", "scenario_name": "CH-01-FP: 孩子生病请假在家(家长陪护)", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "家长也在家(多个房间有活动),不只是儿童房,说明有成人陪护", "target_room": "second_bathroom", "injection_time": "2026-06-11T10:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无人活动,06:17 儿童起床、06:34 大人起床,07:10 出门上班/上学并自动锁门,16:35 孩子先回家,17:57 大人回家,22:30 全家就寝锁门,符合典型三口之家的工作日节奏。\",\n \"推理步骤2: 入侵风险排除——入户门全天仅在 07:10(出门)、16:35(孩子回家)、17:57(大人回家)三次开启,均伴随合理的运动传感器触发和灯光操作,且门锁在出门和就寝时均自动上锁(LockState=1),无异常开锁事件。\",\n \"推理步骤3: 温度趋势正常——全屋温度从凌晨约 22.9°C 逐步升至正午约 25.9°C,午后回落至夜间约 23.3°C,符合夏季自然温度变化曲线,无突发异常升温。\",\n \"推理步骤4: 发现异常——厨房温度传感器在灶具开启期间出现三次 MeasuredValue = None(07:06、07:21、18:20),以及灶具关闭后一次 None(19:29)。其他三个温度传感器在同一时段均正常上报数值,说明问题局限于厨房传感器本身。\",\n \"推理步骤5: 分析 None 值模式——四次 None 均与灶具操作高度相关(07:05 开灶→07:06 None;07:20 关灶→07:21 None;18:19 开灶→18:20 None;19:28 关灶→19:29 None),推测传感器受灶具热冲击或电磁干扰导致读数失效。\",\n \"推理步骤6: 火灾风险评估——虽然传感器间歇失效,但厨房烟雾报警器全天未触发,且灶具使用时长合理(早餐约15分钟、晚餐约69分钟),做饭后均有开窗通风(kitchen_window_contact = False),无火灾迹象。\",\n \"推理步骤7: 其他设备状态正常——所有漏水传感器未触发,烟雾报警器未触发,门窗传感器状态合理,洗碗机正常运行,空调正常开关,无其他异常。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:06、07:21、18:20、19:29 四次报告 MeasuredValue = None,均与灶具开关操作时间高度吻合\",\n \"同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数值,排除系统性网络故障\",\n \"None 值出现在灶具开启后约1分钟和关闭后约1分钟,呈现明确的关联模式\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热冲击或电磁干扰\",\n \"考虑将厨房温度传感器迁移至远离灶具的位置(如靠近厨房门口或天花板处)\",\n \"如传感器位置合理,建议更换传感器或检查其固件版本是否需要更新\",\n \"在传感器修复前,可设置自动化规则:当厨房温度传感器报告 None 时发送提醒,避免在灶具使用期间丧失温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无人活动,06:17 儿童起床、06:34 大人起床,07:10 出门上班/上学并自动锁门,16:35 孩子先回家,17:57 大人回家,22:30 全家就寝锁门,符合典型三口之家的工作日节奏。", "推理步骤2: 入侵风险排除——入户门全天仅在 07:10(出门)、16:35(孩子回家)、17:57(大人回家)三次开启,均伴随合理的运动传感器触发和灯光操作,且门锁在出门和就寝时均自动上锁(LockState=1),无异常开锁事件。", "推理步骤3: 温度趋势正常——全屋温度从凌晨约 22.9°C 逐步升至正午约 25.9°C,午后回落至夜间约 23.3°C,符合夏季自然温度变化曲线,无突发异常升温。", "推理步骤4: 发现异常——厨房温度传感器在灶具开启期间出现三次 MeasuredValue = None(07:06、07:21、18:20),以及灶具关闭后一次 None(19:29)。其他三个温度传感器在同一时段均正常上报数值,说明问题局限于厨房传感器本身。", "推理步骤5: 分析 None 值模式——四次 None 均与灶具操作高度相关(07:05 开灶→07:06 None;07:20 关灶→07:21 None;18:19 开灶→18:20 None;19:28 关灶→19:29 None),推测传感器受灶具热冲击或电磁干扰导致读数失效。", "推理步骤6: 火灾风险评估——虽然传感器间歇失效,但厨房烟雾报警器全天未触发,且灶具使用时长合理(早餐约15分钟、晚餐约69分钟),做饭后均有开窗通风(kitchen_window_contact = False),无火灾迹象。", "推理步骤7: 其他设备状态正常——所有漏水传感器未触发,烟雾报警器未触发,门窗传感器状态合理,洗碗机正常运行,空调正常开关,无其他异常。"], "key_evidence": ["kitchen_temp_sensor 在 07:06、07:21、18:20、19:29 四次报告 MeasuredValue = None,均与灶具开关操作时间高度吻合", "同时段其他三个温度传感器(客厅、主卧、儿童房)均正常上报数值,排除系统性网络故障", "None 值出现在灶具开启后约1分钟和关闭后约1分钟,呈现明确的关联模式"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热冲击或电磁干扰", "考虑将厨房温度传感器迁移至远离灶具的位置(如靠近厨房门口或天花板处)", "如传感器位置合理,建议更换传感器或检查其固件版本是否需要更新", "在传感器修复前,可设置自动化规则:当厨房温度传感器报告 None 时发送提醒,避免在灶具使用期间丧失温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.27825689315796, "api_error": null} {"episode_id": "SQ3_FP_C_0658", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0658.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261287, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "second_bathroom", "injection_time": "2026-06-12T09:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:02 主卧起床、06:37 儿童房起床、06:42 洗漱、07:02 做早餐、07:34 全家出门并锁门,符合工作日上学/上班模式。\",\n \"推理步骤2: 16:03 有人回家(可能是孩子放学),直接进入儿童房;18:08 另一人回家,开客厅灯和空调、18:14 开始做晚饭,19:13 做完饭、19:35 开洗碗机,21:09 孩子关灯睡觉,22:28 大人关灯锁门睡觉。整体作息合理。\",\n \"推理步骤3: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、密码错误等),无入侵迹象。\",\n \"推理步骤4: 温度趋势合理——夜间约 23°C,白天随气温升至峰值约 25.9°C(12:00-12:30),午后逐步回落,18:08 开空调后客厅温度从 24.5°C 缓慢下降,符合夏季自然温度曲线。\",\n \"推理步骤5: 厨房温度传感器在 06:56、07:03、18:15、19:14 四次报告 MeasuredValue = None。这些时间点均与灶具开关操作相关(06:55 灶具状态 Off 但紧接着 None、07:02 灶具开启后 None、18:14 灶具开启后 None、19:13 灶具关闭后 None)。传感器可能受灶具热量/油烟干扰导致读数异常,也可能是传感器本身存在间歇性故障。\",\n \"推理步骤6: 厨房窗户传感器在 06:55 和 19:13 两次报告 StateValue=False(窗户打开),但整个日志中未见对应的 StateValue=True(窗户关闭)事件。如果窗户确实一直处于打开状态,在无人在家时段(07:34-16:03)存在一定安全隐患。但也可能是关窗事件未被记录。\",\n \"推理步骤7: 09:58 厨房漏水传感器触发(StateValue=True),但 10:00 即恢复(StateValue=False),持续仅约 2 分钟。此时家中无人(07:34 已出门),可能是洗碗机残留水滴或冷凝水短暂触发,非持续性漏水,但仍需留意。\",\n \"推理步骤8: 烟雾报警器全天未触发,所有漏水传感器(除厨房短暂触发外)均正常,无火灾或严重水患风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:56、07:03、18:15、19:14 四次报告 MeasuredValue = None,均与灶具操作时间高度相关\",\n \"厨房窗户传感器两次报告打开(06:55、19:13),但全天日志中无关闭记录\",\n \"09:58 厨房漏水传感器短暂触发约 2 分钟后自动恢复,当时家中无人\",\n \"16:03 回家时入户门未重新上锁(日志中无 LockOperationType=0),直到 22:28 才自动锁门——白天至晚间约 6 小时门锁处于未锁状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否距灶具过近导致读数异常;如问题持续,考虑更换传感器\",\n \"确认厨房窗户当前状态:检查窗户是否确实处于打开状态,若是则关闭;同时排查窗户传感器是否存在关闭事件漏报问题\",\n \"关注厨房漏水传感器:虽然本次为短暂触发,建议检查洗碗机进出水管接口及厨房水龙头区域是否有渗漏迹象\",\n \"优化门锁自动化规则:16:03 回家后门锁未上锁,建议设置入门后自动延时上锁策略,避免长时间处于未锁定状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:02 主卧起床、06:37 儿童房起床、06:42 洗漱、07:02 做早餐、07:34 全家出门并锁门,符合工作日上学/上班模式。", "推理步骤2: 16:03 有人回家(可能是孩子放学),直接进入儿童房;18:08 另一人回家,开客厅灯和空调、18:14 开始做晚饭,19:13 做完饭、19:35 开洗碗机,21:09 孩子关灯睡觉,22:28 大人关灯锁门睡觉。整体作息合理。", "推理步骤3: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、密码错误等),无入侵迹象。", "推理步骤4: 温度趋势合理——夜间约 23°C,白天随气温升至峰值约 25.9°C(12:00-12:30),午后逐步回落,18:08 开空调后客厅温度从 24.5°C 缓慢下降,符合夏季自然温度曲线。", "推理步骤5: 厨房温度传感器在 06:56、07:03、18:15、19:14 四次报告 MeasuredValue = None。这些时间点均与灶具开关操作相关(06:55 灶具状态 Off 但紧接着 None、07:02 灶具开启后 None、18:14 灶具开启后 None、19:13 灶具关闭后 None)。传感器可能受灶具热量/油烟干扰导致读数异常,也可能是传感器本身存在间歇性故障。", "推理步骤6: 厨房窗户传感器在 06:55 和 19:13 两次报告 StateValue=False(窗户打开),但整个日志中未见对应的 StateValue=True(窗户关闭)事件。如果窗户确实一直处于打开状态,在无人在家时段(07:34-16:03)存在一定安全隐患。但也可能是关窗事件未被记录。", "推理步骤7: 09:58 厨房漏水传感器触发(StateValue=True),但 10:00 即恢复(StateValue=False),持续仅约 2 分钟。此时家中无人(07:34 已出门),可能是洗碗机残留水滴或冷凝水短暂触发,非持续性漏水,但仍需留意。", "推理步骤8: 烟雾报警器全天未触发,所有漏水传感器(除厨房短暂触发外)均正常,无火灾或严重水患风险。"], "key_evidence": ["厨房温度传感器在 06:56、07:03、18:15、19:14 四次报告 MeasuredValue = None,均与灶具操作时间高度相关", "厨房窗户传感器两次报告打开(06:55、19:13),但全天日志中无关闭记录", "09:58 厨房漏水传感器短暂触发约 2 分钟后自动恢复,当时家中无人", "16:03 回家时入户门未重新上锁(日志中无 LockOperationType=0),直到 22:28 才自动锁门——白天至晚间约 6 小时门锁处于未锁状态"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否距灶具过近导致读数异常;如问题持续,考虑更换传感器", "确认厨房窗户当前状态:检查窗户是否确实处于打开状态,若是则关闭;同时排查窗户传感器是否存在关闭事件漏报问题", "关注厨房漏水传感器:虽然本次为短暂触发,建议检查洗碗机进出水管接口及厨房水龙头区域是否有渗漏迹象", "优化门锁自动化规则:16:03 回家后门锁未上锁,建议设置入门后自动延时上锁策略,避免长时间处于未锁定状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.034530639648438, "api_error": null} {"episode_id": "SQ3_FP_C_0663", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0663.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261292, "scenario_id": "BA-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "master_bathroom", "injection_time": "2026-06-06T15:14:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件。\",\n \"推理步骤2: 温度值以百分之一摄氏度为单位。凌晨 00:00-05:30 各房间温度稳定在 22.9-23.1°C 左右,属于夏季夜间正常室温。\",\n \"推理步骤3: 从 06:00 起温度开始上升(约 24.0°C),到 12:00-13:00 达到峰值约 25.5-25.9°C,随后逐步回落,至 23:30 降回约 23.3°C。这是典型的夏季日照驱动的昼夜温度曲线。\",\n \"推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 1°C 以内,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障导致的异常发热。\",\n \"推理步骤5: 全天最高温度约 25.9°C,最低约 22.9°C,温差约 3°C,完全在正常居住环境范围内,未触及任何安全阈值。\",\n \"推理步骤6: 没有空调运行记录出现在日志中,温度的自然升降进一步印证这是无人为干预的自然温度变化。\"\n ],\n \"key_evidence\": [\n \"全部日志仅含温度数据,无任何安防设备(门锁、门窗、烟雾、漏水、运动传感器)的告警或状态变化事件\",\n \"四个房间温度同步呈现凌晨低(~23°C)→ 午间高(~25.8°C)→ 夜间回落(~23.3°C)的标准昼夜曲线\",\n \"房间间温差始终小于 1°C,无局部异常升温\",\n \"全天温度范围 22.9-25.9°C,处于正常舒适区间\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前家庭环境状态正常\",\n \"可考虑在午间高温时段(11:00-14:00)自动开启空调以提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件。", "推理步骤2: 温度值以百分之一摄氏度为单位。凌晨 00:00-05:30 各房间温度稳定在 22.9-23.1°C 左右,属于夏季夜间正常室温。", "推理步骤3: 从 06:00 起温度开始上升(约 24.0°C),到 12:00-13:00 达到峰值约 25.5-25.9°C,随后逐步回落,至 23:30 降回约 23.3°C。这是典型的夏季日照驱动的昼夜温度曲线。", "推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 1°C 以内,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障导致的异常发热。", "推理步骤5: 全天最高温度约 25.9°C,最低约 22.9°C,温差约 3°C,完全在正常居住环境范围内,未触及任何安全阈值。", "推理步骤6: 没有空调运行记录出现在日志中,温度的自然升降进一步印证这是无人为干预的自然温度变化。"], "key_evidence": ["全部日志仅含温度数据,无任何安防设备(门锁、门窗、烟雾、漏水、运动传感器)的告警或状态变化事件", "四个房间温度同步呈现凌晨低(~23°C)→ 午间高(~25.8°C)→ 夜间回落(~23.3°C)的标准昼夜曲线", "房间间温差始终小于 1°C,无局部异常升温", "全天温度范围 22.9-25.9°C,处于正常舒适区间"], "recommended_actions": ["无需采取任何措施,当前家庭环境状态正常", "可考虑在午间高温时段(11:00-14:00)自动开启空调以提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.13097095489502, "api_error": null} {"episode_id": "SQ3_FP_C_0659", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_C_0659.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261288, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-08T10:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时入户门锁在无人在家时段出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天生活节奏——06:00 主卧有人起床,06:27 使用主卫,06:44 儿童房有人活动,06:56 进厨房做早餐,07:03 餐厅用餐,07:35 全家关灯、手动开锁出门、门自动上锁,符合工作日早晨出门模式。\",\n \"推理步骤2: 07:35 出门后家中无任何运动传感器触发,直到 10:11 出现入户门锁事件。10:11 先报告 LockOperationError(OperationError=1, OperationSource=3),即远程/密码开锁失败一次,20秒后同一 OperationSource=3、UserIndex=1 成功开锁,门被打开,玄关检测到有人。这可能是住户远程开门(如为家政人员开门),输错一次密码后成功,但也不能排除非授权尝试。\",\n \"推理步骤3: 16:18 手动开锁进门后直接去儿童房开灯,符合放学回家的模式。18:05 手动开锁进门后开客厅灯和空调(制冷模式 SystemMode=3),符合下班回家模式。全天出入模式整体合理。\",\n \"推理步骤4: 厨房温度传感器在 06:57、07:04、18:47、19:03 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后。正常传感器不应返回 None,这表明传感器可能受灶具热源干扰导致读数溢出,或传感器本身存在通信/硬件故障。\",\n \"推理步骤5: 厨房窗户传感器在 07:03:30 和 19:02:30 报告 StateValue = False(窗户打开),均发生在灶具关闭后,是做完饭开窗通风的正常行为。但日志中未见窗户关闭事件(StateValue = True),可能是窗户一直保持打开状态,也可能是关闭事件未被记录。\",\n \"推理步骤6: 温度趋势分析——凌晨各房间约 22.9-23.1°C,随日出逐步升温,06:00 出现约 1°C 的跳升(约 24.0°C),中午峰值约 25.7-25.9°C,傍晚开空调后客厅温度从 24.5°C 降至 22:00 的 23.5°C,整体符合夏季自然温度曲线,无异常热源迹象。\",\n \"推理步骤7: 烟雾报警器、漏水传感器全天无任何告警事件,排除火灾和漏水风险。所有门锁操作(除 10:11 的一次失败)均正常,22:26 睡前门已确认上锁(LockState=1)。\",\n \"推理步骤8: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器反复报 None 属于设备异常,需要维护;10:11 的开锁失败事件虽最终由合法用户(UserIndex=1)成功开锁,但建议确认该操作是否为本人授权。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:57、07:04、18:47、19:03 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"10:11 入户门锁远程开锁失败一次(LockOperationError, OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁\",\n \"厨房窗户在 07:03 和 19:02 被打开,但日志中未记录关闭事件\",\n \"22:26 入户门确认上锁(自动锁定),全天烟雾/漏水传感器无告警\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,排查其在灶具使用时反复报 None 的原因(可能是传感器安装位置过近灶具导致读数溢出,或固件/通信故障)\",\n \"确认 10:11 的远程开锁操作(OperationSource=3, UserIndex=1)是否为住户本人授权,如非本人操作应立即更换门锁密码并审查远程访问权限\",\n \"检查厨房窗户是否仍处于打开状态,夜间开窗可能存在安全隐患(入侵风险)和蚊虫问题\",\n \"建议为入户门锁设置连续开锁失败告警规则,超过阈值时自动通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时入户门锁在无人在家时段出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 梳理全天生活节奏——06:00 主卧有人起床,06:27 使用主卫,06:44 儿童房有人活动,06:56 进厨房做早餐,07:03 餐厅用餐,07:35 全家关灯、手动开锁出门、门自动上锁,符合工作日早晨出门模式。", "推理步骤2: 07:35 出门后家中无任何运动传感器触发,直到 10:11 出现入户门锁事件。10:11 先报告 LockOperationError(OperationError=1, OperationSource=3),即远程/密码开锁失败一次,20秒后同一 OperationSource=3、UserIndex=1 成功开锁,门被打开,玄关检测到有人。这可能是住户远程开门(如为家政人员开门),输错一次密码后成功,但也不能排除非授权尝试。", "推理步骤3: 16:18 手动开锁进门后直接去儿童房开灯,符合放学回家的模式。18:05 手动开锁进门后开客厅灯和空调(制冷模式 SystemMode=3),符合下班回家模式。全天出入模式整体合理。", "推理步骤4: 厨房温度传感器在 06:57、07:04、18:47、19:03 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后。正常传感器不应返回 None,这表明传感器可能受灶具热源干扰导致读数溢出,或传感器本身存在通信/硬件故障。", "推理步骤5: 厨房窗户传感器在 07:03:30 和 19:02:30 报告 StateValue = False(窗户打开),均发生在灶具关闭后,是做完饭开窗通风的正常行为。但日志中未见窗户关闭事件(StateValue = True),可能是窗户一直保持打开状态,也可能是关闭事件未被记录。", "推理步骤6: 温度趋势分析——凌晨各房间约 22.9-23.1°C,随日出逐步升温,06:00 出现约 1°C 的跳升(约 24.0°C),中午峰值约 25.7-25.9°C,傍晚开空调后客厅温度从 24.5°C 降至 22:00 的 23.5°C,整体符合夏季自然温度曲线,无异常热源迹象。", "推理步骤7: 烟雾报警器、漏水传感器全天无任何告警事件,排除火灾和漏水风险。所有门锁操作(除 10:11 的一次失败)均正常,22:26 睡前门已确认上锁(LockState=1)。", "推理步骤8: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器反复报 None 属于设备异常,需要维护;10:11 的开锁失败事件虽最终由合法用户(UserIndex=1)成功开锁,但建议确认该操作是否为本人授权。"], "key_evidence": ["厨房温度传感器在 06:57、07:04、18:47、19:03 四次报告 MeasuredValue = None,均与灶具使用时段重合", "10:11 入户门锁远程开锁失败一次(LockOperationError, OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁", "厨房窗户在 07:03 和 19:02 被打开,但日志中未记录关闭事件", "22:26 入户门确认上锁(自动锁定),全天烟雾/漏水传感器无告警"], "recommended_actions": ["检查或更换厨房温度传感器,排查其在灶具使用时反复报 None 的原因(可能是传感器安装位置过近灶具导致读数溢出,或固件/通信故障)", "确认 10:11 的远程开锁操作(OperationSource=3, UserIndex=1)是否为住户本人授权,如非本人操作应立即更换门锁密码并审查远程访问权限", "检查厨房窗户是否仍处于打开状态,夜间开窗可能存在安全隐患(入侵风险)和蚊虫问题", "建议为入户门锁设置连续开锁失败告警规则,超过阈值时自动通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.8253812789917, "api_error": null} {"episode_id": "SQ3_FP_D_0565", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0565.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261194, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bathroom", "injection_time": "2026-06-04T12:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约 05:31 起床(卫生间活动),06:09 进厨房做早餐,07:09 出门,08:27 回家,12:24 午休,14:08 起床,17:02 做晚餐,20:31 洗漱,20:49 就寝。这是一个非常规律、合理的独居老人日常作息,未发现入侵或健康异常迹象。\",\n \"推理步骤2: 门锁与入侵分析——全天仅有两次开门记录(07:09 出门、08:27 回家),均为 Manual 操作且伴随正常的运动传感器触发,门锁在关门后均自动上锁(Auto, LockState=1)。20:49 有一次门锁确认上锁事件,对应就寝前的安全确认。无异常开锁或未授权访问。\",\n \"推理步骤3: 温度趋势分析——三个区域温度呈现正常的日间升温、夜间降温曲线。客厅 23.08°C(凌晨)→ 25.86°C(午间峰值)→ 23.25°C(深夜),卧室 21.9°C → 24.86°C → 22.34°C,厨房 23.05°C → 25.81°C → 23.30°C。温度范围合理,无异常高温或骤变。\",\n \"推理步骤4: 厨房温度传感器异常——灶具三次使用期间(06:09-06:28、11:01-11:38、17:02-17:28),厨房温度传感器均在灶具开启后约 1 分钟报告 MeasuredValue = None,且在灶具关闭后 1 分钟再次报告 None,直到下一个 30 分钟整点才恢复正常数值。这一模式在三次烹饪中完全重复,说明传感器在灶具工作时无法正常读数。\",\n \"推理步骤5: 风险评估——厨房温度传感器是烹饪安全监测的重要环节,尤其对独居老人而言。如果灶具使用期间传感器失效,一旦发生干烧或异常高温,系统将无法及时检测和报警。烟雾报警器虽然存在,但温度传感器提供的是更早期的预警能力。\",\n \"推理步骤6: 其他设备状态正常——烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合,所有灯光和运动传感器的联动逻辑正常。入户门在老人外出期间(07:09-08:27)处于锁定状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:10、06:29、11:02、11:39、17:03、17:29)均报告 MeasuredValue = None,模式完全一致\",\n \"灶具关闭后传感器仍报告 None,需等到下一个 30 分钟周期才恢复正常读数(如 06:30 恢复为 2394、11:30 恢复为 2540、17:30 恢复为 2478)\",\n \"其余时段厨房温度传感器工作正常,说明故障与灶具使用存在明确关联\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程\",\n \"考虑将温度传感器重新安装到距灶具更远但仍能监测厨房整体温度的位置\",\n \"在传感器问题解决前,确保厨房烟雾报警器处于正常工作状态,作为烹饪安全的备用保障\",\n \"如传感器硬件存在问题(如热保护导致读数中断),建议更换为耐高温型号\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约 05:31 起床(卫生间活动),06:09 进厨房做早餐,07:09 出门,08:27 回家,12:24 午休,14:08 起床,17:02 做晚餐,20:31 洗漱,20:49 就寝。这是一个非常规律、合理的独居老人日常作息,未发现入侵或健康异常迹象。", "推理步骤2: 门锁与入侵分析——全天仅有两次开门记录(07:09 出门、08:27 回家),均为 Manual 操作且伴随正常的运动传感器触发,门锁在关门后均自动上锁(Auto, LockState=1)。20:49 有一次门锁确认上锁事件,对应就寝前的安全确认。无异常开锁或未授权访问。", "推理步骤3: 温度趋势分析——三个区域温度呈现正常的日间升温、夜间降温曲线。客厅 23.08°C(凌晨)→ 25.86°C(午间峰值)→ 23.25°C(深夜),卧室 21.9°C → 24.86°C → 22.34°C,厨房 23.05°C → 25.81°C → 23.30°C。温度范围合理,无异常高温或骤变。", "推理步骤4: 厨房温度传感器异常——灶具三次使用期间(06:09-06:28、11:01-11:38、17:02-17:28),厨房温度传感器均在灶具开启后约 1 分钟报告 MeasuredValue = None,且在灶具关闭后 1 分钟再次报告 None,直到下一个 30 分钟整点才恢复正常数值。这一模式在三次烹饪中完全重复,说明传感器在灶具工作时无法正常读数。", "推理步骤5: 风险评估——厨房温度传感器是烹饪安全监测的重要环节,尤其对独居老人而言。如果灶具使用期间传感器失效,一旦发生干烧或异常高温,系统将无法及时检测和报警。烟雾报警器虽然存在,但温度传感器提供的是更早期的预警能力。", "推理步骤6: 其他设备状态正常——烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合,所有灯光和运动传感器的联动逻辑正常。入户门在老人外出期间(07:09-08:27)处于锁定状态。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:10、06:29、11:02、11:39、17:03、17:29)均报告 MeasuredValue = None,模式完全一致", "灶具关闭后传感器仍报告 None,需等到下一个 30 分钟周期才恢复正常读数(如 06:30 恢复为 2394、11:30 恢复为 2540、17:30 恢复为 2478)", "其余时段厨房温度传感器工作正常,说明故障与灶具使用存在明确关联"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程", "考虑将温度传感器重新安装到距灶具更远但仍能监测厨房整体温度的位置", "在传感器问题解决前,确保厨房烟雾报警器处于正常工作状态,作为烹饪安全的备用保障", "如传感器硬件存在问题(如热保护导致读数中断),建议更换为耐高温型号"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.33863091468811, "api_error": null} {"episode_id": "SQ3_FP_D_0566", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0566.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261195, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-24T20:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时晚间 20:35-20:41 时段出现可疑的入户门与卧室窗户活动序列,需要关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:06、06:37、10:54、11:25、16:56、17:34),共计6次。正常传感器即使在灶具使用导致温度升高时也应返回数值,而非 None。这表明传感器存在硬件故障、通信中断或量程溢出问题。\",\n \"推理步骤2: 该传感器在非烹饪时段(每30分钟的定时上报)能正常返回数值,仅在灶具使用期间及关闭后立即出现 None,说明故障与灶具高温环境相关——可能是传感器在高温下超出量程或暂时失联。这对独居老人的厨房安全监控构成隐患:如果灶具忘关导致温度持续升高,传感器恰好无法报告真实温度,烟雾报警器将成为唯一防线。\",\n \"推理步骤3: 20:35 时段出现一个值得注意的序列——浴室灯关闭 → 卧室检测到人 → 入户门传感器报告 StateValue=True(门关闭)→ 门锁自动上锁。这说明老人此时在卧室附近,入户门被确认关闭并上锁,属于正常就寝准备流程。\",\n \"推理步骤4: 但紧接着 20:41 出现了一段简短的卧室活动:卧室检测到人 → 卧室灯开 → 卧室窗户传感器 StateValue=False(窗户打开)→ 卧室灯关 → 卧室人体感应归零。注意此时卧室窗帘在 20:35:29 刚被关闭(100%),而窗户却在 20:41 被打开。老人在已拉上窗帘准备睡觉后又打开窗户,随后卧室人体感应迅速归零,这个序列虽然可能是睡前开窗通风的正常行为,但在独居老人场景下需要留意——窗户整夜保持打开状态且后续无任何卧室活动记录。\",\n \"推理步骤5: 20:35 时段浴室灯关闭,但 20:36 浴室人体感应才归零,随后 20:39 浴室再次检测到人并开灯。之后直到日志结束(23:30),浴室灯和人体感应再无状态变化——浴室灯可能整夜亮着,这对独居老人来说可能意味着忘记关灯,也可能暗示老人在浴室停留时间异常长。\",\n \"推理步骤6: 07:02 老人出门时门锁手动解锁(LockOperationType=1)→ 门开关 → 自动上锁,08:22 回来时同样手动解锁 → 进入客厅。这是正常的外出和返回模式。整体生活节奏(05:30起床、三餐烹饪、12:22午休、20:35就寝)符合独居老人的典型作息。\",\n \"推理步骤7: 入户门在 08:22 解锁进入后,日志中未记录重新上锁事件,直到 20:35:14 才出现自动上锁记录。这意味着从 08:22 到 20:35 长达约12小时内,入户门可能处于未上锁状态。对独居老人而言这是一个安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:37、10:54、11:25、16:56、17:34),非烹饪时段正常\",\n \"20:39 浴室灯开启后直到日志结束(23:30)无关闭记录,浴室可能整夜亮灯\",\n \"20:41 卧室窗户被打开(bedroom_window_contact StateValue=False),此后无关闭记录,窗户整夜敞开\",\n \"08:22 入户门解锁进入后至 20:35 期间无上锁记录,门锁可能长时间未锁\",\n \"20:41:20 卧室人体感应归零后,直到日志结束再无任何房间的活动记录(约3小时无活动,可理解为正常睡眠)\"\n ],\n \"recommended_actions\": [\n \"优先检修或更换厨房温度传感器——该传感器在高温环境下失效,严重削弱厨房火灾预警能力,对独居老人安全至关重要\",\n \"设置入户门锁长时间未上锁提醒(如超过30分钟未锁门则推送通知给紧急联系人)\",\n \"为浴室灯设置自动关闭规则(如浴室无人超过15分钟自动关灯),同时可作为老人异常滞留的检测手段\",\n \"考虑为卧室窗户设置夜间开启提醒,尤其在恶劣天气或安全风险较高时\",\n \"建议增加夜间活动监测规则:如果老人在 21:00-06:00 期间超过一定时长无任何传感器触发,向紧急联系人发送健康确认通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时晚间 20:35-20:41 时段出现可疑的入户门与卧室窗户活动序列,需要关注。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:06、06:37、10:54、11:25、16:56、17:34),共计6次。正常传感器即使在灶具使用导致温度升高时也应返回数值,而非 None。这表明传感器存在硬件故障、通信中断或量程溢出问题。", "推理步骤2: 该传感器在非烹饪时段(每30分钟的定时上报)能正常返回数值,仅在灶具使用期间及关闭后立即出现 None,说明故障与灶具高温环境相关——可能是传感器在高温下超出量程或暂时失联。这对独居老人的厨房安全监控构成隐患:如果灶具忘关导致温度持续升高,传感器恰好无法报告真实温度,烟雾报警器将成为唯一防线。", "推理步骤3: 20:35 时段出现一个值得注意的序列——浴室灯关闭 → 卧室检测到人 → 入户门传感器报告 StateValue=True(门关闭)→ 门锁自动上锁。这说明老人此时在卧室附近,入户门被确认关闭并上锁,属于正常就寝准备流程。", "推理步骤4: 但紧接着 20:41 出现了一段简短的卧室活动:卧室检测到人 → 卧室灯开 → 卧室窗户传感器 StateValue=False(窗户打开)→ 卧室灯关 → 卧室人体感应归零。注意此时卧室窗帘在 20:35:29 刚被关闭(100%),而窗户却在 20:41 被打开。老人在已拉上窗帘准备睡觉后又打开窗户,随后卧室人体感应迅速归零,这个序列虽然可能是睡前开窗通风的正常行为,但在独居老人场景下需要留意——窗户整夜保持打开状态且后续无任何卧室活动记录。", "推理步骤5: 20:35 时段浴室灯关闭,但 20:36 浴室人体感应才归零,随后 20:39 浴室再次检测到人并开灯。之后直到日志结束(23:30),浴室灯和人体感应再无状态变化——浴室灯可能整夜亮着,这对独居老人来说可能意味着忘记关灯,也可能暗示老人在浴室停留时间异常长。", "推理步骤6: 07:02 老人出门时门锁手动解锁(LockOperationType=1)→ 门开关 → 自动上锁,08:22 回来时同样手动解锁 → 进入客厅。这是正常的外出和返回模式。整体生活节奏(05:30起床、三餐烹饪、12:22午休、20:35就寝)符合独居老人的典型作息。", "推理步骤7: 入户门在 08:22 解锁进入后,日志中未记录重新上锁事件,直到 20:35:14 才出现自动上锁记录。这意味着从 08:22 到 20:35 长达约12小时内,入户门可能处于未上锁状态。对独居老人而言这是一个安全隐患。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:37、10:54、11:25、16:56、17:34),非烹饪时段正常", "20:39 浴室灯开启后直到日志结束(23:30)无关闭记录,浴室可能整夜亮灯", "20:41 卧室窗户被打开(bedroom_window_contact StateValue=False),此后无关闭记录,窗户整夜敞开", "08:22 入户门解锁进入后至 20:35 期间无上锁记录,门锁可能长时间未锁", "20:41:20 卧室人体感应归零后,直到日志结束再无任何房间的活动记录(约3小时无活动,可理解为正常睡眠)"], "recommended_actions": ["优先检修或更换厨房温度传感器——该传感器在高温环境下失效,严重削弱厨房火灾预警能力,对独居老人安全至关重要", "设置入户门锁长时间未上锁提醒(如超过30分钟未锁门则推送通知给紧急联系人)", "为浴室灯设置自动关闭规则(如浴室无人超过15分钟自动关灯),同时可作为老人异常滞留的检测手段", "考虑为卧室窗户设置夜间开启提醒,尤其在恶劣天气或安全风险较高时", "建议增加夜间活动监测规则:如果老人在 21:00-06:00 期间超过一定时长无任何传感器触发,向紧急联系人发送健康确认通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 38.60953998565674, "api_error": null} {"episode_id": "SQ3_FP_D_0569", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0569.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261198, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-18T19:27:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致烹饪安全监控失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:23 起床、05:46 如厕、约 06:00 做早餐、07:04 出门、08:26 回家、12:39 午休、13:57 起床、16:56 做晚餐、19:27 有人通过密码开锁进入(可能是老人自己回家或家属探访)、20:40 就寝。作息规律合理,符合独居老人的日常模式。\",\n \"推理步骤2: 门锁事件分析——19:27 出现一次 LockOperationError(OperationError=1, OperationSource=3),随后 20 秒内通过 OperationSource=3(远程/密码)以 UserIndex=1 成功解锁。单次密码输入错误后立即用正确密码开锁,属于正常的输入失误,不构成入侵威胁。若为暴力破解通常会出现连续多次错误。\",\n \"推理步骤3: 入户门在 08:26 开门后直到 20:40 才关门上锁(约 12 小时门未关闭),但考虑到 19:27 有开锁事件,说明门在 07:04 出门后自动上锁,08:26 回来开门后可能一直未关门,直到 20:40 才关门。这段时间老人在家活动,门未关闭虽有一定风险但在独居老人场景中并不罕见。\",\n \"推理步骤4: 厨房温度传感器异常——灶具三次使用期间(05:58-06:34、10:54-11:39、16:56-17:40),厨房温度传感器均在灶具开启后约 30 秒报告 MeasuredValue = None,且在灶具关闭后约 1 分钟再次报告 None。这是一个重复出现的模式,说明传感器在灶具工作时无法正常读数。这可能是高温干扰、传感器硬件故障或通信问题。\",\n \"推理步骤5: 安全影响评估——厨房温度传感器是烹饪安全监控的关键设备。如果传感器在灶具使用时失效,系统将无法检测到厨房异常高温(如忘关灶具、油锅起火等),对独居老人而言这是一个重要的安全隐患。\",\n \"推理步骤6: 温度趋势正常——除传感器 None 值外,各房间温度随昼夜自然变化(夜间约 22°C,午间峰值约 25.7°C),无异常温升,烟雾报警器未触发,无火灾迹象。\",\n \"推理步骤7: 其他设备状态正常——漏水传感器无报警、窗户传感器无异常开合、烟雾报警器未触发,整体设备运行正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:59、06:35、10:55、11:40、16:57、17:41),呈现规律性故障模式\",\n \"19:27 门锁出现一次 LockOperationError,但 20 秒后以合法用户(UserIndex=1)成功解锁,为单次密码输入错误\",\n \"入户门从 08:26 开门到 20:40 才关闭上锁,期间约 12 小时处于未关闭状态\"\n ],\n \"recommended_actions\": [\n \"优先检修或更换厨房温度传感器——该传感器在灶具工作时反复失效,无法履行烹饪安全监控职责,对独居老人存在火灾风险盲区\",\n \"建议设置入户门长时间未关闭提醒(如超过 30 分钟未关门则推送通知),提升居家安全性\",\n \"建议对门锁密码错误事件设置累计告警阈值(如 5 分钟内 3 次错误则告警),当前单次错误无需担忧但应有监控机制\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致烹饪安全监控失效。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:23 起床、05:46 如厕、约 06:00 做早餐、07:04 出门、08:26 回家、12:39 午休、13:57 起床、16:56 做晚餐、19:27 有人通过密码开锁进入(可能是老人自己回家或家属探访)、20:40 就寝。作息规律合理,符合独居老人的日常模式。", "推理步骤2: 门锁事件分析——19:27 出现一次 LockOperationError(OperationError=1, OperationSource=3),随后 20 秒内通过 OperationSource=3(远程/密码)以 UserIndex=1 成功解锁。单次密码输入错误后立即用正确密码开锁,属于正常的输入失误,不构成入侵威胁。若为暴力破解通常会出现连续多次错误。", "推理步骤3: 入户门在 08:26 开门后直到 20:40 才关门上锁(约 12 小时门未关闭),但考虑到 19:27 有开锁事件,说明门在 07:04 出门后自动上锁,08:26 回来开门后可能一直未关门,直到 20:40 才关门。这段时间老人在家活动,门未关闭虽有一定风险但在独居老人场景中并不罕见。", "推理步骤4: 厨房温度传感器异常——灶具三次使用期间(05:58-06:34、10:54-11:39、16:56-17:40),厨房温度传感器均在灶具开启后约 30 秒报告 MeasuredValue = None,且在灶具关闭后约 1 分钟再次报告 None。这是一个重复出现的模式,说明传感器在灶具工作时无法正常读数。这可能是高温干扰、传感器硬件故障或通信问题。", "推理步骤5: 安全影响评估——厨房温度传感器是烹饪安全监控的关键设备。如果传感器在灶具使用时失效,系统将无法检测到厨房异常高温(如忘关灶具、油锅起火等),对独居老人而言这是一个重要的安全隐患。", "推理步骤6: 温度趋势正常——除传感器 None 值外,各房间温度随昼夜自然变化(夜间约 22°C,午间峰值约 25.7°C),无异常温升,烟雾报警器未触发,无火灾迹象。", "推理步骤7: 其他设备状态正常——漏水传感器无报警、窗户传感器无异常开合、烟雾报警器未触发,整体设备运行正常。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:59、06:35、10:55、11:40、16:57、17:41),呈现规律性故障模式", "19:27 门锁出现一次 LockOperationError,但 20 秒后以合法用户(UserIndex=1)成功解锁,为单次密码输入错误", "入户门从 08:26 开门到 20:40 才关闭上锁,期间约 12 小时处于未关闭状态"], "recommended_actions": ["优先检修或更换厨房温度传感器——该传感器在灶具工作时反复失效,无法履行烹饪安全监控职责,对独居老人存在火灾风险盲区", "建议设置入户门长时间未关闭提醒(如超过 30 分钟未关门则推送通知),提升居家安全性", "建议对门锁密码错误事件设置累计告警阈值(如 5 分钟内 3 次错误则告警),当前单次错误无需担忧但应有监控机制"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.071314334869385, "api_error": null} {"episode_id": "SQ3_FP_D_0571", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0571.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20261200, "scenario_id": "EL-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-05-FP", "scenario_name": "EL-05-FP: 偶尔一次起夜", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "一晚只有1次卧室→卫生间,属于正常范围", "target_room": "bedroom", "injection_time": "2026-06-23T18:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志,老人的日常作息模式整体正常——晚餐做饭(17:10-17:26)、客厅看电视(19:27调暗灯光)、洗漱(20:31-20:55)、就寝(20:55关灯拉窗帘),符合独居老人的典型生活节奏。\",\n \"推理步骤2: 入户门在08:39开锁后未关门(front_door_contact 未恢复为 True),直到20:55才记录到门关闭并自动上锁。这意味着入户门可能长时间处于未关闭状态(约12小时),但考虑到08:39有人进入且老人一直在家活动,更可能是老人回家后门虚掩或传感器状态未及时更新。20:55的关门上锁发生在就寝前,属于合理的睡前安全检查行为。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间(05:51、06:25、11:10、11:23、17:11、17:27)反复报告 MeasuredValue = None。一天内出现6次 None 值,且全部与灶具使用时间高度关联。灶具关闭后传感器恢复正常读数。这说明传感器在高温环境下可能超出量程或出现间歇性故障。\",\n \"推理步骤4: 虽然传感器在灶具关闭后能恢复正常读数,但这种反复失效意味着在真正发生厨房火灾或温度异常时,该传感器可能无法提供有效的预警数据,对独居老人的安全构成隐患。\",\n \"推理步骤5: 温度趋势方面,各房间温度随白天升高、夜间降低,波动范围合理(卧室约22-25°C,客厅/厨房约23-26°C),无异常高温或低温情况。烟雾报警器、漏水传感器均未触发,无火灾或漏水风险。\",\n \"推理步骤6: 安全方面,门锁操作均为手动开锁/自动上锁,无异常远程解锁或暴力开锁事件。无深夜异常活动,老人就寝后无其他区域的运动触发。整体安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间(17:11和17:27)报告 MeasuredValue = None,全天共出现6次,均与灶具开启时段吻合\",\n \"入户门从08:39开锁到20:55才记录关闭上锁,中间约12小时门可能未完全关闭\",\n \"老人日常作息模式正常:做饭、午休、看电视、洗漱、就寝,时间节奏合理\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其耐高温性能是否满足灶具附近的安装要求,必要时调整安装位置远离热源\",\n \"确认入户门传感器工作是否正常,排查是否存在门未关好的情况;可设置门长时间未关闭的提醒规则\",\n \"考虑为厨房增加备用温度监测手段,确保灶具使用期间仍有有效的温度异常预警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志,老人的日常作息模式整体正常——晚餐做饭(17:10-17:26)、客厅看电视(19:27调暗灯光)、洗漱(20:31-20:55)、就寝(20:55关灯拉窗帘),符合独居老人的典型生活节奏。", "推理步骤2: 入户门在08:39开锁后未关门(front_door_contact 未恢复为 True),直到20:55才记录到门关闭并自动上锁。这意味着入户门可能长时间处于未关闭状态(约12小时),但考虑到08:39有人进入且老人一直在家活动,更可能是老人回家后门虚掩或传感器状态未及时更新。20:55的关门上锁发生在就寝前,属于合理的睡前安全检查行为。", "推理步骤3: 厨房温度传感器在灶具开启期间(05:51、06:25、11:10、11:23、17:11、17:27)反复报告 MeasuredValue = None。一天内出现6次 None 值,且全部与灶具使用时间高度关联。灶具关闭后传感器恢复正常读数。这说明传感器在高温环境下可能超出量程或出现间歇性故障。", "推理步骤4: 虽然传感器在灶具关闭后能恢复正常读数,但这种反复失效意味着在真正发生厨房火灾或温度异常时,该传感器可能无法提供有效的预警数据,对独居老人的安全构成隐患。", "推理步骤5: 温度趋势方面,各房间温度随白天升高、夜间降低,波动范围合理(卧室约22-25°C,客厅/厨房约23-26°C),无异常高温或低温情况。烟雾报警器、漏水传感器均未触发,无火灾或漏水风险。", "推理步骤6: 安全方面,门锁操作均为手动开锁/自动上锁,无异常远程解锁或暴力开锁事件。无深夜异常活动,老人就寝后无其他区域的运动触发。整体安防状态良好。"], "key_evidence": ["厨房温度传感器在灶具使用期间(17:11和17:27)报告 MeasuredValue = None,全天共出现6次,均与灶具开启时段吻合", "入户门从08:39开锁到20:55才记录关闭上锁,中间约12小时门可能未完全关闭", "老人日常作息模式正常:做饭、午休、看电视、洗漱、就寝,时间节奏合理"], "recommended_actions": ["检查或更换厨房温度传感器,确认其耐高温性能是否满足灶具附近的安装要求,必要时调整安装位置远离热源", "确认入户门传感器工作是否正常,排查是否存在门未关好的情况;可设置门长时间未关闭的提醒规则", "考虑为厨房增加备用温度监测手段,确保灶具使用期间仍有有效的温度异常预警能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.553956508636475, "api_error": null} {"episode_id": "SQ3_FP_D_0574", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0574.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261203, "scenario_id": "BA-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bedroom", "injection_time": "2026-06-19T07:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,疑似传感器故障,削弱了厨房火灾/高温预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 日志时间范围覆盖 2026-06-19 全天,重点分析过去活动密集时段。老人的作息模式为:05:24 起床 → 洗漱 → 做早餐 → 07:03 出门 → 08:29 回家 → 午餐/午休 → 晚餐 → 20:38 就寝,整体生活节奏规律,无异常。\",\n \"推理步骤2: 厨房灶具共使用三次(05:52-06:22 早餐约30分钟、11:07-11:36 午餐约29分钟、17:08-17:25 晚餐约17分钟),每次使用时长合理,且均正常关闭,灶具本身无异常。\",\n \"推理步骤3: 关键异常——厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:53、11:08、17:09),且在灶具关闭后约1分钟也报告 None(06:23、11:37、17:26)。这一模式在三次烹饪中完全重复出现。\",\n \"推理步骤4: 正常情况下,温度传感器在灶具工作时应报告升高的温度值而非 null。每次烹饪开始和结束时都出现 null,说明传感器可能在温度快速变化时出现读数故障或通信中断。而在非烹饪时段(每30分钟的定时上报),该传感器读数正常。\",\n \"推理步骤5: 该故障的安全隐患在于:如果灶具发生干烧或火灾,温度传感器在关键时刻无法提供有效读数,烟雾报警器虽然存在但温度预警链条断裂,对独居老人的安全保障能力下降。\",\n \"推理步骤6: 其他方面均正常——入户门锁操作合理(手动开锁出门、自动上锁),07:03 出门后 08:29 回家期间门锁状态无异常开锁事件;20:38 就寝时门锁确认为锁定状态(LockState=1);所有运动传感器触发与老人活动轨迹一致;无漏水报警;无烟雾报警;室温变化符合夏季昼夜规律。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:53:07、06:23:00、11:08:00、11:37:00、17:09:00、17:26:00),共6次 null 读数,且仅在灶具状态切换后出现\",\n \"非烹饪时段该传感器每30分钟正常上报温度值,说明故障与灶具运行/温度骤变相关,属间歇性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器超量程或热保护断连\",\n \"对该传感器进行固件更新或更换,确保在烹饪等关键场景下能持续提供有效温度数据\",\n \"在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为补偿性安全措施\",\n \"考虑为独居老人增加灶具超时自动关闭规则(如超过45分钟未手动操作则自动断气/断电),防止忘关灶具\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,疑似传感器故障,削弱了厨房火灾/高温预警能力。", "reasoning": ["推理步骤1: 日志时间范围覆盖 2026-06-19 全天,重点分析过去活动密集时段。老人的作息模式为:05:24 起床 → 洗漱 → 做早餐 → 07:03 出门 → 08:29 回家 → 午餐/午休 → 晚餐 → 20:38 就寝,整体生活节奏规律,无异常。", "推理步骤2: 厨房灶具共使用三次(05:52-06:22 早餐约30分钟、11:07-11:36 午餐约29分钟、17:08-17:25 晚餐约17分钟),每次使用时长合理,且均正常关闭,灶具本身无异常。", "推理步骤3: 关键异常——厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:53、11:08、17:09),且在灶具关闭后约1分钟也报告 None(06:23、11:37、17:26)。这一模式在三次烹饪中完全重复出现。", "推理步骤4: 正常情况下,温度传感器在灶具工作时应报告升高的温度值而非 null。每次烹饪开始和结束时都出现 null,说明传感器可能在温度快速变化时出现读数故障或通信中断。而在非烹饪时段(每30分钟的定时上报),该传感器读数正常。", "推理步骤5: 该故障的安全隐患在于:如果灶具发生干烧或火灾,温度传感器在关键时刻无法提供有效读数,烟雾报警器虽然存在但温度预警链条断裂,对独居老人的安全保障能力下降。", "推理步骤6: 其他方面均正常——入户门锁操作合理(手动开锁出门、自动上锁),07:03 出门后 08:29 回家期间门锁状态无异常开锁事件;20:38 就寝时门锁确认为锁定状态(LockState=1);所有运动传感器触发与老人活动轨迹一致;无漏水报警;无烟雾报警;室温变化符合夏季昼夜规律。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:53:07、06:23:00、11:08:00、11:37:00、17:09:00、17:26:00),共6次 null 读数,且仅在灶具状态切换后出现", "非烹饪时段该传感器每30分钟正常上报温度值,说明故障与灶具运行/温度骤变相关,属间歇性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器超量程或热保护断连", "对该传感器进行固件更新或更换,确保在烹饪等关键场景下能持续提供有效温度数据", "在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为补偿性安全措施", "考虑为独居老人增加灶具超时自动关闭规则(如超过45分钟未手动操作则自动断气/断电),防止忘关灶具"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.7802152633667, "api_error": null} {"episode_id": "SQ3_FP_D_0584", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0584.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261213, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-19T17:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器可能存在故障或被高温干扰失效,导致烹饪期间缺失关键的温度监控。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约 05:29 起床(卧室运动+开灯),05:45 如厕,06:08 进厨房做早餐,07:08 出门,08:21 回家,12:24 午休,13:52 起床,16:50 做晚餐,20:45 就寝。这是一个非常规律、合理的独居老人日常作息,无异常。\",\n \"推理步骤2: 入侵检测——07:08 出门时手动开锁(LockOperationType=1)、开关门、自动上锁;08:21 回家同样手动开锁进入。20:45 就寝前确认门锁状态为已锁(LockState=1)且门已关闭(StateValue=True)。全天无未授权开锁事件,无异常。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:08-06:26、11:06-11:28、16:50-17:33),厨房温度传感器均在灶具开启后约 1 分钟报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None,直到下一个整点周期才恢复正常数值。这说明传感器在高温环境下反复失效。\",\n \"推理步骤4: 该故障的安全隐患——厨房温度传感器是火灾预警的重要辅助手段。对于独居老人,如果烹饪时忘记关火导致温度异常升高,温度传感器本应提供早期预警,但当前它在最需要监测的时段恰恰失效,形成监控盲区。虽然烟雾报警器仍在工作,但多层防护中缺失一层会降低整体安全性。\",\n \"推理步骤5: 漏水事件评估——17:18 卫生间漏水传感器触发(StateValue=True),当时老人在场(Occupancy=1、灯亮),2 分钟后恢复(17:20 StateValue=False)。短暂触发且有人在场,最可能是正常用水溅水所致,非持续性漏水,风险较低。\",\n \"推理步骤6: 温度趋势正常——全天各房间温度呈现合理的日间升温、夜间降温曲线(夜间约 22°C,午间峰值约 25.9°C),卧室始终略低于客厅和厨房,符合夏季室内温度变化规律,无异常热源迹象。\",\n \"推理步骤7: 综合判断——生活作息正常、门锁安全、温度趋势合理、漏水为短暂事件。唯一值得关注的是厨房温度传感器在烹饪期间反复失效,这是一个设备故障问题,会削弱独居老人的厨房安全监控能力。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间(06:09、06:27、11:07、11:29、16:51、17:34)均报告 MeasuredValue = None,共 6 次 null 读数,100% 与灶具使用时段重合\",\n \"灶具关闭后传感器仍报告 None(如 06:26 关火,06:27 仍为 None),直到 06:30 整点周期才恢复为 2398,说明传感器恢复存在延迟\",\n \"卫生间漏水传感器 17:18 触发、17:20 恢复,持续仅 2 分钟,且老人在场\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或加装隔热措施\",\n \"对厨房温度传感器进行硬件检测,确认是否存在元器件老化或故障,考虑更换为耐高温型号\",\n \"在传感器修复前,可设置灶具使用时长自动提醒(如超过 45 分钟未关闭则告警),作为补偿性安全措施\",\n \"卫生间漏水传感器目前工作正常,建议持续观察,若短暂触发频率增加则检查管道接头\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器可能存在故障或被高温干扰失效,导致烹饪期间缺失关键的温度监控。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约 05:29 起床(卧室运动+开灯),05:45 如厕,06:08 进厨房做早餐,07:08 出门,08:21 回家,12:24 午休,13:52 起床,16:50 做晚餐,20:45 就寝。这是一个非常规律、合理的独居老人日常作息,无异常。", "推理步骤2: 入侵检测——07:08 出门时手动开锁(LockOperationType=1)、开关门、自动上锁;08:21 回家同样手动开锁进入。20:45 就寝前确认门锁状态为已锁(LockState=1)且门已关闭(StateValue=True)。全天无未授权开锁事件,无异常。", "推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:08-06:26、11:06-11:28、16:50-17:33),厨房温度传感器均在灶具开启后约 1 分钟报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None,直到下一个整点周期才恢复正常数值。这说明传感器在高温环境下反复失效。", "推理步骤4: 该故障的安全隐患——厨房温度传感器是火灾预警的重要辅助手段。对于独居老人,如果烹饪时忘记关火导致温度异常升高,温度传感器本应提供早期预警,但当前它在最需要监测的时段恰恰失效,形成监控盲区。虽然烟雾报警器仍在工作,但多层防护中缺失一层会降低整体安全性。", "推理步骤5: 漏水事件评估——17:18 卫生间漏水传感器触发(StateValue=True),当时老人在场(Occupancy=1、灯亮),2 分钟后恢复(17:20 StateValue=False)。短暂触发且有人在场,最可能是正常用水溅水所致,非持续性漏水,风险较低。", "推理步骤6: 温度趋势正常——全天各房间温度呈现合理的日间升温、夜间降温曲线(夜间约 22°C,午间峰值约 25.9°C),卧室始终略低于客厅和厨房,符合夏季室内温度变化规律,无异常热源迹象。", "推理步骤7: 综合判断——生活作息正常、门锁安全、温度趋势合理、漏水为短暂事件。唯一值得关注的是厨房温度传感器在烹饪期间反复失效,这是一个设备故障问题,会削弱独居老人的厨房安全监控能力。"], "key_evidence": ["厨房温度传感器在三次烹饪期间(06:09、06:27、11:07、11:29、16:51、17:34)均报告 MeasuredValue = None,共 6 次 null 读数,100% 与灶具使用时段重合", "灶具关闭后传感器仍报告 None(如 06:26 关火,06:27 仍为 None),直到 06:30 整点周期才恢复为 2398,说明传感器恢复存在延迟", "卫生间漏水传感器 17:18 触发、17:20 恢复,持续仅 2 分钟,且老人在场"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或加装隔热措施", "对厨房温度传感器进行硬件检测,确认是否存在元器件老化或故障,考虑更换为耐高温型号", "在传感器修复前,可设置灶具使用时长自动提醒(如超过 45 分钟未关闭则告警),作为补偿性安全措施", "卫生间漏水传感器目前工作正常,建议持续观察,若短暂触发频率增加则检查管道接头"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.963017463684082, "api_error": null} {"episode_id": "SQ3_FP_D_0585", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0585.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261214, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-04T15:21:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人回家后未及时上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。老人在19:21回到客厅调低灯光亮度,20:39关闭客厅灯后经卫生间短暂停留进入卧室,20:40关灯就寝,整体作息符合独居老人的正常晚间生活规律。\",\n \"推理步骤2: 17:09-17:25期间厨房灶具开启做晚饭,持续约16分钟后关闭,时长合理。但在灶具开启后(17:10)和关闭后(17:26),厨房温度传感器均报告 MeasuredValue = None。回溯全天日志发现,早餐(05:55-06:37)和午餐(10:55-11:25)期间也出现了同样的 None 值现象,共计6次。这不是正常的温度读数,说明传感器在灶具工作前后存在系统性故障——可能是高温导致传感器超量程、通信中断或硬件老化。\",\n \"推理步骤3: 厨房温度传感器对独居老人的安全至关重要——它是检测灶具忘关、厨房过热等火灾风险的关键设备。传感器在灶具使用期间恰好失效,意味着在最需要监测的时段反而没有有效数据,形成安全监控盲区。\",\n \"推理步骤4: 08:23老人回家时,入户门解锁(LockState=2)、门打开(StateValue=False),但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到20:40才出现门关闭和自动上锁的记录,意味着入户门可能在08:23至20:40之间长达12小时处于未关闭或未上锁状态。对独居老人而言这是安全隐患。\",\n \"推理步骤5: 15:21卫生间漏水传感器短暂触发(2分钟后恢复),当时老人在场(occupancy=1),很可能是正常用水溅水所致,不构成真正的漏水威胁。\",\n \"推理步骤6: 温度趋势方面,各房间温度从下午的25°C左右逐步降至夜间的22-23°C,属于夏季傍晚的正常降温曲线,未见异常温升或骤降。烟雾报警器全天无触发,无火灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在全天三次灶具使用期间均报告 MeasuredValue = None(05:56、06:38、10:56、11:26、17:10、17:26),共6次,呈现系统性故障模式\",\n \"08:23入户门解锁开门后,直到20:40才记录到门关闭(StateValue=True)和自动上锁(LockState=1),中间约12小时无门关闭/上锁记录\",\n \"15:21卫生间漏水传感器短暂触发2分钟后自动恢复,老人在场,属正常用水行为\"\n ],\n \"recommended_actions\": [\n \"尽快检查或更换厨房温度传感器(kitchen_temp_sensor),排查是否因灶具高温导致传感器超量程或通信模块故障,确保烹饪期间的温度监控不中断\",\n \"检查入户门锁(front_door_lock)和门磁传感器(front_door_contact)的联动逻辑,建议设置门未关闭超过一定时间(如5分钟)的提醒通知,防止老人忘记关门\",\n \"考虑为厨房增加备用温度监测手段或设置灶具超时自动关闭规则(如灶具连续开启超过45分钟自动断电),弥补传感器失效期间的安全盲区\",\n \"卫生间漏水传感器本次为短暂触发,暂无需处理,但建议持续关注是否出现频繁或长时间触发的情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人回家后未及时上锁,存在安全隐患。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。老人在19:21回到客厅调低灯光亮度,20:39关闭客厅灯后经卫生间短暂停留进入卧室,20:40关灯就寝,整体作息符合独居老人的正常晚间生活规律。", "推理步骤2: 17:09-17:25期间厨房灶具开启做晚饭,持续约16分钟后关闭,时长合理。但在灶具开启后(17:10)和关闭后(17:26),厨房温度传感器均报告 MeasuredValue = None。回溯全天日志发现,早餐(05:55-06:37)和午餐(10:55-11:25)期间也出现了同样的 None 值现象,共计6次。这不是正常的温度读数,说明传感器在灶具工作前后存在系统性故障——可能是高温导致传感器超量程、通信中断或硬件老化。", "推理步骤3: 厨房温度传感器对独居老人的安全至关重要——它是检测灶具忘关、厨房过热等火灾风险的关键设备。传感器在灶具使用期间恰好失效,意味着在最需要监测的时段反而没有有效数据,形成安全监控盲区。", "推理步骤4: 08:23老人回家时,入户门解锁(LockState=2)、门打开(StateValue=False),但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到20:40才出现门关闭和自动上锁的记录,意味着入户门可能在08:23至20:40之间长达12小时处于未关闭或未上锁状态。对独居老人而言这是安全隐患。", "推理步骤5: 15:21卫生间漏水传感器短暂触发(2分钟后恢复),当时老人在场(occupancy=1),很可能是正常用水溅水所致,不构成真正的漏水威胁。", "推理步骤6: 温度趋势方面,各房间温度从下午的25°C左右逐步降至夜间的22-23°C,属于夏季傍晚的正常降温曲线,未见异常温升或骤降。烟雾报警器全天无触发,无火灾迹象。"], "key_evidence": ["厨房温度传感器在全天三次灶具使用期间均报告 MeasuredValue = None(05:56、06:38、10:56、11:26、17:10、17:26),共6次,呈现系统性故障模式", "08:23入户门解锁开门后,直到20:40才记录到门关闭(StateValue=True)和自动上锁(LockState=1),中间约12小时无门关闭/上锁记录", "15:21卫生间漏水传感器短暂触发2分钟后自动恢复,老人在场,属正常用水行为"], "recommended_actions": ["尽快检查或更换厨房温度传感器(kitchen_temp_sensor),排查是否因灶具高温导致传感器超量程或通信模块故障,确保烹饪期间的温度监控不中断", "检查入户门锁(front_door_lock)和门磁传感器(front_door_contact)的联动逻辑,建议设置门未关闭超过一定时间(如5分钟)的提醒通知,防止老人忘记关门", "考虑为厨房增加备用温度监测手段或设置灶具超时自动关闭规则(如灶具连续开启超过45分钟自动断电),弥补传感器失效期间的安全盲区", "卫生间漏水传感器本次为短暂触发,暂无需处理,但建议持续关注是否出现频繁或长时间触发的情况"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.403669118881226, "api_error": null} {"episode_id": "SQ3_FP_D_0586", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0586.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261215, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-24T09:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天活动时间线——老人 05:31 起床,05:46 进卫生间,06:10 进厨房做早餐,07:07 出门,08:29 回家,10:53 做午餐,12:35 午休,13:59 起床,16:58 做晚餐,20:33 洗漱,20:52 就寝。这是一个非常规律、符合独居老人生活习惯的作息模式。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后均出现 MeasuredValue = None 的异常读数。具体发生在三次做饭期间:06:11(早餐)、10:54(午餐)、16:59(晚餐),且灶具关闭后短时间内也报告 None(06:28、11:39、17:33),随后在下一个整点周期恢复正常数值。这说明传感器在灶具工作时持续失效。\",\n \"推理步骤3: 卧室温度传感器在 09:31、10:01、10:31、11:01 出现了与整点周期不同步的额外读数(值约 2500),但数值本身在合理范围内,可能是空调开启后触发的温度变化上报,属于正常阈值触发机制,不构成异常。\",\n \"推理步骤4: 入侵风险排查——老人 07:07 出门时门锁手动解锁(LockOperationType=1)后自动上锁,08:29 回家时同样手动解锁后门关闭。20:52 就寝前系统确认门锁为锁定状态(LockState=1)、门为关闭状态(StateValue=True)。全天无未授权开锁事件,无异常。\",\n \"推理步骤5: 火灾/烟雾风险排查——三次做饭时长分别约 17 分钟、45 分钟、34 分钟,均在合理范围内,灶具均被正常关闭。烟雾报警器全天未触发。但由于厨房温度传感器在灶具使用期间失效,如果发生灶具忘关或厨房异常升温的情况,系统将无法通过温度数据及时发现,这对独居老人是一个安全隐患。\",\n \"推理步骤6: 漏水传感器和烟雾报警器全天无告警,卫生间使用时长正常(早晨约 24 分钟,晚间约 19 分钟),无健康异常迹象。\",\n \"推理步骤7: 综合判断——老人的生活模式完全正常,无入侵、火灾、漏水或健康方面的威胁。唯一的异常是厨房温度传感器在灶具工作期间反复失效(报告 None),这是一个设备故障问题,会削弱厨房安全监控能力。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次做饭期间均报告 MeasuredValue = None:06:11、06:28(早餐期间)、10:54、11:39(午餐期间)、16:59、17:33(晚餐期间),灶具关闭后恢复正常\",\n \"传感器失效与灶具开启存在强时间关联——每次 kitchen_cook_surface OnOff=True 后约 30 秒内传感器即报告 None\",\n \"其他两个温度传感器(客厅、卧室)全天工作正常,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程,必要时重新选址安装\",\n \"对厨房温度传感器进行硬件检测或固件更新,排查是否存在元器件老化或软件缺陷\",\n \"在传感器修复前,建议为灶具设置自动关闭超时规则(如持续开启超过 60 分钟自动断电),作为独居老人的安全兜底措施\",\n \"考虑增加独立的厨房高温报警器作为冗余保护,避免单一传感器失效导致监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 梳理全天活动时间线——老人 05:31 起床,05:46 进卫生间,06:10 进厨房做早餐,07:07 出门,08:29 回家,10:53 做午餐,12:35 午休,13:59 起床,16:58 做晚餐,20:33 洗漱,20:52 就寝。这是一个非常规律、符合独居老人生活习惯的作息模式。", "推理步骤2: 厨房温度传感器在灶具开启后均出现 MeasuredValue = None 的异常读数。具体发生在三次做饭期间:06:11(早餐)、10:54(午餐)、16:59(晚餐),且灶具关闭后短时间内也报告 None(06:28、11:39、17:33),随后在下一个整点周期恢复正常数值。这说明传感器在灶具工作时持续失效。", "推理步骤3: 卧室温度传感器在 09:31、10:01、10:31、11:01 出现了与整点周期不同步的额外读数(值约 2500),但数值本身在合理范围内,可能是空调开启后触发的温度变化上报,属于正常阈值触发机制,不构成异常。", "推理步骤4: 入侵风险排查——老人 07:07 出门时门锁手动解锁(LockOperationType=1)后自动上锁,08:29 回家时同样手动解锁后门关闭。20:52 就寝前系统确认门锁为锁定状态(LockState=1)、门为关闭状态(StateValue=True)。全天无未授权开锁事件,无异常。", "推理步骤5: 火灾/烟雾风险排查——三次做饭时长分别约 17 分钟、45 分钟、34 分钟,均在合理范围内,灶具均被正常关闭。烟雾报警器全天未触发。但由于厨房温度传感器在灶具使用期间失效,如果发生灶具忘关或厨房异常升温的情况,系统将无法通过温度数据及时发现,这对独居老人是一个安全隐患。", "推理步骤6: 漏水传感器和烟雾报警器全天无告警,卫生间使用时长正常(早晨约 24 分钟,晚间约 19 分钟),无健康异常迹象。", "推理步骤7: 综合判断——老人的生活模式完全正常,无入侵、火灾、漏水或健康方面的威胁。唯一的异常是厨房温度传感器在灶具工作期间反复失效(报告 None),这是一个设备故障问题,会削弱厨房安全监控能力。"], "key_evidence": ["厨房温度传感器在三次做饭期间均报告 MeasuredValue = None:06:11、06:28(早餐期间)、10:54、11:39(午餐期间)、16:59、17:33(晚餐期间),灶具关闭后恢复正常", "传感器失效与灶具开启存在强时间关联——每次 kitchen_cook_surface OnOff=True 后约 30 秒内传感器即报告 None", "其他两个温度传感器(客厅、卧室)全天工作正常,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程,必要时重新选址安装", "对厨房温度传感器进行硬件检测或固件更新,排查是否存在元器件老化或软件缺陷", "在传感器修复前,建议为灶具设置自动关闭超时规则(如持续开启超过 60 分钟自动断电),作为独居老人的安全兜底措施", "考虑增加独立的厨房高温报警器作为冗余保护,避免单一传感器失效导致监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.60295057296753, "api_error": null} {"episode_id": "SQ3_FP_D_0598", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0598.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20261227, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-30T08:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:23起床,05:37如厕,06:03做早餐,07:02出门,08:23回家,12:22午休,14:05起床,16:58做晚餐,20:45就寝,符合独居老人的典型日常模式。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后约30秒~1分钟内反复报告 MeasuredValue = None(06:04、06:41、11:01、11:35、16:59、17:34),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None。\",\n \"推理步骤3: 灶具每次使用时长合理(约30-37分钟),且烟雾报警器未触发,排除火灾风险;但传感器持续返回 None 说明设备在特定条件下无法正常工作。\",\n \"推理步骤4: 08:37卫生间漏水传感器短暂触发(2分钟后恢复),同时有人在卫生间活动,可能是洗漱溅水,属于正常使用后自行消除,暂不构成威胁。\",\n \"推理步骤5: 入户门在07:02出门后未上锁(08:23回来时直接手动开锁进入),但门传感器显示门已关闭且自动上锁,安全性可接受。20:45就寝前门锁确认为已锁状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None(06:04、06:41、11:01、11:35、16:59、17:34)\",\n \"灶具关闭后约1分钟传感器仍报告 None,但在下一个30分钟周期读数恢复正常数值\",\n \"卫生间漏水传感器08:37短暂触发后08:39自动恢复\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或通信中断\",\n \"考虑更换或重新校准厨房温度传感器,确保在烹饪场景下仍能正常监测温度(对独居老人的灶具安全监控至关重要)\",\n \"持续观察卫生间漏水传感器,若短暂触发频繁出现需排查水管接头或地漏密封问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:23起床,05:37如厕,06:03做早餐,07:02出门,08:23回家,12:22午休,14:05起床,16:58做晚餐,20:45就寝,符合独居老人的典型日常模式。", "推理步骤2: 厨房温度传感器在灶具开启后约30秒~1分钟内反复报告 MeasuredValue = None(06:04、06:41、11:01、11:35、16:59、17:34),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None。", "推理步骤3: 灶具每次使用时长合理(约30-37分钟),且烟雾报警器未触发,排除火灾风险;但传感器持续返回 None 说明设备在特定条件下无法正常工作。", "推理步骤4: 08:37卫生间漏水传感器短暂触发(2分钟后恢复),同时有人在卫生间活动,可能是洗漱溅水,属于正常使用后自行消除,暂不构成威胁。", "推理步骤5: 入户门在07:02出门后未上锁(08:23回来时直接手动开锁进入),但门传感器显示门已关闭且自动上锁,安全性可接受。20:45就寝前门锁确认为已锁状态。"], "key_evidence": ["厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None(06:04、06:41、11:01、11:35、16:59、17:34)", "灶具关闭后约1分钟传感器仍报告 None,但在下一个30分钟周期读数恢复正常数值", "卫生间漏水传感器08:37短暂触发后08:39自动恢复"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或通信中断", "考虑更换或重新校准厨房温度传感器,确保在烹饪场景下仍能正常监测温度(对独居老人的灶具安全监控至关重要)", "持续观察卫生间漏水传感器,若短暂触发频繁出现需排查水管接头或地漏密封问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.958426237106323, "api_error": null} {"episode_id": "SQ3_FP_D_0602", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0602.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261231, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-24T14:46:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出期间(08:38)长时间未锁,且14:46出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1 — 生活作息分析: 老人约05:28起床(卧室运动+开灯),05:38如厕,06:08进厨房做早餐,06:58出门(手动开锁、开关门、自动上锁),08:38回家(开锁进门但日志未显示重新锁门),12:35午休拉窗帘,13:50起床,17:01做晚餐,20:40洗漱后约20:44就寝。整体作息规律,符合独居老人的典型模式。\",\n \"推理步骤2 — 厨房温度传感器异常: 灶具三次使用期间(06:08-06:23、10:53-11:24、17:01-17:20),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(如06:24、11:25、17:21)。正常传感器即使在高温环境下也应报告数值而非 null。这表明传感器可能存在硬件故障、通信中断或高温保护导致的读数丢失。每次灶具关闭后下一个半小时整点读数恢复正常,说明问题与灶具使用强相关。\",\n \"推理步骤3 — 入户门安全分析: 06:58老人出门时门锁正常(手动开锁→开门→关门→自动上锁 LockState=1)。08:38老人回家时开锁(LockState=2 即解锁),但日志中未记录后续的关门和重新上锁事件。直到20:44才出现门锁关闭和上锁记录(StateValue=True + LockState=1)。这意味着入户门可能从08:38到20:44长达12小时处于未锁状态。对独居老人而言这是安全隐患。\",\n \"推理步骤4 — 14:46开锁失败事件: 14:46出现 LockOperationError(OperationError=1, OperationSource=3,即远程/Keypad来源),20秒后通过同一来源(OperationSource=3, UserIndex=1)成功开锁。单次失败可能是密码输入错误,不构成入侵威胁,但结合门长时间未锁的情况值得关注。此次开锁后门传感器显示 StateValue=False(门开),但同样未见后续关门上锁记录。\",\n \"推理步骤5 — 温度趋势正常: 全天温度从夜间约22°C逐步升至午间约25.8°C,下午回落,符合夏季自然温度变化曲线。卧室始终比客厅/厨房低约1°C,合理。无异常温升,排除火灾风险。\",\n \"推理步骤6 — 其他设备正常: 烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合,客厅窗帘未被操作。老人活动区域转移合理(卧室→卫生间→厨房→玄关→客厅→厨房→卧室→客厅→厨房→客厅→卫生间→卧室),无长时间无活动的异常间隔。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:09、06:24、10:54、11:25、17:02、17:21),灶具关闭后恢复,指向传感器故障\",\n \"08:38 入户门解锁(LockState=2)后无重新上锁记录,直到20:44才记录到门关闭上锁(StateValue=True, LockState=1),门可能长时间未锁\",\n \"14:46 出现一次远程开锁失败事件(LockOperationError),20秒后成功开锁\",\n \"19:26 客厅灯亮度被设置为极低值(CurrentLevel=13/254),可能是老人视力问题或误操作\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器: 该传感器在灶具工作时反复丢失读数,无法在关键时刻(烹饪期间)提供温度监测,削弱了厨房火灾预警能力\",\n \"配置入户门自动上锁策略: 建议设置门锁在解锁后若干分钟内未检测到关门则发出提醒,或配置自动上锁超时(如5分钟),防止老人忘记锁门\",\n \"关注14:46的开锁失败事件: 虽然单次失败不构成威胁,但建议确认是否为老人本人操作,并检查是否有陌生用户尝试访问\",\n \"检查客厅灯亮度设置: 19:26灯光亮度仅为约5%(13/254),对老人而言可能导致跌倒风险,建议设置最低亮度阈值\",\n \"考虑增加长时间无活动告警: 作为独居老人安全保障,建议配置规则——若所有运动传感器超过一定时间(如2小时)无触发,自动通知紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出期间(08:38)长时间未锁,且14:46出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1 — 生活作息分析: 老人约05:28起床(卧室运动+开灯),05:38如厕,06:08进厨房做早餐,06:58出门(手动开锁、开关门、自动上锁),08:38回家(开锁进门但日志未显示重新锁门),12:35午休拉窗帘,13:50起床,17:01做晚餐,20:40洗漱后约20:44就寝。整体作息规律,符合独居老人的典型模式。", "推理步骤2 — 厨房温度传感器异常: 灶具三次使用期间(06:08-06:23、10:53-11:24、17:01-17:20),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(如06:24、11:25、17:21)。正常传感器即使在高温环境下也应报告数值而非 null。这表明传感器可能存在硬件故障、通信中断或高温保护导致的读数丢失。每次灶具关闭后下一个半小时整点读数恢复正常,说明问题与灶具使用强相关。", "推理步骤3 — 入户门安全分析: 06:58老人出门时门锁正常(手动开锁→开门→关门→自动上锁 LockState=1)。08:38老人回家时开锁(LockState=2 即解锁),但日志中未记录后续的关门和重新上锁事件。直到20:44才出现门锁关闭和上锁记录(StateValue=True + LockState=1)。这意味着入户门可能从08:38到20:44长达12小时处于未锁状态。对独居老人而言这是安全隐患。", "推理步骤4 — 14:46开锁失败事件: 14:46出现 LockOperationError(OperationError=1, OperationSource=3,即远程/Keypad来源),20秒后通过同一来源(OperationSource=3, UserIndex=1)成功开锁。单次失败可能是密码输入错误,不构成入侵威胁,但结合门长时间未锁的情况值得关注。此次开锁后门传感器显示 StateValue=False(门开),但同样未见后续关门上锁记录。", "推理步骤5 — 温度趋势正常: 全天温度从夜间约22°C逐步升至午间约25.8°C,下午回落,符合夏季自然温度变化曲线。卧室始终比客厅/厨房低约1°C,合理。无异常温升,排除火灾风险。", "推理步骤6 — 其他设备正常: 烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合,客厅窗帘未被操作。老人活动区域转移合理(卧室→卫生间→厨房→玄关→客厅→厨房→卧室→客厅→厨房→客厅→卫生间→卧室),无长时间无活动的异常间隔。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:09、06:24、10:54、11:25、17:02、17:21),灶具关闭后恢复,指向传感器故障", "08:38 入户门解锁(LockState=2)后无重新上锁记录,直到20:44才记录到门关闭上锁(StateValue=True, LockState=1),门可能长时间未锁", "14:46 出现一次远程开锁失败事件(LockOperationError),20秒后成功开锁", "19:26 客厅灯亮度被设置为极低值(CurrentLevel=13/254),可能是老人视力问题或误操作"], "recommended_actions": ["检修或更换厨房温度传感器: 该传感器在灶具工作时反复丢失读数,无法在关键时刻(烹饪期间)提供温度监测,削弱了厨房火灾预警能力", "配置入户门自动上锁策略: 建议设置门锁在解锁后若干分钟内未检测到关门则发出提醒,或配置自动上锁超时(如5分钟),防止老人忘记锁门", "关注14:46的开锁失败事件: 虽然单次失败不构成威胁,但建议确认是否为老人本人操作,并检查是否有陌生用户尝试访问", "检查客厅灯亮度设置: 19:26灯光亮度仅为约5%(13/254),对老人而言可能导致跌倒风险,建议设置最低亮度阈值", "考虑增加长时间无活动告警: 作为独居老人安全保障,建议配置规则——若所有运动传感器超过一定时间(如2小时)无触发,自动通知紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 39.159566164016724, "api_error": null} {"episode_id": "SQ3_FP_D_0604", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0604.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261233, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "living_room", "injection_time": "2026-06-07T06:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰;同时入户门在 08:33 老人外出期间处于未锁状态长达约1小时40分钟。\",\n \"reasoning\": [\n \"推理步骤1: 梳理老人全天作息——05:21起床→05:32卫生间→05:59厨房做早餐→06:53出门(门自动上锁)→08:33回家(手动开锁,但之后日志中未见再次上锁)→11:00午餐做饭→12:32午休→13:59起床→17:04晚餐做饭→19:26客厅休息→20:33洗漱→20:41就寝。整体生活节奏规律,符合独居老人模式。\",\n \"推理步骤2: 厨房温度传感器异常——三次做饭期间(06:00、11:01、17:05),灶具开启后温度传感器均报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(如 06:23、11:30、17:27),直到下一个整点周期才恢复正常数值。正常传感器在高温环境下应报告升高的温度值而非 None。这表明传感器可能存在故障:要么高温导致传感器超量程后返回空值,要么传感器硬件存在间歇性通信问题。\",\n \"推理步骤3: 入户门锁状态分析——06:53老人出门,门锁自动上锁(LockState=1)。08:33老人回家,手动开锁(LockState=2,即Unlocked),门打开(contact=False)。但此后日志中再未出现门关闭(contact=True)或上锁事件,直到 20:41:18 才出现 contact=True 和自动上锁。这意味着从 08:33 到 20:41,入户门可能一直处于未锁定甚至未关闭状态,持续超过12小时。对独居老人而言这是安全隐患。\",\n \"推理步骤4: 客厅运动传感器在 06:43-06:49 出现短暂的反复触发(1→0→1→0),此时老人应已在厨房或即将出门,可能只是经过客厅的正常走动,不构成入侵威胁。\",\n \"推理步骤5: 温度趋势正常——全屋温度随夏季日间升温、夜间降温的自然规律变化(卧室约22°C→24.8°C→22.3°C,客厅约23°C→25.8°C→23.3°C),无异常热源或火灾迹象。烟雾报警器全天无触发。\",\n \"推理步骤6: 漏水传感器(厨房、卫生间)全天无报警,排除漏水风险。所有灯光、窗帘操作均与运动传感器和老人作息吻合。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次做饭期间(06:00、11:01、17:05)均报告 MeasuredValue = None,灶具关闭后仍持续 None,属于异常读数\",\n \"08:33 入户门手动开锁后,直到 20:41 才出现门关闭和自动上锁记录,中间超过12小时无门锁状态变化\",\n \"06:53 出门时门锁正常自动上锁(LockState=1),但 08:33 回家后未见对应的关门/上锁事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因高温超量程导致 None 值,考虑将传感器安装位置远离灶具或更换耐高温型号\",\n \"检查入户门锁的自动上锁策略,建议设置「开门超过一定时间未关闭则发送提醒」的自动化规则,保障独居老人的居家安全\",\n \"为独居老人场景增加「长时间无活动检测」规则——如卧室/客厅运动传感器超过数小时无触发则发送健康关怀提醒\",\n \"建议定期检查所有传感器的在线状态和电池电量,确保设备可靠运行\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰;同时入户门在 08:33 老人外出期间处于未锁状态长达约1小时40分钟。", "reasoning": ["推理步骤1: 梳理老人全天作息——05:21起床→05:32卫生间→05:59厨房做早餐→06:53出门(门自动上锁)→08:33回家(手动开锁,但之后日志中未见再次上锁)→11:00午餐做饭→12:32午休→13:59起床→17:04晚餐做饭→19:26客厅休息→20:33洗漱→20:41就寝。整体生活节奏规律,符合独居老人模式。", "推理步骤2: 厨房温度传感器异常——三次做饭期间(06:00、11:01、17:05),灶具开启后温度传感器均报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(如 06:23、11:30、17:27),直到下一个整点周期才恢复正常数值。正常传感器在高温环境下应报告升高的温度值而非 None。这表明传感器可能存在故障:要么高温导致传感器超量程后返回空值,要么传感器硬件存在间歇性通信问题。", "推理步骤3: 入户门锁状态分析——06:53老人出门,门锁自动上锁(LockState=1)。08:33老人回家,手动开锁(LockState=2,即Unlocked),门打开(contact=False)。但此后日志中再未出现门关闭(contact=True)或上锁事件,直到 20:41:18 才出现 contact=True 和自动上锁。这意味着从 08:33 到 20:41,入户门可能一直处于未锁定甚至未关闭状态,持续超过12小时。对独居老人而言这是安全隐患。", "推理步骤4: 客厅运动传感器在 06:43-06:49 出现短暂的反复触发(1→0→1→0),此时老人应已在厨房或即将出门,可能只是经过客厅的正常走动,不构成入侵威胁。", "推理步骤5: 温度趋势正常——全屋温度随夏季日间升温、夜间降温的自然规律变化(卧室约22°C→24.8°C→22.3°C,客厅约23°C→25.8°C→23.3°C),无异常热源或火灾迹象。烟雾报警器全天无触发。", "推理步骤6: 漏水传感器(厨房、卫生间)全天无报警,排除漏水风险。所有灯光、窗帘操作均与运动传感器和老人作息吻合。"], "key_evidence": ["厨房温度传感器在三次做饭期间(06:00、11:01、17:05)均报告 MeasuredValue = None,灶具关闭后仍持续 None,属于异常读数", "08:33 入户门手动开锁后,直到 20:41 才出现门关闭和自动上锁记录,中间超过12小时无门锁状态变化", "06:53 出门时门锁正常自动上锁(LockState=1),但 08:33 回家后未见对应的关门/上锁事件"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因高温超量程导致 None 值,考虑将传感器安装位置远离灶具或更换耐高温型号", "检查入户门锁的自动上锁策略,建议设置「开门超过一定时间未关闭则发送提醒」的自动化规则,保障独居老人的居家安全", "为独居老人场景增加「长时间无活动检测」规则——如卧室/客厅运动传感器超过数小时无触发则发送健康关怀提醒", "建议定期检查所有传感器的在线状态和电池电量,确保设备可靠运行"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.284730672836304, "api_error": null} {"episode_id": "SQ3_FP_D_0610", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0610.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261239, "scenario_id": "BA-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bedroom", "injection_time": "2026-06-03T15:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出后长时间未锁(08:20 开门后至 20:35 才上锁),存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间(06:04、06:28、11:03、11:30、16:53、17:35)反复报告 MeasuredValue = None。正常传感器在高温环境下应返回数值读数,None 表示传感器读取失败或通信中断。这在一天内发生了三次做饭周期共6次,属于反复出现的故障模式。\",\n \"推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果灶具忘关或发生火灾,温度传感器无法提供有效数据来触发预警,削弱了厨房安全监控能力。\",\n \"推理步骤3: 老人于 06:57 手动开锁出门,门自动上锁。08:20 再次手动开锁进门,门传感器显示 StateValue = False(门开),但之后没有关门和上锁记录,直到 20:35 才出现 front_door_lock LockState = 1(上锁)和 front_door_contact StateValue = True(门关)。这意味着入户门可能在 08:20 至 20:35 之间长达约12小时处于未关闭或未上锁状态。\",\n \"推理步骤4: 对于独居老人,入户门长时间未锁是入侵风险。不过老人全天在家活动(客厅、厨房、卧室均有运动检测),可能是有意敞开门通风,因此入侵威胁置信度不算最高,但仍属安全隐患。\",\n \"推理步骤5: 其余行为模式正常——05:27 起床、05:45 洗漱、06:03 做早餐、06:57 出门晨练、08:20 回家、11:02 做午饭、12:35 午休拉窗帘、13:52 起床开窗帘、16:52 做晚饭、19:35 客厅看电视(灯光调暗至 level 14)、20:27 洗漱、20:35 就寝——完全符合独居老人的日常作息规律。\",\n \"推理步骤6: 温度趋势正常,呈现夏季昼夜温差曲线(夜间约22°C,午间峰值约25.8°C),各房间温度一致,无异常热源迹象。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次做饭期间共6次报告 MeasuredValue = None(06:04、06:28、11:03、11:30、16:53、17:35),表明传感器存在间歇性故障\",\n \"入户门 08:20 开启后(front_door_contact StateValue = False),直到 20:35 才记录到关门上锁(StateValue = True, LockState = 1),中间约12小时无关门/上锁记录\",\n \"灶具每次使用后均正常关闭(06:27、11:29、17:34),做饭时长合理(约23-42分钟),排除灶具忘关风险\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器(kitchen_temp_sensor):该传感器在灶具工作时反复失效,可能是高温导致传感器超量程或硬件老化,建议尽快维修以恢复厨房安全监控能力\",\n \"设置入户门未锁超时提醒:建议配置自动化规则,当入户门未上锁超过一定时间(如30分钟)时,向老人或家属发送提醒通知\",\n \"考虑为厨房增加独立的高温报警机制:在温度传感器故障期间,烟雾报警器是唯一的厨房安全防线,建议增加冗余监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在老人外出后长时间未锁(08:20 开门后至 20:35 才上锁),存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间(06:04、06:28、11:03、11:30、16:53、17:35)反复报告 MeasuredValue = None。正常传感器在高温环境下应返回数值读数,None 表示传感器读取失败或通信中断。这在一天内发生了三次做饭周期共6次,属于反复出现的故障模式。", "推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果灶具忘关或发生火灾,温度传感器无法提供有效数据来触发预警,削弱了厨房安全监控能力。", "推理步骤3: 老人于 06:57 手动开锁出门,门自动上锁。08:20 再次手动开锁进门,门传感器显示 StateValue = False(门开),但之后没有关门和上锁记录,直到 20:35 才出现 front_door_lock LockState = 1(上锁)和 front_door_contact StateValue = True(门关)。这意味着入户门可能在 08:20 至 20:35 之间长达约12小时处于未关闭或未上锁状态。", "推理步骤4: 对于独居老人,入户门长时间未锁是入侵风险。不过老人全天在家活动(客厅、厨房、卧室均有运动检测),可能是有意敞开门通风,因此入侵威胁置信度不算最高,但仍属安全隐患。", "推理步骤5: 其余行为模式正常——05:27 起床、05:45 洗漱、06:03 做早餐、06:57 出门晨练、08:20 回家、11:02 做午饭、12:35 午休拉窗帘、13:52 起床开窗帘、16:52 做晚饭、19:35 客厅看电视(灯光调暗至 level 14)、20:27 洗漱、20:35 就寝——完全符合独居老人的日常作息规律。", "推理步骤6: 温度趋势正常,呈现夏季昼夜温差曲线(夜间约22°C,午间峰值约25.8°C),各房间温度一致,无异常热源迹象。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["厨房温度传感器在三次做饭期间共6次报告 MeasuredValue = None(06:04、06:28、11:03、11:30、16:53、17:35),表明传感器存在间歇性故障", "入户门 08:20 开启后(front_door_contact StateValue = False),直到 20:35 才记录到关门上锁(StateValue = True, LockState = 1),中间约12小时无关门/上锁记录", "灶具每次使用后均正常关闭(06:27、11:29、17:34),做饭时长合理(约23-42分钟),排除灶具忘关风险"], "recommended_actions": ["检查或更换厨房温度传感器(kitchen_temp_sensor):该传感器在灶具工作时反复失效,可能是高温导致传感器超量程或硬件老化,建议尽快维修以恢复厨房安全监控能力", "设置入户门未锁超时提醒:建议配置自动化规则,当入户门未上锁超过一定时间(如30分钟)时,向老人或家属发送提醒通知", "考虑为厨房增加独立的高温报警机制:在温度传感器故障期间,烟雾报警器是唯一的厨房安全防线,建议增加冗余监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.109036445617676, "api_error": null} {"episode_id": "SQ3_FP_D_0609", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0609.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261238, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "kitchen", "injection_time": "2026-06-03T21:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在老人外出期间(08:20)未关闭,直到晚间 20:44 才记录到关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约 05:31 起床,05:38 如厕,05:50 进厨房做早餐,07:10 出门(手动开锁、开关门、自动上锁),08:20 回家(开锁进门),12:32 午休拉窗帘,13:59 起床,17:04 做晚餐,20:22 洗漱,20:44 回卧室就寝。整体作息规律,符合独居老人的日常模式。\",\n \"推理步骤2: 厨房温度传感器异常——在灶具开启后约 30 秒至 1 分钟,kitchen_temp_sensor 连续报告 MeasuredValue = None(05:51、06:26、10:57、11:32、17:05、17:24),共出现 6 次。正常温度传感器在灶具使用时应报告升高的温度数值,而非 null。这可能是传感器在高温环境下通信中断、固件 bug 或硬件故障。虽然每次在下一个 30 分钟整点周期都恢复了正常数值,但反复出现 None 值说明问题具有可复现性。\",\n \"推理步骤3: 入户门状态异常——07:10 老人出门时,门传感器记录了完整的开门(StateValue=False)→关门(StateValue=True)→自动上锁序列。但 08:20 老人回家时,只记录了开锁(LockState=2)和开门(StateValue=False),之后没有关门记录。直到 20:44(约 12 小时后)才出现 StateValue=True 和自动上锁。这意味着入户门可能在 08:20 至 20:44 期间一直处于未关闭或未上锁状态,对独居老人来说存在安全隐患。\",\n \"推理步骤4: 积极信号——烟雾报警器全天无触发,漏水传感器无报警,所有房间温度在正常范围内波动(夜间约 22°C,午间峰值约 26°C),灶具使用时长合理(早餐约 35 分钟、午餐约 35 分钟、晚餐约 19 分钟),无火灾或漏水风险。\",\n \"推理步骤5: 21:54 出现了格式简化的日志(缺少 Cluster 前缀),可能是日志系统的小问题,不影响安全判断。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间 6 次报告 MeasuredValue = None(05:51、06:26、10:57、11:32、17:05、17:24),每次均在灶具开启或关闭后约 30 秒至 1 分钟出现\",\n \"08:20 入户门开锁开门后无关门记录(缺少 StateValue=True),直到 20:44 才记录关门上锁,中间约 12.4 小时入户门可能处于未关状态\",\n \"老人全天活动轨迹连贯,作息规律,无长时间无活动的异常间隔\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的固件版本并考虑升级,或检查其安装位置是否距灶具过近导致高温时通信异常\",\n \"检查入户门磁传感器是否安装牢固、电池电量是否充足,排查 08:20 至 20:44 期间关门事件丢失的原因(可能是传感器漏报或门确实未关)\",\n \"建议为入户门设置「长时间未关闭告警」规则,例如开门超过 5 分钟未检测到关门则推送通知给家属或护理人员\",\n \"建议为厨房温度传感器设置「数据缺失告警」,在灶具使用期间传感器离线时及时提醒,避免火灾风险监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在老人外出期间(08:20)未关闭,直到晚间 20:44 才记录到关门上锁。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约 05:31 起床,05:38 如厕,05:50 进厨房做早餐,07:10 出门(手动开锁、开关门、自动上锁),08:20 回家(开锁进门),12:32 午休拉窗帘,13:59 起床,17:04 做晚餐,20:22 洗漱,20:44 回卧室就寝。整体作息规律,符合独居老人的日常模式。", "推理步骤2: 厨房温度传感器异常——在灶具开启后约 30 秒至 1 分钟,kitchen_temp_sensor 连续报告 MeasuredValue = None(05:51、06:26、10:57、11:32、17:05、17:24),共出现 6 次。正常温度传感器在灶具使用时应报告升高的温度数值,而非 null。这可能是传感器在高温环境下通信中断、固件 bug 或硬件故障。虽然每次在下一个 30 分钟整点周期都恢复了正常数值,但反复出现 None 值说明问题具有可复现性。", "推理步骤3: 入户门状态异常——07:10 老人出门时,门传感器记录了完整的开门(StateValue=False)→关门(StateValue=True)→自动上锁序列。但 08:20 老人回家时,只记录了开锁(LockState=2)和开门(StateValue=False),之后没有关门记录。直到 20:44(约 12 小时后)才出现 StateValue=True 和自动上锁。这意味着入户门可能在 08:20 至 20:44 期间一直处于未关闭或未上锁状态,对独居老人来说存在安全隐患。", "推理步骤4: 积极信号——烟雾报警器全天无触发,漏水传感器无报警,所有房间温度在正常范围内波动(夜间约 22°C,午间峰值约 26°C),灶具使用时长合理(早餐约 35 分钟、午餐约 35 分钟、晚餐约 19 分钟),无火灾或漏水风险。", "推理步骤5: 21:54 出现了格式简化的日志(缺少 Cluster 前缀),可能是日志系统的小问题,不影响安全判断。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间 6 次报告 MeasuredValue = None(05:51、06:26、10:57、11:32、17:05、17:24),每次均在灶具开启或关闭后约 30 秒至 1 分钟出现", "08:20 入户门开锁开门后无关门记录(缺少 StateValue=True),直到 20:44 才记录关门上锁,中间约 12.4 小时入户门可能处于未关状态", "老人全天活动轨迹连贯,作息规律,无长时间无活动的异常间隔"], "recommended_actions": ["检查厨房温度传感器的固件版本并考虑升级,或检查其安装位置是否距灶具过近导致高温时通信异常", "检查入户门磁传感器是否安装牢固、电池电量是否充足,排查 08:20 至 20:44 期间关门事件丢失的原因(可能是传感器漏报或门确实未关)", "建议为入户门设置「长时间未关闭告警」规则,例如开门超过 5 分钟未检测到关门则推送通知给家属或护理人员", "建议为厨房温度传感器设置「数据缺失告警」,在灶具使用期间传感器离线时及时提醒,避免火灾风险监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.512994050979614, "api_error": null} {"episode_id": "SQ3_FP_D_0615", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0615.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261244, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-10T11:21:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受热干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:07、10:59、17:09),且在灶具关闭后仍持续报告 None(06:25、11:37、17:34),说明传感器在需要监测温度的关键时段失效。\",\n \"推理步骤2: 对于独居老人家庭,厨房温度传感器是防止火灾的重要安全设备。如果传感器在烹饪期间无法提供有效读数,一旦发生灶具忘关或油温过高等情况,系统将无法及时发出高温预警。\",\n \"推理步骤3: 其余行为模式基本正常——老人05:31起床、06:06做早餐、07:08出门、08:39回家、12:31午休、14:10起床、17:08做晚餐、20:38就寝,符合独居老人的日常作息规律。\",\n \"推理步骤4: 11:21出现一次门锁操作错误(LockOperationError),但20秒后通过UserIndex=1(已注册用户)成功开锁,可能是老人输错密码或指纹识别失败一次,属于偶发正常情况。\",\n \"推理步骤5: 入户门在08:39开锁进入后,直到20:38才再次出现门锁上锁记录,期间门锁状态为未锁(LockState=2),持续约12小时。虽然老人在家中,但长时间未锁门对独居老人存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间均报告 None 值(06:07、06:25、10:59、11:37、17:09、17:34),共6次异常读数\",\n \"灶具每次使用时长分别为约17分钟、38分钟、25分钟,期间温度监测完全缺失\",\n \"08:39开锁后至20:38期间门锁未上锁,持续约12小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否因距离灶具过近导致高温时传感器保护性断连或损坏\",\n \"考虑更换或重新校准厨房温度传感器,确保烹饪期间能正常监测温度\",\n \"设置灶具使用超时自动提醒(如超过30分钟未关闭),作为温度传感器失效时的备用安全机制\",\n \"建议配置入户门长时间未锁提醒,提升独居老人的居家安全性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受热干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:07、10:59、17:09),且在灶具关闭后仍持续报告 None(06:25、11:37、17:34),说明传感器在需要监测温度的关键时段失效。", "推理步骤2: 对于独居老人家庭,厨房温度传感器是防止火灾的重要安全设备。如果传感器在烹饪期间无法提供有效读数,一旦发生灶具忘关或油温过高等情况,系统将无法及时发出高温预警。", "推理步骤3: 其余行为模式基本正常——老人05:31起床、06:06做早餐、07:08出门、08:39回家、12:31午休、14:10起床、17:08做晚餐、20:38就寝,符合独居老人的日常作息规律。", "推理步骤4: 11:21出现一次门锁操作错误(LockOperationError),但20秒后通过UserIndex=1(已注册用户)成功开锁,可能是老人输错密码或指纹识别失败一次,属于偶发正常情况。", "推理步骤5: 入户门在08:39开锁进入后,直到20:38才再次出现门锁上锁记录,期间门锁状态为未锁(LockState=2),持续约12小时。虽然老人在家中,但长时间未锁门对独居老人存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在三次烹饪期间均报告 None 值(06:07、06:25、10:59、11:37、17:09、17:34),共6次异常读数", "灶具每次使用时长分别为约17分钟、38分钟、25分钟,期间温度监测完全缺失", "08:39开锁后至20:38期间门锁未上锁,持续约12小时"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否因距离灶具过近导致高温时传感器保护性断连或损坏", "考虑更换或重新校准厨房温度传感器,确保烹饪期间能正常监测温度", "设置灶具使用超时自动提醒(如超过30分钟未关闭),作为温度传感器失效时的备用安全机制", "建议配置入户门长时间未锁提醒,提升独居老人的居家安全性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.48192596435547, "api_error": null} {"episode_id": "SQ3_FP_D_0619", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0619.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261248, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kitchen", "injection_time": "2026-06-05T07:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了 4 次 MeasuredValue = None 的情况(05:54、06:35、11:11/11:23、16:57/17:40),每次都恰好发生在灶具开启或关闭前后。正常传感器不应在需要监测的关键时刻丢失数据。\",\n \"推理步骤2: 对比客厅和卧室温度传感器,它们全天每 30 分钟稳定上报数值,从未出现 None 值。这排除了系统级通信故障,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房温度传感器的 None 值与灶具使用高度相关——灶具开启后约 30 秒到 1 分钟传感器就丢失读数,灶具关闭后约 1 分钟再次报告 None,直到下一个 30 分钟整点才恢复正常数值。这可能是灶具产生的热量或电磁干扰导致传感器暂时失效。\",\n \"推理步骤4: 对于独居老人家庭,厨房温度监控是防范火灾的关键环节。如果灶具使用期间传感器恰好失效,一旦发生干烧或过热,系统将无法及时检测到异常温度升高并发出预警。\",\n \"推理步骤5: 其余行为模式均属正常——老人 05:31 起床、洗漱、做早餐、06:58 出门(门锁自动上锁)、08:24 回家(入户门未锁说明有人进入,随后客厅有活动)、中午午休(12:40 关窗帘)、13:50 起床、三餐规律做饭、20:38 就寝准备。入户门在老人外出和就寝时均处于上锁状态,无入侵迹象。\",\n \"推理步骤6: 08:24 老人回家时入户门先解锁再开门,但日志中未显示门锁在 06:58~08:24 期间被解锁的异常事件,且随后活动轨迹连贯(玄关→客厅),判断为老人本人回家,非入侵。07:41 和 07:46 厨房短暂的运动检测可能是宠物或传感器灵敏度问题,但老人当时不在家,值得留意但不构成高风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:54、06:35、11:11、11:23、16:57、17:40 共 6 次报告 MeasuredValue = None,且全部与灶具开关操作时间高度吻合\",\n \"客厅和卧室温度传感器全天 48 次上报均正常,排除系统性通信故障\",\n \"老人外出期间(约 07:41 和 07:46)厨房出现两次短暂运动检测(各持续不到 1 分钟),来源不明\"\n ],\n \"recommended_actions\": [\n \"尽快检查或更换厨房温度传感器,确认是否因灶具热量/电磁干扰导致间歇性失效,必要时将传感器安装位置远离灶具\",\n \"在传感器修复前,为厨房灶具设置自动关闭规则(如开启超过 45 分钟未手动操作则自动断电),作为临时安全兜底\",\n \"排查老人外出期间厨房短暂运动检测的来源(是否有宠物、传感器误触发、或窗户未关导致外部因素),确认无安全隐患\",\n \"建议为厨房温度传感器配置离线/异常告警,当传感器连续报告 None 时立即通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了 4 次 MeasuredValue = None 的情况(05:54、06:35、11:11/11:23、16:57/17:40),每次都恰好发生在灶具开启或关闭前后。正常传感器不应在需要监测的关键时刻丢失数据。", "推理步骤2: 对比客厅和卧室温度传感器,它们全天每 30 分钟稳定上报数值,从未出现 None 值。这排除了系统级通信故障,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房温度传感器的 None 值与灶具使用高度相关——灶具开启后约 30 秒到 1 分钟传感器就丢失读数,灶具关闭后约 1 分钟再次报告 None,直到下一个 30 分钟整点才恢复正常数值。这可能是灶具产生的热量或电磁干扰导致传感器暂时失效。", "推理步骤4: 对于独居老人家庭,厨房温度监控是防范火灾的关键环节。如果灶具使用期间传感器恰好失效,一旦发生干烧或过热,系统将无法及时检测到异常温度升高并发出预警。", "推理步骤5: 其余行为模式均属正常——老人 05:31 起床、洗漱、做早餐、06:58 出门(门锁自动上锁)、08:24 回家(入户门未锁说明有人进入,随后客厅有活动)、中午午休(12:40 关窗帘)、13:50 起床、三餐规律做饭、20:38 就寝准备。入户门在老人外出和就寝时均处于上锁状态,无入侵迹象。", "推理步骤6: 08:24 老人回家时入户门先解锁再开门,但日志中未显示门锁在 06:58~08:24 期间被解锁的异常事件,且随后活动轨迹连贯(玄关→客厅),判断为老人本人回家,非入侵。07:41 和 07:46 厨房短暂的运动检测可能是宠物或传感器灵敏度问题,但老人当时不在家,值得留意但不构成高风险。"], "key_evidence": ["厨房温度传感器在 05:54、06:35、11:11、11:23、16:57、17:40 共 6 次报告 MeasuredValue = None,且全部与灶具开关操作时间高度吻合", "客厅和卧室温度传感器全天 48 次上报均正常,排除系统性通信故障", "老人外出期间(约 07:41 和 07:46)厨房出现两次短暂运动检测(各持续不到 1 分钟),来源不明"], "recommended_actions": ["尽快检查或更换厨房温度传感器,确认是否因灶具热量/电磁干扰导致间歇性失效,必要时将传感器安装位置远离灶具", "在传感器修复前,为厨房灶具设置自动关闭规则(如开启超过 45 分钟未手动操作则自动断电),作为临时安全兜底", "排查老人外出期间厨房短暂运动检测的来源(是否有宠物、传感器误触发、或窗户未关导致外部因素),确认无安全隐患", "建议为厨房温度传感器配置离线/异常告警,当传感器连续报告 None 时立即通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.343583822250366, "api_error": null} {"episode_id": "SQ3_FP_D_0620", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0620.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261249, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-05T14:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下持续运行约20分钟,且厨房温度异常飙升至27.5°C,存在明显的火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 14:33 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy=0),这意味着灶具是在厨房无人的情况下被开启或人已离开厨房但灶具仍在运行。\",\n \"推理步骤2: 14:38 厨房温度传感器报告 MeasuredValue=2700(即27.0°C),15:03 进一步升至2750(即27.5°C),相比同时段客厅温度(约25.1°C)高出约2.4°C,且相比14:30的正常厨房温度2530(25.3°C)在短短5分钟内骤升2.2°C,这是不正常的急剧升温。\",\n \"推理步骤3: 直到14:53(灶具开启后约20分钟)厨房运动传感器才重新检测到有人(Occupancy=1),意味着灶具在无人看管的状态下运行了至少20分钟。对于独居老人家庭,这是严重的火灾风险。\",\n \"推理步骤4: 对比当天其他三次正常烹饪(06:01-06:32、10:52-11:39、16:58-17:39),灶具开启时厨房运动传感器均显示有人在场(Occupancy=1),唯独14:33这次是无人状态,属于明显异常。\",\n \"推理步骤5: 另外注意到厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:02、06:33、10:53、11:40、16:59、17:40),这可能是传感器在高温环境下的已知行为或量程问题,但14:33这次灶具运行期间传感器却报告了具体的异常高温值(2700、2750),说明这次的温度状况可能与其他几次不同,温升更为剧烈或持续。\",\n \"推理步骤6: 其余行为模式均属正常——老人05:37起床、07:00出门、08:31回家、12:28午休、14:01起床、20:36就寝,作息规律;入户门锁开关正常;08:31回家时门未重新上锁但门传感器后续显示关闭状态,20:36就寝前门已自动上锁,整体安防状态可接受。\"\n ],\n \"key_evidence\": [\n \"14:33 灶具开启时 kitchen_occupancy Occupancy=0(厨房无人)\",\n \"14:38 厨房温度骤升至2700(27.0°C),14:30时仅为2530(25.3°C),5分钟内升高1.7°C\",\n \"15:03 厨房温度进一步升至2750(27.5°C),远超同时段其他房间温度\",\n \"14:53 厨房才重新检测到有人,灶具无人看管长达约20分钟\",\n \"当天其他三次烹饪(06:01、10:52、16:58)灶具开启时厨房均有人在场,唯独此次例外\"\n ],\n \"recommended_actions\": [\n \"立即设置自动化规则:当灶具开启且厨房运动传感器超过5分钟未检测到人时,自动关闭灶具并发送告警通知给紧急联系人\",\n \"为厨房灶具设置最长无人运行时间限制(建议不超过10分钟),超时自动断电\",\n \"建议在厨房增设燃气泄漏传感器,与烟雾报警器联动,提升火灾预警能力\",\n \"通知老人的家属或护理人员关注此次事件,确认老人是否存在记忆力下降等健康问题(忘记关灶具或无意中开启灶具后离开厨房)\",\n \"检查厨房温度传感器多次报告None值的问题,确认传感器工作是否正常,必要时更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下持续运行约20分钟,且厨房温度异常飙升至27.5°C,存在明显的火灾隐患。", "reasoning": ["推理步骤1: 14:33 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(kitchen_occupancy Occupancy=0),这意味着灶具是在厨房无人的情况下被开启或人已离开厨房但灶具仍在运行。", "推理步骤2: 14:38 厨房温度传感器报告 MeasuredValue=2700(即27.0°C),15:03 进一步升至2750(即27.5°C),相比同时段客厅温度(约25.1°C)高出约2.4°C,且相比14:30的正常厨房温度2530(25.3°C)在短短5分钟内骤升2.2°C,这是不正常的急剧升温。", "推理步骤3: 直到14:53(灶具开启后约20分钟)厨房运动传感器才重新检测到有人(Occupancy=1),意味着灶具在无人看管的状态下运行了至少20分钟。对于独居老人家庭,这是严重的火灾风险。", "推理步骤4: 对比当天其他三次正常烹饪(06:01-06:32、10:52-11:39、16:58-17:39),灶具开启时厨房运动传感器均显示有人在场(Occupancy=1),唯独14:33这次是无人状态,属于明显异常。", "推理步骤5: 另外注意到厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:02、06:33、10:53、11:40、16:59、17:40),这可能是传感器在高温环境下的已知行为或量程问题,但14:33这次灶具运行期间传感器却报告了具体的异常高温值(2700、2750),说明这次的温度状况可能与其他几次不同,温升更为剧烈或持续。", "推理步骤6: 其余行为模式均属正常——老人05:37起床、07:00出门、08:31回家、12:28午休、14:01起床、20:36就寝,作息规律;入户门锁开关正常;08:31回家时门未重新上锁但门传感器后续显示关闭状态,20:36就寝前门已自动上锁,整体安防状态可接受。"], "key_evidence": ["14:33 灶具开启时 kitchen_occupancy Occupancy=0(厨房无人)", "14:38 厨房温度骤升至2700(27.0°C),14:30时仅为2530(25.3°C),5分钟内升高1.7°C", "15:03 厨房温度进一步升至2750(27.5°C),远超同时段其他房间温度", "14:53 厨房才重新检测到有人,灶具无人看管长达约20分钟", "当天其他三次烹饪(06:01、10:52、16:58)灶具开启时厨房均有人在场,唯独此次例外"], "recommended_actions": ["立即设置自动化规则:当灶具开启且厨房运动传感器超过5分钟未检测到人时,自动关闭灶具并发送告警通知给紧急联系人", "为厨房灶具设置最长无人运行时间限制(建议不超过10分钟),超时自动断电", "建议在厨房增设燃气泄漏传感器,与烟雾报警器联动,提升火灾预警能力", "通知老人的家属或护理人员关注此次事件,确认老人是否存在记忆力下降等健康问题(忘记关灶具或无意中开启灶具后离开厨房)", "检查厨房温度传感器多次报告None值的问题,确认传感器工作是否正常,必要时更换"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.73174476623535, "api_error": null} {"episode_id": "SQ3_FP_D_0621", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0621.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261250, "scenario_id": "EL-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-05-FP", "scenario_name": "EL-05-FP: 偶尔一次起夜", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "一晚只有1次卧室→卫生间,属于正常范围", "target_room": "kitchen", "injection_time": "2026-06-24T08:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰导致读数异常。\",\n \"reasoning\": [\n \"推理步骤1: 梳理老人全天活动轨迹——05:28 起床→卫生间→06:05 厨房做早餐→07:03 出门(门锁手动开锁、自动回锁)→08:21 回家(有人开门进入客厅,但门未回锁)→12:29 午休→14:01 起床→17:09 做晚餐→19:28 客厅看电视(调暗灯光)→20:36 洗漱→20:52 回卧室就寝。整体生活节奏规律,符合独居老人的典型作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后约30秒至1分钟内连续报告 MeasuredValue = None(06:06、06:33、10:52、11:34、17:10、17:32),共出现6次。每次都精确对应灶具开启或关闭后的时间窗口。正常传感器即使受热也应报告一个数值而非 None,这表明传感器可能在高温环境下出现读数溢出或通信故障。\",\n \"推理步骤3: 检查安全类传感器——烟雾报警器全天无触发、漏水传感器无触发、所有门窗传感器状态正常。排除火灾、漏水和入侵威胁。\",\n \"推理步骤4: 08:21 老人回家时,入户门开锁(LockOperationType=1, Manual)并进入,但日志中未见门关闭后的自动上锁事件(对比 07:03 出门时门在6秒内自动上锁)。直到 20:52 才出现门锁上锁记录。这意味着入户门可能在 08:21 至 20:52 期间处于未锁状态长达约12.5小时,对独居老人存在一定安全隐患,但不构成即时威胁。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(夜间约22°C,午间峰值约25.8°C),各房间温差合理,无异常高温或骤变,排除火灾或暖通设备故障。\",\n \"推理步骤6: 综合判断——最主要的异常是厨房温度传感器反复报告 None 值,属于设备故障类问题。该传感器是厨房安全监测的重要一环,如果持续失效,可能导致厨房过热或火灾风险无法被及时发现。入户门长时间未锁是次要关注点。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:33、10:52、11:34、17:10、17:32),每次均与灶具开关操作高度关联\",\n \"08:21 入户门手动开锁后,日志中未记录自动上锁事件,直到 20:52 才出现上锁记录(LockState=1),门可能长时间处于未锁定状态\",\n \"烟雾报警器、漏水传感器全天无告警,排除火灾和漏水风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置\",\n \"检查入户门锁的自动上锁功能是否正常工作,确认 08:21 回家后门锁是否确实未上锁,考虑启用门锁未锁定超时提醒\",\n \"鉴于独居老人场景,建议为厨房温度传感器故障设置即时告警,避免灶具使用期间失去温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰导致读数异常。", "reasoning": ["推理步骤1: 梳理老人全天活动轨迹——05:28 起床→卫生间→06:05 厨房做早餐→07:03 出门(门锁手动开锁、自动回锁)→08:21 回家(有人开门进入客厅,但门未回锁)→12:29 午休→14:01 起床→17:09 做晚餐→19:28 客厅看电视(调暗灯光)→20:36 洗漱→20:52 回卧室就寝。整体生活节奏规律,符合独居老人的典型作息。", "推理步骤2: 厨房温度传感器在灶具开启后约30秒至1分钟内连续报告 MeasuredValue = None(06:06、06:33、10:52、11:34、17:10、17:32),共出现6次。每次都精确对应灶具开启或关闭后的时间窗口。正常传感器即使受热也应报告一个数值而非 None,这表明传感器可能在高温环境下出现读数溢出或通信故障。", "推理步骤3: 检查安全类传感器——烟雾报警器全天无触发、漏水传感器无触发、所有门窗传感器状态正常。排除火灾、漏水和入侵威胁。", "推理步骤4: 08:21 老人回家时,入户门开锁(LockOperationType=1, Manual)并进入,但日志中未见门关闭后的自动上锁事件(对比 07:03 出门时门在6秒内自动上锁)。直到 20:52 才出现门锁上锁记录。这意味着入户门可能在 08:21 至 20:52 期间处于未锁状态长达约12.5小时,对独居老人存在一定安全隐患,但不构成即时威胁。", "推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(夜间约22°C,午间峰值约25.8°C),各房间温差合理,无异常高温或骤变,排除火灾或暖通设备故障。", "推理步骤6: 综合判断——最主要的异常是厨房温度传感器反复报告 None 值,属于设备故障类问题。该传感器是厨房安全监测的重要一环,如果持续失效,可能导致厨房过热或火灾风险无法被及时发现。入户门长时间未锁是次要关注点。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:06、06:33、10:52、11:34、17:10、17:32),每次均与灶具开关操作高度关联", "08:21 入户门手动开锁后,日志中未记录自动上锁事件,直到 20:52 才出现上锁记录(LockState=1),门可能长时间处于未锁定状态", "烟雾报警器、漏水传感器全天无告警,排除火灾和漏水风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置", "检查入户门锁的自动上锁功能是否正常工作,确认 08:21 回家后门锁是否确实未上锁,考虑启用门锁未锁定超时提醒", "鉴于独居老人场景,建议为厨房温度传感器故障设置即时告警,避免灶具使用期间失去温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.078766345977783, "api_error": null} {"episode_id": "SQ3_FP_D_0623", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0623.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261252, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-22T14:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时入户门在老人外出期间(08:22)未关闭/未上锁,直到晚间 20:40 才自动上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:56、06:35、11:02、11:22、17:04、17:21),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能存在故障、超量程或通信中断。\",\n \"推理步骤2: 老人于 07:03 手动开锁出门,门在 07:03:15 关闭并自动上锁,这是正常的。但 08:22 门锁再次被手动解锁、门被打开(StateValue=False),之后日志中没有门关闭和上锁的记录,直到 20:40:10 门才关闭(StateValue=True)并自动上锁。这意味着入户门可能处于未关闭状态长达约12小时。考虑到这是独居老人家庭,长时间门户大开存在入侵风险。\",\n \"推理步骤3: 14:18 出现一次门锁操作错误事件 LockOperationError(OperationError=1, OperationSource=3),随后20秒内通过 UserIndex=1 成功解锁。OperationSource=3 通常表示远程/密码操作。单次失败后成功可能是输入错误,但结合门长时间未关的情况,需要关注是否有非授权人员尝试进入。\",\n \"推理步骤4: 老人的日常作息模式基本正常——05:26起床、05:30如厕、05:55做早餐、11:01做午餐、12:32午休、17:03做晚餐、20:29洗漱、20:40就寝。活动节奏合理,各房间运动传感器触发与灯光操作时序吻合,未发现健康异常迹象。\",\n \"推理步骤5: 温度趋势整体正常,呈现夏季白天升温、夜间降温的自然规律(卧室 21.9°C~24.9°C,客厅 22.9°C~25.9°C,厨房 22.9°C~25.8°C)。未发现异常高温或火灾风险信号,烟雾报警器全天无触发。\",\n \"推理步骤6: 漏水传感器全天无报告,窗户传感器无异常开合,窗帘操作与起床/午休/就寝时间吻合,均属正常行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:56、06:35、11:02、11:22、17:04、17:21 共6次报告 MeasuredValue = None,每次均发生在灶具开关前后,传感器可能因高温或故障无法正常读数\",\n \"08:22 入户门被解锁并打开(StateValue=False),之后无门关闭记录,直到 20:40:10 才记录到门关闭(StateValue=True)并自动上锁,门户可能敞开约12小时\",\n \"14:18 出现一次门锁操作错误(LockOperationError, OperationSource=3),20秒后通过 UserIndex=1 成功解锁,需确认是否为授权操作\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器超量程或通信模块故障,必要时更换或重新定位传感器远离热源\",\n \"核实 08:22 至 20:40 期间入户门的实际状态,确认门是否确实长时间未关闭;如属实,建议设置门户长时间未关闭的自动告警(如超过10分钟未关门则推送通知)\",\n \"审查 14:18 门锁操作错误的来源,确认 OperationSource=3(远程操作)是否为老人本人或授权家属操作,排除非授权访问的可能\",\n \"为独居老人安全考虑,建议启用入户门自动上锁策略(如门关闭后自动上锁),并在门未关闭超时后向紧急联系人发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在故障或通信异常;同时入户门在老人外出期间(08:22)未关闭/未上锁,直到晚间 20:40 才自动上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:56、06:35、11:02、11:22、17:04、17:21),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能存在故障、超量程或通信中断。", "推理步骤2: 老人于 07:03 手动开锁出门,门在 07:03:15 关闭并自动上锁,这是正常的。但 08:22 门锁再次被手动解锁、门被打开(StateValue=False),之后日志中没有门关闭和上锁的记录,直到 20:40:10 门才关闭(StateValue=True)并自动上锁。这意味着入户门可能处于未关闭状态长达约12小时。考虑到这是独居老人家庭,长时间门户大开存在入侵风险。", "推理步骤3: 14:18 出现一次门锁操作错误事件 LockOperationError(OperationError=1, OperationSource=3),随后20秒内通过 UserIndex=1 成功解锁。OperationSource=3 通常表示远程/密码操作。单次失败后成功可能是输入错误,但结合门长时间未关的情况,需要关注是否有非授权人员尝试进入。", "推理步骤4: 老人的日常作息模式基本正常——05:26起床、05:30如厕、05:55做早餐、11:01做午餐、12:32午休、17:03做晚餐、20:29洗漱、20:40就寝。活动节奏合理,各房间运动传感器触发与灯光操作时序吻合,未发现健康异常迹象。", "推理步骤5: 温度趋势整体正常,呈现夏季白天升温、夜间降温的自然规律(卧室 21.9°C~24.9°C,客厅 22.9°C~25.9°C,厨房 22.9°C~25.8°C)。未发现异常高温或火灾风险信号,烟雾报警器全天无触发。", "推理步骤6: 漏水传感器全天无报告,窗户传感器无异常开合,窗帘操作与起床/午休/就寝时间吻合,均属正常行为。"], "key_evidence": ["厨房温度传感器在 05:56、06:35、11:02、11:22、17:04、17:21 共6次报告 MeasuredValue = None,每次均发生在灶具开关前后,传感器可能因高温或故障无法正常读数", "08:22 入户门被解锁并打开(StateValue=False),之后无门关闭记录,直到 20:40:10 才记录到门关闭(StateValue=True)并自动上锁,门户可能敞开约12小时", "14:18 出现一次门锁操作错误(LockOperationError, OperationSource=3),20秒后通过 UserIndex=1 成功解锁,需确认是否为授权操作"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器超量程或通信模块故障,必要时更换或重新定位传感器远离热源", "核实 08:22 至 20:40 期间入户门的实际状态,确认门是否确实长时间未关闭;如属实,建议设置门户长时间未关闭的自动告警(如超过10分钟未关门则推送通知)", "审查 14:18 门锁操作错误的来源,确认 OperationSource=3(远程操作)是否为老人本人或授权家属操作,排除非授权访问的可能", "为独居老人安全考虑,建议启用入户门自动上锁策略(如门关闭后自动上锁),并在门未关闭超时后向紧急联系人发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.927098989486694, "api_error": null} {"episode_id": "SQ3_FP_D_0625", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0625.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261254, "scenario_id": "BA-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "kitchen", "injection_time": "2026-06-06T20:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在老人外出期间(08:36)未关闭/上锁状态需关注。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)的活动——该时段内老人的行为轨迹为:晚餐后在客厅活动(19:22 客厅有人、调暗灯光至level=18),20:36左右回卧室准备就寝(卧室有人、开灯、关窗帘、关灯),20:38去卫生间,之后无更多活动事件,符合独居老人的晚间作息规律。\",\n \"推理步骤2: 温度趋势方面,三个房间温度从17:30起持续缓慢下降(客厅从24.74°C降至23.33°C,卧室从23.78°C降至22.31°C,厨房从24.86°C降至23.38°C),这与夏季夜间自然降温一致,无异常温升,排除火灾风险。\",\n \"推理步骤3: 厨房温度传感器在全天中多次报告 MeasuredValue = None(06:03、06:23、11:00、11:40、16:57、17:39),每次都发生在灶具开启或关闭前后。虽然可能是灶具使用时高温导致传感器暂时超量程,但传感器应报告极值而非 None。反复出现 None 值提示传感器可能存在固件缺陷或通信不稳定。\",\n \"推理步骤4: 入户门在08:36被手动开锁、门被打开,但日志中没有记录门关闭(BooleanState.StateValue = True)和重新上锁的事件,直到20:36才出现门关闭和自动上锁记录。这意味着入户门可能在老人外出约12小时期间处于未锁状态(08:36–20:36),对独居老人而言存在安全隐患。\",\n \"推理步骤5: 20:36的事件序列中,卫生间灯先关闭、卧室检测到有人、然后入户门关闭上锁——推测老人此时回家或有人进入后锁门。但08:36开门后长时间未锁门这一点值得关注。\",\n \"推理步骤6: 其余设备行为均正常——烟雾报警器无触发、漏水传感器无报警、门锁操作来源为 Manual/Auto(无异常远程操作)、灶具使用时长合理(约20–40分钟/次)。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用前后多次报告 MeasuredValue = None(06:03、06:23、11:00、11:40、16:57、17:39),正常传感器不应返回空值\",\n \"入户门08:36手动开锁并打开后,直到20:36才记录到关闭和上锁事件,中间约12小时门可能处于未锁定状态\",\n \"20:36门锁事件显示 BooleanState.StateValue = True(门关闭)+ 自动上锁,但此前无对应的关门记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的固件版本并考虑更新或更换,确认其在高温环境下的工作范围是否达标\",\n \"为入户门锁配置「长时间未锁定提醒」规则,例如门开启超过5分钟未关闭时向紧急联系人发送通知\",\n \"考虑为独居老人启用「离家自动安防模式」,在所有房间无人且门锁开启时自动发出警报\",\n \"定期检查所有传感器的在线状态和电池电量,防止关键传感器静默离线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在老人外出期间(08:36)未关闭/上锁状态需关注。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30–23:30)的活动——该时段内老人的行为轨迹为:晚餐后在客厅活动(19:22 客厅有人、调暗灯光至level=18),20:36左右回卧室准备就寝(卧室有人、开灯、关窗帘、关灯),20:38去卫生间,之后无更多活动事件,符合独居老人的晚间作息规律。", "推理步骤2: 温度趋势方面,三个房间温度从17:30起持续缓慢下降(客厅从24.74°C降至23.33°C,卧室从23.78°C降至22.31°C,厨房从24.86°C降至23.38°C),这与夏季夜间自然降温一致,无异常温升,排除火灾风险。", "推理步骤3: 厨房温度传感器在全天中多次报告 MeasuredValue = None(06:03、06:23、11:00、11:40、16:57、17:39),每次都发生在灶具开启或关闭前后。虽然可能是灶具使用时高温导致传感器暂时超量程,但传感器应报告极值而非 None。反复出现 None 值提示传感器可能存在固件缺陷或通信不稳定。", "推理步骤4: 入户门在08:36被手动开锁、门被打开,但日志中没有记录门关闭(BooleanState.StateValue = True)和重新上锁的事件,直到20:36才出现门关闭和自动上锁记录。这意味着入户门可能在老人外出约12小时期间处于未锁状态(08:36–20:36),对独居老人而言存在安全隐患。", "推理步骤5: 20:36的事件序列中,卫生间灯先关闭、卧室检测到有人、然后入户门关闭上锁——推测老人此时回家或有人进入后锁门。但08:36开门后长时间未锁门这一点值得关注。", "推理步骤6: 其余设备行为均正常——烟雾报警器无触发、漏水传感器无报警、门锁操作来源为 Manual/Auto(无异常远程操作)、灶具使用时长合理(约20–40分钟/次)。"], "key_evidence": ["厨房温度传感器在灶具使用前后多次报告 MeasuredValue = None(06:03、06:23、11:00、11:40、16:57、17:39),正常传感器不应返回空值", "入户门08:36手动开锁并打开后,直到20:36才记录到关闭和上锁事件,中间约12小时门可能处于未锁定状态", "20:36门锁事件显示 BooleanState.StateValue = True(门关闭)+ 自动上锁,但此前无对应的关门记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的固件版本并考虑更新或更换,确认其在高温环境下的工作范围是否达标", "为入户门锁配置「长时间未锁定提醒」规则,例如门开启超过5分钟未关闭时向紧急联系人发送通知", "考虑为独居老人启用「离家自动安防模式」,在所有房间无人且门锁开启时自动发出警报", "定期检查所有传感器的在线状态和电池电量,防止关键传感器静默离线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.511513710021973, "api_error": null} {"episode_id": "SQ3_FP_D_0629", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0629.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261258, "scenario_id": "BA-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "bathroom", "injection_time": "2026-06-15T19:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"独居老人在19:40客厅灯反复快速开关(疑似求救信号),随后入户门未正常上锁即进入卧室就寝,存在健康异常风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:39-19:40期间,客厅灯在2秒间隔内连续开关4次(On-Off-On-Off),这不是正常的照明操作模式,更像是老人在尝试发出求救信号或身体不适导致的误操作。\",\n \"推理步骤2: 客厅灯亮度被设置为极低值(LevelControl.CurrentLevel = 28,约11%),随后出现异常的OccupancySensing事件被错误地报告在living_room_light设备上(19:40:00),这可能是日志异常或系统故障的表现。\",\n \"推理步骤3: 对比老人全天的正常行为模式——早晨5:38起床、正常做饭、午休、下午活动——19:40的灯光闪烁行为明显偏离常规。\",\n \"推理步骤4: 20:36老人关灯后进入卫生间、卧室就寝,时间比通常偏早,且20:46入户门自动上锁事件显示门之前处于未锁状态(老人08:28回家后门未上锁,持续超过12小时),这对独居老人是安全隐患。\",\n \"推理步骤5: 厨房温度传感器多次报告None值(05:57、06:31、11:03、11:22、16:59、17:27),虽然可能与灶具使用时的高温有关,但频繁出现None值也可能表示传感器故障,影响火灾预警能力。\"\n ],\n \"key_evidence\": [\n \"19:40:02-19:40:08 客厅灯在6秒内连续开关4次(On→Off→On→Off),属于异常操作模式\",\n \"19:40:00 living_room_light设备上出现了OccupancySensing.Occupancy事件,该属性不属于灯具设备,存在系统异常\",\n \"08:28老人回家后入户门直到20:46才上锁(超过12小时未锁门)\",\n \"厨房温度传感器在灶具使用期间6次报告MeasuredValue=None,传感器可能存在故障\"\n ],\n \"recommended_actions\": [\n \"立即通过电话或视频联系老人,确认其身体状况是否正常\",\n \"检查19:40灯光闪烁是否为老人主动求助行为,如确认异常应安排人员上门查看\",\n \"设置入户门未锁超时提醒(建议回家后30分钟内未上锁即告警)\",\n \"检修厨房温度传感器,确保其在灶具使用时仍能正常工作,避免火灾预警盲区\",\n \"考虑为老人配置一键SOS紧急按钮设备,避免通过灯光闪烁等非标准方式求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "独居老人在19:40客厅灯反复快速开关(疑似求救信号),随后入户门未正常上锁即进入卧室就寝,存在健康异常风险。", "reasoning": ["推理步骤1: 19:39-19:40期间,客厅灯在2秒间隔内连续开关4次(On-Off-On-Off),这不是正常的照明操作模式,更像是老人在尝试发出求救信号或身体不适导致的误操作。", "推理步骤2: 客厅灯亮度被设置为极低值(LevelControl.CurrentLevel = 28,约11%),随后出现异常的OccupancySensing事件被错误地报告在living_room_light设备上(19:40:00),这可能是日志异常或系统故障的表现。", "推理步骤3: 对比老人全天的正常行为模式——早晨5:38起床、正常做饭、午休、下午活动——19:40的灯光闪烁行为明显偏离常规。", "推理步骤4: 20:36老人关灯后进入卫生间、卧室就寝,时间比通常偏早,且20:46入户门自动上锁事件显示门之前处于未锁状态(老人08:28回家后门未上锁,持续超过12小时),这对独居老人是安全隐患。", "推理步骤5: 厨房温度传感器多次报告None值(05:57、06:31、11:03、11:22、16:59、17:27),虽然可能与灶具使用时的高温有关,但频繁出现None值也可能表示传感器故障,影响火灾预警能力。"], "key_evidence": ["19:40:02-19:40:08 客厅灯在6秒内连续开关4次(On→Off→On→Off),属于异常操作模式", "19:40:00 living_room_light设备上出现了OccupancySensing.Occupancy事件,该属性不属于灯具设备,存在系统异常", "08:28老人回家后入户门直到20:46才上锁(超过12小时未锁门)", "厨房温度传感器在灶具使用期间6次报告MeasuredValue=None,传感器可能存在故障"], "recommended_actions": ["立即通过电话或视频联系老人,确认其身体状况是否正常", "检查19:40灯光闪烁是否为老人主动求助行为,如确认异常应安排人员上门查看", "设置入户门未锁超时提醒(建议回家后30分钟内未上锁即告警)", "检修厨房温度传感器,确保其在灶具使用时仍能正常工作,避免火灾预警盲区", "考虑为老人配置一键SOS紧急按钮设备,避免通过灯光闪烁等非标准方式求助"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.010028839111328, "api_error": null} {"episode_id": "SQ3_FP_D_0627", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0627.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-02T00:00:00", "seed": 20261256, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-02T07:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人外出期间(07:03-08:24)未上锁,且晚间门锁确认关闭事件发生时老人已在卧室内,存在门锁状态管理隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人作息规律清晰——05:33起床,05:48洗漱,05:55做早餐,07:03出门,08:24回家,11:01做午餐,12:39午休,14:09起床,17:01做晚餐,19:23客厅活动,20:37就寝。整体生活节奏正常,无长时间无活动的健康异常信号。\",\n \"推理步骤2: 厨房温度传感器在三次灶具使用期间(05:55-06:31、11:01-11:31、17:01-17:21)均出现 MeasuredValue = None 的异常读数。每次灶具开启约1分钟后传感器即报 None,灶具关闭约1分钟后再次报 None,直到下一个30分钟整点才恢复正常数值。这说明传感器在高温环境下无法正常工作,可能是传感器量程不足、热保护触发或硬件故障。\",\n \"推理步骤3: 厨房温度传感器故障意味着在灶具使用这一最需要温度监控的时段,恰恰失去了温度监测能力。对于独居老人,这是一个安全隐患——如果发生干烧或过热,系统无法通过温度数据及时发现。\",\n \"推理步骤4: 07:03老人手动开锁出门(LockOperationType=1=Unlock),门关闭后自动上锁(LockOperationType=0, OperationSource=Auto, LockState=1)。08:24老人回家时再次手动开锁,但日志中未记录回家后的重新上锁事件,直到20:37就寝时才出现门锁自动上锁记录。这意味着入户门可能在08:24至20:37之间处于未锁定状态长达约12小时。\",\n \"推理步骤5: 07:19卫生间漏水传感器短暂触发(2分钟后恢复),结合当时卫生间有人且灯亮,推断为正常用水溅水,非持续性漏水,风险较低。\",\n \"推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室约22°C-25°C,客厅约23°C-26°C,厨房约23°C-26°C),无异常高温或火灾迹象。烟雾报警器全天无触发,排除火灾风险。\",\n \"推理步骤7: 所有入户事件均为手动操作,无异常远程开锁或未知来源开锁,排除入侵风险。窗户传感器无异常开启记录。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间三次报告 MeasuredValue = None(05:56、06:32、11:02、11:32、17:02、17:22),每次均在灶具开启/关闭后约1分钟出现\",\n \"08:24老人回家开锁后,日志中无对应的上锁记录,直到20:37才出现自动上锁事件(LockState=1),入户门可能长时间未锁\",\n \"07:19卫生间漏水传感器短暂触发2分钟后自动恢复\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器:当前传感器在灶具使用时失效,无法在最关键的烹饪时段提供温度监控,建议更换为耐高温型号或调整安装位置远离灶具直接热源\",\n \"检查入户门锁自动上锁策略:建议配置门锁在关门后自动上锁,或设置未上锁超时提醒(如门关闭5分钟后仍未上锁则推送通知),避免独居老人长时间门户未锁\",\n \"持续关注卫生间漏水传感器:本次为短暂触发,暂无风险,但建议检查卫生间水管接头和地漏密封情况,防止潜在漏水隐患\",\n \"考虑为厨房增加独立的灶具超时自动关闭功能,作为温度传感器失效时的备用安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人外出期间(07:03-08:24)未上锁,且晚间门锁确认关闭事件发生时老人已在卧室内,存在门锁状态管理隐患。", "reasoning": ["推理步骤1: 老人作息规律清晰——05:33起床,05:48洗漱,05:55做早餐,07:03出门,08:24回家,11:01做午餐,12:39午休,14:09起床,17:01做晚餐,19:23客厅活动,20:37就寝。整体生活节奏正常,无长时间无活动的健康异常信号。", "推理步骤2: 厨房温度传感器在三次灶具使用期间(05:55-06:31、11:01-11:31、17:01-17:21)均出现 MeasuredValue = None 的异常读数。每次灶具开启约1分钟后传感器即报 None,灶具关闭约1分钟后再次报 None,直到下一个30分钟整点才恢复正常数值。这说明传感器在高温环境下无法正常工作,可能是传感器量程不足、热保护触发或硬件故障。", "推理步骤3: 厨房温度传感器故障意味着在灶具使用这一最需要温度监控的时段,恰恰失去了温度监测能力。对于独居老人,这是一个安全隐患——如果发生干烧或过热,系统无法通过温度数据及时发现。", "推理步骤4: 07:03老人手动开锁出门(LockOperationType=1=Unlock),门关闭后自动上锁(LockOperationType=0, OperationSource=Auto, LockState=1)。08:24老人回家时再次手动开锁,但日志中未记录回家后的重新上锁事件,直到20:37就寝时才出现门锁自动上锁记录。这意味着入户门可能在08:24至20:37之间处于未锁定状态长达约12小时。", "推理步骤5: 07:19卫生间漏水传感器短暂触发(2分钟后恢复),结合当时卫生间有人且灯亮,推断为正常用水溅水,非持续性漏水,风险较低。", "推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室约22°C-25°C,客厅约23°C-26°C,厨房约23°C-26°C),无异常高温或火灾迹象。烟雾报警器全天无触发,排除火灾风险。", "推理步骤7: 所有入户事件均为手动操作,无异常远程开锁或未知来源开锁,排除入侵风险。窗户传感器无异常开启记录。"], "key_evidence": ["厨房温度传感器在灶具使用期间三次报告 MeasuredValue = None(05:56、06:32、11:02、11:32、17:02、17:22),每次均在灶具开启/关闭后约1分钟出现", "08:24老人回家开锁后,日志中无对应的上锁记录,直到20:37才出现自动上锁事件(LockState=1),入户门可能长时间未锁", "07:19卫生间漏水传感器短暂触发2分钟后自动恢复"], "recommended_actions": ["检查或更换厨房温度传感器:当前传感器在灶具使用时失效,无法在最关键的烹饪时段提供温度监控,建议更换为耐高温型号或调整安装位置远离灶具直接热源", "检查入户门锁自动上锁策略:建议配置门锁在关门后自动上锁,或设置未上锁超时提醒(如门关闭5分钟后仍未上锁则推送通知),避免独居老人长时间门户未锁", "持续关注卫生间漏水传感器:本次为短暂触发,暂无风险,但建议检查卫生间水管接头和地漏密封情况,防止潜在漏水隐患", "考虑为厨房增加独立的灶具超时自动关闭功能,作为温度传感器失效时的备用安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.13335633277893, "api_error": null} {"episode_id": "SQ3_FP_D_0631", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0631.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261260, "scenario_id": "BA-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "bedroom", "injection_time": "2026-06-05T16:28:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"独居老人在客厅反复快速开关灯光(16:28),疑似求助信号或身体不适导致的异常操作。\",\n \"reasoning\": [\n \"推理步骤1: 在 16:28:02 至 16:28:08 的 6 秒内,客厅灯被快速开关了 4 次(开→关→开→关),这不是正常的照明使用模式。\",\n \"推理步骤2: 对于独居老人场景,快速反复开关灯可能意味着:(a) 老人身体突然不适(如头晕、胸闷)试图通过操作灯光引起注意;(b) 老人摔倒后在挣扎中反复触碰开关;(c) 设备故障导致灯光闪烁。\",\n \"推理步骤3: 注意到 16:28:00 先触发了 OccupancySensing.Occupancy = 1(但该事件异常地报告在 living_room_light 设备上而非 living_room_occupancy 传感器上),这可能是日志记录错误,也可能暗示传感器异常。\",\n \"推理步骤4: 在此事件之后,老人的活动轨迹恢复正常——16:54 去厨房做饭、19:39 回客厅、20:35 洗漱、20:46 就寝——说明老人最终状态尚可,但该事件本身仍需关注。\",\n \"推理步骤5: 另一个值得注意的异常是厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:10、06:21、10:59、11:25、16:55、17:41),共出现 6 次。这表明该传感器在高温环境下存在读数丢失的故障,会影响厨房火灾风险的监测能力。\",\n \"推理步骤6: 08:40 老人回家后入户门未关闭(front_door_contact 未报告 StateValue = True),直到 20:46 就寝时才确认门已关闭并上锁。独居老人长时间(约12小时)未锁门存在安全隐患。\",\n \"推理步骤7: 其余行为模式基本正常:05:27 起床、06:50 出门晨练/买菜、08:40 回家、12:28 午休、14:03 起床、20:46 就寝,符合独居老人的典型日常作息。\"\n ],\n \"key_evidence\": [\n \"16:28:02-16:28:08 客厅灯在 6 秒内被开关 4 次(True→False→True→False),属于异常操作模式\",\n \"厨房温度传感器在灶具运行期间 6 次报告 None 值(06:10、06:21、10:59、11:25、16:55、17:41),传感器存在故障\",\n \"08:40 入户门开启后未见关门/上锁记录,直到 20:46 才确认门锁闭合,长达约 12 小时未锁门\",\n \"16:28:00 occupancy 事件异常地出现在 living_room_light 设备上而非 living_room_occupancy 传感器上\"\n ],\n \"recommended_actions\": [\n \"立即通过电话或视频联系老人,确认 16:28 时段身体状况是否正常,排除突发健康问题\",\n \"安排检修厨房温度传感器(kitchen_temp_sensor),解决高温环境下读数丢失(None)的问题,恢复厨房火灾监测能力\",\n \"为入户门锁配置自动提醒规则:门锁解锁超过一定时间未重新上锁时,向老人及紧急联系人发送提醒\",\n \"考虑为客厅灯的快速开关模式设置自动化规则:检测到短时间内多次开关时,自动向紧急联系人发送通知\",\n \"检查 living_room_light 设备的 OccupancySensing 上报是否为配置错误,确保传感器数据来源正确\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "独居老人在客厅反复快速开关灯光(16:28),疑似求助信号或身体不适导致的异常操作。", "reasoning": ["推理步骤1: 在 16:28:02 至 16:28:08 的 6 秒内,客厅灯被快速开关了 4 次(开→关→开→关),这不是正常的照明使用模式。", "推理步骤2: 对于独居老人场景,快速反复开关灯可能意味着:(a) 老人身体突然不适(如头晕、胸闷)试图通过操作灯光引起注意;(b) 老人摔倒后在挣扎中反复触碰开关;(c) 设备故障导致灯光闪烁。", "推理步骤3: 注意到 16:28:00 先触发了 OccupancySensing.Occupancy = 1(但该事件异常地报告在 living_room_light 设备上而非 living_room_occupancy 传感器上),这可能是日志记录错误,也可能暗示传感器异常。", "推理步骤4: 在此事件之后,老人的活动轨迹恢复正常——16:54 去厨房做饭、19:39 回客厅、20:35 洗漱、20:46 就寝——说明老人最终状态尚可,但该事件本身仍需关注。", "推理步骤5: 另一个值得注意的异常是厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:10、06:21、10:59、11:25、16:55、17:41),共出现 6 次。这表明该传感器在高温环境下存在读数丢失的故障,会影响厨房火灾风险的监测能力。", "推理步骤6: 08:40 老人回家后入户门未关闭(front_door_contact 未报告 StateValue = True),直到 20:46 就寝时才确认门已关闭并上锁。独居老人长时间(约12小时)未锁门存在安全隐患。", "推理步骤7: 其余行为模式基本正常:05:27 起床、06:50 出门晨练/买菜、08:40 回家、12:28 午休、14:03 起床、20:46 就寝,符合独居老人的典型日常作息。"], "key_evidence": ["16:28:02-16:28:08 客厅灯在 6 秒内被开关 4 次(True→False→True→False),属于异常操作模式", "厨房温度传感器在灶具运行期间 6 次报告 None 值(06:10、06:21、10:59、11:25、16:55、17:41),传感器存在故障", "08:40 入户门开启后未见关门/上锁记录,直到 20:46 才确认门锁闭合,长达约 12 小时未锁门", "16:28:00 occupancy 事件异常地出现在 living_room_light 设备上而非 living_room_occupancy 传感器上"], "recommended_actions": ["立即通过电话或视频联系老人,确认 16:28 时段身体状况是否正常,排除突发健康问题", "安排检修厨房温度传感器(kitchen_temp_sensor),解决高温环境下读数丢失(None)的问题,恢复厨房火灾监测能力", "为入户门锁配置自动提醒规则:门锁解锁超过一定时间未重新上锁时,向老人及紧急联系人发送提醒", "考虑为客厅灯的快速开关模式设置自动化规则:检测到短时间内多次开关时,自动向紧急联系人发送通知", "检查 living_room_light 设备的 OccupancySensing 上报是否为配置错误,确保传感器数据来源正确"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.404163360595703, "api_error": null} {"episode_id": "SQ3_FP_D_0632", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0632.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261261, "scenario_id": "BA-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "living_room", "injection_time": "2026-06-21T13:38:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似传感器故障;同时客厅灯在 13:38 出现快速开关闪烁,可能为设备故障或老人求助信号。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后的 06:01、06:37、11:01、11:32、17:04、17:31 共 6 次报告 MeasuredValue = None。虽然灶具工作时传感器可能因高温超量程而返回 None,但每次灶具开启后都立即出现 None,且灶具关闭后仍出现一次 None(如 06:37、11:32、17:31),说明传感器恢复延迟或存在间歇性故障。\",\n \"推理步骤2: 13:38 客厅灯在 6 秒内经历了 开→关→开→关 四次状态切换(13:38:02 On → 13:38:04 Off → 13:38:06 On → 13:38:08 Off)。这不符合正常的开关灯行为。对于独居老人场景,这可能是:(a) 灯具或开关硬件故障导致的闪烁;(b) 老人有意快速反复按开关作为求助信号;(c) 自动化规则误触发。需要关注。\",\n \"推理步骤3: 08:25 老人回家时门锁解锁(LockOperationType=1),入户门打开又关闭,但日志中没有后续的上锁记录(LockState 保持为 2=Unlocked)。直到 20:48 才出现自动上锁。这意味着入户门从 08:25 到 20:48 长达约 12 小时处于未锁状态。虽然老人在家中,但对独居老人而言,长时间不锁门存在一定安全隐患。\",\n \"推理步骤4: 其余行为模式基本正常——老人 05:23 起床、05:33 如厕、06:00 做早餐、06:52 出门(门锁手动开锁+自动上锁)、08:25 回家、11:00 做午餐、12:21 午休拉窗帘、13:56 起床、17:03 做晚餐、20:40 洗漱、20:48 就寝。作息规律,符合独居老人的日常生活节奏。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温趋势(卧室夜间约 22°C,午间峰值约 25°C),各房间温差合理,无火灾或异常热源迹象。烟雾报警器全天无触发,漏水传感器无报警,门窗传感器状态正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:01、06:37、11:01、11:32、17:04、17:31 共 6 次报告 MeasuredValue = None\",\n \"13:38:02~13:38:08 客厅灯在 6 秒内快速开关 4 次(On→Off→On→Off)\",\n \"08:25 入户门解锁后至 20:48 期间无上锁记录,门锁长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,或传感器本身存在硬件故障,必要时更换或重新定位\",\n \"排查客厅灯(living_room_light)13:38 快速闪烁的原因:检查灯具开关、智能模块是否松动或故障;同时确认老人当时是否在尝试求助\",\n \"建议为入户门锁设置「在家自动上锁」策略,例如门关闭后 5 分钟内自动上锁,避免长时间未锁门的安全隐患\",\n \"考虑为独居老人增设紧急求助按钮(SOS 设备),避免老人需要通过反复开关灯等非常规方式求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似传感器故障;同时客厅灯在 13:38 出现快速开关闪烁,可能为设备故障或老人求助信号。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后的 06:01、06:37、11:01、11:32、17:04、17:31 共 6 次报告 MeasuredValue = None。虽然灶具工作时传感器可能因高温超量程而返回 None,但每次灶具开启后都立即出现 None,且灶具关闭后仍出现一次 None(如 06:37、11:32、17:31),说明传感器恢复延迟或存在间歇性故障。", "推理步骤2: 13:38 客厅灯在 6 秒内经历了 开→关→开→关 四次状态切换(13:38:02 On → 13:38:04 Off → 13:38:06 On → 13:38:08 Off)。这不符合正常的开关灯行为。对于独居老人场景,这可能是:(a) 灯具或开关硬件故障导致的闪烁;(b) 老人有意快速反复按开关作为求助信号;(c) 自动化规则误触发。需要关注。", "推理步骤3: 08:25 老人回家时门锁解锁(LockOperationType=1),入户门打开又关闭,但日志中没有后续的上锁记录(LockState 保持为 2=Unlocked)。直到 20:48 才出现自动上锁。这意味着入户门从 08:25 到 20:48 长达约 12 小时处于未锁状态。虽然老人在家中,但对独居老人而言,长时间不锁门存在一定安全隐患。", "推理步骤4: 其余行为模式基本正常——老人 05:23 起床、05:33 如厕、06:00 做早餐、06:52 出门(门锁手动开锁+自动上锁)、08:25 回家、11:00 做午餐、12:21 午休拉窗帘、13:56 起床、17:03 做晚餐、20:40 洗漱、20:48 就寝。作息规律,符合独居老人的日常生活节奏。", "推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温趋势(卧室夜间约 22°C,午间峰值约 25°C),各房间温差合理,无火灾或异常热源迹象。烟雾报警器全天无触发,漏水传感器无报警,门窗传感器状态正常。"], "key_evidence": ["厨房温度传感器在 06:01、06:37、11:01、11:32、17:04、17:31 共 6 次报告 MeasuredValue = None", "13:38:02~13:38:08 客厅灯在 6 秒内快速开关 4 次(On→Off→On→Off)", "08:25 入户门解锁后至 20:48 期间无上锁记录,门锁长时间处于未锁定状态"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,或传感器本身存在硬件故障,必要时更换或重新定位", "排查客厅灯(living_room_light)13:38 快速闪烁的原因:检查灯具开关、智能模块是否松动或故障;同时确认老人当时是否在尝试求助", "建议为入户门锁设置「在家自动上锁」策略,例如门关闭后 5 分钟内自动上锁,避免长时间未锁门的安全隐患", "考虑为独居老人增设紧急求助按钮(SOS 设备),避免老人需要通过反复开关灯等非常规方式求助"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.57932686805725, "api_error": null} {"episode_id": "SQ3_FP_D_0634", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0634.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261263, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bedroom", "injection_time": "2026-06-12T11:29:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰导致读数异常,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天活动轨迹——老人 05:39 起床,06:03 进厨房做早餐,07:04 出门,08:33 回家,12:33 午休,14:06 起床,17:09 做晚餐,20:41 就寝。作息规律,活动模式正常。\",\n \"推理步骤2: 入户门在 07:04 手动开锁出门后自动上锁,08:33 手动开锁回家但日志中未见随后的上锁记录。直到 20:41 才出现自动上锁事件。这意味着入户门从 08:33 到 20:41 长达约 12 小时处于未锁状态,虽然老人在家,但对独居老人而言存在一定安全隐患。\",\n \"推理步骤3: 厨房温度传感器在三次烹饪期间(06:04、10:57、17:10)及烹饪结束后(06:40、11:34、17:27)均报告 MeasuredValue = None,共出现 6 次。而客厅和卧室传感器全天从未出现 None 值。这说明厨房温度传感器存在间歇性故障,可能是灶具高温干扰或传感器本身硬件问题。\",\n \"推理步骤4: 厨房温度传感器是独居老人厨房安全监控的重要一环——配合烟雾报警器可以在火灾早期通过温度异常升高发出预警。传感器频繁失效会导致温度异常无法被及时检测,降低了厨房安全冗余度。\",\n \"推理步骤5: 烟雾报警器全天未触发,漏水传感器无报警,窗户传感器无异常开合,排除了火灾、漏水和入侵等高危威胁。灶具使用时长合理(早餐约 35 分钟、午餐约 37 分钟、晚餐约 17 分钟),未出现长时间无人看管的情况。\",\n \"推理步骤6: 温度趋势正常——夜间约 22-23°C,午间峰值约 25-26°C,符合夏季自然温度变化规律,无异常温升。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:04、06:40、10:57、11:34、17:10、17:27 共 6 次报告 MeasuredValue = None,均与灶具开关时间高度关联\",\n \"客厅和卧室温度传感器全天 48 次读数均正常,从未出现 None 值,排除系统性问题\",\n \"入户门 08:33 手动开锁后至 20:41 期间无上锁记录,门锁可能长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数溢出或传感器保护性断连,必要时迁移安装位置\",\n \"对厨房温度传感器进行固件检查或更换,确保其在灶具使用期间仍能提供有效读数\",\n \"检查入户门锁的自动上锁策略,建议配置回家后延时自动上锁功能(如 5 分钟无操作自动锁定),避免长时间未锁门\",\n \"考虑为独居老人增加厨房离人自动关火功能——当厨房运动传感器长时间无人且灶具仍开启时,自动关闭灶具并发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰导致读数异常,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 梳理全天活动轨迹——老人 05:39 起床,06:03 进厨房做早餐,07:04 出门,08:33 回家,12:33 午休,14:06 起床,17:09 做晚餐,20:41 就寝。作息规律,活动模式正常。", "推理步骤2: 入户门在 07:04 手动开锁出门后自动上锁,08:33 手动开锁回家但日志中未见随后的上锁记录。直到 20:41 才出现自动上锁事件。这意味着入户门从 08:33 到 20:41 长达约 12 小时处于未锁状态,虽然老人在家,但对独居老人而言存在一定安全隐患。", "推理步骤3: 厨房温度传感器在三次烹饪期间(06:04、10:57、17:10)及烹饪结束后(06:40、11:34、17:27)均报告 MeasuredValue = None,共出现 6 次。而客厅和卧室传感器全天从未出现 None 值。这说明厨房温度传感器存在间歇性故障,可能是灶具高温干扰或传感器本身硬件问题。", "推理步骤4: 厨房温度传感器是独居老人厨房安全监控的重要一环——配合烟雾报警器可以在火灾早期通过温度异常升高发出预警。传感器频繁失效会导致温度异常无法被及时检测,降低了厨房安全冗余度。", "推理步骤5: 烟雾报警器全天未触发,漏水传感器无报警,窗户传感器无异常开合,排除了火灾、漏水和入侵等高危威胁。灶具使用时长合理(早餐约 35 分钟、午餐约 37 分钟、晚餐约 17 分钟),未出现长时间无人看管的情况。", "推理步骤6: 温度趋势正常——夜间约 22-23°C,午间峰值约 25-26°C,符合夏季自然温度变化规律,无异常温升。"], "key_evidence": ["厨房温度传感器在 06:04、06:40、10:57、11:34、17:10、17:27 共 6 次报告 MeasuredValue = None,均与灶具开关时间高度关联", "客厅和卧室温度传感器全天 48 次读数均正常,从未出现 None 值,排除系统性问题", "入户门 08:33 手动开锁后至 20:41 期间无上锁记录,门锁可能长时间处于未锁定状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数溢出或传感器保护性断连,必要时迁移安装位置", "对厨房温度传感器进行固件检查或更换,确保其在灶具使用期间仍能提供有效读数", "检查入户门锁的自动上锁策略,建议配置回家后延时自动上锁功能(如 5 分钟无操作自动锁定),避免长时间未锁门", "考虑为独居老人增加厨房离人自动关火功能——当厨房运动传感器长时间无人且灶具仍开启时,自动关闭灶具并发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.25497269630432, "api_error": null} {"episode_id": "SQ3_FP_D_0639", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0639.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261268, "scenario_id": "EL-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "EL-02-FP", "scenario_name": "EL-02-FP: 正常午睡", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "发生在正常午睡时段(12:30-14:00),最后活动在卧室且灯已关/窗帘已关", "target_room": "kitchen", "injection_time": "2026-06-19T18:50:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:37 起床、06:02 做早餐、07:04 出门、08:23 回家、12:22 午休、13:52 起床、17:09 做晚餐、20:50 就寝,作息规律且符合独居老人的典型模式,无入侵或健康异常迹象。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,07:04 出门时门在 8 秒内关闭并自动上锁,08:23 回家后门锁状态正常,20:50 就寝前确认门已关闭上锁(BooleanState=True, LockState=1),安防状态良好。\",\n \"推理步骤3: 厨房温度传感器在三次灶具使用期间(06:03、06:37、10:54、11:24、17:10、17:24)均报告 MeasuredValue = None,共出现 6 次 None 读数。而同一时段的定时温度采样(如 06:30 报 2404、11:00 报 2553、17:30 报 2470)却能正常返回数值,说明传感器并非完全离线,而是在灶具开启前后的特定时刻出现读数丢失。\",\n \"推理步骤4: 这种 None 值模式高度关联灶具开关动作——每次灶具 OnOff 状态变化后约 30 秒到 1 分钟内,温度传感器就报告 None。可能原因包括:灶具产生的高温超出传感器量程导致读数无效、灶具电磁干扰影响传感器通信、或传感器本身存在间歇性故障。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪时恰好失效,一旦发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全隐患。\",\n \"推理步骤6: 其他方面均正常——烟雾报警器无触发、漏水传感器无报警、客厅和卧室温度传感器全天数据连续且符合夏季日间升温夜间降温的自然规律(卧室 21.9°C~24.8°C,客厅 22.9°C~25.9°C),窗帘和灯光操作与人员活动一致。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间共出现 6 次 MeasuredValue = None(06:03、06:37、10:54、11:24、17:10、17:24),而定时采样时段数据正常\",\n \"None 值与灶具 OnOff 状态变化高度关联,每次灶具开启或关闭后约 30~60 秒内出现\",\n \"客厅和卧室温度传感器全天无任何 None 值,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程或受热损伤,必要时重新选址安装\",\n \"检查传感器固件版本并更新,排除软件层面的间歇性故障\",\n \"在传感器修复前,考虑增加厨房灶具自动定时关闭规则(如灶具连续开启超过 30 分钟自动断电),作为独居老人的安全兜底措施\",\n \"确认厨房烟雾报警器工作正常,在温度传感器不可靠期间作为主要火灾预警手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:37 起床、06:02 做早餐、07:04 出门、08:23 回家、12:22 午休、13:52 起床、17:09 做晚餐、20:50 就寝,作息规律且符合独居老人的典型模式,无入侵或健康异常迹象。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,07:04 出门时门在 8 秒内关闭并自动上锁,08:23 回家后门锁状态正常,20:50 就寝前确认门已关闭上锁(BooleanState=True, LockState=1),安防状态良好。", "推理步骤3: 厨房温度传感器在三次灶具使用期间(06:03、06:37、10:54、11:24、17:10、17:24)均报告 MeasuredValue = None,共出现 6 次 None 读数。而同一时段的定时温度采样(如 06:30 报 2404、11:00 报 2553、17:30 报 2470)却能正常返回数值,说明传感器并非完全离线,而是在灶具开启前后的特定时刻出现读数丢失。", "推理步骤4: 这种 None 值模式高度关联灶具开关动作——每次灶具 OnOff 状态变化后约 30 秒到 1 分钟内,温度传感器就报告 None。可能原因包括:灶具产生的高温超出传感器量程导致读数无效、灶具电磁干扰影响传感器通信、或传感器本身存在间歇性故障。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪时恰好失效,一旦发生灶具忘关或油温过高等危险情况,系统将无法通过温度异常及时发出预警,存在安全隐患。", "推理步骤6: 其他方面均正常——烟雾报警器无触发、漏水传感器无报警、客厅和卧室温度传感器全天数据连续且符合夏季日间升温夜间降温的自然规律(卧室 21.9°C~24.8°C,客厅 22.9°C~25.9°C),窗帘和灯光操作与人员活动一致。"], "key_evidence": ["厨房温度传感器在灶具使用期间共出现 6 次 MeasuredValue = None(06:03、06:37、10:54、11:24、17:10、17:24),而定时采样时段数据正常", "None 值与灶具 OnOff 状态变化高度关联,每次灶具开启或关闭后约 30~60 秒内出现", "客厅和卧室温度传感器全天无任何 None 值,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程或受热损伤,必要时重新选址安装", "检查传感器固件版本并更新,排除软件层面的间歇性故障", "在传感器修复前,考虑增加厨房灶具自动定时关闭规则(如灶具连续开启超过 30 分钟自动断电),作为独居老人的安全兜底措施", "确认厨房烟雾报警器工作正常,在温度传感器不可靠期间作为主要火灾预警手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.387245178222656, "api_error": null} {"episode_id": "SQ3_FP_D_0641", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0641.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261270, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-12T17:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰导致读数异常。\",\n \"reasoning\": [\n \"推理步骤1: 在过去24小时内,厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:06、06:23、11:05、11:39、17:06、17:35),表明传感器在灶具工作期间及关闭后短时间内无法正常读数。\",\n \"推理步骤2: 此外,在17:03和18:03、18:33时刻,厨房温度传感器出现了与半小时定时报告不一致的额外读数(2500、2498、2501),这些读数高于同时段定时报告值,可能是传感器恢复时的异常跳变。\",\n \"推理步骤3: 正常的温度传感器不应因附近灶具使用而完全丢失读数(返回None)。这表明传感器可能安装位置过于靠近灶具,或传感器本身存在硬件问题(超出量程后进入保护状态)。\",\n \"推理步骤4: 其余设备行为均属正常:老人05:40起床、06:50出门晨练、08:21回家、12:37午休、14:07起床、20:54就寝,生活规律合理;门锁正常开关且自动上锁;温度随日照变化符合夏季规律。\",\n \"推理步骤5: 入户门在08:21开锁进入后未显示关门(BooleanState.StateValue未恢复为True),直到20:54才记录到门关闭状态,但考虑到老人在家期间可能门是关着的只是传感器未触发报告,且20:54确认门已关闭上锁,安全风险较低。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None\",\n \"灶具关闭后传感器仍报告None,需要较长时间才恢复正常读数\",\n \"17:03、18:03、18:33出现非定时的异常温度跳变读数(约2500),高于同时段环境温度\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距离灶具过近导致超温保护\",\n \"考虑更换耐高温型温度传感器或将传感器迁移至远离灶具的位置\",\n \"在传感器报告None期间,烟雾报警器是唯一的厨房安全监测手段,需确保其工作正常\",\n \"建议增加规则:当厨房温度传感器持续报告None超过一定时间且灶具仍在工作时,发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰导致读数异常。", "reasoning": ["推理步骤1: 在过去24小时内,厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:06、06:23、11:05、11:39、17:06、17:35),表明传感器在灶具工作期间及关闭后短时间内无法正常读数。", "推理步骤2: 此外,在17:03和18:03、18:33时刻,厨房温度传感器出现了与半小时定时报告不一致的额外读数(2500、2498、2501),这些读数高于同时段定时报告值,可能是传感器恢复时的异常跳变。", "推理步骤3: 正常的温度传感器不应因附近灶具使用而完全丢失读数(返回None)。这表明传感器可能安装位置过于靠近灶具,或传感器本身存在硬件问题(超出量程后进入保护状态)。", "推理步骤4: 其余设备行为均属正常:老人05:40起床、06:50出门晨练、08:21回家、12:37午休、14:07起床、20:54就寝,生活规律合理;门锁正常开关且自动上锁;温度随日照变化符合夏季规律。", "推理步骤5: 入户门在08:21开锁进入后未显示关门(BooleanState.StateValue未恢复为True),直到20:54才记录到门关闭状态,但考虑到老人在家期间可能门是关着的只是传感器未触发报告,且20:54确认门已关闭上锁,安全风险较低。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None", "灶具关闭后传感器仍报告None,需要较长时间才恢复正常读数", "17:03、18:03、18:33出现非定时的异常温度跳变读数(约2500),高于同时段环境温度"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距离灶具过近导致超温保护", "考虑更换耐高温型温度传感器或将传感器迁移至远离灶具的位置", "在传感器报告None期间,烟雾报警器是唯一的厨房安全监测手段,需确保其工作正常", "建议增加规则:当厨房温度传感器持续报告None超过一定时间且灶具仍在工作时,发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.72962188720703, "api_error": null} {"episode_id": "SQ3_FP_D_0642", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0642.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261271, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-15T20:38:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人已就寝后存在未关闭的安全隐患需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约05:31起床,05:40如厕,06:03进厨房做早餐,07:05出门,08:40回家,12:29午休,13:58起床,17:02做晚餐,20:28如厕后20:37回卧室就寝。这是一个规律的独居老人日常作息,活动模式本身正常。\",\n \"推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:03-06:35、11:03-11:27、17:02-17:20),厨房温度传感器均在灶具开启约1分钟后报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None,直到下一个整点周期才恢复正常数值。这说明传感器在高温环境下反复失效,属于设备故障或设计缺陷。\",\n \"推理步骤3: 该故障的安全风险在于——厨房温度传感器是火灾预警的重要辅助手段,如果传感器在灶具使用(最需要监测的时段)时恰好失效,一旦发生干烧或油温过高,系统将无法通过温度异常及时发出预警,只能依赖烟雾报警器作为最后防线。对独居老人而言这增加了风险。\",\n \"推理步骤4: 入户门状态分析——07:05老人出门时,门锁先解锁(LockState=2),门打开(StateValue=False),门关闭(StateValue=True),门锁自动上锁(LockState=1),流程正常。08:40回家时,门锁解锁,门打开,但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到20:37才出现 front_door_contact StateValue=True 和自动上锁事件,意味着入户门可能从08:40到20:37近12小时处于未关闭或未锁定状态。\",\n \"推理步骤5: 对于独居老人,长时间入户门未锁存在入侵风险,但考虑到老人全天在家且各房间活动正常,更可能是老人回家后忘记关门/虚掩了门,属于生活疏忽而非外部威胁。\",\n \"推理步骤6: 漏水传感器在20:38触发,但仅持续2分钟后恢复(20:40 StateValue=False),且当时卫生间有人(occupancy=1),推断为老人洗漱时少量溅水触发传感器,属于正常误触发。\",\n \"推理步骤7: 温度趋势正常——全天温度呈现夜间低(约22-23°C)、午间高(约25-26°C)的自然变化曲线,无异常温升,烟雾报警器全天未触发。\",\n \"推理步骤8: 综合判断——最值得关注的问题是厨房温度传感器的反复失效,这是一个确定的设备故障,会削弱厨房安全监测能力。入户门长时间未锁是次要关注点。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值:06:04、06:36、11:04、11:28、17:03、17:21,共6次异常读数\",\n \"入户门08:40解锁开门后,直到20:37才记录到门关闭和上锁事件,中间约12小时无门锁/门磁状态变化\",\n \"卫生间漏水传感器20:38短暂触发,2分钟内自动恢复,期间有人在卫生间\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——当前传感器在灶具使用时反复失效,可能是安装位置离灶具过近导致超量程,建议调整安装位置或更换耐高温型号,确保烹饪期间温度监测不中断\",\n \"为入户门设置未锁定超时提醒——配置自动化规则:当门锁处于解锁状态超过5分钟且无人在玄关时,向老人或家属手机推送提醒\",\n \"确认卫生间漏水传感器安装位置——虽然本次为短暂触发属正常,但建议检查传感器是否放置在容易被洗漱溅水触及的位置,适当调整以减少误报\",\n \"建议为厨房灶具配置自动关闭规则——作为温度传感器故障期间的补充安全措施,设置灶具连续使用超过30分钟未手动操作时自动关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人已就寝后存在未关闭的安全隐患需关注。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约05:31起床,05:40如厕,06:03进厨房做早餐,07:05出门,08:40回家,12:29午休,13:58起床,17:02做晚餐,20:28如厕后20:37回卧室就寝。这是一个规律的独居老人日常作息,活动模式本身正常。", "推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:03-06:35、11:03-11:27、17:02-17:20),厨房温度传感器均在灶具开启约1分钟后报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None,直到下一个整点周期才恢复正常数值。这说明传感器在高温环境下反复失效,属于设备故障或设计缺陷。", "推理步骤3: 该故障的安全风险在于——厨房温度传感器是火灾预警的重要辅助手段,如果传感器在灶具使用(最需要监测的时段)时恰好失效,一旦发生干烧或油温过高,系统将无法通过温度异常及时发出预警,只能依赖烟雾报警器作为最后防线。对独居老人而言这增加了风险。", "推理步骤4: 入户门状态分析——07:05老人出门时,门锁先解锁(LockState=2),门打开(StateValue=False),门关闭(StateValue=True),门锁自动上锁(LockState=1),流程正常。08:40回家时,门锁解锁,门打开,但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到20:37才出现 front_door_contact StateValue=True 和自动上锁事件,意味着入户门可能从08:40到20:37近12小时处于未关闭或未锁定状态。", "推理步骤5: 对于独居老人,长时间入户门未锁存在入侵风险,但考虑到老人全天在家且各房间活动正常,更可能是老人回家后忘记关门/虚掩了门,属于生活疏忽而非外部威胁。", "推理步骤6: 漏水传感器在20:38触发,但仅持续2分钟后恢复(20:40 StateValue=False),且当时卫生间有人(occupancy=1),推断为老人洗漱时少量溅水触发传感器,属于正常误触发。", "推理步骤7: 温度趋势正常——全天温度呈现夜间低(约22-23°C)、午间高(约25-26°C)的自然变化曲线,无异常温升,烟雾报警器全天未触发。", "推理步骤8: 综合判断——最值得关注的问题是厨房温度传感器的反复失效,这是一个确定的设备故障,会削弱厨房安全监测能力。入户门长时间未锁是次要关注点。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值:06:04、06:36、11:04、11:28、17:03、17:21,共6次异常读数", "入户门08:40解锁开门后,直到20:37才记录到门关闭和上锁事件,中间约12小时无门锁/门磁状态变化", "卫生间漏水传感器20:38短暂触发,2分钟内自动恢复,期间有人在卫生间"], "recommended_actions": ["检查或更换厨房温度传感器——当前传感器在灶具使用时反复失效,可能是安装位置离灶具过近导致超量程,建议调整安装位置或更换耐高温型号,确保烹饪期间温度监测不中断", "为入户门设置未锁定超时提醒——配置自动化规则:当门锁处于解锁状态超过5分钟且无人在玄关时,向老人或家属手机推送提醒", "确认卫生间漏水传感器安装位置——虽然本次为短暂触发属正常,但建议检查传感器是否放置在容易被洗漱溅水触及的位置,适当调整以减少误报", "建议为厨房灶具配置自动关闭规则——作为温度传感器故障期间的补充安全措施,设置灶具连续使用超过30分钟未手动操作时自动关闭"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 35.66406011581421, "api_error": null} {"episode_id": "SQ3_FP_D_0653", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0653.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261282, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-16T06:49:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,导致烹饪期间无法监测厨房温度,对独居老人构成安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人的日常作息模式正常——05:40起床、06:09做早餐、07:10出门、08:37回家、12:26午休、17:07做晚餐、20:45就寝,符合独居老人的典型生活节奏。\",\n \"推理步骤2: 入侵排查——全天仅有两次开门记录(07:10出门、08:37回家),门锁均为手动开锁且自动回锁,08:37回家后入户门传感器未再报告开门事件(20:45的 StateValue=True 是确认门关闭状态),无异常入侵迹象。\",\n \"推理步骤3: 灶具使用排查——三次烹饪时长分别为约29分钟(06:09-06:38)、34分钟(10:50-11:24)、27分钟(17:07-17:34),时长合理,烟雾报警器全天未触发,无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——每次灶具开启后约30秒至1分钟,kitchen_temp_sensor 就报告 MeasuredValue = None(06:10、06:39、10:51、11:25、17:08、17:35),共出现6次。灶具关闭后传感器也不会立即恢复,需要等到下一个整点或约10分钟后才重新报告数值。\",\n \"推理步骤5: 传感器恢复后的读数偏高——06:49恢复时报告2500(25.00°C),而同时段客厅仅2394(23.94°C),厨房比其他房间高出约1°C以上,说明灶具使用确实导致厨房升温,但传感器在最需要监测的烹饪期间恰恰失效。\",\n \"推理步骤6: 对独居老人的风险评估——厨房温度传感器是烹饪安全的重要辅助监测手段。如果老人忘记关火或发生干烧,温度传感器失效意味着系统无法及时检测到异常高温并发出预警,只能依赖烟雾报警器作为最后防线,安全冗余降低。\",\n \"推理步骤7: 其他设备状态正常——漏水传感器未触发、烟雾报警器未触发、所有门窗传感器工作正常、室温变化符合夏季昼夜规律(夜间22°C左右,午间25-26°C),空调06:49开启后温度仍缓慢上升说明是白天自然升温,整体环境无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间共6次报告 MeasuredValue = None(06:10、06:39、10:51、11:25、17:08、17:35),与灶具开关操作高度关联\",\n \"传感器失效模式一致:灶具开启后约30秒-1分钟变为None,关闭后也报告None,需等待较长时间才恢复正常数值\",\n \"恢复后首次读数(如06:49的2500)明显高于其他房间同期温度,说明传感器可能受高温影响导致读数溢出或自我保护断连\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至距灶具较远的位置\",\n \"检查该传感器的固件版本,确认是否存在已知的高温环境下读数异常的bug,必要时更新固件或更换耐高温型号\",\n \"在传感器修复前,建议为厨房灶具设置自动关闭规则(如持续开启超过45分钟自动断电),作为补偿性安全措施\",\n \"考虑增加一个独立的厨房高温报警装置,确保烹饪期间仍有温度监测覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,导致烹饪期间无法监测厨房温度,对独居老人构成安全隐患。", "reasoning": ["推理步骤1: 老人的日常作息模式正常——05:40起床、06:09做早餐、07:10出门、08:37回家、12:26午休、17:07做晚餐、20:45就寝,符合独居老人的典型生活节奏。", "推理步骤2: 入侵排查——全天仅有两次开门记录(07:10出门、08:37回家),门锁均为手动开锁且自动回锁,08:37回家后入户门传感器未再报告开门事件(20:45的 StateValue=True 是确认门关闭状态),无异常入侵迹象。", "推理步骤3: 灶具使用排查——三次烹饪时长分别为约29分钟(06:09-06:38)、34分钟(10:50-11:24)、27分钟(17:07-17:34),时长合理,烟雾报警器全天未触发,无火灾风险。", "推理步骤4: 厨房温度传感器异常——每次灶具开启后约30秒至1分钟,kitchen_temp_sensor 就报告 MeasuredValue = None(06:10、06:39、10:51、11:25、17:08、17:35),共出现6次。灶具关闭后传感器也不会立即恢复,需要等到下一个整点或约10分钟后才重新报告数值。", "推理步骤5: 传感器恢复后的读数偏高——06:49恢复时报告2500(25.00°C),而同时段客厅仅2394(23.94°C),厨房比其他房间高出约1°C以上,说明灶具使用确实导致厨房升温,但传感器在最需要监测的烹饪期间恰恰失效。", "推理步骤6: 对独居老人的风险评估——厨房温度传感器是烹饪安全的重要辅助监测手段。如果老人忘记关火或发生干烧,温度传感器失效意味着系统无法及时检测到异常高温并发出预警,只能依赖烟雾报警器作为最后防线,安全冗余降低。", "推理步骤7: 其他设备状态正常——漏水传感器未触发、烟雾报警器未触发、所有门窗传感器工作正常、室温变化符合夏季昼夜规律(夜间22°C左右,午间25-26°C),空调06:49开启后温度仍缓慢上升说明是白天自然升温,整体环境无异常。"], "key_evidence": ["厨房温度传感器在三次烹饪期间共6次报告 MeasuredValue = None(06:10、06:39、10:51、11:25、17:08、17:35),与灶具开关操作高度关联", "传感器失效模式一致:灶具开启后约30秒-1分钟变为None,关闭后也报告None,需等待较长时间才恢复正常数值", "恢复后首次读数(如06:49的2500)明显高于其他房间同期温度,说明传感器可能受高温影响导致读数溢出或自我保护断连"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至距灶具较远的位置", "检查该传感器的固件版本,确认是否存在已知的高温环境下读数异常的bug,必要时更新固件或更换耐高温型号", "在传感器修复前,建议为厨房灶具设置自动关闭规则(如持续开启超过45分钟自动断电),作为补偿性安全措施", "考虑增加一个独立的厨房高温报警装置,确保烹饪期间仍有温度监测覆盖"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.105945587158203, "api_error": null} {"episode_id": "SQ3_FP_D_0662", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0662.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20261291, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-26T22:56:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.883354663848877, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ3_FP_D_0654", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_FP_D_0654.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261283, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-16T07:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器可能存在故障,无法在烹饪时监测厨房温度,对独居老人构成安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。老人在19:37回到客厅看电视(调暗灯光至35级),20:34去卫生间洗漱,20:53回卧室就寝,关灯拉窗帘,整体生活作息正常。\",\n \"推理步骤2: 入户门在20:53:17确认关闭(StateValue=True)并自动上锁(LockState=1),但此前08:25开门进入后一直未见关门/上锁记录,意味着入户门从08:25到20:53处于未锁定状态长达约12.5小时。对独居老人而言这是一个安全隐患,但考虑到06:52老人出门时门曾自动上锁,08:25的开门事件可能是老人回家,之后门未及时锁上。最终在就寝前补锁,属于疏忽但非入侵。\",\n \"推理步骤3: 重点关注厨房温度传感器异常——在三次烹饪期间(06:09-06:23、11:01-11:26、16:51-17:22),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启约1分钟后传感器就变为 None,灶具关闭后1分钟仍为 None,直到下一个整点周期才恢复正常数值。这一模式在全天三次烹饪中完全一致。\",\n \"推理步骤4: 正常情况下,灶具使用时厨房温度应上升,传感器应报告更高的数值而非 None。None 值表明传感器在高温或灶具运行环境下出现读数失败,可能是传感器受热干扰、通信中断或硬件故障。\",\n \"推理步骤5: 对于独居老人,厨房温度监测是防火安全的重要环节。如果传感器在烹饪时无法正常工作,一旦发生灶具忘关或油温过高等情况,系统将无法及时发出高温预警,增加火灾风险。\",\n \"推理步骤6: 其余方面——客厅空调07:40开启后未见关闭记录,持续运行至深夜,但夏季高温天气下属于正常使用;各房间温度变化符合昼夜规律;烟雾报警器和漏水传感器全天无告警,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间(06:10、06:24、11:02、11:27、16:52、17:23)均报告 MeasuredValue = None,灶具关闭后恢复正常\",\n \"入户门从08:25开锁到20:53才重新关闭上锁,长达约12.5小时处于未确认锁定状态\",\n \"客厅空调07:40开启后全天无关闭记录,持续运行超16小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新定位传感器\",\n \"为厨房灶具设置烹饪超时自动关闭规则(如超过30分钟无人操作自动断气/断电),弥补温度传感器失效时的安全盲区\",\n \"为入户门锁配置离家/长时间未锁定提醒,避免老人忘记锁门\",\n \"为客厅空调设置定时关闭或温度下限自动停机策略,避免夜间过度制冷影响老人健康\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器可能存在故障,无法在烹饪时监测厨房温度,对独居老人构成安全隐患。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。老人在19:37回到客厅看电视(调暗灯光至35级),20:34去卫生间洗漱,20:53回卧室就寝,关灯拉窗帘,整体生活作息正常。", "推理步骤2: 入户门在20:53:17确认关闭(StateValue=True)并自动上锁(LockState=1),但此前08:25开门进入后一直未见关门/上锁记录,意味着入户门从08:25到20:53处于未锁定状态长达约12.5小时。对独居老人而言这是一个安全隐患,但考虑到06:52老人出门时门曾自动上锁,08:25的开门事件可能是老人回家,之后门未及时锁上。最终在就寝前补锁,属于疏忽但非入侵。", "推理步骤3: 重点关注厨房温度传感器异常——在三次烹饪期间(06:09-06:23、11:01-11:26、16:51-17:22),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启约1分钟后传感器就变为 None,灶具关闭后1分钟仍为 None,直到下一个整点周期才恢复正常数值。这一模式在全天三次烹饪中完全一致。", "推理步骤4: 正常情况下,灶具使用时厨房温度应上升,传感器应报告更高的数值而非 None。None 值表明传感器在高温或灶具运行环境下出现读数失败,可能是传感器受热干扰、通信中断或硬件故障。", "推理步骤5: 对于独居老人,厨房温度监测是防火安全的重要环节。如果传感器在烹饪时无法正常工作,一旦发生灶具忘关或油温过高等情况,系统将无法及时发出高温预警,增加火灾风险。", "推理步骤6: 其余方面——客厅空调07:40开启后未见关闭记录,持续运行至深夜,但夏季高温天气下属于正常使用;各房间温度变化符合昼夜规律;烟雾报警器和漏水传感器全天无告警,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间(06:10、06:24、11:02、11:27、16:52、17:23)均报告 MeasuredValue = None,灶具关闭后恢复正常", "入户门从08:25开锁到20:53才重新关闭上锁,长达约12.5小时处于未确认锁定状态", "客厅空调07:40开启后全天无关闭记录,持续运行超16小时"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新定位传感器", "为厨房灶具设置烹饪超时自动关闭规则(如超过30分钟无人操作自动断气/断电),弥补温度传感器失效时的安全盲区", "为入户门锁配置离家/长时间未锁定提醒,避免老人忘记锁门", "为客厅空调设置定时关闭或温度下限自动停机策略,避免夜间过度制冷影响老人健康"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.140406847000122, "api_error": null} {"episode_id": "SQ3_TN_A_0665", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0665.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261294, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在厨房窗户未关闭和入户门未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在18:00突然从约24.8°C飙升至28.58°C,30分钟内升高近4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除了全屋环境因素。\",\n \"推理步骤2: 18:00和18:30的异常高温发生时,灶具尚未开启(灶具在18:51才打开),因此不能用烹饪来解释这次温度骤升。这指向传感器本身出现故障或受到局部热源干扰。\",\n \"推理步骤3: 厨房温度传感器在18:52和19:46两次报告MeasuredValue=None,表明传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回None值,这进一步佐证传感器存在硬件或通信故障。\",\n \"推理步骤4: 到19:00传感器恢复后读数回到24.42°C,与客厅温度基本一致,说明18:00-18:30的28.5°C读数确实是异常值而非真实环境温度。\",\n \"推理步骤5: 厨房窗户在19:45:30被打开(StateValue=False),但整个日志中没有关闭记录,窗户在住户入睡后仍处于开启状态,存在安全隐患。\",\n \"推理步骤6: 入户门在18:29:02被打开(StateValue=False),直到22:00:54才关闭(StateValue=True),中间超过3.5小时门处于未关状态。虽然住户在家,但长时间不关门在一室一厅的住宅中存在入侵风险。\",\n \"推理步骤7: 其余行为模式正常——住户06:35起床、07:25出门、门锁自动上锁、18:29回家、22:47入睡,符合典型上班族作息。灯光、空调、窗帘操作均与人员活动一致。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从约24.8°C骤升至28.58°C,而灶具直到18:51才开启,无法解释该异常升温\",\n \"厨房温度传感器在18:52和19:46两次报告MeasuredValue=None,表明传感器数据采集异常\",\n \"厨房窗户19:45打开后全天无关闭记录,住户睡后仍处于开启状态\",\n \"入户门18:29至22:00期间持续处于未关闭状态,长达约3.5小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否存在故障或受到局部热源(如阳光直射、电器散热)干扰\",\n \"排查传感器通信链路,分析两次None值的原因(电池电量、无线信号、固件问题等)\",\n \"设置自动化规则:当住户进入睡眠模式时,检查并提醒关闭所有窗户\",\n \"建议缩短入户门未关闭的告警阈值,例如门开超过10分钟且无人在玄关时发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在厨房窗户未关闭和入户门未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度在18:00突然从约24.8°C飙升至28.58°C,30分钟内升高近4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除了全屋环境因素。", "推理步骤2: 18:00和18:30的异常高温发生时,灶具尚未开启(灶具在18:51才打开),因此不能用烹饪来解释这次温度骤升。这指向传感器本身出现故障或受到局部热源干扰。", "推理步骤3: 厨房温度传感器在18:52和19:46两次报告MeasuredValue=None,表明传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回None值,这进一步佐证传感器存在硬件或通信故障。", "推理步骤4: 到19:00传感器恢复后读数回到24.42°C,与客厅温度基本一致,说明18:00-18:30的28.5°C读数确实是异常值而非真实环境温度。", "推理步骤5: 厨房窗户在19:45:30被打开(StateValue=False),但整个日志中没有关闭记录,窗户在住户入睡后仍处于开启状态,存在安全隐患。", "推理步骤6: 入户门在18:29:02被打开(StateValue=False),直到22:00:54才关闭(StateValue=True),中间超过3.5小时门处于未关状态。虽然住户在家,但长时间不关门在一室一厅的住宅中存在入侵风险。", "推理步骤7: 其余行为模式正常——住户06:35起床、07:25出门、门锁自动上锁、18:29回家、22:47入睡,符合典型上班族作息。灯光、空调、窗帘操作均与人员活动一致。"], "key_evidence": ["18:00厨房温度从约24.8°C骤升至28.58°C,而灶具直到18:51才开启,无法解释该异常升温", "厨房温度传感器在18:52和19:46两次报告MeasuredValue=None,表明传感器数据采集异常", "厨房窗户19:45打开后全天无关闭记录,住户睡后仍处于开启状态", "入户门18:29至22:00期间持续处于未关闭状态,长达约3.5小时"], "recommended_actions": ["检查厨房温度传感器的硬件状态和安装位置,确认是否存在故障或受到局部热源(如阳光直射、电器散热)干扰", "排查传感器通信链路,分析两次None值的原因(电池电量、无线信号、固件问题等)", "设置自动化规则:当住户进入睡眠模式时,检查并提醒关闭所有窗户", "建议缩短入户门未关闭的告警阈值,例如门开超过10分钟且无人在玄关时发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.15035390853882, "api_error": null} {"episode_id": "SQ3_TN_A_0671", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0671.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261300, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:17 起床,06:30 洗漱,06:52 去厨房早餐,07:23 关灯锁门出门上班,18:27 回家开灯开空调,18:48 做饭,19:46 关灶开窗通风,20:12 启动洗碗机,21:59 关灯回卧室准备睡觉,22:57 熄灯入睡。这是典型的单人上班族一日作息,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均为正常方式——早上 07:23 手动开锁出门后自动上锁,晚上 18:27 手动开锁进门,21:59 门关闭后自动上锁。无异常开锁事件(如错误密码、未知来源解锁)。\",\n \"推理步骤3: 三个区域温度整体趋势一致:凌晨约 22-23°C,白天随日照升至 25-26°C,傍晚回落。客厅和卧室温度曲线平滑合理。但厨房温度传感器在 18:00 突然从约 24.8°C 跳升至 28.55°C,18:30 继续报 28.57°C,而同一时刻客厅仅 24.6°C、卧室 23.6°C,差值高达约 4°C,且此时灶具尚未开启(18:48 才开灶),无法用烹饪解释。\",\n \"推理步骤4: 更关键的是,厨房温度传感器在 18:49 和 19:47 两次报出 MeasuredValue = None(空值)。Matter 协议下 TemperatureMeasurement.MeasuredValue 报 None 通常表示传感器无法获取有效读数,属于设备异常状态。第一次 None 发生在灶具刚开启后 1 分钟,第二次发生在灶具关闭、窗户打开后 1 分钟。\",\n \"推理步骤5: 在 19:00 恢复读数后,厨房温度回到 24.45°C,与客厅 24.37°C 基本一致,说明 18:00 的 28.55°C 跳变并非真实环境温度,更可能是传感器自身故障导致的虚高读数。结合两次 None 值,判断该传感器存在间歇性故障。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。厨房窗户 19:46 打开后日志中未见关闭事件,但这属于通风行为,住户在家期间不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约 24.86°C 骤升至 28.55°C(灶具 18:48 才开启,无合理热源解释此跳变)\",\n \"18:49 和 19:47 厨房温度传感器两次报出 MeasuredValue = None,表明传感器无法正常采集数据\",\n \"19:00 恢复读数后厨房温度回归正常范围(24.45°C),与其他房间一致,进一步证实 18:00 的高温为虚假读数\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和接线,确认是否受潮、松动或靠近热源(如冰箱散热口)\",\n \"对厨房温度传感器进行校准测试或固件更新,若问题持续则更换传感器\",\n \"在传感器修复前,可临时将烟雾报警器作为厨房安全的主要监测手段,避免因温度传感器失灵而遗漏真实高温预警\",\n \"确认厨房窗户是否已关闭,夜间开窗可能带来安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:17 起床,06:30 洗漱,06:52 去厨房早餐,07:23 关灯锁门出门上班,18:27 回家开灯开空调,18:48 做饭,19:46 关灶开窗通风,20:12 启动洗碗机,21:59 关灯回卧室准备睡觉,22:57 熄灯入睡。这是典型的单人上班族一日作息,无入侵迹象。", "推理步骤2: 入户门锁操作均为正常方式——早上 07:23 手动开锁出门后自动上锁,晚上 18:27 手动开锁进门,21:59 门关闭后自动上锁。无异常开锁事件(如错误密码、未知来源解锁)。", "推理步骤3: 三个区域温度整体趋势一致:凌晨约 22-23°C,白天随日照升至 25-26°C,傍晚回落。客厅和卧室温度曲线平滑合理。但厨房温度传感器在 18:00 突然从约 24.8°C 跳升至 28.55°C,18:30 继续报 28.57°C,而同一时刻客厅仅 24.6°C、卧室 23.6°C,差值高达约 4°C,且此时灶具尚未开启(18:48 才开灶),无法用烹饪解释。", "推理步骤4: 更关键的是,厨房温度传感器在 18:49 和 19:47 两次报出 MeasuredValue = None(空值)。Matter 协议下 TemperatureMeasurement.MeasuredValue 报 None 通常表示传感器无法获取有效读数,属于设备异常状态。第一次 None 发生在灶具刚开启后 1 分钟,第二次发生在灶具关闭、窗户打开后 1 分钟。", "推理步骤5: 在 19:00 恢复读数后,厨房温度回到 24.45°C,与客厅 24.37°C 基本一致,说明 18:00 的 28.55°C 跳变并非真实环境温度,更可能是传感器自身故障导致的虚高读数。结合两次 None 值,判断该传感器存在间歇性故障。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。厨房窗户 19:46 打开后日志中未见关闭事件,但这属于通风行为,住户在家期间不构成安全威胁。"], "key_evidence": ["18:00 厨房温度从约 24.86°C 骤升至 28.55°C(灶具 18:48 才开启,无合理热源解释此跳变)", "18:49 和 19:47 厨房温度传感器两次报出 MeasuredValue = None,表明传感器无法正常采集数据", "19:00 恢复读数后厨房温度回归正常范围(24.45°C),与其他房间一致,进一步证实 18:00 的高温为虚假读数"], "recommended_actions": ["检查厨房温度传感器的安装位置和接线,确认是否受潮、松动或靠近热源(如冰箱散热口)", "对厨房温度传感器进行校准测试或固件更新,若问题持续则更换传感器", "在传感器修复前,可临时将烟雾报警器作为厨房安全的主要监测手段,避免因温度传感器失灵而遗漏真实高温预警", "确认厨房窗户是否已关闭,夜间开窗可能带来安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.38877582550049, "api_error": null} {"episode_id": "SQ3_TN_A_0675", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0675.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261304, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在异常:多次报告 None 值,且在 12:00 出现一次异常高温读数(29.71°C),与同时段客厅/卧室温差异常大,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 08:44 起床,经历洗漱、早餐(09:23 做饭)、午餐(12:10)、晚餐(18:06),23:09 就寝并锁门,符合一室一厅单人居住的典型作息。\",\n \"推理步骤2: 安防状态正常——全天无入户门异常开启,23:09 门锁自动上锁(LockOperationType=0, OperationSource=Auto),门传感器显示关闭(StateValue=True),无入侵迹象。\",\n \"推理步骤3: 厨房温度传感器多次报告 MeasuredValue = None(09:24、09:55、12:11、12:30、18:07、18:51),均发生在灶具开启期间或刚关闭后。虽然灶具使用时传感器受热干扰可以理解,但 Matter 协议下传感器应报告数值而非 None,这表明传感器可能在高温环境下出现通信中断或读数溢出。\",\n \"推理步骤4: 12:00 厨房温度传感器报告 2971(29.71°C),而同时刻客厅为 25.80°C、卧室为 24.74°C。厨房比客厅高出近 4°C,且此时灶具尚未开启(12:10 才开),这一异常高温读数无合理热源解释,进一步佐证传感器数据不可靠。12:30 再次报告 2975 也印证了这一点。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警,排除水患;各房间温度整体走势合理(夜间 22-23°C,午后峰值 25-26°C),客厅空调开启后温度得到控制,无其他设备异常。\",\n \"推理步骤6: 厨房窗户传感器多次报告 StateValue=False(窗户打开),均在做饭后通风,属正常行为。洗碗机在晚餐后启动也属正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:24、09:55、12:11、12:30、18:07、18:51 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度传感器报告 2971(29.71°C),12:30 报告 2975(29.75°C),灶具当时未开启(12:10 才开),与客厅/卧室温差异常偏大约 4°C\",\n \"其余所有安防传感器(门锁、门磁、运动传感器、烟雾报警器、漏水传感器)均无异常触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时通信异常或读数溢出\",\n \"对厨房温度传感器进行校准或固件更新,解决频繁报告 None 值的问题\",\n \"如传感器持续异常,建议更换设备,因为温度传感器数据不可靠会影响烟雾/火灾联动判断的准确性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在异常:多次报告 None 值,且在 12:00 出现一次异常高温读数(29.71°C),与同时段客厅/卧室温差异常大,疑似传感器故障。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 08:44 起床,经历洗漱、早餐(09:23 做饭)、午餐(12:10)、晚餐(18:06),23:09 就寝并锁门,符合一室一厅单人居住的典型作息。", "推理步骤2: 安防状态正常——全天无入户门异常开启,23:09 门锁自动上锁(LockOperationType=0, OperationSource=Auto),门传感器显示关闭(StateValue=True),无入侵迹象。", "推理步骤3: 厨房温度传感器多次报告 MeasuredValue = None(09:24、09:55、12:11、12:30、18:07、18:51),均发生在灶具开启期间或刚关闭后。虽然灶具使用时传感器受热干扰可以理解,但 Matter 协议下传感器应报告数值而非 None,这表明传感器可能在高温环境下出现通信中断或读数溢出。", "推理步骤4: 12:00 厨房温度传感器报告 2971(29.71°C),而同时刻客厅为 25.80°C、卧室为 24.74°C。厨房比客厅高出近 4°C,且此时灶具尚未开启(12:10 才开),这一异常高温读数无合理热源解释,进一步佐证传感器数据不可靠。12:30 再次报告 2975 也印证了这一点。", "推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警,排除水患;各房间温度整体走势合理(夜间 22-23°C,午后峰值 25-26°C),客厅空调开启后温度得到控制,无其他设备异常。", "推理步骤6: 厨房窗户传感器多次报告 StateValue=False(窗户打开),均在做饭后通风,属正常行为。洗碗机在晚餐后启动也属正常。"], "key_evidence": ["厨房温度传感器在 09:24、09:55、12:11、12:30、18:07、18:51 共 6 次报告 MeasuredValue = None", "12:00 厨房温度传感器报告 2971(29.71°C),12:30 报告 2975(29.75°C),灶具当时未开启(12:10 才开),与客厅/卧室温差异常偏大约 4°C", "其余所有安防传感器(门锁、门磁、运动传感器、烟雾报警器、漏水传感器)均无异常触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时通信异常或读数溢出", "对厨房温度传感器进行校准或固件更新,解决频繁报告 None 值的问题", "如传感器持续异常,建议更换设备,因为温度传感器数据不可靠会影响烟雾/火灾联动判断的准确性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.23830223083496, "api_error": null} {"episode_id": "SQ3_TN_A_0681", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0681.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20261310, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.61°C),随后在19:00和19:47报告None值,疑似传感器故障或短暂过热事件。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从前一时段的24.77°C跳升至28.61°C(升幅约4°C),而同一时刻客厅和卧室温度仅有正常的微小波动,排除全屋升温的可能。\",\n \"推理步骤2: 18:30时厨房温度仍维持在28.61°C,但此时灶具尚未开启(灶具在18:59才开启),无合理热源解释这一异常升温。\",\n \"推理步骤3: 19:00时厨房温度传感器报告了一次None值(空读数),19:47再次报告None值。两次空值出现在灶具使用前后,可能是传感器受热干扰或自身故障导致读数异常。\",\n \"推理步骤4: 19:00的第二条记录显示厨房温度回落至24.28°C,与客厅温度趋势一致,说明传感器在短暂故障后恢复了正常工作。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除真实火灾风险;住户行为模式(早起、出门、傍晚回家、做饭、睡觉)完全正常,门锁操作均为手动/自动锁定,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 kitchen_temp_sensor 读数突跳至2861(28.61°C),较前一时段升高约4°C,且灶具当时未开启\",\n \"19:00和19:47 kitchen_temp_sensor 报告 MeasuredValue = None(空值),表明传感器读数中断\",\n \"同时段客厅和卧室温度传感器读数正常下降,排除环境因素导致的全屋升温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如阳光直射、烤箱排气口等)导致局部过热\",\n \"观察未来几天厨房温度传感器是否再次出现None值或异常跳变,若反复出现建议更换传感器\",\n \"考虑为厨房温度传感器设置异常阈值告警,当温度突变超过3°C/30min时主动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.61°C),随后在19:00和19:47报告None值,疑似传感器故障或短暂过热事件。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从前一时段的24.77°C跳升至28.61°C(升幅约4°C),而同一时刻客厅和卧室温度仅有正常的微小波动,排除全屋升温的可能。", "推理步骤2: 18:30时厨房温度仍维持在28.61°C,但此时灶具尚未开启(灶具在18:59才开启),无合理热源解释这一异常升温。", "推理步骤3: 19:00时厨房温度传感器报告了一次None值(空读数),19:47再次报告None值。两次空值出现在灶具使用前后,可能是传感器受热干扰或自身故障导致读数异常。", "推理步骤4: 19:00的第二条记录显示厨房温度回落至24.28°C,与客厅温度趋势一致,说明传感器在短暂故障后恢复了正常工作。", "推理步骤5: 烟雾报警器全天未触发,排除真实火灾风险;住户行为模式(早起、出门、傍晚回家、做饭、睡觉)完全正常,门锁操作均为手动/自动锁定,无入侵迹象。"], "key_evidence": ["18:00 kitchen_temp_sensor 读数突跳至2861(28.61°C),较前一时段升高约4°C,且灶具当时未开启", "19:00和19:47 kitchen_temp_sensor 报告 MeasuredValue = None(空值),表明传感器读数中断", "同时段客厅和卧室温度传感器读数正常下降,排除环境因素导致的全屋升温"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如阳光直射、烤箱排气口等)导致局部过热", "观察未来几天厨房温度传感器是否再次出现None值或异常跳变,若反复出现建议更换传感器", "考虑为厨房温度传感器设置异常阈值告警,当温度突变超过3°C/30min时主动通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.27870273590088, "api_error": null} {"episode_id": "SQ3_TN_A_0690", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0690.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261319, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.51°C,而同一时刻客厅(24.6°C)和卧室(23.6°C)温度正常下降,三个房间温度趋势出现明显分歧。\",\n \"推理步骤2: 18:30 厨房温度进一步升至 28.58°C,但此时灶具尚未开启(灶具在 18:45:30 才开启),排除烹饪导致的正常升温。这段无人操作期间的异常高温不合理。\",\n \"推理步骤3: 18:46 灶具刚开启约30秒后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:30 再次出现 None 读数。温度传感器在短时间内两次返回空值,属于设备异常行为。\",\n \"推理步骤4: 19:00 厨房温度突然恢复为 24.41°C,从 28.58°C 在30分钟内骤降超过 4°C,降幅远超自然散热速率,进一步印证 18:00-18:30 的高温读数可能是传感器漂移或故障产生的虚假数据。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发任何事件,排除真实火灾或烟雾风险。结合异常高温读数 + 两次 None 值 + 不合理的温度骤变,判断为传感器故障而非真实环境威胁。\",\n \"推理步骤6: 其余设备行为均正常——住户早晨 6:37 起床、7:18 出门上锁、18:01 回家开灯开空调、18:45 做饭、22:08 就寝关灯锁门,符合典型的单人一室一厅生活作息。入户门锁操作均为 Manual/Auto 来源,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.8°C 骤升至 28.51°C,18:30 达 28.58°C,而灶具直到 18:45:30 才开启,升温无合理热源解释\",\n \"18:46 和 19:30 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数中断\",\n \"19:00 厨房温度从 28.58°C 骤降回 24.41°C,30分钟内降幅超过 4°C,不符合自然散热规律\",\n \"同时段烟雾报警器无任何告警事件,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处)\",\n \"查看传感器固件版本,必要时进行固件升级或设备重置,解决 None 值上报问题\",\n \"如传感器持续出现异常读数,建议更换设备以确保厨房安全监测的可靠性\",\n \"考虑为厨房温度传感器设置合理的告警阈值(如超过 28°C 且灶具未开启时触发预警),以便及时发现真实的环境异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.8°C 跳升至 28.51°C,而同一时刻客厅(24.6°C)和卧室(23.6°C)温度正常下降,三个房间温度趋势出现明显分歧。", "推理步骤2: 18:30 厨房温度进一步升至 28.58°C,但此时灶具尚未开启(灶具在 18:45:30 才开启),排除烹饪导致的正常升温。这段无人操作期间的异常高温不合理。", "推理步骤3: 18:46 灶具刚开启约30秒后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:30 再次出现 None 读数。温度传感器在短时间内两次返回空值,属于设备异常行为。", "推理步骤4: 19:00 厨房温度突然恢复为 24.41°C,从 28.58°C 在30分钟内骤降超过 4°C,降幅远超自然散热速率,进一步印证 18:00-18:30 的高温读数可能是传感器漂移或故障产生的虚假数据。", "推理步骤5: 烟雾报警器在整个时段内未触发任何事件,排除真实火灾或烟雾风险。结合异常高温读数 + 两次 None 值 + 不合理的温度骤变,判断为传感器故障而非真实环境威胁。", "推理步骤6: 其余设备行为均正常——住户早晨 6:37 起床、7:18 出门上锁、18:01 回家开灯开空调、18:45 做饭、22:08 就寝关灯锁门,符合典型的单人一室一厅生活作息。入户门锁操作均为 Manual/Auto 来源,无异常入侵迹象。"], "key_evidence": ["18:00 厨房温度从 ~24.8°C 骤升至 28.51°C,18:30 达 28.58°C,而灶具直到 18:45:30 才开启,升温无合理热源解释", "18:46 和 19:30 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数中断", "19:00 厨房温度从 28.58°C 骤降回 24.41°C,30分钟内降幅超过 4°C,不符合自然散热规律", "同时段烟雾报警器无任何告警事件,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处)", "查看传感器固件版本,必要时进行固件升级或设备重置,解决 None 值上报问题", "如传感器持续出现异常读数,建议更换设备以确保厨房安全监测的可靠性", "考虑为厨房温度传感器设置合理的告警阈值(如超过 28°C 且灶具未开启时触发预警),以便及时发现真实的环境异常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.579872131347656, "api_error": null} {"episode_id": "SQ3_TN_A_0693", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0693.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261322, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 2979(29.79°C),疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:25、09:35、12:04、12:26、18:13、18:34),共计 6 次。这些 None 值出现在灶具开启/关闭前后,但其他时段的正常温度采集周期(每30分钟)从未出现 None,说明传感器在灶具使用期间存在读数异常。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2979(29.79°C),而同一时刻客厅为 2580(25.80°C)、卧室为 2486(24.86°C)。厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(12:03 才开灶)。到 12:30 仍为 2977,但 13:00 骤降回 2566,与客厅基本持平。这一突然的高温尖峰在灶具未使用时出现,不符合正常烹饪升温逻辑,更像是传感器偶发性读数漂移或故障。\",\n \"推理步骤3: 住户行为模式完全正常——08:40 起床开灯开窗帘,08:49 进卫生间,09:24 去厨房做早餐,09:46 到客厅开空调(制冷模式 SystemMode=3,符合夏季高温),中午和傍晚各做了一次饭,23:15 关灯锁门睡觉。所有运动传感器、门锁、灯光的时序逻辑自洽,无入侵迹象。\",\n \"推理步骤4: 烟雾报警器全天未触发,漏水传感器无报警,门锁操作均为自动锁定且入户门传感器显示关闭(StateValue=True 表示门关闭),安防层面无异常。\",\n \"推理步骤5: 空调在 09:46 开启制冷但客厅温度从 2512(10:00)持续上升到 2580(12:00),直到下午才逐步下降。这可能是因为中午室外高温导致制冷效果有限,属于正常现象,但也值得关注空调制冷效率。\",\n \"推理步骤6: 厨房窗户在每次做完饭后都被打开(BooleanState.StateValue=False 表示窗户打开),这是合理的通风行为,但日志中未见窗户关闭事件,需确认窗户是否一直处于打开状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:25、09:35、12:04、12:26、18:13、18:34 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度异常跳升至 2979(29.79°C),灶具此时未开启,12:30 仍为 2977,13:00 骤降回 2566\",\n \"其他所有设备行为(门锁、运动传感器、灯光、窗帘)时序逻辑正常,无安防威胁迹象\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致灶具余热影响读数或传感器过热保护触发 None 值\",\n \"对厨房温度传感器进行校准或更换,解决频繁 None 值和异常高温读数问题\",\n \"持续观察几天的数据,确认 12:00 的温度尖峰是偶发还是规律性故障\",\n \"确认厨房窗户在通风后是否已关闭,避免夜间窗户敞开带来的安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 2979(29.79°C),疑似传感器故障。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:25、09:35、12:04、12:26、18:13、18:34),共计 6 次。这些 None 值出现在灶具开启/关闭前后,但其他时段的正常温度采集周期(每30分钟)从未出现 None,说明传感器在灶具使用期间存在读数异常。", "推理步骤2: 12:00 厨房温度传感器报告 2979(29.79°C),而同一时刻客厅为 2580(25.80°C)、卧室为 2486(24.86°C)。厨房温度比其他房间高出约 4°C,且此时灶具尚未开启(12:03 才开灶)。到 12:30 仍为 2977,但 13:00 骤降回 2566,与客厅基本持平。这一突然的高温尖峰在灶具未使用时出现,不符合正常烹饪升温逻辑,更像是传感器偶发性读数漂移或故障。", "推理步骤3: 住户行为模式完全正常——08:40 起床开灯开窗帘,08:49 进卫生间,09:24 去厨房做早餐,09:46 到客厅开空调(制冷模式 SystemMode=3,符合夏季高温),中午和傍晚各做了一次饭,23:15 关灯锁门睡觉。所有运动传感器、门锁、灯光的时序逻辑自洽,无入侵迹象。", "推理步骤4: 烟雾报警器全天未触发,漏水传感器无报警,门锁操作均为自动锁定且入户门传感器显示关闭(StateValue=True 表示门关闭),安防层面无异常。", "推理步骤5: 空调在 09:46 开启制冷但客厅温度从 2512(10:00)持续上升到 2580(12:00),直到下午才逐步下降。这可能是因为中午室外高温导致制冷效果有限,属于正常现象,但也值得关注空调制冷效率。", "推理步骤6: 厨房窗户在每次做完饭后都被打开(BooleanState.StateValue=False 表示窗户打开),这是合理的通风行为,但日志中未见窗户关闭事件,需确认窗户是否一直处于打开状态。"], "key_evidence": ["厨房温度传感器在 09:25、09:35、12:04、12:26、18:13、18:34 共 6 次报告 MeasuredValue = None", "12:00 厨房温度异常跳升至 2979(29.79°C),灶具此时未开启,12:30 仍为 2977,13:00 骤降回 2566", "其他所有设备行为(门锁、运动传感器、灯光、窗帘)时序逻辑正常,无安防威胁迹象"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致灶具余热影响读数或传感器过热保护触发 None 值", "对厨房温度传感器进行校准或更换,解决频繁 None 值和异常高温读数问题", "持续观察几天的数据,确认 12:00 的温度尖峰是偶发还是规律性故障", "确认厨房窗户在通风后是否已关闭,避免夜间窗户敞开带来的安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.398083686828613, "api_error": null} {"episode_id": "SQ3_TN_A_0701", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0701.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261330, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:18:00 温度突然飙升至 28.64°C(前一读数 24.78°C,跳升近 4°C),随后在灶具开启期间两次报告 None(空值),疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:28 起床(卫生间活动),07:15 出门上班(门锁手动开锁、开关门、自动上锁),18:07 回家(门锁开锁、玄关灯亮、客厅活动),22:03 进卧室准备睡觉,22:38 关灯入睡。这是典型的单人上班族作息。\",\n \"推理步骤2: 安防方面无异常——入户门全天仅两次开关(早出晚归),均为 Manual 操作后 Auto 上锁,无异常开锁尝试;住户外出期间(07:15-18:07)无任何运动传感器触发、无门窗状态变化,排除入侵风险。\",\n \"推理步骤3: 温度趋势整体合理——三个区域温度从凌晨 22-23°C 随日照升至中午 25-26°C,下午回落,符合夏季自然温度曲线。客厅空调 18:07 开启制冷(SystemMode=3)后温度从约 24.6°C 降至 22:0°C 左右,效果正常。\",\n \"推理步骤4: 关键异常——厨房温度在 17:30 为 24.78°C,18:00 突然跳至 28.64°C(+3.86°C),18:30 仍为 28.55°C。此时灶具尚未开启(18:47 才开),住户刚进门在客厅,厨房无人活动,无合理热源解释这一突变。同期客厅和卧室温度均在正常下降。\",\n \"推理步骤5: 18:48 和 19:44 厨房温度传感器两次报告 MeasuredValue = None(空值),分别对应灶具开启后 1 分钟和关闭后 1 分钟。正常传感器不应返回空值,这表明传感器可能因过热、通信故障或硬件问题导致读数丢失。\",\n \"推理步骤6: 19:00 厨房温度恢复为 24.45°C,与 18:00 前的 28.64°C 相比大幅下降,且此时灶具仍在使用中(19:43 才关闭),温度读数的剧烈波动进一步佐证传感器工作状态不稳定。\",\n \"推理步骤7: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报告,排除水患;洗碗机正常启动运行。厨房窗户在 19:43 打开通风属正常烹饪后行为。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 24.78°C 骤升至 28.64°C(+3.86°C),当时灶具未开、厨房无人,无合理热源\",\n \"18:48 和 19:44 厨房温度传感器两次返回 MeasuredValue = None,正常传感器不应出现空值\",\n \"18:30 厨房温度仍高达 28.55°C,而 19:00 骤降至 24.45°C,灶具使用期间温度反而下降,读数自相矛盾\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近或受到其他热源(如阳光直射)干扰\",\n \"检查传感器固件版本和电池电量,两次 None 值可能是硬件老化或供电不足导致的间歇性故障\",\n \"考虑重启或更换厨房温度传感器,并在更换后观察数天确认读数稳定性\",\n \"如传感器同时承担烟雾报警联动的温度参考,建议在修复前增加独立温度监测手段,避免安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:18:00 温度突然飙升至 28.64°C(前一读数 24.78°C,跳升近 4°C),随后在灶具开启期间两次报告 None(空值),疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:28 起床(卫生间活动),07:15 出门上班(门锁手动开锁、开关门、自动上锁),18:07 回家(门锁开锁、玄关灯亮、客厅活动),22:03 进卧室准备睡觉,22:38 关灯入睡。这是典型的单人上班族作息。", "推理步骤2: 安防方面无异常——入户门全天仅两次开关(早出晚归),均为 Manual 操作后 Auto 上锁,无异常开锁尝试;住户外出期间(07:15-18:07)无任何运动传感器触发、无门窗状态变化,排除入侵风险。", "推理步骤3: 温度趋势整体合理——三个区域温度从凌晨 22-23°C 随日照升至中午 25-26°C,下午回落,符合夏季自然温度曲线。客厅空调 18:07 开启制冷(SystemMode=3)后温度从约 24.6°C 降至 22:0°C 左右,效果正常。", "推理步骤4: 关键异常——厨房温度在 17:30 为 24.78°C,18:00 突然跳至 28.64°C(+3.86°C),18:30 仍为 28.55°C。此时灶具尚未开启(18:47 才开),住户刚进门在客厅,厨房无人活动,无合理热源解释这一突变。同期客厅和卧室温度均在正常下降。", "推理步骤5: 18:48 和 19:44 厨房温度传感器两次报告 MeasuredValue = None(空值),分别对应灶具开启后 1 分钟和关闭后 1 分钟。正常传感器不应返回空值,这表明传感器可能因过热、通信故障或硬件问题导致读数丢失。", "推理步骤6: 19:00 厨房温度恢复为 24.45°C,与 18:00 前的 28.64°C 相比大幅下降,且此时灶具仍在使用中(19:43 才关闭),温度读数的剧烈波动进一步佐证传感器工作状态不稳定。", "推理步骤7: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报告,排除水患;洗碗机正常启动运行。厨房窗户在 19:43 打开通风属正常烹饪后行为。"], "key_evidence": ["18:00 厨房温度从 24.78°C 骤升至 28.64°C(+3.86°C),当时灶具未开、厨房无人,无合理热源", "18:48 和 19:44 厨房温度传感器两次返回 MeasuredValue = None,正常传感器不应出现空值", "18:30 厨房温度仍高达 28.55°C,而 19:00 骤降至 24.45°C,灶具使用期间温度反而下降,读数自相矛盾"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近或受到其他热源(如阳光直射)干扰", "检查传感器固件版本和电池电量,两次 None 值可能是硬件老化或供电不足导致的间歇性故障", "考虑重启或更换厨房温度传感器,并在更换后观察数天确认读数稳定性", "如传感器同时承担烟雾报警联动的温度参考,建议在修复前增加独立温度监测手段,避免安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.39714002609253, "api_error": null} {"episode_id": "SQ3_TN_A_0702", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0702.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261331, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次读数丢失(None),疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在18:30为2463(约24.6°C),到19:00突然跳升至2826(约28.3°C),30分钟内飙升约3.6°C,而同一时段客厅和卧室温度均在正常下降,排除全屋环境突变的可能。\",\n \"推理步骤2: 灶具(cook_surface)在19:02才开启,但温度跳变发生在19:00,即灶具开启之前。如果是做饭导致升温,温度应在灶具开启之后才上升,时序不匹配。\",\n \"推理步骤3: 19:03厨房温度传感器报告MeasuredValue=None(读数丢失),19:30灶具关闭后再次报告2842(约28.4°C),紧接着19:31又一次报告None。短时间内两次出现None值,说明传感器存在间歇性通信故障或硬件异常。\",\n \"推理步骤4: 到20:00厨房温度恢复为2412(约24.1°C),与客厅2409基本一致,说明之前的2826/2842高温读数并非真实环境温度,而是传感器的错误读数。\",\n \"推理步骤5: 烟雾报警器(kitchen_smoke_alarm)全天无任何触发记录,进一步排除了厨房真实发生高温或火灾的可能性。\",\n \"推理步骤6: 其余设备行为均属正常——住户约06:37起床、07:21出门上班、18:16回家、19:02做饭、22:09就寝,入户门锁开关和自动上锁逻辑正确,无入侵迹象。入户门在18:16开锁后一直处于开启状态(BooleanState=False),直到22:09才关闭并自动上锁,虽然时间较长但住户在家期间属于正常行为。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从2463骤升至2826(+3.6°C/30min),而灶具19:02才开启,时序矛盾\",\n \"19:03和19:31厨房温度传感器两次报告MeasuredValue=None,出现间歇性读数丢失\",\n \"19:30温度读数2842与20:00恢复后的2412相差约4.3°C,虚高读数不可信\",\n \"烟雾报警器全天未触发,排除真实高温/火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和供电/通信连接,排查间歇性故障原因\",\n \"清洁传感器探头,确认其未被油烟、水汽等污染导致读数偏差\",\n \"如传感器持续出现None值或异常跳变,建议更换传感器\",\n \"在传感器修复前,可临时设置告警规则:当厨房温度30分钟内变化超过2°C且烟雾报警器未触发时,标记为传感器疑似故障而非火灾风险,避免误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次读数丢失(None),疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 厨房温度在18:30为2463(约24.6°C),到19:00突然跳升至2826(约28.3°C),30分钟内飙升约3.6°C,而同一时段客厅和卧室温度均在正常下降,排除全屋环境突变的可能。", "推理步骤2: 灶具(cook_surface)在19:02才开启,但温度跳变发生在19:00,即灶具开启之前。如果是做饭导致升温,温度应在灶具开启之后才上升,时序不匹配。", "推理步骤3: 19:03厨房温度传感器报告MeasuredValue=None(读数丢失),19:30灶具关闭后再次报告2842(约28.4°C),紧接着19:31又一次报告None。短时间内两次出现None值,说明传感器存在间歇性通信故障或硬件异常。", "推理步骤4: 到20:00厨房温度恢复为2412(约24.1°C),与客厅2409基本一致,说明之前的2826/2842高温读数并非真实环境温度,而是传感器的错误读数。", "推理步骤5: 烟雾报警器(kitchen_smoke_alarm)全天无任何触发记录,进一步排除了厨房真实发生高温或火灾的可能性。", "推理步骤6: 其余设备行为均属正常——住户约06:37起床、07:21出门上班、18:16回家、19:02做饭、22:09就寝,入户门锁开关和自动上锁逻辑正确,无入侵迹象。入户门在18:16开锁后一直处于开启状态(BooleanState=False),直到22:09才关闭并自动上锁,虽然时间较长但住户在家期间属于正常行为。"], "key_evidence": ["19:00厨房温度从2463骤升至2826(+3.6°C/30min),而灶具19:02才开启,时序矛盾", "19:03和19:31厨房温度传感器两次报告MeasuredValue=None,出现间歇性读数丢失", "19:30温度读数2842与20:00恢复后的2412相差约4.3°C,虚高读数不可信", "烟雾报警器全天未触发,排除真实高温/火灾风险"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和供电/通信连接,排查间歇性故障原因", "清洁传感器探头,确认其未被油烟、水汽等污染导致读数偏差", "如传感器持续出现None值或异常跳变,建议更换传感器", "在传感器修复前,可临时设置告警规则:当厨房温度30分钟内变化超过2°C且烟雾报警器未触发时,标记为传感器疑似故障而非火灾风险,避免误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.57188582420349, "api_error": null} {"episode_id": "SQ3_TN_A_0707", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0707.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261336, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息模式正常——约 06:28 起床、07:16 出门上班、18:03 回家、22:01 就寝,符合典型上班族一室一厅的生活节奏。\",\n \"推理步骤2: 入侵排查——全天仅有两次开门事件(07:16 出门、18:03 回家),门锁均为 Manual 解锁且出门后自动上锁,住户不在家期间(07:16–18:03)无任何运动传感器触发、无门窗打开事件,排除入侵。\",\n \"推理步骤3: 火灾风险排查——19:07 开灶做饭、19:32 关灶,持续约 25 分钟,烟雾报警器全天未触发,灶具使用时长合理,排除火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——19:00 厨房温度从前一读数 24.62°C 突然跳至 28.36°C(跳升约 3.7°C),而此时灶具尚未开启(19:07 才开)。随后 19:08 和 19:33 两次报告 MeasuredValue = None(空值),说明传感器读数丢失。19:30 又报出 28.31°C 的高温。直到 20:00 恢复到 24.07°C 的正常水平。这种在灶具开启前就出现的异常高温跳变,加上两次 null 读数,指向传感器本身故障。\",\n \"推理步骤5: 漏水排查——卫生间漏水传感器全天无触发,排除漏水。\",\n \"推理步骤6: 其他设备行为均正常——空调制冷模式开启后室温逐步下降、窗帘按作息开合、洗碗机晚间运行、卧室灯 22:38 关闭后 22:45 调至低亮度(夜灯),均为合理行为。\",\n \"推理步骤7: 入户门在 18:03 开门后直到 22:01 才关闭上锁,中间约 4 小时门处于未关状态(BooleanState.StateValue 未恢复 True),这是一个轻微的安全隐患,但更可能是住户习惯(回家后未随手关门或虚掩),不构成威胁事件。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数从 ~24.6°C 突跳至 28.36°C,此时灶具尚未开启(19:07 才开)\",\n \"19:08 和 19:33 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数丢失\",\n \"19:30 厨房温度仍为 28.31°C 的异常高值,20:00 恢复正常(24.07°C)\",\n \"入户门 18:03 开启后至 22:01 才关闭上锁,长时间处于未闭合状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰,或传感器本身存在硬件故障\",\n \"观察厨房温度传感器后续是否继续出现 null 值或异常跳变,若持续出现建议更换传感器\",\n \"建议设置入户门未关闭超时提醒(如开门超过 5 分钟未关闭则推送通知),提升居家安全性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 住户作息模式正常——约 06:28 起床、07:16 出门上班、18:03 回家、22:01 就寝,符合典型上班族一室一厅的生活节奏。", "推理步骤2: 入侵排查——全天仅有两次开门事件(07:16 出门、18:03 回家),门锁均为 Manual 解锁且出门后自动上锁,住户不在家期间(07:16–18:03)无任何运动传感器触发、无门窗打开事件,排除入侵。", "推理步骤3: 火灾风险排查——19:07 开灶做饭、19:32 关灶,持续约 25 分钟,烟雾报警器全天未触发,灶具使用时长合理,排除火灾风险。", "推理步骤4: 厨房温度传感器异常——19:00 厨房温度从前一读数 24.62°C 突然跳至 28.36°C(跳升约 3.7°C),而此时灶具尚未开启(19:07 才开)。随后 19:08 和 19:33 两次报告 MeasuredValue = None(空值),说明传感器读数丢失。19:30 又报出 28.31°C 的高温。直到 20:00 恢复到 24.07°C 的正常水平。这种在灶具开启前就出现的异常高温跳变,加上两次 null 读数,指向传感器本身故障。", "推理步骤5: 漏水排查——卫生间漏水传感器全天无触发,排除漏水。", "推理步骤6: 其他设备行为均正常——空调制冷模式开启后室温逐步下降、窗帘按作息开合、洗碗机晚间运行、卧室灯 22:38 关闭后 22:45 调至低亮度(夜灯),均为合理行为。", "推理步骤7: 入户门在 18:03 开门后直到 22:01 才关闭上锁,中间约 4 小时门处于未关状态(BooleanState.StateValue 未恢复 True),这是一个轻微的安全隐患,但更可能是住户习惯(回家后未随手关门或虚掩),不构成威胁事件。"], "key_evidence": ["19:00 厨房温度传感器读数从 ~24.6°C 突跳至 28.36°C,此时灶具尚未开启(19:07 才开)", "19:08 和 19:33 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数丢失", "19:30 厨房温度仍为 28.31°C 的异常高值,20:00 恢复正常(24.07°C)", "入户门 18:03 开启后至 22:01 才关闭上锁,长时间处于未闭合状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰,或传感器本身存在硬件故障", "观察厨房温度传感器后续是否继续出现 null 值或异常跳变,若持续出现建议更换传感器", "建议设置入户门未关闭超时提醒(如开门超过 5 分钟未关闭则推送通知),提升居家安全性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.827504873275757, "api_error": null} {"episode_id": "SQ3_TN_A_0705", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0705.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261334, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:28 起床,07:31 出门上班(门锁手动开锁、自动回锁),18:25 回家,21:53 进卧室准备就寝,22:30 关灯睡觉。所有人员活动事件与单人一室一厅的作息高度吻合,无入侵迹象。\",\n \"推理步骤2: 入户门在住户外出(07:31)和就寝(21:53)时均自动上锁(LockState=1),全天无异常开锁事件,排除入侵威胁。\",\n \"推理步骤3: 温度趋势整体合理——凌晨约 22°C,白天随气温升至 25-26°C 峰值(约 12:00-13:00),傍晚回落。客厅开空调(18:25,制冷模式 SystemMode=3)后温度从 24.6°C 逐步降至 23.2°C,符合预期。\",\n \"推理步骤4: 关键异常——厨房温度传感器在 18:00 突然从 24.85°C 跳升至 28.50°C(+3.65°C),而同一时刻客厅仅 24.55°C、卧室 23.64°C。此时灶具尚未开启(18:56 才开),且住户刚到家还在客厅,厨房无人操作,这一跳变缺乏合理热源解释。\",\n \"推理步骤5: 18:30 厨房温度仍维持 28.50°C 不变(与 18:00 完全相同的 2850),这种精确重复的读数本身就不自然,正常传感器应有微小波动。\",\n \"推理步骤6: 18:57 灶具刚开启约 30 秒后,厨房温度传感器报告 None(空值);19:52 灶具关闭后再次报告 None。两次 None 值表明传感器在特定条件下无法正常采样,可能存在硬件故障、通信中断或受热干扰。\",\n \"推理步骤7: 19:00 传感器恢复后读数为 24.26°C,与客厅 24.37°C 基本一致,说明 18:00 的 28.50°C 并非真实环境温度,进一步佐证传感器异常。\",\n \"推理步骤8: 烟雾报警器全天未触发,灶具使用时间合理(18:56-19:51,约 55 分钟),排除火灾风险。漏水传感器无报警,排除水患。\",\n \"推理步骤9: 22:42 卧室灯在已关闭状态下报告 LevelControl.CurrentLevel=10,但此前 22:30 已执行 OnOff=False。这可能是住户睡前重新调至极低亮度作为夜灯,属于正常使用,不构成异常。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.85°C 骤升至 28.50°C,此时灶具未开、厨房无人活动,缺乏合理热源\",\n \"18:30 厨房温度读数与 18:00 完全相同(均为 2850),缺乏正常波动\",\n \"18:57 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,表明采样失败\",\n \"19:00 恢复后读数回落至 24.26°C,与相邻房间一致,说明 28.50°C 为虚假读数\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射处)导致局部高温\",\n \"检查传感器的 Matter 通信连接质量,查看是否有频繁掉线或重连记录\",\n \"考虑对厨房温度传感器进行固件更新或硬件更换,两次 None 值提示可能存在硬件级故障\",\n \"在传感器修复前,可适当增加烟雾报警器的灵敏度作为厨房安全的补偿监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:28 起床,07:31 出门上班(门锁手动开锁、自动回锁),18:25 回家,21:53 进卧室准备就寝,22:30 关灯睡觉。所有人员活动事件与单人一室一厅的作息高度吻合,无入侵迹象。", "推理步骤2: 入户门在住户外出(07:31)和就寝(21:53)时均自动上锁(LockState=1),全天无异常开锁事件,排除入侵威胁。", "推理步骤3: 温度趋势整体合理——凌晨约 22°C,白天随气温升至 25-26°C 峰值(约 12:00-13:00),傍晚回落。客厅开空调(18:25,制冷模式 SystemMode=3)后温度从 24.6°C 逐步降至 23.2°C,符合预期。", "推理步骤4: 关键异常——厨房温度传感器在 18:00 突然从 24.85°C 跳升至 28.50°C(+3.65°C),而同一时刻客厅仅 24.55°C、卧室 23.64°C。此时灶具尚未开启(18:56 才开),且住户刚到家还在客厅,厨房无人操作,这一跳变缺乏合理热源解释。", "推理步骤5: 18:30 厨房温度仍维持 28.50°C 不变(与 18:00 完全相同的 2850),这种精确重复的读数本身就不自然,正常传感器应有微小波动。", "推理步骤6: 18:57 灶具刚开启约 30 秒后,厨房温度传感器报告 None(空值);19:52 灶具关闭后再次报告 None。两次 None 值表明传感器在特定条件下无法正常采样,可能存在硬件故障、通信中断或受热干扰。", "推理步骤7: 19:00 传感器恢复后读数为 24.26°C,与客厅 24.37°C 基本一致,说明 18:00 的 28.50°C 并非真实环境温度,进一步佐证传感器异常。", "推理步骤8: 烟雾报警器全天未触发,灶具使用时间合理(18:56-19:51,约 55 分钟),排除火灾风险。漏水传感器无报警,排除水患。", "推理步骤9: 22:42 卧室灯在已关闭状态下报告 LevelControl.CurrentLevel=10,但此前 22:30 已执行 OnOff=False。这可能是住户睡前重新调至极低亮度作为夜灯,属于正常使用,不构成异常。"], "key_evidence": ["18:00 厨房温度从 ~24.85°C 骤升至 28.50°C,此时灶具未开、厨房无人活动,缺乏合理热源", "18:30 厨房温度读数与 18:00 完全相同(均为 2850),缺乏正常波动", "18:57 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,表明采样失败", "19:00 恢复后读数回落至 24.26°C,与相邻房间一致,说明 28.50°C 为虚假读数"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射处)导致局部高温", "检查传感器的 Matter 通信连接质量,查看是否有频繁掉线或重连记录", "考虑对厨房温度传感器进行固件更新或硬件更换,两次 None 值提示可能存在硬件级故障", "在传感器修复前,可适当增加烟雾报警器的灵敏度作为厨房安全的补偿监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.238781929016113, "api_error": null} {"episode_id": "SQ3_TN_B_0667", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0667.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261296, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在12:00出现异常高温读数(29.76°C),且做饭期间多次报告None值,疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 过去6小时(约17:30至23:30)的整体活动模式为——傍晚做饭(17:53开灶,18:49关灶并启动洗碗机)、晚间客厅活动、23:06关灯关空调并锁门就寝,属于典型的居家晚间作息,无入侵或异常出入迹象。\",\n \"推理步骤2: 入户门在23:06:25关闭(contact=True),随即自动上锁(LockState=1, OperationSource=Auto),这是正常的自动锁门行为,且全天无异常开锁事件。\",\n \"推理步骤3: 厨房温度传感器在12:00报告2976(29.76°C),而同一时刻其他房间温度均在25.8°C左右,厨房比其他房间高出约4°C。虽然中午做饭(12:15开灶)可能导致厨房升温,但该异常读数出现在开灶之前,且跳变幅度过大(从11:30的25.40°C骤升至29.76°C),不符合自然升温规律。\",\n \"推理步骤4: 厨房温度传感器在做饭期间多次报告MeasuredValue=None(09:18、09:26、12:16、12:47、17:54、18:50),每次都与灶具开关操作时间高度吻合。这表明传感器可能受到灶具热辐射或电磁干扰影响,导致读数溢出或采集失败。\",\n \"推理步骤5: 12:30时厨房温度仍为2973(29.73°C),灶具在12:46关闭后,13:00恢复到25.62°C。温度在关灶后14分钟内骤降4°C以上,降温速度异常快,进一步佐证12:00和12:30的高温读数可能是传感器受干扰产生的虚假值,而非真实环境温度。\",\n \"推理步骤6: 烟雾报警器全天未触发任何告警,排除了真实火灾或燃气泄漏的可能性。厨房窗户在每次做饭后都有开窗通风(contact=False),属于正常操作。\",\n \"推理步骤7: 其余设备行为均正常——客厅空调制冷运行(SystemMode=3)、洗碗机正常启动、卫生间使用时间合理(08:53-09:17约24分钟)、漏水传感器无报警。\"\n ],\n \"key_evidence\": [\n \"12:00厨房温度传感器读数2976(29.76°C),较其他房间高约4°C,且出现在开灶(12:15)之前,跳变异常\",\n \"厨房温度传感器在灶具操作期间多次报告None值(09:18、09:26、12:16、12:47、17:54、18:50),与灶具开关时间高度关联\",\n \"12:46关灶后仅14分钟厨房温度从29.73°C骤降至25.62°C,降温速率不符合物理规律\",\n \"烟雾报警器全天未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,建议将其移至远离热源和电磁干扰的位置\",\n \"对厨房温度传感器进行校准或更换,排除硬件老化导致的间歇性故障\",\n \"考虑为厨房温度传感器设置合理的异常值过滤规则(如30秒内温度变化超过2°C则标记为可疑读数),避免虚假高温触发不必要的告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在12:00出现异常高温读数(29.76°C),且做饭期间多次报告None值,疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 过去6小时(约17:30至23:30)的整体活动模式为——傍晚做饭(17:53开灶,18:49关灶并启动洗碗机)、晚间客厅活动、23:06关灯关空调并锁门就寝,属于典型的居家晚间作息,无入侵或异常出入迹象。", "推理步骤2: 入户门在23:06:25关闭(contact=True),随即自动上锁(LockState=1, OperationSource=Auto),这是正常的自动锁门行为,且全天无异常开锁事件。", "推理步骤3: 厨房温度传感器在12:00报告2976(29.76°C),而同一时刻其他房间温度均在25.8°C左右,厨房比其他房间高出约4°C。虽然中午做饭(12:15开灶)可能导致厨房升温,但该异常读数出现在开灶之前,且跳变幅度过大(从11:30的25.40°C骤升至29.76°C),不符合自然升温规律。", "推理步骤4: 厨房温度传感器在做饭期间多次报告MeasuredValue=None(09:18、09:26、12:16、12:47、17:54、18:50),每次都与灶具开关操作时间高度吻合。这表明传感器可能受到灶具热辐射或电磁干扰影响,导致读数溢出或采集失败。", "推理步骤5: 12:30时厨房温度仍为2973(29.73°C),灶具在12:46关闭后,13:00恢复到25.62°C。温度在关灶后14分钟内骤降4°C以上,降温速度异常快,进一步佐证12:00和12:30的高温读数可能是传感器受干扰产生的虚假值,而非真实环境温度。", "推理步骤6: 烟雾报警器全天未触发任何告警,排除了真实火灾或燃气泄漏的可能性。厨房窗户在每次做饭后都有开窗通风(contact=False),属于正常操作。", "推理步骤7: 其余设备行为均正常——客厅空调制冷运行(SystemMode=3)、洗碗机正常启动、卫生间使用时间合理(08:53-09:17约24分钟)、漏水传感器无报警。"], "key_evidence": ["12:00厨房温度传感器读数2976(29.76°C),较其他房间高约4°C,且出现在开灶(12:15)之前,跳变异常", "厨房温度传感器在灶具操作期间多次报告None值(09:18、09:26、12:16、12:47、17:54、18:50),与灶具开关时间高度关联", "12:46关灶后仅14分钟厨房温度从29.73°C骤降至25.62°C,降温速率不符合物理规律", "烟雾报警器全天未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,建议将其移至远离热源和电磁干扰的位置", "对厨房温度传感器进行校准或更换,排除硬件老化导致的间歇性故障", "考虑为厨房温度传感器设置合理的异常值过滤规则(如30秒内温度变化超过2°C则标记为可疑读数),避免虚假高温触发不必要的告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.98382544517517, "api_error": null} {"episode_id": "SQ3_TN_A_0710", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_A_0710.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261339, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在 18:00 突然从 2490(24.90°C)跳升至 2858(28.58°C),涨幅约 3.7°C,而同一时刻客厅和卧室温度仅有正常的缓慢下降趋势。这种单一房间的突变不符合自然温度变化规律。\",\n \"推理步骤2: 18:30 厨房温度继续维持在 2861(28.61°C)的高位,但此时灶具尚未开启(灶具在 18:47 才打开),排除了烹饪导致升温的可能。这意味着要么传感器本身出现漂移/故障,要么厨房存在其他未被记录的热源。\",\n \"推理步骤3: 18:48 灶具刚开启约 30 秒后,厨房温度传感器报告 MeasuredValue = None,表示读数丢失。19:00 温度恢复正常(2445),说明传感器短暂恢复。但 19:42(灶具关闭后约 1 分钟)再次出现 None 读数,20:00 又恢复为 2410。两次 None 读数高度可疑。\",\n \"推理步骤4: 烟雾报警器全天未触发任何告警,排除了火灾或烟雾事件。18:00 的异常高温如果是真实环境温度,烟雾报警器未响应也侧面说明这更可能是传感器故障而非真实火险。\",\n \"推理步骤5: 其余设备行为均正常——住户约 06:41 起床、07:31 出门(门锁手动开锁后自动上锁)、18:10 回家(开门、开灯、开空调)、22:08 进卧室准备睡觉、22:58 关灯入睡,完全符合独居上班族的日常作息模式。入户门在住户外出期间无任何异常开锁事件,无入侵迹象。\",\n \"推理步骤6: 入户门在 18:10 开门后直到 22:08 才记录到关门上锁(StateValue=True),中间约 4 小时门的接触传感器未报告关闭。但考虑到住户回家后可能只是关门未触发传感器更新(或日志仅记录状态变化),这一点需要关注但不构成主要威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.9°C 骤升至 28.58°C,而灶具直到 18:47 才开启,且客厅/卧室温度无对应变化\",\n \"18:30 厨房温度维持 28.61°C 高位,进一步确认异常非瞬时波动\",\n \"18:48 和 19:42 厨房温度传感器两次报告 MeasuredValue = None(数据丢失),间隔约 54 分钟\",\n \"19:00 和 20:00 温度恢复正常值(24.45°C / 24.10°C),说明传感器间歇性工作\",\n \"烟雾报警器全天无告警,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态(电池电量、连接稳定性、安装位置),两次 None 读数和异常高温强烈提示传感器需要维护或更换\",\n \"排查厨房在 18:00 前后是否存在未被监控的热源(如阳光直射传感器、热水管道等),确认异常高温的根因\",\n \"考虑为厨房温度传感器设置异常值告警规则:当温度在 30 分钟内变化超过 3°C 或出现 None 读数时自动通知住户\",\n \"确认入户门接触传感器工作正常——住户 18:10 进门后到 22:08 之间门传感器未报告关闭状态,建议检查是否存在传感器延迟或遗漏\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 厨房温度在 18:00 突然从 2490(24.90°C)跳升至 2858(28.58°C),涨幅约 3.7°C,而同一时刻客厅和卧室温度仅有正常的缓慢下降趋势。这种单一房间的突变不符合自然温度变化规律。", "推理步骤2: 18:30 厨房温度继续维持在 2861(28.61°C)的高位,但此时灶具尚未开启(灶具在 18:47 才打开),排除了烹饪导致升温的可能。这意味着要么传感器本身出现漂移/故障,要么厨房存在其他未被记录的热源。", "推理步骤3: 18:48 灶具刚开启约 30 秒后,厨房温度传感器报告 MeasuredValue = None,表示读数丢失。19:00 温度恢复正常(2445),说明传感器短暂恢复。但 19:42(灶具关闭后约 1 分钟)再次出现 None 读数,20:00 又恢复为 2410。两次 None 读数高度可疑。", "推理步骤4: 烟雾报警器全天未触发任何告警,排除了火灾或烟雾事件。18:00 的异常高温如果是真实环境温度,烟雾报警器未响应也侧面说明这更可能是传感器故障而非真实火险。", "推理步骤5: 其余设备行为均正常——住户约 06:41 起床、07:31 出门(门锁手动开锁后自动上锁)、18:10 回家(开门、开灯、开空调)、22:08 进卧室准备睡觉、22:58 关灯入睡,完全符合独居上班族的日常作息模式。入户门在住户外出期间无任何异常开锁事件,无入侵迹象。", "推理步骤6: 入户门在 18:10 开门后直到 22:08 才记录到关门上锁(StateValue=True),中间约 4 小时门的接触传感器未报告关闭。但考虑到住户回家后可能只是关门未触发传感器更新(或日志仅记录状态变化),这一点需要关注但不构成主要威胁。"], "key_evidence": ["18:00 厨房温度从 ~24.9°C 骤升至 28.58°C,而灶具直到 18:47 才开启,且客厅/卧室温度无对应变化", "18:30 厨房温度维持 28.61°C 高位,进一步确认异常非瞬时波动", "18:48 和 19:42 厨房温度传感器两次报告 MeasuredValue = None(数据丢失),间隔约 54 分钟", "19:00 和 20:00 温度恢复正常值(24.45°C / 24.10°C),说明传感器间歇性工作", "烟雾报警器全天无告警,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的硬件状态(电池电量、连接稳定性、安装位置),两次 None 读数和异常高温强烈提示传感器需要维护或更换", "排查厨房在 18:00 前后是否存在未被监控的热源(如阳光直射传感器、热水管道等),确认异常高温的根因", "考虑为厨房温度传感器设置异常值告警规则:当温度在 30 分钟内变化超过 3°C 或出现 None 读数时自动通知住户", "确认入户门接触传感器工作正常——住户 18:10 进门后到 22:08 之间门传感器未报告关闭状态,建议检查是否存在传感器延迟或遗漏"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.35019874572754, "api_error": null} {"episode_id": "SQ3_TN_B_0672", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0672.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261301, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有房间温度变化符合自然昼夜温度波动规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器的 MeasuredValue 数据,无门锁、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件触发记录。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.87°C(中午高点),波动约 3°C,属于夏季(6月21日)正常的昼夜温差范围。\",\n \"推理步骤3: 温度变化趋势呈现典型的日间升温、夜间降温曲线——凌晨 00:00-05:30 维持在 22.9-23.1°C 低位,06:00 起随日出快速升温,12:00-12:30 达到峰值约 25.8°C,午后逐步回落,至 23:30 降回约 23.3°C。\",\n \"推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度高度一致,同一时刻各传感器读数差异通常在 0.1-0.2°C 以内,说明传感器工作正常,不存在单个传感器异常偏高或偏低的故障情况。\",\n \"推理步骤5: 未出现任何突发性温度骤升(如火灾特征的快速升温)或骤降(如门窗异常打开导致的冷空气灌入),也没有厨房温度单独异常升高的情况(排除灶具相关风险)。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.90°C - 25.87°C,波动幅度约 3°C,符合夏季自然昼夜温差\",\n \"四个传感器温度走势高度同步,无单点异常偏离\",\n \"温度变化曲线平滑,无突发骤升骤降,不存在火灾或设备故障特征\",\n \"整个日志周期内无任何安全类设备(门锁、烟雾报警器、漏水传感器、运动传感器)的事件触发\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭环境温度正常\",\n \"可考虑在午间高温时段(11:00-14:00,室温超过 25.5°C)设置空调自动开启规则以提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有房间温度变化符合自然昼夜温度波动规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器的 MeasuredValue 数据,无门锁、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件触发记录。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.87°C(中午高点),波动约 3°C,属于夏季(6月21日)正常的昼夜温差范围。", "推理步骤3: 温度变化趋势呈现典型的日间升温、夜间降温曲线——凌晨 00:00-05:30 维持在 22.9-23.1°C 低位,06:00 起随日出快速升温,12:00-12:30 达到峰值约 25.8°C,午后逐步回落,至 23:30 降回约 23.3°C。", "推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度高度一致,同一时刻各传感器读数差异通常在 0.1-0.2°C 以内,说明传感器工作正常,不存在单个传感器异常偏高或偏低的故障情况。", "推理步骤5: 未出现任何突发性温度骤升(如火灾特征的快速升温)或骤降(如门窗异常打开导致的冷空气灌入),也没有厨房温度单独异常升高的情况(排除灶具相关风险)。"], "key_evidence": ["全天温度范围 22.90°C - 25.87°C,波动幅度约 3°C,符合夏季自然昼夜温差", "四个传感器温度走势高度同步,无单点异常偏离", "温度变化曲线平滑,无突发骤升骤降,不存在火灾或设备故障特征", "整个日志周期内无任何安全类设备(门锁、烟雾报警器、漏水传感器、运动传感器)的事件触发"], "recommended_actions": ["当前无需采取任何措施,家庭环境温度正常", "可考虑在午间高温时段(11:00-14:00,室温超过 25.5°C)设置空调自动开启规则以提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.69055938720703, "api_error": null} {"episode_id": "SQ3_TN_B_0683", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0683.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261312, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2450(24.5°C)跳升至 2829(28.29°C),而此时灶具尚未开启(19:15 才开),其他房间温度正常下降,说明该跳变不是环境温度变化所致\",\n \"推理步骤2: 19:16 灶具开启后仅 1 分钟,厨房温度传感器报告 None(空值),这是非正常的传感器行为,正常传感器不应输出 None\",\n \"推理步骤3: 19:30 灶具关闭后,传感器再次报告 2835(28.35°C),随后 19:31 又报告 None,说明传感器在高温环境下工作不稳定,存在间歇性故障\",\n \"推理步骤4: 20:00 之后厨房温度恢复到与其他房间一致的正常范围(~2407),传感器恢复正常上报,进一步印证是传感器在特定条件下的故障而非持续性环境异常\",\n \"推理步骤5: 其余所有设备行为均正常——住户早晨 7:10 出门、傍晚 18:07 回家、晚间做饭、21:51 关灯锁门的生活模式合理,门锁操作均为正常手动/自动操作,无入侵迹象\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2450 跳至 2829,灶具尚未开启,其他房间温度正常\",\n \"19:16 和 19:31 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 灶具已关闭但温度仍为 2835,随后再次 None,表明传感器读数不可靠\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰\",\n \"观察传感器是否持续出现 None 值,若反复出现建议更换传感器或重新校准\",\n \"考虑为厨房温度传感器设置合理阈值告警,当读数突变超过 3°C/30min 时触发通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2450(24.5°C)跳升至 2829(28.29°C),而此时灶具尚未开启(19:15 才开),其他房间温度正常下降,说明该跳变不是环境温度变化所致", "推理步骤2: 19:16 灶具开启后仅 1 分钟,厨房温度传感器报告 None(空值),这是非正常的传感器行为,正常传感器不应输出 None", "推理步骤3: 19:30 灶具关闭后,传感器再次报告 2835(28.35°C),随后 19:31 又报告 None,说明传感器在高温环境下工作不稳定,存在间歇性故障", "推理步骤4: 20:00 之后厨房温度恢复到与其他房间一致的正常范围(~2407),传感器恢复正常上报,进一步印证是传感器在特定条件下的故障而非持续性环境异常", "推理步骤5: 其余所有设备行为均正常——住户早晨 7:10 出门、傍晚 18:07 回家、晚间做饭、21:51 关灯锁门的生活模式合理,门锁操作均为正常手动/自动操作,无入侵迹象"], "key_evidence": ["19:00 厨房温度从 2450 跳至 2829,灶具尚未开启,其他房间温度正常", "19:16 和 19:31 厨房温度传感器两次报告 MeasuredValue = None", "19:30 灶具已关闭但温度仍为 2835,随后再次 None,表明传感器读数不可靠"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰", "观察传感器是否持续出现 None 值,若反复出现建议更换传感器或重新校准", "考虑为厨房温度传感器设置合理阈值告警,当读数突变超过 3°C/30min 时触发通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.98679542541504, "api_error": null} {"episode_id": "SQ3_TN_B_0688", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0688.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261317, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(约28.6°C),随后两次报告null值,疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(18:00-23:30)的温度数据。在18:00时刻,厨房温度传感器突然从约24.6°C跳升至28.59°C(MeasuredValue=2859),而同一时刻其他三个房间的温度均在24.5-24.6°C范围内,厨房与其他房间出现约4°C的异常温差。\",\n \"推理步骤2: 该异常高温在18:30仍然持续(2861,约28.6°C),但此时灶具尚未开启(灶具在18:48才打开),排除了烹饪导致升温的可能性。这意味着要么传感器本身出现故障读数,要么厨房存在未被记录的热源。\",\n \"推理步骤3: 在18:49和19:26两个时刻,厨房温度传感器报告了MeasuredValue=None(空值),这是明显的设备异常——正常传感器不应返回null。两次null读数分别出现在灶具开启后1分钟和灶具关闭后1分钟,可能与灶具运行产生的热量或电磁干扰有关。\",\n \"推理步骤4: 19:00之后厨房温度恢复正常(2436),与其他房间温度一致,后续读数也完全正常。说明这不是持续性的火灾风险,而更像是传感器的间歇性故障。\",\n \"推理步骤5: 烟雾报警器在整个时段内未触发任何告警,进一步排除了真实火灾或烟雾风险,支持传感器故障的判断。\",\n \"推理步骤6: 其他设备行为均正常——住户约18:03回家(开门、开灯、开空调),18:48-19:25做饭,20:02启动洗碗机,22:10关灯就寝,属于典型的晚间生活模式。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度突增至2859(28.59°C),比同时刻其他房间高出约4°C,且灶具尚未开启\",\n \"18:30厨房温度仍为2861(28.61°C),异常持续\",\n \"18:49和19:26厨房温度传感器两次报告MeasuredValue=None,正常传感器不应出现空值\",\n \"烟雾报警器全天无告警,排除真实火灾风险\",\n \"19:00后厨房温度恢复正常(2436),与其他房间一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温读数\",\n \"排查传感器硬件状态,两次null值报告提示可能存在通信不稳定或传感器老化问题,建议重启或更换传感器\",\n \"监控未来几天厨房温度传感器的读数,确认异常是否复现;如频繁出现null值或异常跳变,应尽快更换\",\n \"虽然本次烟雾报警器未触发,但温度传感器异常会削弱火灾预警能力,建议在传感器修复前适当提高烟雾报警器的监控频率\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(约28.6°C),随后两次报告null值,疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 分析过去6小时(18:00-23:30)的温度数据。在18:00时刻,厨房温度传感器突然从约24.6°C跳升至28.59°C(MeasuredValue=2859),而同一时刻其他三个房间的温度均在24.5-24.6°C范围内,厨房与其他房间出现约4°C的异常温差。", "推理步骤2: 该异常高温在18:30仍然持续(2861,约28.6°C),但此时灶具尚未开启(灶具在18:48才打开),排除了烹饪导致升温的可能性。这意味着要么传感器本身出现故障读数,要么厨房存在未被记录的热源。", "推理步骤3: 在18:49和19:26两个时刻,厨房温度传感器报告了MeasuredValue=None(空值),这是明显的设备异常——正常传感器不应返回null。两次null读数分别出现在灶具开启后1分钟和灶具关闭后1分钟,可能与灶具运行产生的热量或电磁干扰有关。", "推理步骤4: 19:00之后厨房温度恢复正常(2436),与其他房间温度一致,后续读数也完全正常。说明这不是持续性的火灾风险,而更像是传感器的间歇性故障。", "推理步骤5: 烟雾报警器在整个时段内未触发任何告警,进一步排除了真实火灾或烟雾风险,支持传感器故障的判断。", "推理步骤6: 其他设备行为均正常——住户约18:03回家(开门、开灯、开空调),18:48-19:25做饭,20:02启动洗碗机,22:10关灯就寝,属于典型的晚间生活模式。"], "key_evidence": ["18:00厨房温度突增至2859(28.59°C),比同时刻其他房间高出约4°C,且灶具尚未开启", "18:30厨房温度仍为2861(28.61°C),异常持续", "18:49和19:26厨房温度传感器两次报告MeasuredValue=None,正常传感器不应出现空值", "烟雾报警器全天无告警,排除真实火灾风险", "19:00后厨房温度恢复正常(2436),与其他房间一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温读数", "排查传感器硬件状态,两次null值报告提示可能存在通信不稳定或传感器老化问题,建议重启或更换传感器", "监控未来几天厨房温度传感器的读数,确认异常是否复现;如频繁出现null值或异常跳变,应尽快更换", "虽然本次烟雾报警器未触发,但温度传感器异常会削弱火灾预警能力,建议在传感器修复前适当提高烟雾报警器的监控频率"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.435834407806396, "api_error": null} {"episode_id": "SQ3_TN_B_0695", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0695.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261324, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在异常:多次报告 None 值,且在 12:00 出现突发高温读数(29.70°C),疑似传感器故障或灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 温度整体趋势合理——凌晨约 22.9-23.1°C,白天升至峰值约 25.8°C,傍晚回落,符合夏季(6月28日)昼夜温度变化规律。各房间温度高度一致,无单一房间异常升温的火灾迹象。\",\n \"推理步骤2: 厨房温度传感器在 09:07、09:52、12:03、12:38、18:04、18:38 共 6 次报告 MeasuredValue = None。每次都发生在灶具开启后或关闭/开窗后不久。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受热辐射干扰导致读数溢出,或存在通信/硬件故障。\",\n \"推理步骤3: 12:00 厨房温度突然跳至 2970(29.70°C),而同一时刻其他房间均在 25.7-25.8°C 范围内,厨房比其他房间高出约 4°C。12:30 仍为 2973(29.73°C),但灶具关闭、开窗通风后 13:00 回落至 25.64°C,与其他房间一致。这一突发高温可能是灶具热量影响传感器,但幅度偏大(从 25.1°C 瞬间跳到 29.7°C),也可能是传感器读数漂移的表现。\",\n \"推理步骤4: 住户行为模式正常——早晨 08:57 起床(卫生间活动),09:06 做早餐,12:02 做午餐,18:03 做晚餐,三餐规律。做完饭后开窗通风是合理习惯。18:37 启动洗碗机也属正常。\",\n \"推理步骤5: 23:11 客厅灯和空调关闭后,入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),这是就寝前的正常离开客厅/锁门流程,无入侵迹象。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,入户门锁无异常开锁事件,阳台门传感器无异常,整体安防状态良好。\",\n \"推理步骤7: 唯一值得关注的是厨房温度传感器的 None 值和 12:00 的异常高温读数。虽然不构成即时安全威胁,但传感器故障会导致无法及时检测厨房真实的高温异常(如火灾),属于安全监控盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(09:07, 09:52, 12:03, 12:38, 18:04, 18:38)\",\n \"12:00 厨房温度突跳至 29.70°C,较其他房间高约 4°C,12:30 仍维持 29.73°C,13:00 恢复正常\",\n \"其他所有传感器全天无 None 值,读数平稳,仅厨房传感器存在此问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰,必要时重新定位\",\n \"对厨房温度传感器进行硬件诊断或固件更新,排查 None 值的根本原因(通信超时、读数溢出等)\",\n \"如传感器持续异常,建议更换设备,确保厨房温度监控不出现盲区,以配合烟雾报警器形成完整的厨房安全防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在异常:多次报告 None 值,且在 12:00 出现突发高温读数(29.70°C),疑似传感器故障或灶具热辐射干扰。", "reasoning": ["推理步骤1: 温度整体趋势合理——凌晨约 22.9-23.1°C,白天升至峰值约 25.8°C,傍晚回落,符合夏季(6月28日)昼夜温度变化规律。各房间温度高度一致,无单一房间异常升温的火灾迹象。", "推理步骤2: 厨房温度传感器在 09:07、09:52、12:03、12:38、18:04、18:38 共 6 次报告 MeasuredValue = None。每次都发生在灶具开启后或关闭/开窗后不久。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受热辐射干扰导致读数溢出,或存在通信/硬件故障。", "推理步骤3: 12:00 厨房温度突然跳至 2970(29.70°C),而同一时刻其他房间均在 25.7-25.8°C 范围内,厨房比其他房间高出约 4°C。12:30 仍为 2973(29.73°C),但灶具关闭、开窗通风后 13:00 回落至 25.64°C,与其他房间一致。这一突发高温可能是灶具热量影响传感器,但幅度偏大(从 25.1°C 瞬间跳到 29.7°C),也可能是传感器读数漂移的表现。", "推理步骤4: 住户行为模式正常——早晨 08:57 起床(卫生间活动),09:06 做早餐,12:02 做午餐,18:03 做晚餐,三餐规律。做完饭后开窗通风是合理习惯。18:37 启动洗碗机也属正常。", "推理步骤5: 23:11 客厅灯和空调关闭后,入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),这是就寝前的正常离开客厅/锁门流程,无入侵迹象。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,入户门锁无异常开锁事件,阳台门传感器无异常,整体安防状态良好。", "推理步骤7: 唯一值得关注的是厨房温度传感器的 None 值和 12:00 的异常高温读数。虽然不构成即时安全威胁,但传感器故障会导致无法及时检测厨房真实的高温异常(如火灾),属于安全监控盲区。"], "key_evidence": ["厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(09:07, 09:52, 12:03, 12:38, 18:04, 18:38)", "12:00 厨房温度突跳至 29.70°C,较其他房间高约 4°C,12:30 仍维持 29.73°C,13:00 恢复正常", "其他所有传感器全天无 None 值,读数平稳,仅厨房传感器存在此问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰,必要时重新定位", "对厨房温度传感器进行硬件诊断或固件更新,排查 None 值的根本原因(通信超时、读数溢出等)", "如传感器持续异常,建议更换设备,确保厨房温度监控不出现盲区,以配合烟雾报警器形成完整的厨房安全防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.732747554779053, "api_error": null} {"episode_id": "SQ3_TN_B_0704", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0704.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261333, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或局部过热事件\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2454(24.54°C)跳升至 2836(28.36°C),而同一时刻其他房间温度仍在 24.4°C 左右,温差接近 4°C,远超正常室间差异\",\n \"推理步骤2: 19:14 灶具开启前(19:00)温度已经异常升高,说明该跳变并非由灶具使用引起;灶具开启后 19:15 和 19:32 传感器连续两次报告 None(空值),表明传感器读数丢失\",\n \"推理步骤3: 19:30 传感器恢复报告时仍为 2841(28.41°C),但 19:31 灶具关闭、19:31:30 窗户打开通风后,20:00 温度回落至 2416(24.16°C),说明通风有效但传感器在灶具运行期间无法正常工作\",\n \"推理步骤4: 烟雾报警器全天未触发,排除真实火灾风险;但传感器出现 None 值属于设备异常状态,可能是高温导致传感器暂时失灵或通信故障\",\n \"推理步骤5: 其余行为模式正常——住户约 06:33 起床、07:34 出门上班、18:28 回家、19:14 做饭、22:05 关灯就寝,门锁开关和运动传感器均与正常生活节奏吻合\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.5°C 突跳至 28.36°C(灶具尚未开启)\",\n \"19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None(读数丢失)\",\n \"19:30 灶具运行期间温度仍为 28.41°C,与其他房间差距约 4°C\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致异常升温\",\n \"排查传感器固件或通信模块状态,连续两次 None 值可能表示硬件故障或需要重新配对\",\n \"考虑在灶具附近增加耐高温传感器或调整现有传感器位置,避免烹饪时读数丢失影响安全监测\",\n \"持续观察未来几天该传感器是否再次出现 None 值或异常跳变,若反复出现建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 值,疑似传感器故障或局部过热事件", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2454(24.54°C)跳升至 2836(28.36°C),而同一时刻其他房间温度仍在 24.4°C 左右,温差接近 4°C,远超正常室间差异", "推理步骤2: 19:14 灶具开启前(19:00)温度已经异常升高,说明该跳变并非由灶具使用引起;灶具开启后 19:15 和 19:32 传感器连续两次报告 None(空值),表明传感器读数丢失", "推理步骤3: 19:30 传感器恢复报告时仍为 2841(28.41°C),但 19:31 灶具关闭、19:31:30 窗户打开通风后,20:00 温度回落至 2416(24.16°C),说明通风有效但传感器在灶具运行期间无法正常工作", "推理步骤4: 烟雾报警器全天未触发,排除真实火灾风险;但传感器出现 None 值属于设备异常状态,可能是高温导致传感器暂时失灵或通信故障", "推理步骤5: 其余行为模式正常——住户约 06:33 起床、07:34 出门上班、18:28 回家、19:14 做饭、22:05 关灯就寝,门锁开关和运动传感器均与正常生活节奏吻合"], "key_evidence": ["19:00 厨房温度从 ~24.5°C 突跳至 28.36°C(灶具尚未开启)", "19:15 和 19:32 厨房温度传感器报告 MeasuredValue = None(读数丢失)", "19:30 灶具运行期间温度仍为 28.41°C,与其他房间差距约 4°C"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致异常升温", "排查传感器固件或通信模块状态,连续两次 None 值可能表示硬件故障或需要重新配对", "考虑在灶具附近增加耐高温传感器或调整现有传感器位置,避免烹饪时读数丢失影响安全监测", "持续观察未来几天该传感器是否再次出现 None 值或异常跳变,若反复出现建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.388229370117188, "api_error": null} {"episode_id": "SQ3_TN_B_0703", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0703.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261332, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在下午有一段时间处于未关闭/未上锁状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:50、06:54、18:21、18:57 四次报告 MeasuredValue = None。其他三个温度传感器在同一时段均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。\",\n \"推理步骤2: 观察 None 值出现的时机——均紧跟在灶具开启或关闭前后(06:49 灶具开、06:53 灶具关;18:20 灶具开、18:56 灶具关)。推测灶具工作产生的高温或电磁干扰导致传感器短暂失效。虽然在半小时整点采样时传感器恢复了正常数值,但在灶具使用期间传感器处于失效状态,意味着如果此时发生真正的厨房高温异常(如火灾),系统将无法及时检测。\",\n \"推理步骤3: 入户门在 15:58 被手动解锁并打开(contact=False),但直到 22:30:13 才记录到门关闭(contact=True)和自动上锁。中间约 6.5 小时门处于开启/未锁状态。虽然 18:07 有人回家(解锁+开门+玄关运动+客厅运动),说明家中有人活动,但长时间大门未关闭仍存在安全隐患。不过也有可能 15:58 开门后门已关但传感器未触发记录,18:07 再次开门后一直到 22:30 才关门,这段时间住户在家,风险相对可控。\",\n \"推理步骤4: 其余行为模式均属正常——凌晨全屋无人活动、温度自然波动在合理范围(夜间约23°C,午间峰值约25.8°C,符合夏季规律);06:31 起床、06:49 做早餐、07:16 出门并自动锁门;18:07 回家开灯开空调、18:20 做晚餐、19:31 洗碗机启动、22:30 关灯关空调就寝——均为典型的单人工作日生活节奏。\",\n \"推理步骤5: 烟雾报警器全天无触发、漏水传感器无报警、所有门锁操作均为手动或自动(无异常远程解锁),不存在入侵或火灾/水灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:50、06:54、18:21、18:57 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"入户门从 15:58 开启到 22:30:13 才关闭上锁,中间无关门记录,持续约 6.5 小时\",\n \"其他温度传感器在相同时段均正常上报,排除系统级故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰使其间歇性失效,必要时重新定位或更换耐高温型号\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当传感器在灶具工作期间失效时及时通知用户,避免安全监测盲区\",\n \"检查 15:58 至 18:07 期间入户门的实际状态,确认门传感器是否存在漏报;如确实长时间未关门,建议设置大门超时未关提醒(如超过 5 分钟未关门则推送通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在下午有一段时间处于未关闭/未上锁状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:50、06:54、18:21、18:57 四次报告 MeasuredValue = None。其他三个温度传感器在同一时段均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。", "推理步骤2: 观察 None 值出现的时机——均紧跟在灶具开启或关闭前后(06:49 灶具开、06:53 灶具关;18:20 灶具开、18:56 灶具关)。推测灶具工作产生的高温或电磁干扰导致传感器短暂失效。虽然在半小时整点采样时传感器恢复了正常数值,但在灶具使用期间传感器处于失效状态,意味着如果此时发生真正的厨房高温异常(如火灾),系统将无法及时检测。", "推理步骤3: 入户门在 15:58 被手动解锁并打开(contact=False),但直到 22:30:13 才记录到门关闭(contact=True)和自动上锁。中间约 6.5 小时门处于开启/未锁状态。虽然 18:07 有人回家(解锁+开门+玄关运动+客厅运动),说明家中有人活动,但长时间大门未关闭仍存在安全隐患。不过也有可能 15:58 开门后门已关但传感器未触发记录,18:07 再次开门后一直到 22:30 才关门,这段时间住户在家,风险相对可控。", "推理步骤4: 其余行为模式均属正常——凌晨全屋无人活动、温度自然波动在合理范围(夜间约23°C,午间峰值约25.8°C,符合夏季规律);06:31 起床、06:49 做早餐、07:16 出门并自动锁门;18:07 回家开灯开空调、18:20 做晚餐、19:31 洗碗机启动、22:30 关灯关空调就寝——均为典型的单人工作日生活节奏。", "推理步骤5: 烟雾报警器全天无触发、漏水传感器无报警、所有门锁操作均为手动或自动(无异常远程解锁),不存在入侵或火灾/水灾迹象。"], "key_evidence": ["厨房温度传感器在 06:50、06:54、18:21、18:57 四次报告 MeasuredValue = None,均与灶具使用时段重合", "入户门从 15:58 开启到 22:30:13 才关闭上锁,中间无关门记录,持续约 6.5 小时", "其他温度传感器在相同时段均正常上报,排除系统级故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰使其间歇性失效,必要时重新定位或更换耐高温型号", "考虑为厨房温度传感器设置 None 值告警规则,当传感器在灶具工作期间失效时及时通知用户,避免安全监测盲区", "检查 15:58 至 18:07 期间入户门的实际状态,确认门传感器是否存在漏报;如确实长时间未关门,建议设置大门超时未关提醒(如超过 5 分钟未关门则推送通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.719958305358887, "api_error": null} {"episode_id": "SQ3_TN_B_0708", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0708.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261337, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:18:00 突然飙升至 28.6°C(其他房间约 24.5°C),且在灶具使用期间两次报告 None 值,疑似传感器故障或安装位置不当。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.5-25.9°C,午后逐步回落,符合夏季自然温度曲线,各传感器之间偏差很小(通常 <0.2°C),整体正常。\",\n \"推理步骤2: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.6°C,而同一时刻其他三个房间温度仅约 24.5-24.7°C,偏差高达 ~4°C。此时灶具尚未开启(灶具 18:50 才开),且烟雾报警器未触发,排除真实火灾或灶具预热的可能。18:30 仍维持 28.5°C,说明不是瞬时噪声。\",\n \"推理步骤3: 灶具在 18:50 开启后,厨房温度传感器在 18:51 和 19:26 两次报告 MeasuredValue = None(空值),正常传感器不应返回 None。这表明传感器在高温或特定条件下出现读数故障。\",\n \"推理步骤4: 19:00 厨房温度恢复为 24.37°C(与其他房间一致),之后一直正常,说明传感器间歇性故障而非永久损坏。\",\n \"推理步骤5: 住户行为模式完全正常——早晨 6:50 起床洗漱、7:06 去厨房、7:31 出门上班并自动锁门;傍晚 18:01 回家开灯开空调、18:50 做饭、19:25 关灶开窗通风、19:48 启动洗碗机、21:47 关灯锁门就寝。入户门锁均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤6: 其他安全设备状态正常——烟雾报警器未触发、漏水传感器未报警、所有门窗传感器状态合理、门锁操作均有对应的人体感应配合,不存在入侵或其他安全威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数 2860(28.6°C),比同时刻其他房间高约 4°C,且灶具尚未开启\",\n \"18:30 厨房温度仍为 2851(28.51°C),异常持续存在\",\n \"18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None,传感器读数丢失\",\n \"19:00 之后厨房温度恢复正常(2437),与其他房间一致,说明是间歇性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具或热源过近,导致在特定条件下受辐射热影响\",\n \"检查厨房温度传感器固件版本,考虑更新固件或重置设备以解决间歇性 None 值问题\",\n \"如问题反复出现,建议更换厨房温度传感器,避免因读数异常影响烟雾/火灾联动判断的可靠性\",\n \"确认厨房窗户传感器在 19:25 开窗后是否已关闭——日志中未记录关窗事件,夜间窗户可能仍处于打开状态,建议检查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:18:00 突然飙升至 28.6°C(其他房间约 24.5°C),且在灶具使用期间两次报告 None 值,疑似传感器故障或安装位置不当。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.5-25.9°C,午后逐步回落,符合夏季自然温度曲线,各传感器之间偏差很小(通常 <0.2°C),整体正常。", "推理步骤2: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.6°C,而同一时刻其他三个房间温度仅约 24.5-24.7°C,偏差高达 ~4°C。此时灶具尚未开启(灶具 18:50 才开),且烟雾报警器未触发,排除真实火灾或灶具预热的可能。18:30 仍维持 28.5°C,说明不是瞬时噪声。", "推理步骤3: 灶具在 18:50 开启后,厨房温度传感器在 18:51 和 19:26 两次报告 MeasuredValue = None(空值),正常传感器不应返回 None。这表明传感器在高温或特定条件下出现读数故障。", "推理步骤4: 19:00 厨房温度恢复为 24.37°C(与其他房间一致),之后一直正常,说明传感器间歇性故障而非永久损坏。", "推理步骤5: 住户行为模式完全正常——早晨 6:50 起床洗漱、7:06 去厨房、7:31 出门上班并自动锁门;傍晚 18:01 回家开灯开空调、18:50 做饭、19:25 关灶开窗通风、19:48 启动洗碗机、21:47 关灯锁门就寝。入户门锁均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤6: 其他安全设备状态正常——烟雾报警器未触发、漏水传感器未报警、所有门窗传感器状态合理、门锁操作均有对应的人体感应配合,不存在入侵或其他安全威胁。"], "key_evidence": ["18:00 厨房温度传感器读数 2860(28.6°C),比同时刻其他房间高约 4°C,且灶具尚未开启", "18:30 厨房温度仍为 2851(28.51°C),异常持续存在", "18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None,传感器读数丢失", "19:00 之后厨房温度恢复正常(2437),与其他房间一致,说明是间歇性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具或热源过近,导致在特定条件下受辐射热影响", "检查厨房温度传感器固件版本,考虑更新固件或重置设备以解决间歇性 None 值问题", "如问题反复出现,建议更换厨房温度传感器,避免因读数异常影响烟雾/火灾联动判断的可靠性", "确认厨房窗户传感器在 19:25 开窗后是否已关闭——日志中未记录关窗事件,夜间窗户可能仍处于打开状态,建议检查"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.57939338684082, "api_error": null} {"episode_id": "SQ3_TN_B_0713", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0713.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261342, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,且入户门在下午有一段长时间未关闭/未上锁的记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:33起床,07:36出门并自动上锁,17:57回家,22:30就寝,符合单人上班族的典型作息。\",\n \"推理步骤2: 温度趋势正常——凌晨约22.9°C,白天随气温升至最高约25.8°C(12:00-12:30),傍晚回落,各房间温差在合理范围内,无异常热源迹象。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后分别于06:58、07:03、18:47、18:59四次报告 MeasuredValue = None。灶具使用时厨房温度会升高,传感器应能正常读数,报告 null 说明传感器可能受高温或油烟干扰导致读数失败,属于设备故障或安装位置不当。\",\n \"推理步骤4: 16:16入户门被手动开锁、门打开,但直到17:57才有下一次门锁事件。期间约1小时41分钟内,没有关门(front_door_contact 恢复 True)或上锁的记录。虽然可能是住户短暂回来取东西后忘记关门,但长时间门户敞开存在安全隐患。\",\n \"推理步骤5: 22:30关灯就寝时,front_door_contact 才恢复 True 并自动上锁,说明入户门确实在16:16至22:30之间一直处于开启状态(或至少到17:57住户正式回家后才关门,但日志中17:57只有开锁和开门记录,没有先关门的记录)。最终22:30的关门上锁可能是住户睡前检查时才发现并关闭的。\",\n \"推理步骤6: 厨房窗户在07:02和18:58两次被打开(StateValue=False),但日志中没有关闭记录。考虑到是做饭后通风,这可能是正常行为,但长时间开窗在无人时段(07:36-17:57)也值得留意。\",\n \"推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。洗碗机19:50启动运行,属正常使用。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在06:58、07:03、18:47、18:59四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"16:16入户门手动开锁并打开,但直到22:30才有关门和上锁记录,中间约6小时无门状态恢复事件\",\n \"17:57住户回家时门锁再次手动开锁,说明16:16的开门事件与正式回家是两次独立事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否离灶具过近导致高温时读数异常,必要时更换耐高温型号或调整位置\",\n \"排查16:16的开门事件——确认是否为住户本人操作(如中途回家取物),若非本人则需高度警惕入侵风险\",\n \"建议设置入户门长时间未关闭的自动告警(如超过5分钟未关门即推送通知),避免门户长时间敞开\",\n \"考虑为厨房窗户也设置离家后未关闭提醒,减少无人时段的安全敞口\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,且入户门在下午有一段长时间未关闭/未上锁的记录。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:33起床,07:36出门并自动上锁,17:57回家,22:30就寝,符合单人上班族的典型作息。", "推理步骤2: 温度趋势正常——凌晨约22.9°C,白天随气温升至最高约25.8°C(12:00-12:30),傍晚回落,各房间温差在合理范围内,无异常热源迹象。", "推理步骤3: 厨房温度传感器在灶具开启后分别于06:58、07:03、18:47、18:59四次报告 MeasuredValue = None。灶具使用时厨房温度会升高,传感器应能正常读数,报告 null 说明传感器可能受高温或油烟干扰导致读数失败,属于设备故障或安装位置不当。", "推理步骤4: 16:16入户门被手动开锁、门打开,但直到17:57才有下一次门锁事件。期间约1小时41分钟内,没有关门(front_door_contact 恢复 True)或上锁的记录。虽然可能是住户短暂回来取东西后忘记关门,但长时间门户敞开存在安全隐患。", "推理步骤5: 22:30关灯就寝时,front_door_contact 才恢复 True 并自动上锁,说明入户门确实在16:16至22:30之间一直处于开启状态(或至少到17:57住户正式回家后才关门,但日志中17:57只有开锁和开门记录,没有先关门的记录)。最终22:30的关门上锁可能是住户睡前检查时才发现并关闭的。", "推理步骤6: 厨房窗户在07:02和18:58两次被打开(StateValue=False),但日志中没有关闭记录。考虑到是做饭后通风,这可能是正常行为,但长时间开窗在无人时段(07:36-17:57)也值得留意。", "推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。洗碗机19:50启动运行,属正常使用。"], "key_evidence": ["kitchen_temp_sensor 在06:58、07:03、18:47、18:59四次报告 MeasuredValue = None,均发生在灶具使用前后", "16:16入户门手动开锁并打开,但直到22:30才有关门和上锁记录,中间约6小时无门状态恢复事件", "17:57住户回家时门锁再次手动开锁,说明16:16的开门事件与正式回家是两次独立事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否离灶具过近导致高温时读数异常,必要时更换耐高温型号或调整位置", "排查16:16的开门事件——确认是否为住户本人操作(如中途回家取物),若非本人则需高度警惕入侵风险", "建议设置入户门长时间未关闭的自动告警(如超过5分钟未关门即推送通知),避免门户长时间敞开", "考虑为厨房窗户也设置离家后未关闭提醒,减少无人时段的安全敞口"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.66241192817688, "api_error": null} {"episode_id": "SQ3_TN_B_0715", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0715.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261344, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且住户下午外出近2小时期间入户门未关闭/未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:26起床,07:16出门上班并自动上锁,18:10回家,22:14就寝,符合单人居住的工作日作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后分别于06:56、07:02、18:34、19:26四次报告 MeasuredValue = None。灶具使用会导致厨房局部升温,传感器应能正常测量,None 值表明传感器可能因高温或故障进入异常状态。虽然07:00和19:00的整点读数恢复了正常数值,但反复出现 None 仍属异常。\",\n \"推理步骤3: 16:21住户手动开锁出门,入户门传感器显示门打开(StateValue=False),但直到18:10住户回家之前,日志中没有出现门关闭(StateValue=True)或上锁的记录。这意味着入户门在近2小时内处于未关闭或未上锁状态,存在安全隐患。\",\n \"推理步骤4: 厨房窗户在07:01:30被打开后,日志中未出现关闭记录(StateValue 未恢复为 True)。直到晚间19:25:30再次打开窗户的记录出现,说明窗户可能整天处于开启状态,住户外出期间厨房窗户未关,存在一定入侵风险。\",\n \"推理步骤5: 温度趋势方面,所有房间温度从凌晨约23°C逐步升至中午约25.8°C再回落,属于夏季正常日间波动,未见异常高温或骤变,排除火灾风险。烟雾报警器和漏水传感器全天无告警,排除火灾和水患。\",\n \"推理步骤6: 洗碗机20:00启动运行(OperationalState=1),属正常晚餐后使用,无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:56、07:02、18:34、19:26四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"16:21入户门开锁并打开后,直到18:10回家期间无门关闭和上锁记录,门可能敞开近2小时\",\n \"07:01:30厨房窗户打开后全天无关闭记录,住户外出期间窗户保持开启\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新校准传感器\",\n \"设置离家自动化规则:当入户门上锁且无人在家时,自动检查并提醒关闭所有窗户\",\n \"为入户门设置超时未关闭/未上锁告警,例如门打开超过5分钟未关闭时推送通知\",\n \"确认16:21外出时入户门是否确实未关闭,如果是门磁传感器漏报,需检查传感器电量和连接状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且住户下午外出近2小时期间入户门未关闭/未上锁。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:26起床,07:16出门上班并自动上锁,18:10回家,22:14就寝,符合单人居住的工作日作息。", "推理步骤2: 厨房温度传感器在灶具开启后分别于06:56、07:02、18:34、19:26四次报告 MeasuredValue = None。灶具使用会导致厨房局部升温,传感器应能正常测量,None 值表明传感器可能因高温或故障进入异常状态。虽然07:00和19:00的整点读数恢复了正常数值,但反复出现 None 仍属异常。", "推理步骤3: 16:21住户手动开锁出门,入户门传感器显示门打开(StateValue=False),但直到18:10住户回家之前,日志中没有出现门关闭(StateValue=True)或上锁的记录。这意味着入户门在近2小时内处于未关闭或未上锁状态,存在安全隐患。", "推理步骤4: 厨房窗户在07:01:30被打开后,日志中未出现关闭记录(StateValue 未恢复为 True)。直到晚间19:25:30再次打开窗户的记录出现,说明窗户可能整天处于开启状态,住户外出期间厨房窗户未关,存在一定入侵风险。", "推理步骤5: 温度趋势方面,所有房间温度从凌晨约23°C逐步升至中午约25.8°C再回落,属于夏季正常日间波动,未见异常高温或骤变,排除火灾风险。烟雾报警器和漏水传感器全天无告警,排除火灾和水患。", "推理步骤6: 洗碗机20:00启动运行(OperationalState=1),属正常晚餐后使用,无异常。"], "key_evidence": ["厨房温度传感器在06:56、07:02、18:34、19:26四次报告 MeasuredValue = None,均发生在灶具使用前后", "16:21入户门开锁并打开后,直到18:10回家期间无门关闭和上锁记录,门可能敞开近2小时", "07:01:30厨房窗户打开后全天无关闭记录,住户外出期间窗户保持开启"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新校准传感器", "设置离家自动化规则:当入户门上锁且无人在家时,自动检查并提醒关闭所有窗户", "为入户门设置超时未关闭/未上锁告警,例如门打开超过5分钟未关闭时推送通知", "确认16:21外出时入户门是否确实未关闭,如果是门磁传感器漏报,需检查传感器电量和连接状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.845645427703857, "api_error": null} {"episode_id": "SQ3_TN_B_0717", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_B_0717.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261346, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "我先梳理一下\"过去6小时\"的时间范围和关键事件,然后给出分析。\n\n日志截止时间为 2026-06-10T23:30:00,因此\"过去6小时\"大致为 17:30 ~ 23:30。\n\n关键事件回顾:\n\n1. 18:00 — 入户门手动解锁、开门、有人进入玄关和客厅,开客厅灯和空调(制冷模式)\n2. 18:14 — 开厨房灯和灶具做饭\n3. 18:15 — 厨房温度传感器报 None\n4. 19:10 — 灶具关闭,厨房窗户打开通风\n5. 19:11 — 厨房温度传感器再次报 None\n6. 19:57 — 洗碗机启动\n7. 22:13 — 关客厅灯和空调,主卧有人、关窗帘,关门上锁(自动),关主卧灯就寝\n8. 16:11 — 入户门解锁开门,但之后没有关门/上锁记录,直到 18:00 才有下一次开门事件;22:13 才关门上锁\n\n下面是我的分析结果:\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用前后多次报告 None(空值),存在设备故障或通信异常,可能导致厨房高温/火灾风险无法被及时监测。\",\n \"reasoning\": [\n \"推理步骤1: 在过去6小时内,18:00住户回家后的活动链(开门→开灯→开空调→做饭→洗碗→就寝→锁门)完全符合正常的晚间生活模式,不存在入侵迹象。\",\n \"推理步骤2: 18:14:30 灶具开启后,18:15:00 厨房温度传感器报告 MeasuredValue = None;19:10 灶具关闭后,19:11 再次报告 None。同样的现象在早晨 06:56 灶具开启后(06:57、07:25 两次 None)也出现过。这说明该传感器在灶具工作期间会系统性地丢失读数。\",\n \"推理步骤3: 厨房温度传感器的职责之一是配合烟雾报警器监测厨房热安全。灶具使用恰恰是最需要温度监测的时段,此时传感器失效意味着如果发生干烧或油温过高,系统将无法通过温度异常触发预警。\",\n \"推理步骤4: 16:11 入户门被手动解锁并开门(contact=False),但直到 18:00 下一次开门事件前,没有关门(contact=True)或上锁记录。这意味着入户门可能在 16:11~18:00 之间处于未关闭状态约 110 分钟,存在一定安全隐患。不过考虑到 18:00 住户正常回家,此次开门更可能是住户短暂外出或快递场景,威胁程度有限。\",\n \"推理步骤5: 22:13 就寝流程中,入户门正常关闭并自动上锁(LockState=1),所有灯关闭,窗帘拉上,当前家庭处于安全状态。\",\n \"推理步骤6: 各房间温度从 18:00 的约 24.5°C 逐步降至 23:30 的约 23.3°C,变化平缓合理,无异常热源迹象。烟雾报警器和漏水传感器均未触发,无火灾或水患风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间多次报告 None:18:15:00、19:11:00(晚间),以及 06:57:00、07:25:00(早晨),呈现规律性故障模式\",\n \"16:11 入户门解锁开门后,约 110 分钟内无关门/上锁记录,门可能长时间处于未关状态\",\n \"厨房窗户在早晨 07:24:30 被打开后,直到 19:10:30 才有第二次窗户事件记录,期间住户外出,厨房窗户可能一直处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor):排查其在灶具工作时报告 None 的原因,可能是高温干扰、通信中断或传感器本身故障,必要时更换或重新定位传感器\",\n \"为灶具使用场景增加备用安全监测:在厨房温度传感器失效期间,可依赖烟雾报警器作为兜底,但建议增加灶具自动超时关闭规则(如持续开启超过60分钟未操作则告警)\",\n \"优化离家安全自动化:建议设置入户门开启超过一定时间(如5分钟)未关闭时发送提醒通知,避免门长时间处于未锁状态\",\n \"确认厨房窗户状态管理:建议在离家模式激活时检查所有窗户是否关闭,避免外出期间窗户长时间敞开\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用前后多次报告 None(空值),存在设备故障或通信异常,可能导致厨房高温/火灾风险无法被及时监测。", "reasoning": ["推理步骤1: 在过去6小时内,18:00住户回家后的活动链(开门→开灯→开空调→做饭→洗碗→就寝→锁门)完全符合正常的晚间生活模式,不存在入侵迹象。", "推理步骤2: 18:14:30 灶具开启后,18:15:00 厨房温度传感器报告 MeasuredValue = None;19:10 灶具关闭后,19:11 再次报告 None。同样的现象在早晨 06:56 灶具开启后(06:57、07:25 两次 None)也出现过。这说明该传感器在灶具工作期间会系统性地丢失读数。", "推理步骤3: 厨房温度传感器的职责之一是配合烟雾报警器监测厨房热安全。灶具使用恰恰是最需要温度监测的时段,此时传感器失效意味着如果发生干烧或油温过高,系统将无法通过温度异常触发预警。", "推理步骤4: 16:11 入户门被手动解锁并开门(contact=False),但直到 18:00 下一次开门事件前,没有关门(contact=True)或上锁记录。这意味着入户门可能在 16:11~18:00 之间处于未关闭状态约 110 分钟,存在一定安全隐患。不过考虑到 18:00 住户正常回家,此次开门更可能是住户短暂外出或快递场景,威胁程度有限。", "推理步骤5: 22:13 就寝流程中,入户门正常关闭并自动上锁(LockState=1),所有灯关闭,窗帘拉上,当前家庭处于安全状态。", "推理步骤6: 各房间温度从 18:00 的约 24.5°C 逐步降至 23:30 的约 23.3°C,变化平缓合理,无异常热源迹象。烟雾报警器和漏水传感器均未触发,无火灾或水患风险。"], "key_evidence": ["厨房温度传感器在灶具使用期间多次报告 None:18:15:00、19:11:00(晚间),以及 06:57:00、07:25:00(早晨),呈现规律性故障模式", "16:11 入户门解锁开门后,约 110 分钟内无关门/上锁记录,门可能长时间处于未关状态", "厨房窗户在早晨 07:24:30 被打开后,直到 19:10:30 才有第二次窗户事件记录,期间住户外出,厨房窗户可能一直处于开启状态"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor):排查其在灶具工作时报告 None 的原因,可能是高温干扰、通信中断或传感器本身故障,必要时更换或重新定位传感器", "为灶具使用场景增加备用安全监测:在厨房温度传感器失效期间,可依赖烟雾报警器作为兜底,但建议增加灶具自动超时关闭规则(如持续开启超过60分钟未操作则告警)", "优化离家安全自动化:建议设置入户门开启超过一定时间(如5分钟)未关闭时发送提醒通知,避免门长时间处于未锁状态", "确认厨房窗户状态管理:建议在离家模式激活时检查所有窗户是否关闭,避免外出期间窗户长时间敞开"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.827587842941284, "api_error": null} {"episode_id": "SQ3_TN_C_0668", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0668.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261297, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时入户门在16:22开锁进入后未及时关门/锁门,存在安全疏忽。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)及全天日志的整体生活节奏——早晨06:08起床、07:24全家出门、16:22有人回家(直奔儿童房,推测孩子放学)、17:51另一人回家(开客厅灯和空调)、18:36做饭、19:21晚餐、20:50孩子就寝、22:30大人就寝。这是一个典型的三口之家工作日作息,整体行为模式正常。\",\n \"推理步骤2: 重点关注厨房温度传感器(kitchen_temp_sensor)——在06:47、07:11、18:37、19:22四个时间点报告了 MeasuredValue = None。这些时间点均与灶具开启/关闭高度相关(06:46灶具开、07:10灶具关、18:36灶具开、19:21灶具关)。正常传感器不应返回 null,即使温度超量程也应报告边界值或触发告警。这表明传感器可能存在故障,或在灶具使用时受热干扰导致读数异常。\",\n \"推理步骤3: 检查16:22的入户事件——门锁解锁(LockOperationType=1)、门传感器显示开门(StateValue=False),但在后续日志中直到22:30:34才出现 front_door_contact StateValue=True(关门)和自动上锁。这意味着从16:22到22:30,入户门可能处于未关闭或未上锁状态长达6小时以上。虽然17:51又有一次开门事件,但17:51之后同样没有关门记录,直到22:30才统一关门锁门。家中无人看守入口长时间敞开存在安全隐患。\",\n \"推理步骤4: 检查其他安全设备——烟雾报警器全天无告警、漏水传感器无触发、所有窗户传感器状态正常、门锁操作均为手动/自动合法操作(无异常PIN或强制开锁)。空调在17:51开启制冷(SystemMode=3)、22:30关闭,与夏季傍晚回家的习惯一致。温度趋势也符合夏季日间升温、夜间降温的自然规律。\",\n \"推理步骤5: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器的反复 null 值属于设备异常,需要排查;入户门长时间未关闭/锁定属于安全疏忽,风险等级中等。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:11、18:37、19:22 四次报告 MeasuredValue = None,均与灶具开关操作时间高度吻合\",\n \"front_door_contact 在 16:22:02 显示开门(StateValue=False),直到 22:30:34 才记录关门(StateValue=True),期间超过6小时无关门记录\",\n \"17:51 入户门再次解锁开门,但同样无后续关门记录直到 22:30\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器\",\n \"检查厨房温度传感器固件版本,确认是否存在已知的 null 值上报 bug,必要时升级固件\",\n \"设置入户门未关闭/未上锁超时提醒(建议阈值5分钟),避免长时间门户洞开\",\n \"建议在入户门区域增加自动关门器或设置离家模式下的门锁状态监控规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时入户门在16:22开锁进入后未及时关门/锁门,存在安全疏忽。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30–23:30)及全天日志的整体生活节奏——早晨06:08起床、07:24全家出门、16:22有人回家(直奔儿童房,推测孩子放学)、17:51另一人回家(开客厅灯和空调)、18:36做饭、19:21晚餐、20:50孩子就寝、22:30大人就寝。这是一个典型的三口之家工作日作息,整体行为模式正常。", "推理步骤2: 重点关注厨房温度传感器(kitchen_temp_sensor)——在06:47、07:11、18:37、19:22四个时间点报告了 MeasuredValue = None。这些时间点均与灶具开启/关闭高度相关(06:46灶具开、07:10灶具关、18:36灶具开、19:21灶具关)。正常传感器不应返回 null,即使温度超量程也应报告边界值或触发告警。这表明传感器可能存在故障,或在灶具使用时受热干扰导致读数异常。", "推理步骤3: 检查16:22的入户事件——门锁解锁(LockOperationType=1)、门传感器显示开门(StateValue=False),但在后续日志中直到22:30:34才出现 front_door_contact StateValue=True(关门)和自动上锁。这意味着从16:22到22:30,入户门可能处于未关闭或未上锁状态长达6小时以上。虽然17:51又有一次开门事件,但17:51之后同样没有关门记录,直到22:30才统一关门锁门。家中无人看守入口长时间敞开存在安全隐患。", "推理步骤4: 检查其他安全设备——烟雾报警器全天无告警、漏水传感器无触发、所有窗户传感器状态正常、门锁操作均为手动/自动合法操作(无异常PIN或强制开锁)。空调在17:51开启制冷(SystemMode=3)、22:30关闭,与夏季傍晚回家的习惯一致。温度趋势也符合夏季日间升温、夜间降温的自然规律。", "推理步骤5: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器的反复 null 值属于设备异常,需要排查;入户门长时间未关闭/锁定属于安全疏忽,风险等级中等。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:11、18:37、19:22 四次报告 MeasuredValue = None,均与灶具开关操作时间高度吻合", "front_door_contact 在 16:22:02 显示开门(StateValue=False),直到 22:30:34 才记录关门(StateValue=True),期间超过6小时无关门记录", "17:51 入户门再次解锁开门,但同样无后续关门记录直到 22:30"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器", "检查厨房温度传感器固件版本,确认是否存在已知的 null 值上报 bug,必要时升级固件", "设置入户门未关闭/未上锁超时提醒(建议阈值5分钟),避免长时间门户洞开", "建议在入户门区域增加自动关门器或设置离家模式下的门锁状态监控规则"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 35.98732256889343, "api_error": null} {"episode_id": "SQ3_TN_C_0669", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0669.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261298, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,入户门在16:24开锁进入后未及时上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:20起床,07:40全家出门并自动锁门,16:24有人(推测小孩放学)回家,18:09大人回家,22:19就寝锁门,符合三口之家的工作日作息。\",\n \"推理步骤2: 温度趋势合理——夜间约23°C,白天随气温升高至中午峰值约25.8°C,傍晚逐步回落,18:09开启客厅空调(制冷模式SystemMode=3)后温度加速下降,整体无异常温升。\",\n \"推理步骤3: 厨房温度传感器在06:39、07:24、18:49、19:10共4次报告 MeasuredValue = None。这些时间点均与灶具开启或关闭前后高度相关,但正常传感器不应返回 None。可能原因:传感器受高温干扰导致读数溢出、通信中断、或硬件故障。这是一个需要关注的设备健康问题——如果传感器在真正的火灾场景中失效,将无法提供预警辅助。\",\n \"推理步骤4: 厨房窗户传感器在07:23:30报告 StateValue=False(窗户打开),之后在19:09:30再次报告 StateValue=False(打开)。整个日志中没有出现 StateValue=True(关闭)的记录。这意味着厨房窗户从早上07:23起可能一直处于打开状态,家中无人的约9小时内窗户未关。虽然通风是合理行为,但长时间无人时窗户敞开存在一定安全隐患。\",\n \"推理步骤5: 16:24入户门解锁有人进入,但日志中未见随后的上锁事件(LockOperationType=0),直到22:19才自动上锁。期间约6小时门锁处于未锁状态。结合18:09大人回家的时间线,16:24-18:09之间可能只有小孩在家且门未上锁,存在一定入侵风险。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,灶具使用时间合理(早餐约45分钟、晚餐约21分钟),洗碗机正常启动,无火灾或水灾迹象。门锁操作均为 Manual 或 Auto 来源,无异常远程解锁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器4次返回 None(06:39、07:24、18:49、19:10),均与灶具操作时间高度关联\",\n \"厨房窗户全天仅有两次'打开'事件(07:23、19:09),无'关闭'记录,家中无人期间窗户可能一直敞开\",\n \"16:24入户门解锁后至22:19期间无上锁记录,约6小时门锁未锁定\",\n \"烟雾报警器和漏水传感器全天无异常告警,排除火灾和水灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否受灶具高温影响导致读数异常,必要时更换或重新定位传感器\",\n \"设置自动化规则:当全家离家(门锁上锁+无运动检测)时,若厨房窗户仍处于打开状态,发送提醒通知\",\n \"设置自动化规则:入户门解锁后若超过一定时间(如5分钟)未重新上锁且无持续运动检测,自动上锁或发送提醒\",\n \"考虑为16:24的回家场景(小孩独自在家)配置专门的安全模式,确保门锁自动上锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,入户门在16:24开锁进入后未及时上锁。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:20起床,07:40全家出门并自动锁门,16:24有人(推测小孩放学)回家,18:09大人回家,22:19就寝锁门,符合三口之家的工作日作息。", "推理步骤2: 温度趋势合理——夜间约23°C,白天随气温升高至中午峰值约25.8°C,傍晚逐步回落,18:09开启客厅空调(制冷模式SystemMode=3)后温度加速下降,整体无异常温升。", "推理步骤3: 厨房温度传感器在06:39、07:24、18:49、19:10共4次报告 MeasuredValue = None。这些时间点均与灶具开启或关闭前后高度相关,但正常传感器不应返回 None。可能原因:传感器受高温干扰导致读数溢出、通信中断、或硬件故障。这是一个需要关注的设备健康问题——如果传感器在真正的火灾场景中失效,将无法提供预警辅助。", "推理步骤4: 厨房窗户传感器在07:23:30报告 StateValue=False(窗户打开),之后在19:09:30再次报告 StateValue=False(打开)。整个日志中没有出现 StateValue=True(关闭)的记录。这意味着厨房窗户从早上07:23起可能一直处于打开状态,家中无人的约9小时内窗户未关。虽然通风是合理行为,但长时间无人时窗户敞开存在一定安全隐患。", "推理步骤5: 16:24入户门解锁有人进入,但日志中未见随后的上锁事件(LockOperationType=0),直到22:19才自动上锁。期间约6小时门锁处于未锁状态。结合18:09大人回家的时间线,16:24-18:09之间可能只有小孩在家且门未上锁,存在一定入侵风险。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,灶具使用时间合理(早餐约45分钟、晚餐约21分钟),洗碗机正常启动,无火灾或水灾迹象。门锁操作均为 Manual 或 Auto 来源,无异常远程解锁。"], "key_evidence": ["厨房温度传感器4次返回 None(06:39、07:24、18:49、19:10),均与灶具操作时间高度关联", "厨房窗户全天仅有两次'打开'事件(07:23、19:09),无'关闭'记录,家中无人期间窗户可能一直敞开", "16:24入户门解锁后至22:19期间无上锁记录,约6小时门锁未锁定", "烟雾报警器和漏水传感器全天无异常告警,排除火灾和水灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否受灶具高温影响导致读数异常,必要时更换或重新定位传感器", "设置自动化规则:当全家离家(门锁上锁+无运动检测)时,若厨房窗户仍处于打开状态,发送提醒通知", "设置自动化规则:入户门解锁后若超过一定时间(如5分钟)未重新上锁且无持续运动检测,自动上锁或发送提醒", "考虑为16:24的回家场景(小孩独自在家)配置专门的安全模式,确保门锁自动上锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.486361503601074, "api_error": null} {"episode_id": "SQ3_TN_C_0670", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0670.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261299, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数符合正常的昼夜温度变化规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件,说明这些安全设备在过去24小时内均未被触发。\",\n \"推理步骤2: 温度数据呈现典型的昼夜变化曲线——凌晨0:00-5:30温度最低(约22.9-23.1°C),6:00起随日出逐步升高,12:00-12:30达到峰值(约25.8-25.9°C),之后缓慢下降,至23:30回落到约23.3°C。这完全符合夏季(6月)自然气温的日变化规律。\",\n \"推理步骤3: 四个房间的温度走势高度一致,彼此差异始终在1°C以内,不存在某个房间温度异常飙升或骤降的情况。若存在火灾风险,厨房或某个房间的温度会出现与其他房间显著偏离的急剧上升;若存在窗户被打开入侵,对应房间温度会出现与室外温差相关的突变。这些情况均未出现。\",\n \"推理步骤4: 全天温度范围为22.9°C至25.9°C,处于舒适区间,未触及任何高温或低温告警阈值,也不存在对居住者健康构成威胁的极端温度。\"\n ],\n \"key_evidence\": [\n \"24小时内仅有温度上报事件,无任何安全类设备(门锁、门窗传感器、运动传感器、烟雾/漏水报警器)触发记录\",\n \"四个房间温度同步呈现标准昼夜曲线:凌晨低谷约22.9°C → 正午峰值约25.9°C → 夜间回落至约23.3°C,房间间温差始终小于1°C\",\n \"无任何温度突变、异常尖峰或单点偏离现象\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭环境状态正常\",\n \"如进入盛夏高温期,可考虑设置空调自动开启规则,当室温超过26°C时启动制冷以保持舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数符合正常的昼夜温度变化规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件,说明这些安全设备在过去24小时内均未被触发。", "推理步骤2: 温度数据呈现典型的昼夜变化曲线——凌晨0:00-5:30温度最低(约22.9-23.1°C),6:00起随日出逐步升高,12:00-12:30达到峰值(约25.8-25.9°C),之后缓慢下降,至23:30回落到约23.3°C。这完全符合夏季(6月)自然气温的日变化规律。", "推理步骤3: 四个房间的温度走势高度一致,彼此差异始终在1°C以内,不存在某个房间温度异常飙升或骤降的情况。若存在火灾风险,厨房或某个房间的温度会出现与其他房间显著偏离的急剧上升;若存在窗户被打开入侵,对应房间温度会出现与室外温差相关的突变。这些情况均未出现。", "推理步骤4: 全天温度范围为22.9°C至25.9°C,处于舒适区间,未触及任何高温或低温告警阈值,也不存在对居住者健康构成威胁的极端温度。"], "key_evidence": ["24小时内仅有温度上报事件,无任何安全类设备(门锁、门窗传感器、运动传感器、烟雾/漏水报警器)触发记录", "四个房间温度同步呈现标准昼夜曲线:凌晨低谷约22.9°C → 正午峰值约25.9°C → 夜间回落至约23.3°C,房间间温差始终小于1°C", "无任何温度突变、异常尖峰或单点偏离现象"], "recommended_actions": ["当前无需采取任何措施,家庭环境状态正常", "如进入盛夏高温期,可考虑设置空调自动开启规则,当室温超过26°C时启动制冷以保持舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.809097051620483, "api_error": null} {"episode_id": "SQ3_TN_C_0677", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0677.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261306, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的半小时间隔读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件,说明这些设备在过去24小时内未被触发。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.88°C(中午高点),这是6月中旬夏季典型的室内温度区间,完全正常。\",\n \"推理步骤3: 温度变化曲线呈现清晰的昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低温平台,06:00 起随日出开始上升,12:00-12:30 达到峰值约 25.8°C,之后逐步回落,至 23:30 降回约 23.3°C。这完全符合无空调运行时的自然温度变化模式。\",\n \"推理步骤4: 四个房间的温度高度一致,彼此差异始终在 1°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。\",\n \"推理步骤5: 厨房温度未出现突然飙升,排除灶具异常使用或火灾风险。全天无任何传感器报告烟雾、漏水、门窗开合或运动检测事件,家庭处于安全状态。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C-25.9°C,四个房间高度一致,呈标准昼夜正弦曲线\",\n \"无任何安全类设备(门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器)触发事件\",\n \"凌晨至清晨温度平稳(约23°C),06:00后随日照均匀上升,午后逐步回落,符合夏季自然规律\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭环境安全正常\",\n \"可考虑在午间高温时段(12:00-14:00,室温接近26°C)设置空调自动开启规则,提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的半小时间隔读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的事件,说明这些设备在过去24小时内未被触发。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.88°C(中午高点),这是6月中旬夏季典型的室内温度区间,完全正常。", "推理步骤3: 温度变化曲线呈现清晰的昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低温平台,06:00 起随日出开始上升,12:00-12:30 达到峰值约 25.8°C,之后逐步回落,至 23:30 降回约 23.3°C。这完全符合无空调运行时的自然温度变化模式。", "推理步骤4: 四个房间的温度高度一致,彼此差异始终在 1°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。", "推理步骤5: 厨房温度未出现突然飙升,排除灶具异常使用或火灾风险。全天无任何传感器报告烟雾、漏水、门窗开合或运动检测事件,家庭处于安全状态。"], "key_evidence": ["全天温度范围 22.9°C-25.9°C,四个房间高度一致,呈标准昼夜正弦曲线", "无任何安全类设备(门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器)触发事件", "凌晨至清晨温度平稳(约23°C),06:00后随日照均匀上升,午后逐步回落,符合夏季自然规律"], "recommended_actions": ["当前无需采取任何措施,家庭环境安全正常", "可考虑在午间高温时段(12:00-14:00,室温接近26°C)设置空调自动开启规则,提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.207595109939575, "api_error": null} {"episode_id": "SQ3_TN_C_0676", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0676.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261305, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在15:55开锁进入后未关门/未锁门,直到22:32才确认关闭上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:41、07:30、18:49、19:09共出现4次 MeasuredValue = None 的读数。其中06:41和18:49两次均紧跟在灶具开启之后,07:30和19:09则在灶具关闭前后。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统级通信故障,而是厨房温度传感器自身的问题——可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器硬件老化。\",\n \"推理步骤2: 15:55入户门解锁、门打开(contact=False),有人进入(entrance_occupancy=1,kids_room_occupancy=1),但日志中没有记录门关闭(contact=True)和重新上锁的事件。直到22:32才出现 front_door_contact=True 和 LockState=1(上锁)。这意味着入户门在约6.5小时内处于未关闭或未上锁状态。对比早上07:25的出门流程——开锁、开门、关门、自动上锁,整个过程仅用6秒,15:55的异常就非常明显。\",\n \"推理步骤3: 18:04又有一次开锁进门事件,但同样没有记录关门和上锁。结合15:55的情况,说明从下午到晚上入户门长时间未处于安全状态。虽然家中有人(客厅、厨房、餐厅均有活动),但长时间不锁门仍然是入侵风险。\",\n \"推理步骤4: 其余设备行为均属正常模式——早晨起床洗漱做饭、出门上锁、下午孩子回家、傍晚大人回家做饭、晚上睡前关灯锁门拉窗帘,温度曲线也符合夏季白天升温夜间降温的自然规律。烟雾报警器和漏水传感器全天无告警,洗碗机和洗衣机运行正常。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:41、07:30(第一次)、18:49、19:09 四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"15:55:02 front_door_contact = False(门开)后,直到 22:32:21 才出现 front_door_contact = True(门关),中间约6.5小时无关门记录\",\n \"18:04:02 front_door_contact = False(门再次开启),同样无后续关门记录直到 22:32\",\n \"对比 07:25 出门时门在3秒内关闭并自动上锁,下午/傍晚的开门行为明显缺少关门步骤\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰;如传感器老化应及时更换\",\n \"设置入户门未关闭/未上锁超时告警(建议阈值5分钟),避免长时间门户洞开\",\n \"检查入户门门磁传感器(front_door_contact)是否存在漏报问题,确认15:55和18:04进门后门是否确实未关闭,还是传感器未能正确检测到关门动作\",\n \"考虑为入户门锁配置自动上锁策略(如开门超过一定时间未关闭则推送提醒)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在15:55开锁进入后未关门/未锁门,直到22:32才确认关闭上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在06:41、07:30、18:49、19:09共出现4次 MeasuredValue = None 的读数。其中06:41和18:49两次均紧跟在灶具开启之后,07:30和19:09则在灶具关闭前后。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统级通信故障,而是厨房温度传感器自身的问题——可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器硬件老化。", "推理步骤2: 15:55入户门解锁、门打开(contact=False),有人进入(entrance_occupancy=1,kids_room_occupancy=1),但日志中没有记录门关闭(contact=True)和重新上锁的事件。直到22:32才出现 front_door_contact=True 和 LockState=1(上锁)。这意味着入户门在约6.5小时内处于未关闭或未上锁状态。对比早上07:25的出门流程——开锁、开门、关门、自动上锁,整个过程仅用6秒,15:55的异常就非常明显。", "推理步骤3: 18:04又有一次开锁进门事件,但同样没有记录关门和上锁。结合15:55的情况,说明从下午到晚上入户门长时间未处于安全状态。虽然家中有人(客厅、厨房、餐厅均有活动),但长时间不锁门仍然是入侵风险。", "推理步骤4: 其余设备行为均属正常模式——早晨起床洗漱做饭、出门上锁、下午孩子回家、傍晚大人回家做饭、晚上睡前关灯锁门拉窗帘,温度曲线也符合夏季白天升温夜间降温的自然规律。烟雾报警器和漏水传感器全天无告警,洗碗机和洗衣机运行正常。"], "key_evidence": ["kitchen_temp_sensor 在 06:41、07:30(第一次)、18:49、19:09 四次报告 MeasuredValue = None,均与灶具使用时段相关", "15:55:02 front_door_contact = False(门开)后,直到 22:32:21 才出现 front_door_contact = True(门关),中间约6.5小时无关门记录", "18:04:02 front_door_contact = False(门再次开启),同样无后续关门记录直到 22:32", "对比 07:25 出门时门在3秒内关闭并自动上锁,下午/傍晚的开门行为明显缺少关门步骤"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰;如传感器老化应及时更换", "设置入户门未关闭/未上锁超时告警(建议阈值5分钟),避免长时间门户洞开", "检查入户门门磁传感器(front_door_contact)是否存在漏报问题,确认15:55和18:04进门后门是否确实未关闭,还是传感器未能正确检测到关门动作", "考虑为入户门锁配置自动上锁策略(如开门超过一定时间未关闭则推送提醒)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.74166178703308, "api_error": null} {"episode_id": "SQ3_TN_C_0680", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0680.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261309, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器数据呈现正常的昼夜温度变化曲线,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无其他设备事件(门锁、运动传感器、烟雾报警器等均无触发)\",\n \"推理步骤2: 温度变化趋势符合典型夏季昼夜规律——凌晨最低约22.9°C,中午最高约25.9°C,傍晚后逐步回落至23.3°C,升降幅度约3°C,完全在正常范围内\",\n \"推理步骤3: 四个房间的温度高度一致,无单一房间出现异常升温(如火灾前兆)或骤降(如门窗被破坏导致冷风灌入)的情况\",\n \"推理步骤4: 厨房温度未出现与其他房间显著偏离的突增,排除灶具异常或火灾风险\",\n \"推理步骤5: 无入侵相关事件(门锁状态变化、门窗传感器开合、运动传感器触发),无漏水或烟雾报警,系统运行平稳\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C ~ 25.9°C,符合6月夏季昼夜温差规律\",\n \"四个房间温度走势高度同步,无单点异常\",\n \"24小时内无任何非温度类设备事件触发\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,系统运行正常\",\n \"可考虑在午间高温时段(12:00-14:00,室温接近26°C)自动开启空调以提升舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器数据呈现正常的昼夜温度变化曲线,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)每30分钟一次的温度上报,无其他设备事件(门锁、运动传感器、烟雾报警器等均无触发)", "推理步骤2: 温度变化趋势符合典型夏季昼夜规律——凌晨最低约22.9°C,中午最高约25.9°C,傍晚后逐步回落至23.3°C,升降幅度约3°C,完全在正常范围内", "推理步骤3: 四个房间的温度高度一致,无单一房间出现异常升温(如火灾前兆)或骤降(如门窗被破坏导致冷风灌入)的情况", "推理步骤4: 厨房温度未出现与其他房间显著偏离的突增,排除灶具异常或火灾风险", "推理步骤5: 无入侵相关事件(门锁状态变化、门窗传感器开合、运动传感器触发),无漏水或烟雾报警,系统运行平稳"], "key_evidence": ["全天温度范围 22.9°C ~ 25.9°C,符合6月夏季昼夜温差规律", "四个房间温度走势高度同步,无单点异常", "24小时内无任何非温度类设备事件触发"], "recommended_actions": ["无需采取措施,系统运行正常", "可考虑在午间高温时段(12:00-14:00,室温接近26°C)自动开启空调以提升舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.118757247924805, "api_error": null} {"episode_id": "SQ3_TN_C_0678", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0678.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261307, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30-23:30)的活动模式。17:43有人回家开门、开灯、开空调;18:35开始做饭;19:11做饭结束转入餐厅用餐;19:56启动洗碗机;20:46儿童房关灯就寝;22:11主卧就寝、锁门。整体生活节奏正常。\",\n \"推理步骤2: 厨房温度传感器在18:36和19:12报告 MeasuredValue = None。结合早晨07:06和07:17也出现同样的None值,该传感器在灶具开启/关闭前后会丢失读数。这不是正常行为——其他温度传感器全天均正常上报数值。\",\n \"推理步骤3: 入户门在16:19开锁后未记录到关门和上锁事件(BooleanState.StateValue 未恢复为 True,LockState 未恢复为 1),直到22:11才确认门关闭并自动上锁。这意味着从16:19到22:11约6小时内入户门可能处于未锁状态。不过考虑到17:43又有一次开门记录,且家中持续有人活动,这段时间门未锁属于有人在家的正常状态。\",\n \"推理步骤4: 厨房窗户在07:16:30打开后,日志中未见关闭记录(BooleanState.StateValue 未恢复为 True),19:11:30又记录了一次打开事件。说明厨房窗户可能全天保持打开状态用于通风,属于合理行为。\",\n \"推理步骤5: 综合判断,最值得关注的异常是厨房温度传感器反复报告None值。虽然目前未造成安全事故,但该传感器是厨房火灾预警的重要辅助手段,其失效会降低安全冗余。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 18:36 和 19:12 报告 MeasuredValue = None(灶具使用前后)\",\n \"同日早晨 07:06 和 07:17 也出现相同的 None 值,说明问题具有重复性\",\n \"其他三个温度传感器全天正常上报,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否因灶具热量或油烟导致传感器过热保护或通信中断\",\n \"清洁或更换厨房温度传感器,确保其在烹饪场景下能正常工作\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确认 kitchen_smoke_alarm 工作正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常", "reasoning": ["推理步骤1: 分析过去6小时(约17:30-23:30)的活动模式。17:43有人回家开门、开灯、开空调;18:35开始做饭;19:11做饭结束转入餐厅用餐;19:56启动洗碗机;20:46儿童房关灯就寝;22:11主卧就寝、锁门。整体生活节奏正常。", "推理步骤2: 厨房温度传感器在18:36和19:12报告 MeasuredValue = None。结合早晨07:06和07:17也出现同样的None值,该传感器在灶具开启/关闭前后会丢失读数。这不是正常行为——其他温度传感器全天均正常上报数值。", "推理步骤3: 入户门在16:19开锁后未记录到关门和上锁事件(BooleanState.StateValue 未恢复为 True,LockState 未恢复为 1),直到22:11才确认门关闭并自动上锁。这意味着从16:19到22:11约6小时内入户门可能处于未锁状态。不过考虑到17:43又有一次开门记录,且家中持续有人活动,这段时间门未锁属于有人在家的正常状态。", "推理步骤4: 厨房窗户在07:16:30打开后,日志中未见关闭记录(BooleanState.StateValue 未恢复为 True),19:11:30又记录了一次打开事件。说明厨房窗户可能全天保持打开状态用于通风,属于合理行为。", "推理步骤5: 综合判断,最值得关注的异常是厨房温度传感器反复报告None值。虽然目前未造成安全事故,但该传感器是厨房火灾预警的重要辅助手段,其失效会降低安全冗余。"], "key_evidence": ["kitchen_temp_sensor 在 18:36 和 19:12 报告 MeasuredValue = None(灶具使用前后)", "同日早晨 07:06 和 07:17 也出现相同的 None 值,说明问题具有重复性", "其他三个温度传感器全天正常上报,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否因灶具热量或油烟导致传感器过热保护或通信中断", "清洁或更换厨房温度传感器,确保其在烹饪场景下能正常工作", "在传感器修复前,加强对厨房烟雾报警器的依赖,确认 kitchen_smoke_alarm 工作正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.350675582885742, "api_error": null} {"episode_id": "SQ3_TN_C_0685", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0685.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261314, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:54、07:01、18:39、19:22 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值\",\n \"推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关——06:53 灶具关闭后立即出现 None,07:00 灶具开启后再次出现 None,18:38 灶具开启后出现 None,19:21 灶具关闭后出现 None。这暗示灶具操作可能对传感器产生电磁干扰或热冲击导致读数失效\",\n \"推理步骤3: 除传感器异常外,整体家庭活动模式正常——早晨 6:13 起床、7:12 出门上班/上学、16:04 孩子放学回家、17:51 大人下班回家、晚间 21:09 孩子就寝、22:24 大人就寝,符合典型三口之家的作息规律\",\n \"推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:04 回家时门锁未关闭(front_door_contact 未记录关门),但 22:24 确认门已关闭并自动上锁\",\n \"推理步骤5: 温度整体趋势合理——夜间约 23°C,白天升至 25-26°C 峰值后回落,符合 6 月中旬夏季气温变化。无异常温升提示火灾风险\",\n \"推理步骤6: 灶具使用后均有开窗通风(kitchen_window_contact = False)和关灶操作,烟雾报警器未触发,厨房使用行为正常\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:54、07:01、18:39、19:22 四次报告 MeasuredValue = None\",\n \"None 值均与 kitchen_cook_surface 的开关操作时间高度关联(前后 1-2 分钟内)\",\n \"其他三个温度传感器在相同时段始终正常上报数据\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰\",\n \"检查传感器供电和通信链路是否稳定,考虑更换或重新配对该设备\",\n \"如传感器持续在灶具使用时失效,建议将其迁移至远离灶具的位置以确保持续监测能力\",\n \"关注 16:04 回家后入户门是否正常关闭——日志中未记录该次关门事件,建议确认门磁传感器工作正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常", "reasoning": ["推理步骤1: 厨房温度传感器在 06:54、07:01、18:39、19:22 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值", "推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关——06:53 灶具关闭后立即出现 None,07:00 灶具开启后再次出现 None,18:38 灶具开启后出现 None,19:21 灶具关闭后出现 None。这暗示灶具操作可能对传感器产生电磁干扰或热冲击导致读数失效", "推理步骤3: 除传感器异常外,整体家庭活动模式正常——早晨 6:13 起床、7:12 出门上班/上学、16:04 孩子放学回家、17:51 大人下班回家、晚间 21:09 孩子就寝、22:24 大人就寝,符合典型三口之家的作息规律", "推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:04 回家时门锁未关闭(front_door_contact 未记录关门),但 22:24 确认门已关闭并自动上锁", "推理步骤5: 温度整体趋势合理——夜间约 23°C,白天升至 25-26°C 峰值后回落,符合 6 月中旬夏季气温变化。无异常温升提示火灾风险", "推理步骤6: 灶具使用后均有开窗通风(kitchen_window_contact = False)和关灶操作,烟雾报警器未触发,厨房使用行为正常"], "key_evidence": ["kitchen_temp_sensor 在 06:54、07:01、18:39、19:22 四次报告 MeasuredValue = None", "None 值均与 kitchen_cook_surface 的开关操作时间高度关联(前后 1-2 分钟内)", "其他三个温度传感器在相同时段始终正常上报数据"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰", "检查传感器供电和通信链路是否稳定,考虑更换或重新配对该设备", "如传感器持续在灶具使用时失效,建议将其迁移至远离灶具的位置以确保持续监测能力", "关注 16:04 回家后入户门是否正常关闭——日志中未记录该次关门事件,建议确认门磁传感器工作正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.909679889678955, "api_error": null} {"episode_id": "SQ3_TN_C_0686", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0686.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261315, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:18开锁后长时间未关闭/上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、07:27、18:47、19:04 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。这说明传感器在厨房温度快速变化时出现读数丢失,可能是传感器量程溢出、通信中断或硬件故障。\",\n \"推理步骤2: 16:18 入户门通过手动方式解锁(LockOperationType=1),门被打开(StateValue=False),之后没有对应的关门(StateValue=True)和上锁记录,直到 22:30:25 才记录到门关闭并自动上锁。这意味着入户门在约6小时12分钟内处于未锁定/未关闭状态。虽然期间有人在家(17:48 有第二次进门记录),但长时间门户未关存在安全隐患。\",\n \"推理步骤3: 其余行为模式均属正常——早晨6点左右起床、7:25出门上锁、下午/傍晚回家、晚间做饭用餐、22:30就寝锁门,符合典型三口之家(含儿童)的作息规律。温度曲线呈现正常的昼夜波动(夜间约23°C,午间峰值约25.8°C)。灶具使用时间合理,烟雾报警器和漏水传感器均未触发。\",\n \"推理步骤4: 厨房窗户在 07:26:30 被打开后,日志中没有关闭记录(19:03:30 再次出现 StateValue=False 说明仍为开启状态或被再次打开),这本身不构成严重威胁,但结合厨房传感器异常值得关注。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:27、18:47、19:04 四次报告 MeasuredValue = None\",\n \"16:18 入户门解锁开门后,直到 22:30:25(约6小时后)才有关门上锁记录\",\n \"厨房窗户 07:26:30 打开后无明确关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否存在量程限制或通信故障,必要时更换传感器\",\n \"设置入户门未关闭/未上锁超时告警(建议阈值5-10分钟),避免长时间门户洞开\",\n \"考虑为入户门添加自动上锁策略,在门打开超过一定时间后发送提醒通知\",\n \"检查厨房窗户传感器是否正常工作,确认窗户实际开关状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:18开锁后长时间未关闭/上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、07:27、18:47、19:04 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。这说明传感器在厨房温度快速变化时出现读数丢失,可能是传感器量程溢出、通信中断或硬件故障。", "推理步骤2: 16:18 入户门通过手动方式解锁(LockOperationType=1),门被打开(StateValue=False),之后没有对应的关门(StateValue=True)和上锁记录,直到 22:30:25 才记录到门关闭并自动上锁。这意味着入户门在约6小时12分钟内处于未锁定/未关闭状态。虽然期间有人在家(17:48 有第二次进门记录),但长时间门户未关存在安全隐患。", "推理步骤3: 其余行为模式均属正常——早晨6点左右起床、7:25出门上锁、下午/傍晚回家、晚间做饭用餐、22:30就寝锁门,符合典型三口之家(含儿童)的作息规律。温度曲线呈现正常的昼夜波动(夜间约23°C,午间峰值约25.8°C)。灶具使用时间合理,烟雾报警器和漏水传感器均未触发。", "推理步骤4: 厨房窗户在 07:26:30 被打开后,日志中没有关闭记录(19:03:30 再次出现 StateValue=False 说明仍为开启状态或被再次打开),这本身不构成严重威胁,但结合厨房传感器异常值得关注。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:27、18:47、19:04 四次报告 MeasuredValue = None", "16:18 入户门解锁开门后,直到 22:30:25(约6小时后)才有关门上锁记录", "厨房窗户 07:26:30 打开后无明确关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否存在量程限制或通信故障,必要时更换传感器", "设置入户门未关闭/未上锁超时告警(建议阈值5-10分钟),避免长时间门户洞开", "考虑为入户门添加自动上锁策略,在门打开超过一定时间后发送提醒通知", "检查厨房窗户传感器是否正常工作,确认窗户实际开关状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.516351461410522, "api_error": null} {"episode_id": "SQ3_TN_C_0691", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0691.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261320, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 分析时间范围——过去6小时对应 2026-06-22 约 17:30 至 23:30。但日志中厨房温度传感器的 None 值出现在 06:42、07:10、18:45、19:25,其中 18:45 和 19:25 落在分析窗口附近。回顾全天日志,该传感器共出现 4 次 None 读数。\",\n \"推理步骤2: 厨房温度传感器在灶具开启期间(06:41 开灶 → 06:42 报 None;18:44 开灶 → 18:45 报 None)以及灶具关闭后(07:09 关灶 → 07:10 报 None;19:24 关灶 → 19:25 报 None)均出现 None 值。这说明每次烹饪前后传感器都会丢失读数,模式高度一致。\",\n \"推理步骤3: 可能原因包括:(a) 灶具工作时产生的热量或电磁干扰导致传感器通信中断;(b) 传感器本身在高温环境下出现间歇性故障;(c) 传感器与网关之间的无线链路在厨房环境变化时不稳定。无论哪种原因,温度传感器在烹饪场景下不可靠会削弱厨房火灾/高温预警能力。\",\n \"推理步骤4: 其余设备行为均属正常——17:44 家人回家开门、开灯、开空调;18:44 做饭;19:24 用餐、开洗碗机;20:44 儿童房关灯就寝;22:35 全家就寝、锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。\",\n \"推理步骤5: 厨房窗户在 07:09 做完早饭后打开(BooleanState=False 表示开启),19:24 晚饭后再次打开通风,属于正常烹饪后通风行为。但注意日志中未见厨房窗户关闭事件,结合当前已是深夜 23:30,厨房窗户可能仍处于开启状态,存在轻微安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:42、07:10、18:45、19:25 四次报告 MeasuredValue = None,均与灶具开关操作高度关联\",\n \"其他三个温度传感器(客厅、主卧、儿童房)全天无 None 值,排除系统性网络问题\",\n \"厨房窗户传感器在 07:09 和 19:24 报告 StateValue=False(开启),但全天日志中未见对应的关闭事件(StateValue=True)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响正常工作\",\n \"对厨房温度传感器进行固件更新或更换,确保烹饪场景下的温度监测不中断,以保障火灾预警能力\",\n \"确认厨房窗户当前状态,如已入夜且无人活动区域,建议关闭厨房窗户以保障夜间安全\",\n \"考虑为厨房温度传感器增加冗余设备或将烟雾报警器作为厨房高温场景的主要安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 分析时间范围——过去6小时对应 2026-06-22 约 17:30 至 23:30。但日志中厨房温度传感器的 None 值出现在 06:42、07:10、18:45、19:25,其中 18:45 和 19:25 落在分析窗口附近。回顾全天日志,该传感器共出现 4 次 None 读数。", "推理步骤2: 厨房温度传感器在灶具开启期间(06:41 开灶 → 06:42 报 None;18:44 开灶 → 18:45 报 None)以及灶具关闭后(07:09 关灶 → 07:10 报 None;19:24 关灶 → 19:25 报 None)均出现 None 值。这说明每次烹饪前后传感器都会丢失读数,模式高度一致。", "推理步骤3: 可能原因包括:(a) 灶具工作时产生的热量或电磁干扰导致传感器通信中断;(b) 传感器本身在高温环境下出现间歇性故障;(c) 传感器与网关之间的无线链路在厨房环境变化时不稳定。无论哪种原因,温度传感器在烹饪场景下不可靠会削弱厨房火灾/高温预警能力。", "推理步骤4: 其余设备行为均属正常——17:44 家人回家开门、开灯、开空调;18:44 做饭;19:24 用餐、开洗碗机;20:44 儿童房关灯就寝;22:35 全家就寝、锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。", "推理步骤5: 厨房窗户在 07:09 做完早饭后打开(BooleanState=False 表示开启),19:24 晚饭后再次打开通风,属于正常烹饪后通风行为。但注意日志中未见厨房窗户关闭事件,结合当前已是深夜 23:30,厨房窗户可能仍处于开启状态,存在轻微安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在 06:42、07:10、18:45、19:25 四次报告 MeasuredValue = None,均与灶具开关操作高度关联", "其他三个温度传感器(客厅、主卧、儿童房)全天无 None 值,排除系统性网络问题", "厨房窗户传感器在 07:09 和 19:24 报告 StateValue=False(开启),但全天日志中未见对应的关闭事件(StateValue=True)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响正常工作", "对厨房温度传感器进行固件更新或更换,确保烹饪场景下的温度监测不中断,以保障火灾预警能力", "确认厨房窗户当前状态,如已入夜且无人活动区域,建议关闭厨房窗户以保障夜间安全", "考虑为厨房温度传感器增加冗余设备或将烟雾报警器作为厨房高温场景的主要安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.402034997940063, "api_error": null} {"episode_id": "SQ3_TN_C_0692", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0692.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261321, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:21 主卧起床、06:36 儿童房起床、06:45 做早餐、07:16 全家出门并自动锁门,16:28 孩子放学回家,17:46 大人回家,18:28 做晚餐,21:03 孩子就寝,22:43 大人就寝并锁门。这是典型的三口之家工作日作息,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,LockOperationType=1(解锁)和0(上锁)配对正常,无异常开锁源(如远程、强制),且开门/关门传感器事件与运动传感器时序吻合,排除入侵风险。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:46:10、07:02:00、18:29:00、19:00:00 第一条),这不是正常的温度读数。可能原因:(a) 灶具工作时局部高温超出传感器量程导致读数失效;(b) 传感器本身存在间歇性故障。值得注意的是,其他三个温度传感器全天从未出现 None 值,说明这不是系统性问题,而是厨房传感器的个体问题。\",\n \"推理步骤4: 厨房窗户传感器在 07:01:30 报告 StateValue=False(窗户打开,早餐后通风),但在 16:28 孩子回家前日志中未见对应的 StateValue=True(关闭)事件。18:59:30 晚餐后再次报告 StateValue=False(开窗),同样未见后续关闭记录。家人出门期间厨房窗户可能一直处于开启状态,存在安全隐患。\",\n \"推理步骤5: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无报警,排除火灾和水患风险。所有温度读数(除 None 外)在 22.9°C~25.9°C 之间随昼夜自然波动,无异常高温。\",\n \"推理步骤6: 客厅空调 17:46 开启制冷模式(SystemMode=3),22:43 关闭,使用时长合理。儿童房窗帘早开晚关,主卧窗帘睡前关闭,均为正常操作。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:46:10、07:02:00、18:29:00、19:00:00 四次报告 MeasuredValue = None,与灶具使用时段高度相关,其他传感器全天无此现象\",\n \"kitchen_window_contact 在 07:01:30 报告开窗(StateValue=False),全家 07:16 出门后日志中无关窗记录,家中无人期间窗户可能持续开启约 9 小时\",\n \"晚餐后 18:59:30 厨房窗户再次开启,至日志结束(23:30)未见关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如位置合理则考虑更换传感器\",\n \"设置自动化规则:当入户门锁上锁(全家离开)时,检查厨房窗户状态,若为开启则发送提醒通知\",\n \"考虑为厨房温度传感器设置 None 值告警,以便及时发现传感器离线或故障\",\n \"建议在离家模式下对所有窗户传感器状态进行联动检查,防止无人时窗户长时间开启带来的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时厨房窗户做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:21 主卧起床、06:36 儿童房起床、06:45 做早餐、07:16 全家出门并自动锁门,16:28 孩子放学回家,17:46 大人回家,18:28 做晚餐,21:03 孩子就寝,22:43 大人就寝并锁门。这是典型的三口之家工作日作息,无入侵迹象。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,LockOperationType=1(解锁)和0(上锁)配对正常,无异常开锁源(如远程、强制),且开门/关门传感器事件与运动传感器时序吻合,排除入侵风险。", "推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:46:10、07:02:00、18:29:00、19:00:00 第一条),这不是正常的温度读数。可能原因:(a) 灶具工作时局部高温超出传感器量程导致读数失效;(b) 传感器本身存在间歇性故障。值得注意的是,其他三个温度传感器全天从未出现 None 值,说明这不是系统性问题,而是厨房传感器的个体问题。", "推理步骤4: 厨房窗户传感器在 07:01:30 报告 StateValue=False(窗户打开,早餐后通风),但在 16:28 孩子回家前日志中未见对应的 StateValue=True(关闭)事件。18:59:30 晚餐后再次报告 StateValue=False(开窗),同样未见后续关闭记录。家人出门期间厨房窗户可能一直处于开启状态,存在安全隐患。", "推理步骤5: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无报警,排除火灾和水患风险。所有温度读数(除 None 外)在 22.9°C~25.9°C 之间随昼夜自然波动,无异常高温。", "推理步骤6: 客厅空调 17:46 开启制冷模式(SystemMode=3),22:43 关闭,使用时长合理。儿童房窗帘早开晚关,主卧窗帘睡前关闭,均为正常操作。"], "key_evidence": ["kitchen_temp_sensor 在 06:46:10、07:02:00、18:29:00、19:00:00 四次报告 MeasuredValue = None,与灶具使用时段高度相关,其他传感器全天无此现象", "kitchen_window_contact 在 07:01:30 报告开窗(StateValue=False),全家 07:16 出门后日志中无关窗记录,家中无人期间窗户可能持续开启约 9 小时", "晚餐后 18:59:30 厨房窗户再次开启,至日志结束(23:30)未见关闭事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如位置合理则考虑更换传感器", "设置自动化规则:当入户门锁上锁(全家离开)时,检查厨房窗户状态,若为开启则发送提醒通知", "考虑为厨房温度传感器设置 None 值告警,以便及时发现传感器离线或故障", "建议在离家模式下对所有窗户传感器状态进行联动检查,防止无人时窗户长时间开启带来的安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.76619553565979, "api_error": null} {"episode_id": "SQ3_TN_C_0694", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0694.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261323, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:07开锁进入后未及时关门上锁,存在一定安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏分析——06:06主卧有人起床,06:38-07:00做早餐、孩子起床,07:50全家关灯出门并锁门,16:07有人(推测孩子放学)回家,18:13大人回家开灯开空调,18:50做晚餐,20:50孩子关灯睡觉,22:13大人关灯锁门就寝。整体符合三口之家的正常作息。\",\n \"推理步骤2: 厨房温度传感器异常——在06:39:07、06:59:00、18:51:00、19:06:00四个时间点,kitchen_temp_sensor报告MeasuredValue=None。这些时刻恰好在灶具开启或关闭前后,但温度传感器不应因灶具使用而返回空值。正常的半小时周期读数(07:00、07:30等)又恢复了有效数值,说明传感器间歇性失联或数据采集异常。\",\n \"推理步骤3: 入户门状态分析——07:50出门时,门锁解锁(LockState=2)→开门(StateValue=False)→关门(StateValue=True)→自动上锁(LockState=1),流程完整。16:07有人回家时,门锁解锁→开门,但日志中没有对应的关门(StateValue=True)和上锁记录,直到18:13第二次开门也只有开门记录,最终到22:13才出现关门和自动上锁。这意味着从16:07到22:13长达约6小时,入户门可能处于未完全关闭或未上锁状态。\",\n \"推理步骤4: 厨房窗户传感器在06:58:30和19:05:30两次报告StateValue=False(窗户打开),但日志中没有对应的关闭记录(StateValue=True)。做饭后开窗通风合理,但如果窗户一直未关,夜间存在安全隐患。\",\n \"推理步骤5: 烟雾报警器、漏水传感器全天无告警,灶具使用时间合理(早餐约20分钟、晚餐约15分钟),空调在制冷模式(SystemMode=3)下运行约4小时后关闭,温度曲线符合夏季白天升温夜间降温的自然规律,这些方面均正常。\",\n \"推理步骤6: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器的间歇性None值属于设备故障类异常,入户门长时间未确认关锁和厨房窗户未关闭属于需要关注的安全细节。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:39:07、06:59:00、18:51:00、19:06:00 四次报告 MeasuredValue=None,与灶具操作时间高度相关但不应出现空值\",\n \"16:07 入户门解锁开门后,日志中无关门(BooleanState.StateValue=True)和上锁记录,直到22:13才出现关门上锁\",\n \"厨房窗户传感器在 06:58:30 和 19:05:30 两次报告打开,但全天无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热量或油烟干扰导致间歇性通信故障,必要时更换或重新定位传感器\",\n \"检查入户门门锁的自动上锁功能是否正常工作,建议设置门未关提醒(如开门超过一定时间未关闭则推送告警)\",\n \"确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报关闭事件;如未关闭,建议夜间关窗并设置窗户未关提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:07开锁进入后未及时关门上锁,存在一定安全隐患。", "reasoning": ["推理步骤1: 整体生活节奏分析——06:06主卧有人起床,06:38-07:00做早餐、孩子起床,07:50全家关灯出门并锁门,16:07有人(推测孩子放学)回家,18:13大人回家开灯开空调,18:50做晚餐,20:50孩子关灯睡觉,22:13大人关灯锁门就寝。整体符合三口之家的正常作息。", "推理步骤2: 厨房温度传感器异常——在06:39:07、06:59:00、18:51:00、19:06:00四个时间点,kitchen_temp_sensor报告MeasuredValue=None。这些时刻恰好在灶具开启或关闭前后,但温度传感器不应因灶具使用而返回空值。正常的半小时周期读数(07:00、07:30等)又恢复了有效数值,说明传感器间歇性失联或数据采集异常。", "推理步骤3: 入户门状态分析——07:50出门时,门锁解锁(LockState=2)→开门(StateValue=False)→关门(StateValue=True)→自动上锁(LockState=1),流程完整。16:07有人回家时,门锁解锁→开门,但日志中没有对应的关门(StateValue=True)和上锁记录,直到18:13第二次开门也只有开门记录,最终到22:13才出现关门和自动上锁。这意味着从16:07到22:13长达约6小时,入户门可能处于未完全关闭或未上锁状态。", "推理步骤4: 厨房窗户传感器在06:58:30和19:05:30两次报告StateValue=False(窗户打开),但日志中没有对应的关闭记录(StateValue=True)。做饭后开窗通风合理,但如果窗户一直未关,夜间存在安全隐患。", "推理步骤5: 烟雾报警器、漏水传感器全天无告警,灶具使用时间合理(早餐约20分钟、晚餐约15分钟),空调在制冷模式(SystemMode=3)下运行约4小时后关闭,温度曲线符合夏季白天升温夜间降温的自然规律,这些方面均正常。", "推理步骤6: 综合判断——无入侵、火灾、漏水等高危威胁,但厨房温度传感器的间歇性None值属于设备故障类异常,入户门长时间未确认关锁和厨房窗户未关闭属于需要关注的安全细节。"], "key_evidence": ["kitchen_temp_sensor 在 06:39:07、06:59:00、18:51:00、19:06:00 四次报告 MeasuredValue=None,与灶具操作时间高度相关但不应出现空值", "16:07 入户门解锁开门后,日志中无关门(BooleanState.StateValue=True)和上锁记录,直到22:13才出现关门上锁", "厨房窗户传感器在 06:58:30 和 19:05:30 两次报告打开,但全天无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热量或油烟干扰导致间歇性通信故障,必要时更换或重新定位传感器", "检查入户门门锁的自动上锁功能是否正常工作,建议设置门未关提醒(如开门超过一定时间未关闭则推送告警)", "确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报关闭事件;如未关闭,建议夜间关窗并设置窗户未关提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.07967233657837, "api_error": null} {"episode_id": "SQ3_TN_C_0698", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0698.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261327, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:33、07:15、18:51、19:15 共4次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明灶具工作产生的热量或电磁干扰可能导致传感器读数异常,也可能是传感器本身存在硬件故障。\",\n \"推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在整个24小时内从未出现 None 值,数据连续且合理,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房窗户传感器在 07:14:30 报告开启(StateValue=False),之后在 19:14:30 再次报告开启,但全天日志中没有任何关闭(StateValue=True)的记录。这意味着厨房窗户从早上7点起一直处于开启状态,白天无人在家时窗户敞开存在安全风险。\",\n \"推理步骤4: 整体生活模式正常——早上6点起床、7:14出门上班/上学、16:05孩子放学回家、17:57大人下班回家、22:15就寝,门锁开关和运动传感器的触发时序合理,不存在入侵迹象。\",\n \"推理步骤5: 温度趋势符合夏季日间规律:凌晨约23°C,中午升至约25.9°C,傍晚回落。客厅空调在17:57开启制冷(SystemMode=3),22:15关闭,温度变化与之吻合,无火灾或异常升温迹象。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为手动开锁+自动上锁的正常模式,洗碗机正常启动运行,儿童房窗帘按作息开合,均属正常行为。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:33、07:15、18:51、19:15 四次报告 MeasuredValue = None,均与灶具操作时间高度相关\",\n \"kitchen_window_contact 在 07:14:30 和 19:14:30 两次报告 StateValue=False(开启),但全天无 StateValue=True(关闭)记录,窗户持续敞开\",\n \"其他温度传感器全天数据连续正常,排除系统性通信故障\",\n \"16:05 入户时前门未上锁(日志中无 LockOperationType=0),直到 22:15 才自动上锁,中间约6小时门锁处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或干扰,必要时更换或重新定位传感器\",\n \"设置自动化规则:当厨房温度传感器报告 None 值时立即发送告警通知,避免在灶具使用期间丧失温度监控能力\",\n \"确认厨房窗户当前状态,如已关闭则可能是窗户传感器漏报,需检查传感器电量和信号;如确实未关闭,建议立即关闭\",\n \"建议设置离家模式自动化:出门后若检测到窗户仍开启,自动发送提醒\",\n \"建议设置入户后自动上锁规则,避免长时间门锁处于未锁定状态(16:05至22:15约6小时未上锁)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:33、07:15、18:51、19:15 共4次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明灶具工作产生的热量或电磁干扰可能导致传感器读数异常,也可能是传感器本身存在硬件故障。", "推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在整个24小时内从未出现 None 值,数据连续且合理,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房窗户传感器在 07:14:30 报告开启(StateValue=False),之后在 19:14:30 再次报告开启,但全天日志中没有任何关闭(StateValue=True)的记录。这意味着厨房窗户从早上7点起一直处于开启状态,白天无人在家时窗户敞开存在安全风险。", "推理步骤4: 整体生活模式正常——早上6点起床、7:14出门上班/上学、16:05孩子放学回家、17:57大人下班回家、22:15就寝,门锁开关和运动传感器的触发时序合理,不存在入侵迹象。", "推理步骤5: 温度趋势符合夏季日间规律:凌晨约23°C,中午升至约25.9°C,傍晚回落。客厅空调在17:57开启制冷(SystemMode=3),22:15关闭,温度变化与之吻合,无火灾或异常升温迹象。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为手动开锁+自动上锁的正常模式,洗碗机正常启动运行,儿童房窗帘按作息开合,均属正常行为。"], "key_evidence": ["kitchen_temp_sensor 在 06:33、07:15、18:51、19:15 四次报告 MeasuredValue = None,均与灶具操作时间高度相关", "kitchen_window_contact 在 07:14:30 和 19:14:30 两次报告 StateValue=False(开启),但全天无 StateValue=True(关闭)记录,窗户持续敞开", "其他温度传感器全天数据连续正常,排除系统性通信故障", "16:05 入户时前门未上锁(日志中无 LockOperationType=0),直到 22:15 才自动上锁,中间约6小时门锁处于未锁定状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或干扰,必要时更换或重新定位传感器", "设置自动化规则:当厨房温度传感器报告 None 值时立即发送告警通知,避免在灶具使用期间丧失温度监控能力", "确认厨房窗户当前状态,如已关闭则可能是窗户传感器漏报,需检查传感器电量和信号;如确实未关闭,建议立即关闭", "建议设置离家模式自动化:出门后若检测到窗户仍开启,自动发送提醒", "建议设置入户后自动上锁规则,避免长时间门锁处于未锁定状态(16:05至22:15约6小时未上锁)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.0088107585907, "api_error": null} {"episode_id": "SQ3_TN_C_0699", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0699.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261328, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后未关闭,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天生活节奏——05:58 主卧有人起床,06:27 儿童房起床,07:07 做早餐,07:13 全家出门并锁门,16:23 孩子放学回家,18:13 大人回家开空调做晚饭,20:51 孩子就寝,22:36 大人就寝并锁门。整体作息模式完全正常,符合有学龄儿童的三口之家。\",\n \"推理步骤2: 入侵检测——全天仅有三次开门记录(07:13 出门、16:23 回家、18:13 回家),每次开门都伴随合理的运动传感器触发和后续活动(开灯、开空调等)。07:13 和 22:36 两次锁门均为自动上锁,夜间无任何门窗异常开启或运动传感器触发,排除入侵风险。\",\n \"推理步骤3: 火灾/烟雾检测——全天厨房和客厅烟雾报警器均未触发,灶具两次使用(07:07-07:14 早餐、18:40-19:12 晚餐)时长合理,且每次使用后都已关闭,无火灾风险。\",\n \"推理步骤4: 漏水检测——厨房、主卫、次卫的漏水传感器全天无任何报警事件,排除漏水风险。\",\n \"推理步骤5: 温度趋势分析——各房间温度从凌晨约 22.9°C 逐步升至中午峰值约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。18:13 开启客厅空调(制冷模式 SystemMode=3)后,客厅温度从 24.5°C 稳步下降,表现正常。无任何房间出现异常温升。\",\n \"推理步骤6: 厨房温度传感器异常——在 07:08、07:15、18:41、19:13 四个时间点,kitchen_temp_sensor 报告 MeasuredValue = None。这些时间点恰好与灶具开启/关闭时段重合,可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然 07:30 和 19:30 之后传感器恢复了正常读数,但反复出现 null 值不应被忽视。\",\n \"推理步骤7: 厨房窗户状态——07:14:30 早餐后开窗通风(StateValue=False 表示打开),但全天日志中未见该窗户关闭的记录。19:12:30 晚餐后再次记录窗户打开,同样未见关闭。这意味着厨房窗户可能整天处于打开状态,夜间无人时窗户未关存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:08、07:15、18:41、19:13 四次报告 MeasuredValue = None,与灶具使用时段高度相关\",\n \"kitchen_window_contact 在 07:14:30 记录打开后,全天日志中未出现关闭记录(StateValue=True),22:36 就寝锁门时厨房窗户仍处于打开状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器\",\n \"关闭厨房窗户,或设置自动化规则:当入户门锁定(就寝/离家)时检查所有窗户状态并发出提醒\",\n \"可考虑为厨房温度传感器设置 null 值告警规则,连续出现 null 时及时通知住户排查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时厨房窗户在做饭后未关闭,存在轻微安全隐患。", "reasoning": ["推理步骤1: 梳理全天生活节奏——05:58 主卧有人起床,06:27 儿童房起床,07:07 做早餐,07:13 全家出门并锁门,16:23 孩子放学回家,18:13 大人回家开空调做晚饭,20:51 孩子就寝,22:36 大人就寝并锁门。整体作息模式完全正常,符合有学龄儿童的三口之家。", "推理步骤2: 入侵检测——全天仅有三次开门记录(07:13 出门、16:23 回家、18:13 回家),每次开门都伴随合理的运动传感器触发和后续活动(开灯、开空调等)。07:13 和 22:36 两次锁门均为自动上锁,夜间无任何门窗异常开启或运动传感器触发,排除入侵风险。", "推理步骤3: 火灾/烟雾检测——全天厨房和客厅烟雾报警器均未触发,灶具两次使用(07:07-07:14 早餐、18:40-19:12 晚餐)时长合理,且每次使用后都已关闭,无火灾风险。", "推理步骤4: 漏水检测——厨房、主卫、次卫的漏水传感器全天无任何报警事件,排除漏水风险。", "推理步骤5: 温度趋势分析——各房间温度从凌晨约 22.9°C 逐步升至中午峰值约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。18:13 开启客厅空调(制冷模式 SystemMode=3)后,客厅温度从 24.5°C 稳步下降,表现正常。无任何房间出现异常温升。", "推理步骤6: 厨房温度传感器异常——在 07:08、07:15、18:41、19:13 四个时间点,kitchen_temp_sensor 报告 MeasuredValue = None。这些时间点恰好与灶具开启/关闭时段重合,可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然 07:30 和 19:30 之后传感器恢复了正常读数,但反复出现 null 值不应被忽视。", "推理步骤7: 厨房窗户状态——07:14:30 早餐后开窗通风(StateValue=False 表示打开),但全天日志中未见该窗户关闭的记录。19:12:30 晚餐后再次记录窗户打开,同样未见关闭。这意味着厨房窗户可能整天处于打开状态,夜间无人时窗户未关存在一定安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在 07:08、07:15、18:41、19:13 四次报告 MeasuredValue = None,与灶具使用时段高度相关", "kitchen_window_contact 在 07:14:30 记录打开后,全天日志中未出现关闭记录(StateValue=True),22:36 就寝锁门时厨房窗户仍处于打开状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器", "关闭厨房窗户,或设置自动化规则:当入户门锁定(就寝/离家)时检查所有窗户状态并发出提醒", "可考虑为厨房温度传感器设置 null 值告警规则,连续出现 null 时及时通知住户排查"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.23751997947693, "api_error": null} {"episode_id": "SQ3_TN_C_0706", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0706.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261335, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户做饭后开启但全天未见关闭记录,以及入户门在16:14开锁进入后未见关锁记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、06:52、18:27、18:55 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后,可能是灶具产生的热量/电磁干扰导致传感器读数异常,也可能是传感器本身存在间歇性故障。其他三个温度传感器在同一时段均正常上报数值,排除了系统级通信故障。\",\n \"推理步骤2: 厨房窗户传感器在 06:51:30 记录 StateValue=False(窗户打开),之后在 18:54:30 再次记录 StateValue=False(再次打开或仍为打开状态)。全天日志中没有出现 StateValue=True(窗户关闭)的记录。早晨做饭后开窗通风是合理行为,但窗户从早到晚持续开启且无人在家(07:45~16:14 家中无人),存在一定安全风险。\",\n \"推理步骤3: 16:14 入户门通过手动方式解锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:48:25 才出现门关闭确认和自动上锁。这意味着从 16:14 到 22:48 约 6.5 小时内,入户门可能处于未完全关闭或未上锁状态。结合 16:14 进入后仅儿童房有活动(孩子放学回家),大人 18:09 才回来,期间门锁状态不明确。\",\n \"推理步骤4: 整体生活模式分析——06:14 主卧有人起床,06:36 儿童房有人起床,06:45 做早餐,07:45 全家出门并锁门,16:14 孩子回家,18:09 大人回家,21:02 孩子就寝,22:48 大人就寝。这是典型的工作日家庭作息,行为模式本身正常。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9~23.1°C,白天随气温升高至峰值约 25.9°C(12:00-12:30),傍晚逐步回落。18:09 开启客厅空调(制冷模式 SystemMode=3)后温度加速下降,符合夏季制冷预期。各房间温度走势一致,无异常热源迹象。\",\n \"推理步骤6: 门锁、烟雾报警器、漏水传感器均未触发告警事件,无入侵、火灾或漏水迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:46、06:52、18:27、18:55 四次报告 MeasuredValue = None,其他传感器同期正常\",\n \"厨房窗户 06:51:30 打开后全天无关闭记录,家中无人时段(07:45~16:14)窗户持续敞开\",\n \"16:14 入户门手动解锁后无关锁记录,直到 22:48 才确认门关闭并自动上锁,中间约 6.5 小时门锁状态不确定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,确认是否存在间歇性故障,必要时更换设备\",\n \"设置自动化规则:入户门解锁后若超过一定时间未检测到关门/上锁,自动发送提醒通知\",\n \"设置自动化规则:家中无人(离家模式)时若检测到窗户处于打开状态,发送提醒通知\",\n \"考虑为厨房温度传感器增加异常值(None)的实时告警,避免在灶具使用期间丢失关键温度监测数据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户做饭后开启但全天未见关闭记录,以及入户门在16:14开锁进入后未见关锁记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、06:52、18:27、18:55 四次报告 MeasuredValue = None。这些时间点恰好在灶具开启或关闭前后,可能是灶具产生的热量/电磁干扰导致传感器读数异常,也可能是传感器本身存在间歇性故障。其他三个温度传感器在同一时段均正常上报数值,排除了系统级通信故障。", "推理步骤2: 厨房窗户传感器在 06:51:30 记录 StateValue=False(窗户打开),之后在 18:54:30 再次记录 StateValue=False(再次打开或仍为打开状态)。全天日志中没有出现 StateValue=True(窗户关闭)的记录。早晨做饭后开窗通风是合理行为,但窗户从早到晚持续开启且无人在家(07:45~16:14 家中无人),存在一定安全风险。", "推理步骤3: 16:14 入户门通过手动方式解锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但之后没有门关闭(StateValue=True)和重新上锁的记录,直到 22:48:25 才出现门关闭确认和自动上锁。这意味着从 16:14 到 22:48 约 6.5 小时内,入户门可能处于未完全关闭或未上锁状态。结合 16:14 进入后仅儿童房有活动(孩子放学回家),大人 18:09 才回来,期间门锁状态不明确。", "推理步骤4: 整体生活模式分析——06:14 主卧有人起床,06:36 儿童房有人起床,06:45 做早餐,07:45 全家出门并锁门,16:14 孩子回家,18:09 大人回家,21:02 孩子就寝,22:48 大人就寝。这是典型的工作日家庭作息,行为模式本身正常。", "推理步骤5: 温度趋势正常——夜间约 22.9~23.1°C,白天随气温升高至峰值约 25.9°C(12:00-12:30),傍晚逐步回落。18:09 开启客厅空调(制冷模式 SystemMode=3)后温度加速下降,符合夏季制冷预期。各房间温度走势一致,无异常热源迹象。", "推理步骤6: 门锁、烟雾报警器、漏水传感器均未触发告警事件,无入侵、火灾或漏水迹象。"], "key_evidence": ["厨房温度传感器在 06:46、06:52、18:27、18:55 四次报告 MeasuredValue = None,其他传感器同期正常", "厨房窗户 06:51:30 打开后全天无关闭记录,家中无人时段(07:45~16:14)窗户持续敞开", "16:14 入户门手动解锁后无关锁记录,直到 22:48 才确认门关闭并自动上锁,中间约 6.5 小时门锁状态不确定"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,确认是否存在间歇性故障,必要时更换设备", "设置自动化规则:入户门解锁后若超过一定时间未检测到关门/上锁,自动发送提醒通知", "设置自动化规则:家中无人(离家模式)时若检测到窗户处于打开状态,发送提醒通知", "考虑为厨房温度传感器增加异常值(None)的实时告警,避免在灶具使用期间丢失关键温度监测数据"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.58171796798706, "api_error": null} {"episode_id": "SQ3_TN_C_0709", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0709.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261338, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:51、06:56、18:23、19:31 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在同一时段均正常上报数值。这说明问题局限于该传感器本身,而非网络全局故障。\",\n \"推理步骤2: 观察 None 值出现的时间规律——06:50:30 厨房窗户打开后紧接着 06:51 出现 None,19:30:30 厨房窗户打开后紧接着 19:31 出现 None;同时 06:55:33 灶具开启后 06:56:03 也出现 None。传感器似乎在环境温度快速变化(开窗通风或灶具点火)时读数失败,可能是传感器量程边界问题或硬件老化导致的间歇性故障。\",\n \"推理步骤3: 每次 None 之后,传感器在下一个 30 分钟整点周期又恢复了正常数值上报(如 07:00 报 2426、18:30 报 2457),说明故障是间歇性的,尚未完全失效,但不可靠的读数会影响安全监控——特别是厨房同时配有灶具和烟雾报警器,温度传感器是火灾预警的重要辅助数据源。\",\n \"推理步骤4: 除此之外,整体生活模式正常:凌晨无人活动,06:29 起床、07:19 出门上班/上学(关灯、锁门、自动上锁),16:26 孩子放学回家,18:00 大人回家开灯开空调,18:22 做饭,19:30 晚餐,20:40 孩子就寝,22:38 大人就寝并锁门。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁尝试。\",\n \"推理步骤5: 所有房间温度走势一致且合理(夜间约 23°C,午间峰值约 25.9°C,傍晚逐步回落),无异常温升。烟雾报警器和漏水传感器全天无告警。入侵风险方面,无未授权开锁事件,无深夜运动传感器异常触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:51、06:56、18:23、19:31 四次报告 MeasuredValue = None,均发生在厨房窗户打开或灶具状态变化后的短时间内\",\n \"其他三个温度传感器(客厅、主卧、儿童房)在相同时段始终正常上报,排除网络层面问题\",\n \"传感器在下一个周期恢复正常读数,表明为间歇性故障而非永久失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态(电池电量、安装位置是否过于靠近灶具或窗户),考虑清洁或更换传感器\",\n \"在传感器修复前,可临时增加厨房烟雾报警器的灵敏度或设置灶具使用时长自动提醒,弥补温度监测的空白期\",\n \"检查传感器固件版本,如有可用更新则升级,可能修复极端温变下的读数异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:51、06:56、18:23、19:31 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在同一时段均正常上报数值。这说明问题局限于该传感器本身,而非网络全局故障。", "推理步骤2: 观察 None 值出现的时间规律——06:50:30 厨房窗户打开后紧接着 06:51 出现 None,19:30:30 厨房窗户打开后紧接着 19:31 出现 None;同时 06:55:33 灶具开启后 06:56:03 也出现 None。传感器似乎在环境温度快速变化(开窗通风或灶具点火)时读数失败,可能是传感器量程边界问题或硬件老化导致的间歇性故障。", "推理步骤3: 每次 None 之后,传感器在下一个 30 分钟整点周期又恢复了正常数值上报(如 07:00 报 2426、18:30 报 2457),说明故障是间歇性的,尚未完全失效,但不可靠的读数会影响安全监控——特别是厨房同时配有灶具和烟雾报警器,温度传感器是火灾预警的重要辅助数据源。", "推理步骤4: 除此之外,整体生活模式正常:凌晨无人活动,06:29 起床、07:19 出门上班/上学(关灯、锁门、自动上锁),16:26 孩子放学回家,18:00 大人回家开灯开空调,18:22 做饭,19:30 晚餐,20:40 孩子就寝,22:38 大人就寝并锁门。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁尝试。", "推理步骤5: 所有房间温度走势一致且合理(夜间约 23°C,午间峰值约 25.9°C,傍晚逐步回落),无异常温升。烟雾报警器和漏水传感器全天无告警。入侵风险方面,无未授权开锁事件,无深夜运动传感器异常触发。"], "key_evidence": ["kitchen_temp_sensor 在 06:51、06:56、18:23、19:31 四次报告 MeasuredValue = None,均发生在厨房窗户打开或灶具状态变化后的短时间内", "其他三个温度传感器(客厅、主卧、儿童房)在相同时段始终正常上报,排除网络层面问题", "传感器在下一个周期恢复正常读数,表明为间歇性故障而非永久失效"], "recommended_actions": ["检查厨房温度传感器的硬件状态(电池电量、安装位置是否过于靠近灶具或窗户),考虑清洁或更换传感器", "在传感器修复前,可临时增加厨房烟雾报警器的灵敏度或设置灶具使用时长自动提醒,弥补温度监测的空白期", "检查传感器固件版本,如有可用更新则升级,可能修复极端温变下的读数异常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.461662530899048, "api_error": null} {"episode_id": "SQ3_TN_C_0712", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0712.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261341, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——凌晨无活动,06:15 起床,07:39 出门并自动锁门,16:27 孩子放学回家,17:57 大人回家,22:45 就寝锁门,符合典型三口之家作息。\",\n \"推理步骤2: 入侵风险排除——所有开门/解锁事件均为 Manual 操作且伴随运动传感器触发,离家和就寝时门锁均自动上锁(LockState=1),入户门传感器最终状态为关闭(True)。\",\n \"推理步骤3: 厨房温度传感器在 07:10、07:14、18:46、19:05 四次报告 MeasuredValue = None。虽然两次发生在灶具使用期间(可能因高温超量程),但正常传感器应报告具体数值或错误码,而非 None。这表明传感器可能存在间歇性通信故障或硬件问题。\",\n \"推理步骤4: 温度趋势整体合理——夜间约 22.9-23.1°C,白天随日照升至 25-26°C 峰值,傍晚逐步回落,各房间温度一致性良好,无异常热源迹象。\",\n \"推理步骤5: 厨房窗户在做饭后打开(07:13:30 和 19:04:30)属于正常通风行为,但日志中未见关闭事件,需确认窗户是否仍处于开启状态。\",\n \"推理步骤6: 火灾风险排除——灶具使用时间短(约 3-4 分钟早餐、约 19 分钟晚餐),烟雾报警器未触发,无异常温度飙升。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:10、07:14、18:46、19:05 四次报告 MeasuredValue = None\",\n \"厨房窗户传感器两次报告打开(BooleanState.StateValue = False)但日志中无对应关闭事件\",\n \"所有门锁操作均为正常手动开锁/自动上锁,无异常解锁尝试\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和电池电量,必要时重新配对或更换设备\",\n \"确认厨房窗户当前是否处于关闭状态,夜间开窗可能带来安全隐患\",\n \"考虑为厨房温度传感器设置 None 值告警规则,以便及时发现传感器离线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 整体生活模式正常——凌晨无活动,06:15 起床,07:39 出门并自动锁门,16:27 孩子放学回家,17:57 大人回家,22:45 就寝锁门,符合典型三口之家作息。", "推理步骤2: 入侵风险排除——所有开门/解锁事件均为 Manual 操作且伴随运动传感器触发,离家和就寝时门锁均自动上锁(LockState=1),入户门传感器最终状态为关闭(True)。", "推理步骤3: 厨房温度传感器在 07:10、07:14、18:46、19:05 四次报告 MeasuredValue = None。虽然两次发生在灶具使用期间(可能因高温超量程),但正常传感器应报告具体数值或错误码,而非 None。这表明传感器可能存在间歇性通信故障或硬件问题。", "推理步骤4: 温度趋势整体合理——夜间约 22.9-23.1°C,白天随日照升至 25-26°C 峰值,傍晚逐步回落,各房间温度一致性良好,无异常热源迹象。", "推理步骤5: 厨房窗户在做饭后打开(07:13:30 和 19:04:30)属于正常通风行为,但日志中未见关闭事件,需确认窗户是否仍处于开启状态。", "推理步骤6: 火灾风险排除——灶具使用时间短(约 3-4 分钟早餐、约 19 分钟晚餐),烟雾报警器未触发,无异常温度飙升。"], "key_evidence": ["kitchen_temp_sensor 在 07:10、07:14、18:46、19:05 四次报告 MeasuredValue = None", "厨房窗户传感器两次报告打开(BooleanState.StateValue = False)但日志中无对应关闭事件", "所有门锁操作均为正常手动开锁/自动上锁,无异常解锁尝试"], "recommended_actions": ["检查厨房温度传感器的连接状态和电池电量,必要时重新配对或更换设备", "确认厨房窗户当前是否处于关闭状态,夜间开窗可能带来安全隐患", "考虑为厨房温度传感器设置 None 值告警规则,以便及时发现传感器离线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.18698024749756, "api_error": null} {"episode_id": "SQ3_TN_C_0719", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0719.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261348, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——凌晨无人活动,06:03 主卧起床,07:32 全家出门并自动锁门,16:05 孩子放学回家,18:06 大人回家,22:44 就寝锁门,符合典型三口之家作息。\",\n \"推理步骤2: 入侵风险排除——两次出门/回家均通过 Manual 方式开锁,门锁在关门后自动上锁(Auto, LockState=1),16:05 回家时未锁门但入户门传感器未报告异常长时间开启,18:06 回家后门也正常关闭,22:44 就寝时确认门已关闭并上锁。\",\n \"推理步骤3: 厨房温度传感器异常——07:08 和 07:10 灶具短暂使用期间,以及 18:41 和 18:58 晚餐烹饪期间,kitchen_temp_sensor 报告 MeasuredValue = None。正常传感器即使在高温环境下也应报告数值而非 None。这可能是传感器在灶具产生的热量/蒸汽影响下出现通信中断或测量超限。\",\n \"推理步骤4: 但传感器在非烹饪时段(如 07:30、19:00 之后)恢复正常读数,说明并非完全损坏,而是在特定条件下(灶具开启时的高温或干扰)出现间歇性故障。\",\n \"推理步骤5: 其他方面均正常——温度曲线符合夏季昼夜变化(夜间 22.9°C,午间峰值 25.8°C,傍晚回落),空调制冷模式(SystemMode=3)合理,烟雾报警器未触发,漏水传感器无报警,洗碗机正常运行。\"\n ],\n \"key_evidence\": [\n \"07:08 和 07:10 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 07:07:40 开启,07:09 关闭)\",\n \"18:41 和 18:58 kitchen_temp_sensor 再次报告 MeasuredValue = None(灶具 18:40:30 开启,18:57 关闭)\",\n \"传感器在灶具关闭后的下一个整点读数恢复正常(07:30 报告 2427,19:00 报告 2438)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出测量范围\",\n \"检查传感器固件版本,考虑更新固件以改善极端温度下的容错处理\",\n \"如问题持续,建议将传感器迁移至远离灶具热源的位置,或增加一个备用传感器以确保厨房火灾监测不出现盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 整体生活模式正常——凌晨无人活动,06:03 主卧起床,07:32 全家出门并自动锁门,16:05 孩子放学回家,18:06 大人回家,22:44 就寝锁门,符合典型三口之家作息。", "推理步骤2: 入侵风险排除——两次出门/回家均通过 Manual 方式开锁,门锁在关门后自动上锁(Auto, LockState=1),16:05 回家时未锁门但入户门传感器未报告异常长时间开启,18:06 回家后门也正常关闭,22:44 就寝时确认门已关闭并上锁。", "推理步骤3: 厨房温度传感器异常——07:08 和 07:10 灶具短暂使用期间,以及 18:41 和 18:58 晚餐烹饪期间,kitchen_temp_sensor 报告 MeasuredValue = None。正常传感器即使在高温环境下也应报告数值而非 None。这可能是传感器在灶具产生的热量/蒸汽影响下出现通信中断或测量超限。", "推理步骤4: 但传感器在非烹饪时段(如 07:30、19:00 之后)恢复正常读数,说明并非完全损坏,而是在特定条件下(灶具开启时的高温或干扰)出现间歇性故障。", "推理步骤5: 其他方面均正常——温度曲线符合夏季昼夜变化(夜间 22.9°C,午间峰值 25.8°C,傍晚回落),空调制冷模式(SystemMode=3)合理,烟雾报警器未触发,漏水传感器无报警,洗碗机正常运行。"], "key_evidence": ["07:08 和 07:10 kitchen_temp_sensor 报告 MeasuredValue = None(灶具 07:07:40 开启,07:09 关闭)", "18:41 和 18:58 kitchen_temp_sensor 再次报告 MeasuredValue = None(灶具 18:40:30 开启,18:57 关闭)", "传感器在灶具关闭后的下一个整点读数恢复正常(07:30 报告 2427,19:00 报告 2438)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出测量范围", "检查传感器固件版本,考虑更新固件以改善极端温度下的容错处理", "如问题持续,建议将传感器迁移至远离灶具热源的位置,或增加一个备用传感器以确保厨房火灾监测不出现盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.236684322357178, "api_error": null} {"episode_id": "SQ3_TN_C_0716", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_C_0716.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261345, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——凌晨无人活动,06:22 儿童房先起床,06:31 主卧起床,符合有孩子的家庭作息。07:40 全家关灯、手动开锁出门、自动上锁,是典型的工作日出门流程。\",\n \"推理步骤2: 16:20 有人回家(开锁→玄关感应→儿童房活动),17:44 另一人回家(开锁→客厅活动→开空调),符合放学/下班的时间规律。晚间做饭、用餐、洗碗机运行、22:33 关灯锁门就寝,均为正常家庭活动。\",\n \"推理步骤3: 入侵排查——所有开锁事件均为 Manual 操作源,无异常远程或未授权开锁。门锁在出门和就寝时均自动上锁(LockState=1),入户门传感器状态与开关门动作一致。16:20 回家后入户门未显示关门/上锁记录,但这可能是日志未记录中间状态,17:44 回家后同样如此,直到 22:33 就寝时确认门已关闭并上锁。\",\n \"推理步骤4: 火灾风险排查——灶具两次使用(07:03-07:15 早餐、18:18-19:27 晚餐),时长合理。烟雾报警器全天无触发。做饭后开厨房窗通风(07:15:30 和 19:27:30),是正常习惯。\",\n \"推理步骤5: 温度趋势正常——凌晨约 22.9-23.1°C,白天随气温升至峰值约 25.8°C(12:00-12:30),下午逐步回落,晚间降至约 23.4°C。各房间温度走势一致,无局部异常升温。17:44 开启客厅空调(制冷模式 SystemMode=3)后温度平稳下降,合理。\",\n \"推理步骤6: 异常发现——厨房温度传感器在 07:04:03、07:16:00、18:19:00、19:28:00 四次报告 MeasuredValue = None。这些时间点恰好与灶具开启/关闭时段重合,可能是灶具产生的热量或油烟干扰了传感器,也可能是传感器本身存在间歇性通信故障。虽然 30 分钟周期的正常读数恢复了,但短时间内反复出现 None 值不应被忽视。\",\n \"推理步骤7: 漏水排查——厨房、主卫、次卫的漏水传感器全天无报警,正常。洗碗机运行期间也无异常。\",\n \"推理步骤8: 儿童安全——儿童房窗户传感器无开启记录,20:49 关灯并关闭窗帘(100%),符合儿童就寝流程。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:04:03、07:16:00、18:19:00、19:28:00 四次报告 MeasuredValue = None,均与灶具使用时段高度关联\",\n \"除厨房温度传感器的 None 值外,所有设备行为(门锁、运动传感器、灯光、空调、窗帘)均符合正常家庭作息模式\",\n \"烟雾报警器和漏水传感器全天无触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑调整安装位置\",\n \"查看厨房温度传感器的设备健康状态和电池电量,排除硬件故障或低电量导致的间歇性通信丢失\",\n \"如传感器持续出现 None 值,建议更换设备或联系厂商排查固件问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 整体生活模式正常——凌晨无人活动,06:22 儿童房先起床,06:31 主卧起床,符合有孩子的家庭作息。07:40 全家关灯、手动开锁出门、自动上锁,是典型的工作日出门流程。", "推理步骤2: 16:20 有人回家(开锁→玄关感应→儿童房活动),17:44 另一人回家(开锁→客厅活动→开空调),符合放学/下班的时间规律。晚间做饭、用餐、洗碗机运行、22:33 关灯锁门就寝,均为正常家庭活动。", "推理步骤3: 入侵排查——所有开锁事件均为 Manual 操作源,无异常远程或未授权开锁。门锁在出门和就寝时均自动上锁(LockState=1),入户门传感器状态与开关门动作一致。16:20 回家后入户门未显示关门/上锁记录,但这可能是日志未记录中间状态,17:44 回家后同样如此,直到 22:33 就寝时确认门已关闭并上锁。", "推理步骤4: 火灾风险排查——灶具两次使用(07:03-07:15 早餐、18:18-19:27 晚餐),时长合理。烟雾报警器全天无触发。做饭后开厨房窗通风(07:15:30 和 19:27:30),是正常习惯。", "推理步骤5: 温度趋势正常——凌晨约 22.9-23.1°C,白天随气温升至峰值约 25.8°C(12:00-12:30),下午逐步回落,晚间降至约 23.4°C。各房间温度走势一致,无局部异常升温。17:44 开启客厅空调(制冷模式 SystemMode=3)后温度平稳下降,合理。", "推理步骤6: 异常发现——厨房温度传感器在 07:04:03、07:16:00、18:19:00、19:28:00 四次报告 MeasuredValue = None。这些时间点恰好与灶具开启/关闭时段重合,可能是灶具产生的热量或油烟干扰了传感器,也可能是传感器本身存在间歇性通信故障。虽然 30 分钟周期的正常读数恢复了,但短时间内反复出现 None 值不应被忽视。", "推理步骤7: 漏水排查——厨房、主卫、次卫的漏水传感器全天无报警,正常。洗碗机运行期间也无异常。", "推理步骤8: 儿童安全——儿童房窗户传感器无开启记录,20:49 关灯并关闭窗帘(100%),符合儿童就寝流程。"], "key_evidence": ["kitchen_temp_sensor 在 07:04:03、07:16:00、18:19:00、19:28:00 四次报告 MeasuredValue = None,均与灶具使用时段高度关联", "除厨房温度传感器的 None 值外,所有设备行为(门锁、运动传感器、灯光、空调、窗帘)均符合正常家庭作息模式", "烟雾报警器和漏水传感器全天无触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑调整安装位置", "查看厨房温度传感器的设备健康状态和电池电量,排除硬件故障或低电量导致的间歇性通信丢失", "如传感器持续出现 None 值,建议更换设备或联系厂商排查固件问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.688832759857178, "api_error": null} {"episode_id": "SQ3_TN_D_0666", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0666.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261295, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时入户门在老人外出期间(08:30)未关闭/未锁定,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:07、06:41、10:51、11:34、17:09、17:27),共出现6次。虽然灶具工作时传感器可能因高温超量程而返回 None,但该行为在灶具关闭后(06:41、11:34、17:27)仍然出现,说明传感器可能存在故障或响应延迟问题。\",\n \"推理步骤2: 老人于 06:56 手动开锁出门,门锁自动上锁,这是正常外出。但 08:30 门锁再次手动解锁(LockOperationType=1),门被打开(StateValue=False),随后玄关和客厅检测到有人进入并开灯——但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到 20:42 才出现门关闭和自动上锁记录,意味着入户门可能从 08:30 到 20:42 长达约12小时处于未关闭或未锁定状态。对于独居老人,这是一个显著的安全隐患。\",\n \"推理步骤3: 老人的日常作息模式基本正常——05:29起床、05:46如厕、06:06做早餐、06:56外出、08:30回家、12:25午休、14:08起床、17:08做晚餐、20:26如厕、20:42就寝。活动轨迹连贯,各房间运动传感器触发顺序合理,未发现长时间无活动的健康异常。\",\n \"推理步骤4: 温度数据整体呈现正常的日间升温、夜间降温趋势(卧室夜间约22°C,午间峰值约25°C),未出现异常高温或骤变,排除火灾风险。烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤5: 灶具三次使用时长分别约为34分钟、43分钟、18分钟,均在合理范围内,且每次都有人在厨房(occupancy=1),不存在无人看管灶具的情况。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:07、06:41、10:51、11:34、17:09、17:27 共6次报告 MeasuredValue = None\",\n \"08:30 入户门解锁并打开(front_door_contact StateValue=False),但直到 20:42 才记录到门关闭(StateValue=True)和自动上锁,期间约12小时无门锁闭合记录\",\n \"08:30 进入者触发了玄关和客厅运动传感器,行为与老人回家一致,但长时间未锁门仍属异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否工作正常,确认灶具附近高温是否导致传感器超量程,必要时更换耐高温型号或调整安装位置\",\n \"核实入户门锁和门磁传感器状态,确认 08:30 至 20:42 期间门是否确实未关闭;如属实,建议设置门锁未锁定超时提醒(如超过10分钟未锁门则推送告警)\",\n \"为独居老人配置「长时间未活动告警」规则,如任何房间运动传感器超过2小时无触发则通知紧急联系人\",\n \"建议在入户门增加自动关门器或设置门未关闭的语音提醒,降低老人忘记关门的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时入户门在老人外出期间(08:30)未关闭/未锁定,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:07、06:41、10:51、11:34、17:09、17:27),共出现6次。虽然灶具工作时传感器可能因高温超量程而返回 None,但该行为在灶具关闭后(06:41、11:34、17:27)仍然出现,说明传感器可能存在故障或响应延迟问题。", "推理步骤2: 老人于 06:56 手动开锁出门,门锁自动上锁,这是正常外出。但 08:30 门锁再次手动解锁(LockOperationType=1),门被打开(StateValue=False),随后玄关和客厅检测到有人进入并开灯——但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到 20:42 才出现门关闭和自动上锁记录,意味着入户门可能从 08:30 到 20:42 长达约12小时处于未关闭或未锁定状态。对于独居老人,这是一个显著的安全隐患。", "推理步骤3: 老人的日常作息模式基本正常——05:29起床、05:46如厕、06:06做早餐、06:56外出、08:30回家、12:25午休、14:08起床、17:08做晚餐、20:26如厕、20:42就寝。活动轨迹连贯,各房间运动传感器触发顺序合理,未发现长时间无活动的健康异常。", "推理步骤4: 温度数据整体呈现正常的日间升温、夜间降温趋势(卧室夜间约22°C,午间峰值约25°C),未出现异常高温或骤变,排除火灾风险。烟雾报警器和漏水传感器全天无告警。", "推理步骤5: 灶具三次使用时长分别约为34分钟、43分钟、18分钟,均在合理范围内,且每次都有人在厨房(occupancy=1),不存在无人看管灶具的情况。"], "key_evidence": ["厨房温度传感器在 06:07、06:41、10:51、11:34、17:09、17:27 共6次报告 MeasuredValue = None", "08:30 入户门解锁并打开(front_door_contact StateValue=False),但直到 20:42 才记录到门关闭(StateValue=True)和自动上锁,期间约12小时无门锁闭合记录", "08:30 进入者触发了玄关和客厅运动传感器,行为与老人回家一致,但长时间未锁门仍属异常"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否工作正常,确认灶具附近高温是否导致传感器超量程,必要时更换耐高温型号或调整安装位置", "核实入户门锁和门磁传感器状态,确认 08:30 至 20:42 期间门是否确实未关闭;如属实,建议设置门锁未锁定超时提醒(如超过10分钟未锁门则推送告警)", "为独居老人配置「长时间未活动告警」规则,如任何房间运动传感器超过2小时无触发则通知紧急联系人", "建议在入户门增加自动关门器或设置门未关闭的语音提醒,降低老人忘记关门的风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.863336324691772, "api_error": null} {"episode_id": "SQ3_TN_D_0673", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0673.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261302, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险;同时入户门在 08:22 开锁进入后长时间未上锁,直到 20:36 才自动落锁,独居老人安全隐患较大。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:23 起床、05:41 如厕、06:02 进厨房做早餐、06:50 出门、08:22 回家,12:25 午休、13:53 起床,17:09 做晚餐,20:36 就寝。三餐规律、作息正常,未发现健康异常(如长时间无活动)。\",\n \"推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:02-06:26、10:53-11:21、17:09-17:23),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启时恰恰是最需要温度监控的时刻(防止过热/火灾),传感器在此关键时段失效意味着安全监控存在盲区。灶具关闭后传感器也报告了一次 None,随后在下一个整点恢复正常读数,说明可能是高温导致传感器暂时失灵或通信中断。\",\n \"推理步骤3: 入户门锁状态分析——06:50 老人手动开锁出门,门关闭后自动上锁(LockState=1),正常。08:22 老人手动开锁回家(LockOperationType=1),门打开(StateValue=False),但之后日志中没有门关闭和上锁的记录,直到 20:36 才出现 front_door_contact StateValue=True 和自动上锁。这意味着入户门可能在 08:22 至 20:36 长达约 12 小时处于未锁定甚至未关闭状态,对独居老人存在入侵风险。\",\n \"推理步骤4: 温度趋势正常——室内温度随夏季日间升温(从 ~23°C 升至 ~25.9°C)、夜间降温,符合自然规律。未开启空调,卧室温度始终略低于客厅和厨房(可能朝北或有遮阳),无异常热源迹象。\",\n \"推理步骤5: 安防设备状态——烟雾报警器、漏水传感器全天无告警,窗户传感器无异常开合记录,排除火灾和水患风险。\",\n \"推理步骤6: 误报排除——厨房温度传感器的 None 值如果是设计行为(如灶具使用时主动屏蔽以避免高温误读),则不算故障,但这种设计不常见且会造成监控盲区,仍建议确认。入户门长时间未锁也可能是传感器漏报,但基于日志数据应按实际状态处理。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:03、06:27、10:54、11:22、17:10、17:24)共 6 次报告 MeasuredValue = None\",\n \"入户门 08:22 开锁后无关门/上锁记录,直到 20:36(约 12 小时后)才记录到门关闭并自动上锁\",\n \"08:22 开门事件中有 front_door_contact StateValue=False(门开),但后续无 StateValue=True(门关)直到 20:36\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor):确认灶具使用期间报告 None 是否为已知行为,若非预期则更换或重新校准传感器,确保烹饪期间温度监控不中断\",\n \"检查入户门锁及门磁传感器:确认 08:22-20:36 期间门是否确实未关闭/未上锁,排查门磁传感器是否存在漏报问题\",\n \"建议设置入户门未锁定超时告警:独居老人场景下,门锁处于未锁定状态超过一定时间(如 10 分钟)应推送提醒\",\n \"考虑为厨房增加独立的高温告警机制(如烟雾报警器联动),不完全依赖温度传感器进行灶具安全监控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险;同时入户门在 08:22 开锁进入后长时间未上锁,直到 20:36 才自动落锁,独居老人安全隐患较大。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:23 起床、05:41 如厕、06:02 进厨房做早餐、06:50 出门、08:22 回家,12:25 午休、13:53 起床,17:09 做晚餐,20:36 就寝。三餐规律、作息正常,未发现健康异常(如长时间无活动)。", "推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:02-06:26、10:53-11:21、17:09-17:23),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启时恰恰是最需要温度监控的时刻(防止过热/火灾),传感器在此关键时段失效意味着安全监控存在盲区。灶具关闭后传感器也报告了一次 None,随后在下一个整点恢复正常读数,说明可能是高温导致传感器暂时失灵或通信中断。", "推理步骤3: 入户门锁状态分析——06:50 老人手动开锁出门,门关闭后自动上锁(LockState=1),正常。08:22 老人手动开锁回家(LockOperationType=1),门打开(StateValue=False),但之后日志中没有门关闭和上锁的记录,直到 20:36 才出现 front_door_contact StateValue=True 和自动上锁。这意味着入户门可能在 08:22 至 20:36 长达约 12 小时处于未锁定甚至未关闭状态,对独居老人存在入侵风险。", "推理步骤4: 温度趋势正常——室内温度随夏季日间升温(从 ~23°C 升至 ~25.9°C)、夜间降温,符合自然规律。未开启空调,卧室温度始终略低于客厅和厨房(可能朝北或有遮阳),无异常热源迹象。", "推理步骤5: 安防设备状态——烟雾报警器、漏水传感器全天无告警,窗户传感器无异常开合记录,排除火灾和水患风险。", "推理步骤6: 误报排除——厨房温度传感器的 None 值如果是设计行为(如灶具使用时主动屏蔽以避免高温误读),则不算故障,但这种设计不常见且会造成监控盲区,仍建议确认。入户门长时间未锁也可能是传感器漏报,但基于日志数据应按实际状态处理。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:03、06:27、10:54、11:22、17:10、17:24)共 6 次报告 MeasuredValue = None", "入户门 08:22 开锁后无关门/上锁记录,直到 20:36(约 12 小时后)才记录到门关闭并自动上锁", "08:22 开门事件中有 front_door_contact StateValue=False(门开),但后续无 StateValue=True(门关)直到 20:36"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor):确认灶具使用期间报告 None 是否为已知行为,若非预期则更换或重新校准传感器,确保烹饪期间温度监控不中断", "检查入户门锁及门磁传感器:确认 08:22-20:36 期间门是否确实未关闭/未上锁,排查门磁传感器是否存在漏报问题", "建议设置入户门未锁定超时告警:独居老人场景下,门锁处于未锁定状态超过一定时间(如 10 分钟)应推送提醒", "考虑为厨房增加独立的高温告警机制(如烟雾报警器联动),不完全依赖温度传感器进行灶具安全监控"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.852032899856567, "api_error": null} {"episode_id": "SQ3_TN_D_0674", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0674.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20261303, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:21起床、05:42洗漱、05:52做早餐、07:09出门、08:32回家、12:30午休、16:50做晚餐、20:39就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入户门锁操作均为 Manual 解锁 + Auto 自动上锁,无异常远程开锁或暴力入侵迹象;08:32回家后入户门直到20:40才确认关锁,期间无异常开门事件。\",\n \"推理步骤3: 厨房温度传感器在三次烹饪期间(05:53、11:07、16:51)以及灶具关闭后(06:28、11:27、17:33)均报告 MeasuredValue = None,共出现6次 null 读数。正常传感器在灶具工作时应报告升高的温度值而非 null。\",\n \"推理步骤4: 对比客厅和卧室温度传感器,全天均正常上报数值且趋势合理(夜间约22°C,午间峰值约25.7°C),唯独厨房传感器在灶具开启/关闭前后出现 null,说明问题与灶具运行相关,可能是高温导致传感器通信中断或硬件异常。\",\n \"推理步骤5: 厨房烟雾报警器全天未触发,说明目前尚未发生实际火灾事件,但温度传感器失效意味着如果灶具忘关或温度异常升高,系统将无法及时发出高温预警,对独居老人构成潜在安全隐患。\",\n \"推理步骤6: 其余方面——漏水传感器无报警、窗户传感器状态正常、所有运动传感器与灯光联动合理、室温在正常范围内,未发现入侵、漏水或其他健康异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间及关闭后共6次报告 MeasuredValue = None(05:53、06:28、11:07、11:27、16:51、17:33),而同时段客厅和卧室传感器均正常上报\",\n \"该 null 值与灶具 OnOff 状态变化高度相关——每次灶具开启约1分钟后和关闭约1分钟后各出现一次 null 读数,呈现可复现的故障模式\",\n \"厨房温度传感器在非烹饪时段(如00:00-05:30、06:30、07:00等)能正常报告数值,进一步证实故障与灶具运行环境有关\"\n ],\n \"recommended_actions\": [\n \"尽快检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"在传感器修复前,为灶具设置自动关闭定时器(如超过40分钟未手动关闭则自动断电),防止老人忘关灶具时缺少温度监控\",\n \"检查厨房温度传感器的固件版本和电池电量,排除软件bug或供电不足导致的间歇性通信中断\",\n \"考虑增加冗余温度监测手段(如在厨房烟雾报警器旁加装独立温度传感器),确保灶具区域始终有有效的温度监控覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:21起床、05:42洗漱、05:52做早餐、07:09出门、08:32回家、12:30午休、16:50做晚餐、20:39就寝,符合独居老人的典型日常规律。", "推理步骤2: 入户门锁操作均为 Manual 解锁 + Auto 自动上锁,无异常远程开锁或暴力入侵迹象;08:32回家后入户门直到20:40才确认关锁,期间无异常开门事件。", "推理步骤3: 厨房温度传感器在三次烹饪期间(05:53、11:07、16:51)以及灶具关闭后(06:28、11:27、17:33)均报告 MeasuredValue = None,共出现6次 null 读数。正常传感器在灶具工作时应报告升高的温度值而非 null。", "推理步骤4: 对比客厅和卧室温度传感器,全天均正常上报数值且趋势合理(夜间约22°C,午间峰值约25.7°C),唯独厨房传感器在灶具开启/关闭前后出现 null,说明问题与灶具运行相关,可能是高温导致传感器通信中断或硬件异常。", "推理步骤5: 厨房烟雾报警器全天未触发,说明目前尚未发生实际火灾事件,但温度传感器失效意味着如果灶具忘关或温度异常升高,系统将无法及时发出高温预警,对独居老人构成潜在安全隐患。", "推理步骤6: 其余方面——漏水传感器无报警、窗户传感器状态正常、所有运动传感器与灯光联动合理、室温在正常范围内,未发现入侵、漏水或其他健康异常。"], "key_evidence": ["厨房温度传感器在灶具使用期间及关闭后共6次报告 MeasuredValue = None(05:53、06:28、11:07、11:27、16:51、17:33),而同时段客厅和卧室传感器均正常上报", "该 null 值与灶具 OnOff 状态变化高度相关——每次灶具开启约1分钟后和关闭约1分钟后各出现一次 null 读数,呈现可复现的故障模式", "厨房温度传感器在非烹饪时段(如00:00-05:30、06:30、07:00等)能正常报告数值,进一步证实故障与灶具运行环境有关"], "recommended_actions": ["尽快检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "在传感器修复前,为灶具设置自动关闭定时器(如超过40分钟未手动关闭则自动断电),防止老人忘关灶具时缺少温度监控", "检查厨房温度传感器的固件版本和电池电量,排除软件bug或供电不足导致的间歇性通信中断", "考虑增加冗余温度监测手段(如在厨房烟雾报警器旁加装独立温度传感器),确保灶具区域始终有有效的温度监控覆盖"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.959744691848755, "api_error": null} {"episode_id": "SQ3_TN_D_0679", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0679.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20261308, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人外出归来后长时间处于未锁状态。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30~23:30)的活动时间线——17:39灶具关闭,17:40厨房温度传感器再次报告None;19:37老人在客厅活动并调暗灯光;20:36转入卫生间;20:44进入卧室准备就寝,关灯拉窗帘;之后无任何活动直到日志结束。整体生活节奏正常。\",\n \"推理步骤2: 重点关注厨房温度传感器——全天共出现4次 MeasuredValue=None(06:05、06:41、11:11/11:29、16:55/17:40),每次都与灶具开启/关闭时间高度吻合。传感器在灶具工作期间失去有效读数,灶具关闭后约20~30分钟恢复正常值。这说明传感器可能因灶具高温干扰而超量程或出现故障。\",\n \"推理步骤3: 该传感器故障对独居老人构成安全隐患——如果灶具忘关或发生火灾,温度传感器恰好在此时失效,将无法提供有效的温度异常告警,削弱了厨房火灾预警能力。\",\n \"推理步骤4: 检查入户门状态——08:37老人回家时开锁开门(LockState=2, StateValue=False),但此后直到20:44才记录到门关闭并自动上锁。这意味着入户门可能在约12小时内处于未锁定或未完全关闭状态(或者门传感器在08:37后未记录关门事件)。对独居老人而言这是安全隐患。\",\n \"推理步骤5: 其他方面均正常——烟雾报警器无触发、漏水传感器无报警、窗户传感器无异常开合、室内温度随昼夜自然波动(夜间22°C左右,午间25-26°C),老人作息规律(早5:25起床、午休12:38-14:08、晚20:44就寝)。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间4次报告 MeasuredValue=None(06:05、06:41、11:11、16:55、17:40),灶具关闭后恢复正常\",\n \"08:37 入户门解锁开门后,直到20:44才有关门上锁记录,中间约12小时无门锁/门磁状态更新\",\n \"厨房温度传感器失效期间若发生灶具异常将无法提供温度告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程失效,建议将传感器移至远离灶具热源但仍能监测厨房整体温度的位置\",\n \"对厨房温度传感器进行硬件检测或更换,确保其在高温环境下仍能正常报告数值,保障火灾预警能力\",\n \"排查入户门锁和门磁传感器是否存在事件丢失问题——确认08:37至20:44期间门是否确实未关,若是则需提醒老人外出归来后及时关门上锁\",\n \"考虑增加灶具使用超时自动关闭的自动化规则,作为温度传感器失效时的备用安全措施\",\n \"建议为厨房增设独立的高温报警装置,不依赖当前温度传感器,形成冗余保护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人外出归来后长时间处于未锁状态。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30~23:30)的活动时间线——17:39灶具关闭,17:40厨房温度传感器再次报告None;19:37老人在客厅活动并调暗灯光;20:36转入卫生间;20:44进入卧室准备就寝,关灯拉窗帘;之后无任何活动直到日志结束。整体生活节奏正常。", "推理步骤2: 重点关注厨房温度传感器——全天共出现4次 MeasuredValue=None(06:05、06:41、11:11/11:29、16:55/17:40),每次都与灶具开启/关闭时间高度吻合。传感器在灶具工作期间失去有效读数,灶具关闭后约20~30分钟恢复正常值。这说明传感器可能因灶具高温干扰而超量程或出现故障。", "推理步骤3: 该传感器故障对独居老人构成安全隐患——如果灶具忘关或发生火灾,温度传感器恰好在此时失效,将无法提供有效的温度异常告警,削弱了厨房火灾预警能力。", "推理步骤4: 检查入户门状态——08:37老人回家时开锁开门(LockState=2, StateValue=False),但此后直到20:44才记录到门关闭并自动上锁。这意味着入户门可能在约12小时内处于未锁定或未完全关闭状态(或者门传感器在08:37后未记录关门事件)。对独居老人而言这是安全隐患。", "推理步骤5: 其他方面均正常——烟雾报警器无触发、漏水传感器无报警、窗户传感器无异常开合、室内温度随昼夜自然波动(夜间22°C左右,午间25-26°C),老人作息规律(早5:25起床、午休12:38-14:08、晚20:44就寝)。"], "key_evidence": ["厨房温度传感器在灶具使用期间4次报告 MeasuredValue=None(06:05、06:41、11:11、16:55、17:40),灶具关闭后恢复正常", "08:37 入户门解锁开门后,直到20:44才有关门上锁记录,中间约12小时无门锁/门磁状态更新", "厨房温度传感器失效期间若发生灶具异常将无法提供温度告警"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程失效,建议将传感器移至远离灶具热源但仍能监测厨房整体温度的位置", "对厨房温度传感器进行硬件检测或更换,确保其在高温环境下仍能正常报告数值,保障火灾预警能力", "排查入户门锁和门磁传感器是否存在事件丢失问题——确认08:37至20:44期间门是否确实未关,若是则需提醒老人外出归来后及时关门上锁", "考虑增加灶具使用超时自动关闭的自动化规则,作为温度传感器失效时的备用安全措施", "建议为厨房增设独立的高温报警装置,不依赖当前温度传感器,形成冗余保护"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.45852279663086, "api_error": null} {"episode_id": "SQ3_TN_D_0682", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0682.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261311, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"老人外出期间(06:56-08:34),入户门被从外部手动开锁进入,且门锁未在老人出门时的记录中体现回锁,存在未授权入侵的可疑迹象。\",\n \"reasoning\": [\n \"推理步骤1: 老人于 05:40 起床(卧室运动传感器触发),经历洗漱、做早餐的正常晨间流程后,于 06:56 关闭厨房灯、手动开锁(LockOperationType=1)出门,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto)。这是正常的外出行为。\",\n \"推理步骤2: 08:34 入户门再次被手动开锁(LockOperationType=1, OperationSource=Manual),门被打开(contact=False),玄关和客厅运动传感器依次触发,随后客厅灯被打开。但日志中没有记录门再次关闭(contact=True)的事件,这与 06:56 出门时门迅速关闭并自动上锁的模式不同。\",\n \"推理步骤3: 08:34 的开锁操作来源为 Manual(手动),这意味着是从物理侧操作的。对于独居老人场景,这可能是老人自己回家,但也可能是他人持有钥匙/密码进入。从行为连贯性看,老人回来后直接去客厅开灯,后续活动(做午饭、午休、做晚饭、看电视、睡觉)均符合独居老人的正常生活节奏,因此更可能是老人本人回家。\",\n \"推理步骤4: 关键异常点在于 08:34 进入后入户门未记录关闭事件(BooleanState.StateValue=True),直到 20:38:15 才出现门传感器恢复关闭状态并自动上锁。这意味着入户门可能从 08:34 一直处于未关闭或未上锁状态长达约 12 小时,对于独居老人而言这是一个显著的安全隐患。\",\n \"推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:54、06:35、11:04、11:22、16:53、17:24),这表明传感器在高温环境下可能超出量程或出现故障,属于设备异常,需要关注。\"\n ],\n \"key_evidence\": [\n \"08:34 入户门手动开锁后,日志中无门关闭(BooleanState.StateValue=True)记录,直到 20:38:15 才出现关门上锁事件,入户门疑似敞开约 12 小时\",\n \"厨房温度传感器在灶具使用期间多次报告 None 值(05:54:05、06:35:00、11:04:00、11:22:00、16:53:00、17:24:00),传感器工作异常\",\n \"20:38:15 门传感器显示关闭、自动上锁,但此时老人已在卧室准备就寝,关门动作的触发者不明确\"\n ],\n \"recommended_actions\": [\n \"立即确认入户门当前状态是否已关闭并上锁,如未锁好应远程锁定\",\n \"检查 08:34 开锁事件的具体凭证类型(密码/指纹/钥匙),确认是否为老人本人操作,排除他人持有凭证入侵的可能\",\n \"为入户门设置「开门超时未关」告警规则,例如门打开超过 5 分钟未关闭时自动推送通知给紧急联系人\",\n \"检修厨房温度传感器,灶具使用时反复报 None 值说明传感器可能不耐高温或已损坏,应更换耐高温型号或调整安装位置远离灶具\",\n \"建议为独居老人配置更完善的出入记录规则,包括非常规时段开锁的即时通知推送给家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "老人外出期间(06:56-08:34),入户门被从外部手动开锁进入,且门锁未在老人出门时的记录中体现回锁,存在未授权入侵的可疑迹象。", "reasoning": ["推理步骤1: 老人于 05:40 起床(卧室运动传感器触发),经历洗漱、做早餐的正常晨间流程后,于 06:56 关闭厨房灯、手动开锁(LockOperationType=1)出门,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto)。这是正常的外出行为。", "推理步骤2: 08:34 入户门再次被手动开锁(LockOperationType=1, OperationSource=Manual),门被打开(contact=False),玄关和客厅运动传感器依次触发,随后客厅灯被打开。但日志中没有记录门再次关闭(contact=True)的事件,这与 06:56 出门时门迅速关闭并自动上锁的模式不同。", "推理步骤3: 08:34 的开锁操作来源为 Manual(手动),这意味着是从物理侧操作的。对于独居老人场景,这可能是老人自己回家,但也可能是他人持有钥匙/密码进入。从行为连贯性看,老人回来后直接去客厅开灯,后续活动(做午饭、午休、做晚饭、看电视、睡觉)均符合独居老人的正常生活节奏,因此更可能是老人本人回家。", "推理步骤4: 关键异常点在于 08:34 进入后入户门未记录关闭事件(BooleanState.StateValue=True),直到 20:38:15 才出现门传感器恢复关闭状态并自动上锁。这意味着入户门可能从 08:34 一直处于未关闭或未上锁状态长达约 12 小时,对于独居老人而言这是一个显著的安全隐患。", "推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:54、06:35、11:04、11:22、16:53、17:24),这表明传感器在高温环境下可能超出量程或出现故障,属于设备异常,需要关注。"], "key_evidence": ["08:34 入户门手动开锁后,日志中无门关闭(BooleanState.StateValue=True)记录,直到 20:38:15 才出现关门上锁事件,入户门疑似敞开约 12 小时", "厨房温度传感器在灶具使用期间多次报告 None 值(05:54:05、06:35:00、11:04:00、11:22:00、16:53:00、17:24:00),传感器工作异常", "20:38:15 门传感器显示关闭、自动上锁,但此时老人已在卧室准备就寝,关门动作的触发者不明确"], "recommended_actions": ["立即确认入户门当前状态是否已关闭并上锁,如未锁好应远程锁定", "检查 08:34 开锁事件的具体凭证类型(密码/指纹/钥匙),确认是否为老人本人操作,排除他人持有凭证入侵的可能", "为入户门设置「开门超时未关」告警规则,例如门打开超过 5 分钟未关闭时自动推送通知给紧急联系人", "检修厨房温度传感器,灶具使用时反复报 None 值说明传感器可能不耐高温或已损坏,应更换耐高温型号或调整安装位置远离灶具", "建议为独居老人配置更完善的出入记录规则,包括非常规时段开锁的即时通知推送给家属"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.20186686515808, "api_error": null} {"episode_id": "SQ3_TN_D_0684", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0684.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261313, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约 05:30 起床(卫生间活动),05:58 进厨房做早餐,06:54 出门,08:23 回家,12:21 午休(卧室窗帘关闭),14:10 起床,17:06 做晚餐,20:36 洗漱,20:52 就寝。作息规律,符合独居老人的典型模式。\",\n \"推理步骤2: 入侵排查——06:54 出门时门锁手动解锁→开门→关门→自动上锁,08:23 回家时同样流程正常。20:52 就寝前门锁确认为已锁状态(LockState=1)。全天无异常开锁事件、无未知来源的解锁操作,无入侵迹象。\",\n \"推理步骤3: 灶具使用安全分析——三次使用灶具:05:58-06:31(约33分钟)、11:03-11:21(约18分钟)、17:06-17:37(约31分钟),使用时长合理,均有人在厨房(occupancy=1),且每次都正常关闭,无遗忘关火风险。\",\n \"推理步骤4: 厨房温度传感器异常——在灶具开启后约1分钟,kitchen_temp_sensor 均报告 MeasuredValue=None(05:59、06:32、11:04、11:22、17:07、17:38),共出现6次。灶具关闭后的下一个整点读数恢复正常。这表明传感器在灶具工作产生的热量/蒸汽环境下无法正常读数,可能是传感器量程溢出、受潮或硬件故障。\",\n \"推理步骤5: 风险评估——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在高温环境下失效,恰恰在最需要监测的时刻丧失了监测能力。对于独居老人家庭,这是一个需要关注的安全隐患。\",\n \"推理步骤6: 其他设备状态正常——烟雾报警器全天无触发,漏水传感器无报警,各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.8°C),窗户传感器无异常开启,整体环境安全。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间共6次报告 MeasuredValue=None(05:59:04、06:32:00、11:04:00、11:22:00、17:07:00、17:38:00),每次均在灶具开启/关闭后约1分钟出现\",\n \"灶具关闭后下一个30分钟整点温度读数恢复正常,说明传感器并非完全损坏,而是在特定条件下失效\",\n \"全天无入侵、无火灾、无漏水报警,老人作息规律正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致量程溢出或受热/蒸汽影响\",\n \"考虑更换为耐高温、量程更大的温度传感器,或将传感器移至远离灶具但仍能有效监测厨房整体温度的位置\",\n \"在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为火灾预警的主要手段\",\n \"建议为灶具设置自动超时关闭功能(如超过45分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约 05:30 起床(卫生间活动),05:58 进厨房做早餐,06:54 出门,08:23 回家,12:21 午休(卧室窗帘关闭),14:10 起床,17:06 做晚餐,20:36 洗漱,20:52 就寝。作息规律,符合独居老人的典型模式。", "推理步骤2: 入侵排查——06:54 出门时门锁手动解锁→开门→关门→自动上锁,08:23 回家时同样流程正常。20:52 就寝前门锁确认为已锁状态(LockState=1)。全天无异常开锁事件、无未知来源的解锁操作,无入侵迹象。", "推理步骤3: 灶具使用安全分析——三次使用灶具:05:58-06:31(约33分钟)、11:03-11:21(约18分钟)、17:06-17:37(约31分钟),使用时长合理,均有人在厨房(occupancy=1),且每次都正常关闭,无遗忘关火风险。", "推理步骤4: 厨房温度传感器异常——在灶具开启后约1分钟,kitchen_temp_sensor 均报告 MeasuredValue=None(05:59、06:32、11:04、11:22、17:07、17:38),共出现6次。灶具关闭后的下一个整点读数恢复正常。这表明传感器在灶具工作产生的热量/蒸汽环境下无法正常读数,可能是传感器量程溢出、受潮或硬件故障。", "推理步骤5: 风险评估——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在高温环境下失效,恰恰在最需要监测的时刻丧失了监测能力。对于独居老人家庭,这是一个需要关注的安全隐患。", "推理步骤6: 其他设备状态正常——烟雾报警器全天无触发,漏水传感器无报警,各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.8°C),窗户传感器无异常开启,整体环境安全。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间共6次报告 MeasuredValue=None(05:59:04、06:32:00、11:04:00、11:22:00、17:07:00、17:38:00),每次均在灶具开启/关闭后约1分钟出现", "灶具关闭后下一个30分钟整点温度读数恢复正常,说明传感器并非完全损坏,而是在特定条件下失效", "全天无入侵、无火灾、无漏水报警,老人作息规律正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致量程溢出或受热/蒸汽影响", "考虑更换为耐高温、量程更大的温度传感器,或将传感器移至远离灶具但仍能有效监测厨房整体温度的位置", "在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为火灾预警的主要手段", "建议为灶具设置自动超时关闭功能(如超过45分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.22139072418213, "api_error": null} {"episode_id": "SQ3_TN_D_0687", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0687.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261316, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在三次烹饪事件中均出现(05:52、11:11、16:58),且灶具关闭后也出现 None(06:31、11:27、17:33),说明这不是偶发现象而是系统性问题。\",\n \"推理步骤2: 正常的温度传感器在灶具使用时应报告升高的温度值而非 None。None 值通常表示传感器读数超出量程、通信中断或硬件故障。该传感器在非烹饪时段能正常报告数值,说明故障与高温环境相关。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时失效,则无法在温度异常升高时发出预警,存在安全监控盲区。\",\n \"推理步骤4: 其余行为模式正常——老人约05:28起床、洗漱、做早餐后06:57出门(门锁手动开锁后自动上锁),08:25回家,12:35午休至14:04,晚间20:40就寝。活动节奏合理,无入侵或健康异常迹象。\",\n \"推理步骤5: 08:25回家时门未关闭/上锁的记录直到20:40才出现自动上锁,但考虑到老人白天在家,门锁状态可能是正常的(门关着但未反锁),不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间均报告 MeasuredValue = None(05:52:10、11:11:00、16:58:00)\",\n \"灶具关闭后传感器仍报告 None(06:31、11:27、17:33),但在下一个半小时整点采样时恢复正常读数\",\n \"其他两个温度传感器(客厅、卧室)全天工作正常,无 None 值出现\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出测量范围\",\n \"考虑更换耐高温型温度传感器或调整安装位置,确保烹饪期间仍能有效监测厨房温度\",\n \"在传感器修复前,可设置规则:若灶具开启超过一定时长且温度传感器无有效读数,触发提醒或自动关闭灶具\",\n \"确认 08:25 回家后入户门的锁定状态,建议设置门锁未上锁超时提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在三次烹饪事件中均出现(05:52、11:11、16:58),且灶具关闭后也出现 None(06:31、11:27、17:33),说明这不是偶发现象而是系统性问题。", "推理步骤2: 正常的温度传感器在灶具使用时应报告升高的温度值而非 None。None 值通常表示传感器读数超出量程、通信中断或硬件故障。该传感器在非烹饪时段能正常报告数值,说明故障与高温环境相关。", "推理步骤3: 对于独居老人家庭,厨房温度监控是火灾预警的关键环节。如果传感器在灶具使用时失效,则无法在温度异常升高时发出预警,存在安全监控盲区。", "推理步骤4: 其余行为模式正常——老人约05:28起床、洗漱、做早餐后06:57出门(门锁手动开锁后自动上锁),08:25回家,12:35午休至14:04,晚间20:40就寝。活动节奏合理,无入侵或健康异常迹象。", "推理步骤5: 08:25回家时门未关闭/上锁的记录直到20:40才出现自动上锁,但考虑到老人白天在家,门锁状态可能是正常的(门关着但未反锁),不构成安全威胁。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间均报告 MeasuredValue = None(05:52:10、11:11:00、16:58:00)", "灶具关闭后传感器仍报告 None(06:31、11:27、17:33),但在下一个半小时整点采样时恢复正常读数", "其他两个温度传感器(客厅、卧室)全天工作正常,无 None 值出现"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出测量范围", "考虑更换耐高温型温度传感器或调整安装位置,确保烹饪期间仍能有效监测厨房温度", "在传感器修复前,可设置规则:若灶具开启超过一定时长且温度传感器无有效读数,触发提醒或自动关闭灶具", "确认 08:25 回家后入户门的锁定状态,建议设置门锁未上锁超时提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.927147150039673, "api_error": null} {"episode_id": "SQ3_TN_D_0689", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0689.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261318, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。住户活动模式整体正常——晚餐时段使用厨房灶具(17:02-17:21),之后在客厅活动(19:40调暗灯光看电视),20:22去卫生间洗漱,20:43回卧室关窗帘就寝,符合独居老人的典型晚间作息。\",\n \"推理步骤2: 入户门在20:43确认为关闭锁定状态(BooleanState=True, LockState=1),且全天仅有早晨6:54出门和8:28回家两次开门记录,均为手动操作,无异常入侵迹象。\",\n \"推理步骤3: 关键异常——厨房温度传感器在灶具开启期间(17:03和17:22)连续报告 MeasuredValue = None。回溯全天日志发现,早餐(6:10、6:36)和午餐(10:53、11:23)时段也出现了同样的 None 值。这意味着每次灶具工作时,该传感器都无法正常读数。\",\n \"推理步骤4: 温度传感器报告 None 而非一个偏高的数值,说明这不是简单的高温读数,而是传感器完全无法返回有效测量值。可能原因包括:传感器安装位置离灶具过近导致超出量程、传感器硬件老化故障、或通信链路在高温环境下不稳定。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果该传感器在灶具使用时持续失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常升高来提前预警,只能依赖烟雾报警器(触发时火情可能已较严重)。\",\n \"推理步骤6: 其他方面均正常——客厅和卧室温度传感器全天读数连续稳定(夜间约22-23°C,午间峰值约25.8°C),无漏水报警,无烟雾报警,门窗状态正常。20:43的门锁自动上锁事件是确认门已关闭的正常行为。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启期间全天共6次报告 MeasuredValue = None(06:10、06:36、10:53、11:23、17:03、17:22),呈现100%复现的规律性故障\",\n \"灶具关闭后,kitchen_temp_sensor 在下一个整点/半点周期恢复正常读数(如17:30报告2471),说明故障与灶具使用强相关\",\n \"该传感器在非烹饪时段读数完全正常且与其他房间温度趋势一致,排除传感器完全损坏的可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时将其迁移到远离热源但仍能有效监测厨房整体温度的位置\",\n \"检查该传感器的量程规格,确认其最高可测温度是否满足厨房烹饪场景的需求,如不满足则更换为耐高温型号\",\n \"在传感器问题修复前,建议为独居老人增加灶具自动关火定时功能(如超过30分钟未操作自动断气/断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常并定期测试,在温度传感器不可靠期间它是厨房安全的最后防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志。住户活动模式整体正常——晚餐时段使用厨房灶具(17:02-17:21),之后在客厅活动(19:40调暗灯光看电视),20:22去卫生间洗漱,20:43回卧室关窗帘就寝,符合独居老人的典型晚间作息。", "推理步骤2: 入户门在20:43确认为关闭锁定状态(BooleanState=True, LockState=1),且全天仅有早晨6:54出门和8:28回家两次开门记录,均为手动操作,无异常入侵迹象。", "推理步骤3: 关键异常——厨房温度传感器在灶具开启期间(17:03和17:22)连续报告 MeasuredValue = None。回溯全天日志发现,早餐(6:10、6:36)和午餐(10:53、11:23)时段也出现了同样的 None 值。这意味着每次灶具工作时,该传感器都无法正常读数。", "推理步骤4: 温度传感器报告 None 而非一个偏高的数值,说明这不是简单的高温读数,而是传感器完全无法返回有效测量值。可能原因包括:传感器安装位置离灶具过近导致超出量程、传感器硬件老化故障、或通信链路在高温环境下不稳定。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果该传感器在灶具使用时持续失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常升高来提前预警,只能依赖烟雾报警器(触发时火情可能已较严重)。", "推理步骤6: 其他方面均正常——客厅和卧室温度传感器全天读数连续稳定(夜间约22-23°C,午间峰值约25.8°C),无漏水报警,无烟雾报警,门窗状态正常。20:43的门锁自动上锁事件是确认门已关闭的正常行为。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启期间全天共6次报告 MeasuredValue = None(06:10、06:36、10:53、11:23、17:03、17:22),呈现100%复现的规律性故障", "灶具关闭后,kitchen_temp_sensor 在下一个整点/半点周期恢复正常读数(如17:30报告2471),说明故障与灶具使用强相关", "该传感器在非烹饪时段读数完全正常且与其他房间温度趋势一致,排除传感器完全损坏的可能"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,必要时将其迁移到远离热源但仍能有效监测厨房整体温度的位置", "检查该传感器的量程规格,确认其最高可测温度是否满足厨房烹饪场景的需求,如不满足则更换为耐高温型号", "在传感器问题修复前,建议为独居老人增加灶具自动关火定时功能(如超过30分钟未操作自动断气/断电),作为补偿性安全措施", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常并定期测试,在温度传感器不可靠期间它是厨房安全的最后防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.397780418395996, "api_error": null} {"episode_id": "SQ3_TN_D_0696", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0696.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20261325, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,导致烹饪期间缺失关键温度监控。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息规律正常——05:33起床、06:10做早餐、07:09出门、08:35回家、12:22午休、14:07起床、16:53做晚餐、20:50就寝,符合独居老人的典型生活节奏。\",\n \"推理步骤2: 入侵排查——全天仅有两次开门记录(07:09出门、08:35回家),门锁均为手动开锁且自动回锁,无异常开锁事件;08:35回家后入户门传感器未再报告开门,直到20:50确认门已关闭并上锁。无入侵迹象。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:10-06:20、10:58-11:33、16:53-17:40),kitchen_temp_sensor 均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None,直到下一个30分钟整点周期才恢复正常数值。这一模式在三次烹饪中完全重复。\",\n \"推理步骤4: 正常情况下温度传感器不应返回 None。可能原因:(a) 灶具产生的高温超出传感器量程导致读数溢出;(b) 灶具电磁干扰影响传感器通信;(c) 传感器硬件老化,在温度快速变化时失效。无论哪种原因,烹饪期间恰恰是最需要温度监控的时段,此时传感器失效意味着火灾风险监控存在盲区。\",\n \"推理步骤5: 烟雾报警器全天未触发,各房间温度曲线(白天升温、夜间降温)符合夏季自然变化规律,漏水传感器无报警,其余设备工作正常。除厨房温度传感器外未发现其他异常。\",\n \"推理步骤6: 对于独居老人场景,厨房安全监控尤为重要。温度传感器在烹饪时段反复失效,会削弱火灾早期预警能力,构成中等风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间(06:11、06:21、10:59、11:34、16:54、17:41)共6次报告 MeasuredValue = None,模式高度一致\",\n \"每次 None 出现时间与 kitchen_cook_surface 开启/关闭时间高度关联(开启后约30秒、关闭后约1分钟),表明故障与灶具运行直接相关\",\n \"非烹饪时段 kitchen_temp_sensor 读数正常(2290-2577),说明传感器在常温下可工作,但在灶具工作环境下失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,必要时重新选址安装\",\n \"检查传感器固件版本并更新,确认其量程是否覆盖烹饪场景下的环境温度\",\n \"如传感器硬件老化,建议更换为耐高温型号,确保烹饪期间温度监控不中断\",\n \"在传感器修复前,可考虑增加烹饪定时提醒或灶具自动关闭策略,作为补偿性安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,导致烹饪期间缺失关键温度监控。", "reasoning": ["推理步骤1: 住户作息规律正常——05:33起床、06:10做早餐、07:09出门、08:35回家、12:22午休、14:07起床、16:53做晚餐、20:50就寝,符合独居老人的典型生活节奏。", "推理步骤2: 入侵排查——全天仅有两次开门记录(07:09出门、08:35回家),门锁均为手动开锁且自动回锁,无异常开锁事件;08:35回家后入户门传感器未再报告开门,直到20:50确认门已关闭并上锁。无入侵迹象。", "推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:10-06:20、10:58-11:33、16:53-17:40),kitchen_temp_sensor 均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None,直到下一个30分钟整点周期才恢复正常数值。这一模式在三次烹饪中完全重复。", "推理步骤4: 正常情况下温度传感器不应返回 None。可能原因:(a) 灶具产生的高温超出传感器量程导致读数溢出;(b) 灶具电磁干扰影响传感器通信;(c) 传感器硬件老化,在温度快速变化时失效。无论哪种原因,烹饪期间恰恰是最需要温度监控的时段,此时传感器失效意味着火灾风险监控存在盲区。", "推理步骤5: 烟雾报警器全天未触发,各房间温度曲线(白天升温、夜间降温)符合夏季自然变化规律,漏水传感器无报警,其余设备工作正常。除厨房温度传感器外未发现其他异常。", "推理步骤6: 对于独居老人场景,厨房安全监控尤为重要。温度传感器在烹饪时段反复失效,会削弱火灾早期预警能力,构成中等风险。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间(06:11、06:21、10:59、11:34、16:54、17:41)共6次报告 MeasuredValue = None,模式高度一致", "每次 None 出现时间与 kitchen_cook_surface 开启/关闭时间高度关联(开启后约30秒、关闭后约1分钟),表明故障与灶具运行直接相关", "非烹饪时段 kitchen_temp_sensor 读数正常(2290-2577),说明传感器在常温下可工作,但在灶具工作环境下失效"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰,必要时重新选址安装", "检查传感器固件版本并更新,确认其量程是否覆盖烹饪场景下的环境温度", "如传感器硬件老化,建议更换为耐高温型号,确保烹饪期间温度监控不中断", "在传感器修复前,可考虑增加烹饪定时提醒或灶具自动关闭策略,作为补偿性安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.161197662353516, "api_error": null} {"episode_id": "SQ3_TN_D_0697", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0697.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261326, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或超量程异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内报告 MeasuredValue = None(06:08、11:02、17:04),且在灶具关闭后约1分钟再次报告 None(06:30第一条、11:36、17:41),共出现6次 None 读数。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 为 None/null 通常表示传感器无法提供有效测量值,可能是超出量程或硬件通信故障。如果是因灶具加热导致超量程,说明传感器安装位置不当或量程不足;如果是通信故障则需要检修。\",\n \"推理步骤3: 除传感器异常外,整体生活模式正常——独居老人 05:21 起床、06:07 做早餐、07:06 出门(门锁自动上锁)、08:39 回家、12:25 午休、14:01 起床、17:03 做晚餐、20:47 就寝,作息规律无健康异常迹象。\",\n \"推理步骤4: 入户门在 08:39 开锁进入后未见再次上锁记录,直到 20:47 才有自动上锁事件,期间门锁状态不明确,但考虑到老人在家中活动且无入侵迹象(无异常运动传感器触发),风险较低。\",\n \"推理步骤5: 灶具每次使用时长合理(早餐约22分钟、午餐约34分钟、晚餐约37分钟),烟雾报警器未触发,无火灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:08、06:30、11:02、11:36、17:04、17:41 共6次报告 MeasuredValue = None\",\n \"None 值均出现在灶具开启/关闭前后约1分钟内,与烹饪活动强相关\",\n \"其他时段厨房温度传感器读数正常(2291-2573范围),说明传感器并非完全失效\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致烹饪时超出测量量程\",\n \"如传感器量程不足(通常上限50°C/5000),考虑更换为耐高温型号或调整安装位置\",\n \"建议为独居老人设置灶具使用超时提醒(如超过45分钟未关闭则告警),作为额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或超量程异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内报告 MeasuredValue = None(06:08、11:02、17:04),且在灶具关闭后约1分钟再次报告 None(06:30第一条、11:36、17:41),共出现6次 None 读数。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 为 None/null 通常表示传感器无法提供有效测量值,可能是超出量程或硬件通信故障。如果是因灶具加热导致超量程,说明传感器安装位置不当或量程不足;如果是通信故障则需要检修。", "推理步骤3: 除传感器异常外,整体生活模式正常——独居老人 05:21 起床、06:07 做早餐、07:06 出门(门锁自动上锁)、08:39 回家、12:25 午休、14:01 起床、17:03 做晚餐、20:47 就寝,作息规律无健康异常迹象。", "推理步骤4: 入户门在 08:39 开锁进入后未见再次上锁记录,直到 20:47 才有自动上锁事件,期间门锁状态不明确,但考虑到老人在家中活动且无入侵迹象(无异常运动传感器触发),风险较低。", "推理步骤5: 灶具每次使用时长合理(早餐约22分钟、午餐约34分钟、晚餐约37分钟),烟雾报警器未触发,无火灾风险。"], "key_evidence": ["厨房温度传感器在 06:08、06:30、11:02、11:36、17:04、17:41 共6次报告 MeasuredValue = None", "None 值均出现在灶具开启/关闭前后约1分钟内,与烹饪活动强相关", "其他时段厨房温度传感器读数正常(2291-2573范围),说明传感器并非完全失效"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距灶具过近导致烹饪时超出测量量程", "如传感器量程不足(通常上限50°C/5000),考虑更换为耐高温型号或调整安装位置", "建议为独居老人设置灶具使用超时提醒(如超过45分钟未关闭则告警),作为额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.432953119277954, "api_error": null} {"episode_id": "SQ3_TN_D_0711", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0711.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261340, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在三次烹饪期间(06:05、10:58、16:52)均出现,说明这是一个可复现的问题。\",\n \"推理步骤2: 温度传感器报告 None 意味着测量失败。在灶具使用期间恰恰是最需要温度监控的时刻(火灾风险最高),传感器此时失效会导致安全监控盲区。\",\n \"推理步骤3: 老人的日常作息模式正常——05:39起床、06:53出门晨练、08:26回家、12:39午休、14:03起床、20:42就寝,活动轨迹连贯合理,排除入侵或健康异常。\",\n \"推理步骤4: 入户门锁操作均为手动开锁+自动上锁,符合正常出入模式。08:26回家时门未重新上锁直到20:42就寝时自动锁定,期间老人一直在家,属于合理行为。\",\n \"推理步骤5: 所有温度读数在正常范围内波动(夜间约22°C,午间峰值约25.8°C),无异常温升,烟雾报警器未触发,排除火灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值:06:06、06:30(第一次)、10:59、11:32、16:53、17:39\",\n \"传感器在灶具关闭后的下一个整点读数恢复正常(如06:30报2394、11:00报2540、17:00报2488),说明故障与灶具使用强相关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或触发保护机制\",\n \"考虑将温度传感器迁移到远离灶具但仍能监测厨房整体温度的位置\",\n \"在传感器报告 None 期间,系统应依赖烟雾报警器作为厨房安全的后备监控手段,并向家属/监护人发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这在三次烹饪期间(06:05、10:58、16:52)均出现,说明这是一个可复现的问题。", "推理步骤2: 温度传感器报告 None 意味着测量失败。在灶具使用期间恰恰是最需要温度监控的时刻(火灾风险最高),传感器此时失效会导致安全监控盲区。", "推理步骤3: 老人的日常作息模式正常——05:39起床、06:53出门晨练、08:26回家、12:39午休、14:03起床、20:42就寝,活动轨迹连贯合理,排除入侵或健康异常。", "推理步骤4: 入户门锁操作均为手动开锁+自动上锁,符合正常出入模式。08:26回家时门未重新上锁直到20:42就寝时自动锁定,期间老人一直在家,属于合理行为。", "推理步骤5: 所有温度读数在正常范围内波动(夜间约22°C,午间峰值约25.8°C),无异常温升,烟雾报警器未触发,排除火灾风险。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值:06:06、06:30(第一次)、10:59、11:32、16:53、17:39", "传感器在灶具关闭后的下一个整点读数恢复正常(如06:30报2394、11:00报2540、17:00报2488),说明故障与灶具使用强相关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或触发保护机制", "考虑将温度传感器迁移到远离灶具但仍能监测厨房整体温度的位置", "在传感器报告 None 期间,系统应依赖烟雾报警器作为厨房安全的后备监控手段,并向家属/监护人发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.308424711227417, "api_error": null} {"episode_id": "SQ3_TN_D_0700", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0700.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20261329, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人回家就寝时处于未锁状态长达约1.5小时。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约05:36起床(卫生间活动),06:04做早餐,07:03出门并自动上锁,08:34回家,12:22午休拉窗帘,14:04起床,16:52做晚餐,20:36洗漱后约20:54就寝。这是一个合理的独居老人日常作息。\",\n \"推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:04-06:31、11:07-11:40、16:52-17:32),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。每次灶具使用都触发此现象,说明这不是偶发通信故障,而是传感器在高温环境下系统性失效。在正常的30分钟周期采样中传感器读数正常,仅在灶具使用时段出现 None 值。\",\n \"推理步骤3: 入户门安全隐患——老人08:34回家时解锁开门(LockOperationType=1, LockState=2),门传感器显示门打开(StateValue=False),但此后直到20:54才出现门关闭(StateValue=True)和自动上锁(LockState=1)的记录。这意味着入户门可能在08:34至20:54之间长时间未锁。虽然中间日志可能未记录所有门锁状态变化,但从日志来看,老人回家后门锁未及时恢复锁定状态,对独居老人存在安全风险。\",\n \"推理步骤4: 温度趋势正常——各房间温度随昼夜自然变化:夜间约22-23°C,午间峰值约25-26°C,卧室始终略低于客厅和厨房,符合夏季室内温度规律,无火灾或异常升温迹象。\",\n \"推理步骤5: 无入侵迹象——所有运动传感器触发均与老人活动轨迹一致,门锁操作均为手动或自动,无异常时段的未授权开锁事件。烟雾报警器和漏水传感器全天无触发。\",\n \"推理步骤6: 健康状况初步评估——老人活动节奏规律,三餐按时,午休时长约2小时属正常范围,卫生间使用时长合理(早晨约28分钟,晚间约18分钟),未发现长时间无活动的异常静默期。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:05、06:32、11:08、11:41、16:53、17:33),共6次异常读数,呈现与灶具开关强相关的系统性故障模式\",\n \"入户门08:34解锁开门后,日志中直到20:54才记录到门关闭和上锁事件,期间约12小时无门锁状态更新\",\n \"灶具关闭后的定期采样(每30分钟)中温度传感器恢复正常读数,说明传感器硬件未完全损坏,但在灶具工作温度下无法正常工作\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或触发保护机制,建议将传感器迁移至远离灶具热源的位置\",\n \"检查厨房温度传感器固件版本,确认 None 值是传感器主动报告的超量程标识还是通信故障,必要时更换耐高温型号\",\n \"为入户门锁配置自动上锁策略(如开门后5分钟未手动锁定则自动上锁),防止老人忘记锁门\",\n \"建议为独居老人启用门锁状态提醒,若门锁长时间处于未锁定状态则向紧急联系人发送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时入户门在老人回家就寝时处于未锁状态长达约1.5小时。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约05:36起床(卫生间活动),06:04做早餐,07:03出门并自动上锁,08:34回家,12:22午休拉窗帘,14:04起床,16:52做晚餐,20:36洗漱后约20:54就寝。这是一个合理的独居老人日常作息。", "推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:04-06:31、11:07-11:40、16:52-17:32),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。每次灶具使用都触发此现象,说明这不是偶发通信故障,而是传感器在高温环境下系统性失效。在正常的30分钟周期采样中传感器读数正常,仅在灶具使用时段出现 None 值。", "推理步骤3: 入户门安全隐患——老人08:34回家时解锁开门(LockOperationType=1, LockState=2),门传感器显示门打开(StateValue=False),但此后直到20:54才出现门关闭(StateValue=True)和自动上锁(LockState=1)的记录。这意味着入户门可能在08:34至20:54之间长时间未锁。虽然中间日志可能未记录所有门锁状态变化,但从日志来看,老人回家后门锁未及时恢复锁定状态,对独居老人存在安全风险。", "推理步骤4: 温度趋势正常——各房间温度随昼夜自然变化:夜间约22-23°C,午间峰值约25-26°C,卧室始终略低于客厅和厨房,符合夏季室内温度规律,无火灾或异常升温迹象。", "推理步骤5: 无入侵迹象——所有运动传感器触发均与老人活动轨迹一致,门锁操作均为手动或自动,无异常时段的未授权开锁事件。烟雾报警器和漏水传感器全天无触发。", "推理步骤6: 健康状况初步评估——老人活动节奏规律,三餐按时,午休时长约2小时属正常范围,卫生间使用时长合理(早晨约28分钟,晚间约18分钟),未发现长时间无活动的异常静默期。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:05、06:32、11:08、11:41、16:53、17:33),共6次异常读数,呈现与灶具开关强相关的系统性故障模式", "入户门08:34解锁开门后,日志中直到20:54才记录到门关闭和上锁事件,期间约12小时无门锁状态更新", "灶具关闭后的定期采样(每30分钟)中温度传感器恢复正常读数,说明传感器硬件未完全损坏,但在灶具工作温度下无法正常工作"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或触发保护机制,建议将传感器迁移至远离灶具热源的位置", "检查厨房温度传感器固件版本,确认 None 值是传感器主动报告的超量程标识还是通信故障,必要时更换耐高温型号", "为入户门锁配置自动上锁策略(如开门后5分钟未手动锁定则自动上锁),防止老人忘记锁门", "建议为独居老人启用门锁状态提醒,若门锁长时间处于未锁定状态则向紧急联系人发送通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.32744264602661, "api_error": null} {"episode_id": "SQ3_TN_D_0718", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0718.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261347, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(06:08、11:10、17:00),且在灶具关闭后也再次报告 None(06:34、11:33、17:25),共出现6次空值。\",\n \"推理步骤2: 正常情况下,温度传感器在灶具使用时应报告升高的温度值而非 None。None 值表示传感器无法完成测量,可能是高温导致传感器暂时失效、通信中断或硬件故障。\",\n \"推理步骤3: 除传感器异常外,老人的整体生活模式正常——05:28起床、06:07洗漱后做早餐、06:55出门晨练、08:24回家、12:23午休、14:10起床、16:59做晚餐、20:42就寝,作息规律无健康异常迹象。\",\n \"推理步骤4: 入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。烟雾报警器和漏水传感器全天无触发,排除火灾和漏水风险。\",\n \"推理步骤5: 08:24 回家时门锁解锁但日志未显示门关闭(front_door_contact 只有 StateValue=False 即开门,未见关门记录),直到 20:42 才出现 StateValue=True(门关闭)。这可能意味着入户门从早上8:24到晚上20:42一直处于未关闭状态,对独居老人存在一定安全隐患,但也可能是传感器上报机制仅在状态变化时记录。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:08、06:34、11:10、11:33、17:00、17:25 共6次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"08:24 入户门开启后无关门记录,直到 20:42 才记录门关闭状态(StateValue=True)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,高温可能导致传感器暂时失效,建议调整安装位置或更换耐高温型号\",\n \"确认入户门传感器工作是否正常,排查 08:24-20:42 期间门是否确实未关闭;如确实长时间未关门,建议设置门未关提醒\",\n \"考虑为厨房增加备用温度监测手段,确保灶具使用期间的安全监控不中断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(06:08、11:10、17:00),且在灶具关闭后也再次报告 None(06:34、11:33、17:25),共出现6次空值。", "推理步骤2: 正常情况下,温度传感器在灶具使用时应报告升高的温度值而非 None。None 值表示传感器无法完成测量,可能是高温导致传感器暂时失效、通信中断或硬件故障。", "推理步骤3: 除传感器异常外,老人的整体生活模式正常——05:28起床、06:07洗漱后做早餐、06:55出门晨练、08:24回家、12:23午休、14:10起床、16:59做晚餐、20:42就寝,作息规律无健康异常迹象。", "推理步骤4: 入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。烟雾报警器和漏水传感器全天无触发,排除火灾和漏水风险。", "推理步骤5: 08:24 回家时门锁解锁但日志未显示门关闭(front_door_contact 只有 StateValue=False 即开门,未见关门记录),直到 20:42 才出现 StateValue=True(门关闭)。这可能意味着入户门从早上8:24到晚上20:42一直处于未关闭状态,对独居老人存在一定安全隐患,但也可能是传感器上报机制仅在状态变化时记录。"], "key_evidence": ["kitchen_temp_sensor 在 06:08、06:34、11:10、11:33、17:00、17:25 共6次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "08:24 入户门开启后无关门记录,直到 20:42 才记录门关闭状态(StateValue=True)"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,高温可能导致传感器暂时失效,建议调整安装位置或更换耐高温型号", "确认入户门传感器工作是否正常,排查 08:24-20:42 期间门是否确实未关闭;如确实长时间未关门,建议设置门未关提醒", "考虑为厨房增加备用温度监测手段,确保灶具使用期间的安全监控不中断"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.644946813583374, "api_error": null} {"episode_id": "SQ3_TN_D_0714", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TN_D_0714.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261343, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理老人全天作息——05:20起床、05:43如厕、06:10做早餐、07:10出门、08:31回家、11:03做午餐、12:33午休、13:56起床、17:09做晚餐、20:36洗漱、20:51就寝。整体生活节奏规律,符合独居老人的典型模式。\",\n \"推理步骤2: 入侵排查——全天仅有两次开门记录(07:10出门、08:31回家),门锁均为手动解锁后自动上锁,无异常解锁源(如远程或未知方式)。老人外出期间(07:10-08:31)家中无任何运动传感器触发,排除入侵可能。\",\n \"推理步骤3: 火灾风险排查——灶具三次使用时长分别约13分钟、31分钟、31分钟,均在合理范围内且主动关闭;烟雾报警器全天未触发;厨房温度在灶具关闭后的定时读数中恢复正常,无持续异常升温。\",\n \"推理步骤4: 厨房温度传感器异常——在三次灶具使用期间(06:11、06:24、11:04、11:35、17:10、17:41),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启约1分钟后传感器即丢失读数,关闭后约1分钟再次报告 None,直到下一个30分钟整点才恢复正常数值。这一模式在三次烹饪中完全重复,说明传感器在受热或灶具工作环境下无法正常工作。\",\n \"推理步骤5: 健康状况排查——老人全天活动轨迹连贯,无长时间滞留卫生间(早晨约27分钟、晚间约15分钟均属正常),午休约1.5小时合理,夜间正常就寝。未发现跌倒或长时间无活动的迹象。\",\n \"推理步骤6: 漏水排查——两个漏水传感器全天无任何触发事件,排除漏水风险。\",\n \"推理步骤7: 综合评估——唯一异常是厨房温度传感器在灶具使用时反复失效。对于独居老人家庭,厨房温度监控是防范火灾的重要环节,传感器失效意味着如果灶具忘关导致温度异常升高,系统将无法及时检测和报警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:11、11:04、17:10)均报告 MeasuredValue = None,灶具关闭后(06:24、11:35、17:41)仍为 None,直到下一个定时采集点才恢复\",\n \"该故障模式在全天三次烹饪中100%复现,具有高度一致性,排除偶发通信丢包的可能\",\n \"其他所有传感器(客厅温度、卧室温度、运动传感器、门锁等)全天工作正常,问题仅限于厨房温度传感器\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程,必要时重新选址安装\",\n \"对厨房温度传感器进行硬件检测或固件更新,排除设备本身的故障\",\n \"在传感器修复前,考虑为灶具设置自动定时关闭规则(如超过45分钟未手动操作则自动断电),作为补偿性安全措施\",\n \"增加对厨房烟雾报警器的定期测试频率,确保在温度传感器失效期间仍有可靠的火灾预警手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 梳理老人全天作息——05:20起床、05:43如厕、06:10做早餐、07:10出门、08:31回家、11:03做午餐、12:33午休、13:56起床、17:09做晚餐、20:36洗漱、20:51就寝。整体生活节奏规律,符合独居老人的典型模式。", "推理步骤2: 入侵排查——全天仅有两次开门记录(07:10出门、08:31回家),门锁均为手动解锁后自动上锁,无异常解锁源(如远程或未知方式)。老人外出期间(07:10-08:31)家中无任何运动传感器触发,排除入侵可能。", "推理步骤3: 火灾风险排查——灶具三次使用时长分别约13分钟、31分钟、31分钟,均在合理范围内且主动关闭;烟雾报警器全天未触发;厨房温度在灶具关闭后的定时读数中恢复正常,无持续异常升温。", "推理步骤4: 厨房温度传感器异常——在三次灶具使用期间(06:11、06:24、11:04、11:35、17:10、17:41),kitchen_temp_sensor 均报告 MeasuredValue = None。灶具开启约1分钟后传感器即丢失读数,关闭后约1分钟再次报告 None,直到下一个30分钟整点才恢复正常数值。这一模式在三次烹饪中完全重复,说明传感器在受热或灶具工作环境下无法正常工作。", "推理步骤5: 健康状况排查——老人全天活动轨迹连贯,无长时间滞留卫生间(早晨约27分钟、晚间约15分钟均属正常),午休约1.5小时合理,夜间正常就寝。未发现跌倒或长时间无活动的迹象。", "推理步骤6: 漏水排查——两个漏水传感器全天无任何触发事件,排除漏水风险。", "推理步骤7: 综合评估——唯一异常是厨房温度传感器在灶具使用时反复失效。对于独居老人家庭,厨房温度监控是防范火灾的重要环节,传感器失效意味着如果灶具忘关导致温度异常升高,系统将无法及时检测和报警。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:11、11:04、17:10)均报告 MeasuredValue = None,灶具关闭后(06:24、11:35、17:41)仍为 None,直到下一个定时采集点才恢复", "该故障模式在全天三次烹饪中100%复现,具有高度一致性,排除偶发通信丢包的可能", "其他所有传感器(客厅温度、卧室温度、运动传感器、门锁等)全天工作正常,问题仅限于厨房温度传感器"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰或超出量程,必要时重新选址安装", "对厨房温度传感器进行硬件检测或固件更新,排除设备本身的故障", "在传感器修复前,考虑为灶具设置自动定时关闭规则(如超过45分钟未手动操作则自动断电),作为补偿性安全措施", "增加对厨房烟雾报警器的定期测试频率,确保在温度传感器失效期间仍有可靠的火灾预警手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.299217700958252, "api_error": null} {"episode_id": "SQ3_TP_A_0433", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0433.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261062, "scenario_id": "INS-05", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "bedroom", "injection_time": "2026-06-17T16:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~24.8°C 跳升至 28.62°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.64°C / 23.62°C),排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度继续维持在 28.66°C 的异常高位,但此时灶具尚未开启(灶具 18:47 才打开),说明这次温度飙升并非烹饪导致。\",\n \"推理步骤3: 18:48 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:43 灶具关闭后再次报告 None。两次 None 读数表明传感器在高温或特定条件下出现通信或采样故障。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到 24.43°C 并回归正常趋势,说明 18:00-18:30 的 28°C+ 读数是一个孤立的异常脉冲,而非持续的环境变化。\",\n \"推理步骤5: 烟雾报警器全天未触发任何事件,排除火灾或烟雾风险;但传感器的异常行为本身值得关注,可能影响后续自动化规则的可靠性。\",\n \"推理步骤6: 其余设备行为均符合正常生活模式——早晨起床、出门上班、傍晚回家、晚间就寝,门锁操作均为合法用户(手动/自动/UserIndex=1),无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~25.04°C 骤升至 28.62°C,18:30 维持 28.66°C,而灶具直到 18:47 才开启,升温无合理热源解释\",\n \"18:48 和 19:43 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集异常\",\n \"同时段客厅和卧室温度正常下降,排除全屋性环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温读数\",\n \"检查传感器固件版本并考虑重启或更新,排除因固件缺陷导致的间歇性 None 值上报\",\n \"在自动化规则中为厨房温度传感器增加异常值过滤逻辑(如连续两次超阈值才触发告警),避免单次脉冲误触发\",\n \"持续观察未来几天厨房温度传感器数据,若 None 值或异常跳变反复出现,建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~24.8°C 跳升至 28.62°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.64°C / 23.62°C),排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度继续维持在 28.66°C 的异常高位,但此时灶具尚未开启(灶具 18:47 才打开),说明这次温度飙升并非烹饪导致。", "推理步骤3: 18:48 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:43 灶具关闭后再次报告 None。两次 None 读数表明传感器在高温或特定条件下出现通信或采样故障。", "推理步骤4: 19:00 之后厨房温度恢复到 24.43°C 并回归正常趋势,说明 18:00-18:30 的 28°C+ 读数是一个孤立的异常脉冲,而非持续的环境变化。", "推理步骤5: 烟雾报警器全天未触发任何事件,排除火灾或烟雾风险;但传感器的异常行为本身值得关注,可能影响后续自动化规则的可靠性。", "推理步骤6: 其余设备行为均符合正常生活模式——早晨起床、出门上班、傍晚回家、晚间就寝,门锁操作均为合法用户(手动/自动/UserIndex=1),无入侵迹象。"], "key_evidence": ["18:00 厨房温度从 ~25.04°C 骤升至 28.62°C,18:30 维持 28.66°C,而灶具直到 18:47 才开启,升温无合理热源解释", "18:48 和 19:43 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集异常", "同时段客厅和卧室温度正常下降,排除全屋性环境因素"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温读数", "检查传感器固件版本并考虑重启或更新,排除因固件缺陷导致的间歇性 None 值上报", "在自动化规则中为厨房温度传感器增加异常值过滤逻辑(如连续两次超阈值才触发告警),避免单次脉冲误触发", "持续观察未来几天厨房温度传感器数据,若 None 值或异常跳变反复出现,建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.039183616638184, "api_error": null} {"episode_id": "SQ3_TP_A_0435", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0435.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20261064, "scenario_id": "INS-01", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-14T03:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.4-29.6°C),且传感器多次报告None值,疑似传感器故障或存在未被识别的热源。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30-23:30)的整体活动——住户在家做晚饭(17:46开灶、18:37关灶启动洗碗机)、晚间活动后23:07左右进入卧室就寝,关灯、关空调、锁门,属于典型的晚间生活节奏,无入侵迹象。\",\n \"推理步骤2: 入户门在23:07自动上锁(OperationSource=Auto, LockState=1),门传感器StateValue=True表示门已关闭,安防状态正常。\",\n \"推理步骤3: 回溯全天数据发现关键异常——11:00时厨房温度传感器突然从2510(25.10°C)跳升至2944(29.44°C),11:30进一步升至2958(29.58°C),而同时段客厅仅为25.5°C左右。这一跳变幅度(约4.3°C/30分钟)远超正常环境波动,且当时灶具处于关闭状态(上次关灶在09:41,下次开灶在11:48)。\",\n \"推理步骤4: 厨房温度传感器在全天多次报告MeasuredValue=None(08:57、09:42、11:49、12:49、17:47、18:38),均发生在灶具开启或关闭前后。虽然部分None可能是灶具操作导致的传感器保护机制,但频率过高(6次/天),且11:00的异常高温发生在灶具关闭期间,说明传感器本身可能存在故障或受到干扰。\",\n \"推理步骤5: 11:00-11:30的异常高温无法用灶具使用解释(灶具当时未开启),也无法用室外温度解释(客厅和卧室同期温度正常)。可能原因:传感器硬件故障导致读数漂移,或厨房存在未被监控的热源。\",\n \"推理步骤6: 其余行为模式均正常——早晨起床(08:16)、洗漱做早餐、午餐、晚餐的时间和设备操作序列合理;空调制冷模式(SystemMode=3)在夏季高温天合理;客厅窗户03:44打开后未见关闭记录,但夏夜通风属常见行为。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度从2510骤升至2944(+4.34°C),11:30达2958,而此时灶具处于关闭状态(09:41关闭,11:48才重新开启),客厅同期仅2559\",\n \"厨房温度传感器全天6次报告MeasuredValue=None,频率异常偏高,提示传感器工作状态不稳定\",\n \"12:00灶具开启后温度恢复至2571的正常范围,进一步说明11:00-11:30的高温读数为异常值而非真实环境温度持续升高\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器探头,排查是否存在安装位置不当(如靠近热源管道)或硬件老化问题\",\n \"排查厨房在11:00-11:30期间是否有其他未被监控的热源(如烤箱、电热水壶等非智能设备)运行\",\n \"如传感器频繁报告None值,建议更换传感器或升级固件,确保厨房温度监控的可靠性——这对烟雾报警联动至关重要\",\n \"建议为厨房温度设置异常阈值告警(如30分钟内变化超过3°C且灶具未开启时自动通知),以便及时发现潜在火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.4-29.6°C),且传感器多次报告None值,疑似传感器故障或存在未被识别的热源。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30-23:30)的整体活动——住户在家做晚饭(17:46开灶、18:37关灶启动洗碗机)、晚间活动后23:07左右进入卧室就寝,关灯、关空调、锁门,属于典型的晚间生活节奏,无入侵迹象。", "推理步骤2: 入户门在23:07自动上锁(OperationSource=Auto, LockState=1),门传感器StateValue=True表示门已关闭,安防状态正常。", "推理步骤3: 回溯全天数据发现关键异常——11:00时厨房温度传感器突然从2510(25.10°C)跳升至2944(29.44°C),11:30进一步升至2958(29.58°C),而同时段客厅仅为25.5°C左右。这一跳变幅度(约4.3°C/30分钟)远超正常环境波动,且当时灶具处于关闭状态(上次关灶在09:41,下次开灶在11:48)。", "推理步骤4: 厨房温度传感器在全天多次报告MeasuredValue=None(08:57、09:42、11:49、12:49、17:47、18:38),均发生在灶具开启或关闭前后。虽然部分None可能是灶具操作导致的传感器保护机制,但频率过高(6次/天),且11:00的异常高温发生在灶具关闭期间,说明传感器本身可能存在故障或受到干扰。", "推理步骤5: 11:00-11:30的异常高温无法用灶具使用解释(灶具当时未开启),也无法用室外温度解释(客厅和卧室同期温度正常)。可能原因:传感器硬件故障导致读数漂移,或厨房存在未被监控的热源。", "推理步骤6: 其余行为模式均正常——早晨起床(08:16)、洗漱做早餐、午餐、晚餐的时间和设备操作序列合理;空调制冷模式(SystemMode=3)在夏季高温天合理;客厅窗户03:44打开后未见关闭记录,但夏夜通风属常见行为。"], "key_evidence": ["11:00厨房温度从2510骤升至2944(+4.34°C),11:30达2958,而此时灶具处于关闭状态(09:41关闭,11:48才重新开启),客厅同期仅2559", "厨房温度传感器全天6次报告MeasuredValue=None,频率异常偏高,提示传感器工作状态不稳定", "12:00灶具开启后温度恢复至2571的正常范围,进一步说明11:00-11:30的高温读数为异常值而非真实环境温度持续升高"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器探头,排查是否存在安装位置不当(如靠近热源管道)或硬件老化问题", "排查厨房在11:00-11:30期间是否有其他未被监控的热源(如烤箱、电热水壶等非智能设备)运行", "如传感器频繁报告None值,建议更换传感器或升级固件,确保厨房温度监控的可靠性——这对烟雾报警联动至关重要", "建议为厨房温度设置异常阈值告警(如30分钟内变化超过3°C且灶具未开启时自动通知),以便及时发现潜在火灾风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.698395013809204, "api_error": null} {"episode_id": "SQ3_TP_A_0449", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0449.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261078, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-18T15:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在住户外出期间触发报警,且持续数小时无人处理;同时厨房温度传感器出现异常读数和离线,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:36 关灯、手动开锁出门、门自动上锁,判断住户离家上班。18:17 手动开锁回家,因此 07:36–18:17 期间家中无人。\",\n \"推理步骤2: 15:24 卫生间漏水传感器 bathroom_water_leak 触发 StateValue=True 并产生 StateChange 事件,表明检测到漏水。此时家中无人,无法及时处理。\",\n \"推理步骤3: 截至日志结束(23:30),未见 bathroom_water_leak 恢复为 False 的记录,说明漏水状态持续了至少 8 小时以上,存在水损风险。\",\n \"推理步骤4: 18:00 厨房温度传感器突然从 ~24.8°C 跳升至 28.51°C,18:30 仍为 28.52°C,而此时灶具未开、住户刚到家。这一异常升温与客厅/卧室趋势不符,可能是传感器故障或短暂环境异常。\",\n \"推理步骤5: 18:55 和 19:44 厨房温度传感器两次报告 MeasuredValue=None(空值),表明传感器出现读数丢失/离线情况。虽然 19:00 之后恢复正常读数,但间歇性 None 值说明该传感器工作不稳定。\",\n \"推理步骤6: 19:43 厨房窗户打开(contact=False),截至日志结束未见关闭记录。住户 23:00 已入睡,厨房窗户整夜开着存在一定安全隐患(入侵风险较低,但值得提醒)。\",\n \"推理步骤7: 其余行为模式正常——早起洗漱、开灯开窗帘、出门上锁、回家开空调做饭、睡前关灯拉窗帘,均符合独居一室一厅的生活习惯。\"\n ],\n \"key_evidence\": [\n \"15:24 bathroom_water_leak StateValue=True,漏水报警触发,且至日志结束未恢复\",\n \"18:00–18:30 kitchen_temp_sensor 异常跳升至 2851–2852(约28.5°C),偏离正常趋势约 3.5°C\",\n \"18:55 和 19:44 kitchen_temp_sensor 报告 MeasuredValue=None,传感器间歇性离线\",\n \"19:43 kitchen_window_contact=False(窗户打开),至日志结束未关闭\",\n \"漏水发生时住户不在家(07:36 出门,18:17 回家),无人及时响应\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗衣机进水管等),必要时关闭卫生间水阀\",\n \"检查卫生间地面是否有积水,评估是否已造成水损,防止渗漏到楼下\",\n \"建议配置漏水传感器联动自动关水阀,或至少设置手机即时推送告警,避免长时间无人响应\",\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排查间歇性离线和异常读数的原因\",\n \"睡前确认厨房窗户已关闭,或设置睡眠模式自动提醒未关窗户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在住户外出期间触发报警,且持续数小时无人处理;同时厨房温度传感器出现异常读数和离线,需关注。", "reasoning": ["推理步骤1: 住户于 07:36 关灯、手动开锁出门、门自动上锁,判断住户离家上班。18:17 手动开锁回家,因此 07:36–18:17 期间家中无人。", "推理步骤2: 15:24 卫生间漏水传感器 bathroom_water_leak 触发 StateValue=True 并产生 StateChange 事件,表明检测到漏水。此时家中无人,无法及时处理。", "推理步骤3: 截至日志结束(23:30),未见 bathroom_water_leak 恢复为 False 的记录,说明漏水状态持续了至少 8 小时以上,存在水损风险。", "推理步骤4: 18:00 厨房温度传感器突然从 ~24.8°C 跳升至 28.51°C,18:30 仍为 28.52°C,而此时灶具未开、住户刚到家。这一异常升温与客厅/卧室趋势不符,可能是传感器故障或短暂环境异常。", "推理步骤5: 18:55 和 19:44 厨房温度传感器两次报告 MeasuredValue=None(空值),表明传感器出现读数丢失/离线情况。虽然 19:00 之后恢复正常读数,但间歇性 None 值说明该传感器工作不稳定。", "推理步骤6: 19:43 厨房窗户打开(contact=False),截至日志结束未见关闭记录。住户 23:00 已入睡,厨房窗户整夜开着存在一定安全隐患(入侵风险较低,但值得提醒)。", "推理步骤7: 其余行为模式正常——早起洗漱、开灯开窗帘、出门上锁、回家开空调做饭、睡前关灯拉窗帘,均符合独居一室一厅的生活习惯。"], "key_evidence": ["15:24 bathroom_water_leak StateValue=True,漏水报警触发,且至日志结束未恢复", "18:00–18:30 kitchen_temp_sensor 异常跳升至 2851–2852(约28.5°C),偏离正常趋势约 3.5°C", "18:55 和 19:44 kitchen_temp_sensor 报告 MeasuredValue=None,传感器间歇性离线", "19:43 kitchen_window_contact=False(窗户打开),至日志结束未关闭", "漏水发生时住户不在家(07:36 出门,18:17 回家),无人及时响应"], "recommended_actions": ["立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗衣机进水管等),必要时关闭卫生间水阀", "检查卫生间地面是否有积水,评估是否已造成水损,防止渗漏到楼下", "建议配置漏水传感器联动自动关水阀,或至少设置手机即时推送告警,避免长时间无人响应", "检查厨房温度传感器硬件状态,清洁或更换传感器,排查间歇性离线和异常读数的原因", "睡前确认厨房窗户已关闭,或设置睡眠模式自动提醒未关窗户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.624049186706543, "api_error": null} {"episode_id": "SQ3_TP_A_0473", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0473.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261102, "scenario_id": "DF-05", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T12:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器发生硬件故障,且厨房温度传感器在做饭期间出现异常读数和数据丢失,家中消防安全监控能力受损。\",\n \"reasoning\": [\n \"推理步骤1: 12:40 厨房烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(硬件故障状态),并触发 HardwareFault 事件。此时住户不在家(07:35 出门),无人知晓该故障。\",\n \"推理步骤2: 19:00 厨房温度传感器突然从 ~2451 跳升至 2836(约28.36°C),异常偏高。随后 19:14 和 19:42 两次报告 MeasuredValue=None,表明传感器数据丢失或故障。19:30 仍报告 2839 的异常高值。\",\n \"推理步骤3: 住户 18:25 回家后于 19:13 开始使用灶具做饭,此时烟雾报警器已处于硬件故障状态,无法提供正常的烟雾/CO监测保护。这构成了实际的消防安全风险。\",\n \"推理步骤4: 厨房温度传感器的异常行为(突然跳变+数据丢失)可能与烟雾报警器故障存在关联,暗示厨房区域可能存在电气或环境问题影响多个设备。\",\n \"推理步骤5: 其余行为模式正常——住户早起(06:28)、出门上班(07:35)、傍晚回家(18:25)、做饭、晚间休息(22:47关灯),门锁操作均为手动/自动锁定,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"12:40 kitchen_smoke_alarm HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault()\",\n \"19:00 kitchen_temp_sensor 温度从 2451 突跳至 2836(异常升高约4°C)\",\n \"19:14 和 19:42 kitchen_temp_sensor MeasuredValue=None(数据丢失)\",\n \"烟雾报警器故障期间住户使用了灶具做饭(19:13-19:41)\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,确认其恢复正常工作状态\",\n \"检查厨房温度传感器是否存在硬件问题或安装位置是否受灶具热辐射影响\",\n \"在烟雾报警器修复前,避免无人看管的烹饪操作\",\n \"检查厨房区域电路和设备线路,排除可能影响多个设备的电气问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器发生硬件故障,且厨房温度传感器在做饭期间出现异常读数和数据丢失,家中消防安全监控能力受损。", "reasoning": ["推理步骤1: 12:40 厨房烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(硬件故障状态),并触发 HardwareFault 事件。此时住户不在家(07:35 出门),无人知晓该故障。", "推理步骤2: 19:00 厨房温度传感器突然从 ~2451 跳升至 2836(约28.36°C),异常偏高。随后 19:14 和 19:42 两次报告 MeasuredValue=None,表明传感器数据丢失或故障。19:30 仍报告 2839 的异常高值。", "推理步骤3: 住户 18:25 回家后于 19:13 开始使用灶具做饭,此时烟雾报警器已处于硬件故障状态,无法提供正常的烟雾/CO监测保护。这构成了实际的消防安全风险。", "推理步骤4: 厨房温度传感器的异常行为(突然跳变+数据丢失)可能与烟雾报警器故障存在关联,暗示厨房区域可能存在电气或环境问题影响多个设备。", "推理步骤5: 其余行为模式正常——住户早起(06:28)、出门上班(07:35)、傍晚回家(18:25)、做饭、晚间休息(22:47关灯),门锁操作均为手动/自动锁定,无入侵迹象。"], "key_evidence": ["12:40 kitchen_smoke_alarm HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault()", "19:00 kitchen_temp_sensor 温度从 2451 突跳至 2836(异常升高约4°C)", "19:14 和 19:42 kitchen_temp_sensor MeasuredValue=None(数据丢失)", "烟雾报警器故障期间住户使用了灶具做饭(19:13-19:41)"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,确认其恢复正常工作状态", "检查厨房温度传感器是否存在硬件问题或安装位置是否受灶具热辐射影响", "在烟雾报警器修复前,避免无人看管的烹饪操作", "检查厨房区域电路和设备线路,排除可能影响多个设备的电气问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.931966543197632, "api_error": null} {"episode_id": "SQ3_TP_A_0463", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0463.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261092, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T21:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器在21:00触发一氧化碳(CO)报警,同时厨房温度传感器在烹饪期间两次报告None值,存在CO中毒风险及传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为画像——住户约06:17起床,07:36出门上班(关灯、锁门),18:03回家(开门、开灯、开空调),22:50入睡。这是典型的单人上班族作息,整体生活节奏正常。\",\n \"推理步骤2: 入侵分析——全天仅有两次开门事件(07:36出门、18:03回家),均为Manual手动操作,门锁在无人时段保持锁定(LockState=1),门传感器保持关闭(StateValue=True),无人在家期间无任何运动传感器触发,排除入侵威胁。\",\n \"推理步骤3: 厨房温度异常跳变——19:00时厨房温度从18:30的24.59°C骤升至28.25°C(+3.66°C/30min),而此时灶具尚未开启(19:13才开启)。这一异常升温缺乏合理解释,可能是传感器受干扰或存在其他热源。\",\n \"推理步骤4: 厨房温度传感器故障——19:14和19:34两个时间点,kitchen_temp_sensor报告MeasuredValue=None,说明传感器在烹饪高温期间出现读数丢失/故障。传感器在20:00恢复正常读数(24.07°C),但间歇性故障意味着在关键时刻(烹饪期间)无法可靠监测厨房温度。\",\n \"推理步骤5: 一氧化碳报警事件——21:00厨房烟雾报警器触发CO报警:COState=1(CO检测到)、ExpressedState=2(CO报警状态)、并产生COAlarm事件。此时距灶具关闭(19:33)已过约1.5小时,CO仍被检测到,说明这不是简单的烹饪烟气残留。\",\n \"推理步骤6: CO报警后续处理缺失——从21:00 CO报警触发到22:10住户准备睡觉,日志中未见任何针对CO报警的响应动作(如开窗通风、关闭燃气、报警器消音等)。住户可能未注意到报警,或报警器未有效提醒,这增加了CO中毒的风险。\",\n \"推理步骤7: 厨房窗户状态——19:33烹饪结束后厨房窗户被打开(StateValue=False),但日志中未见关闭记录,说明厨房窗户可能一直保持打开状态,这对通风有利但也说明住户可能意识到了厨房空气问题。\",\n \"推理步骤8: 入户门未在回家时关闭——18:03回家时front_door_contact变为False(门打开),但直到22:10才记录到StateValue=True(门关闭)并自动上锁。超过4小时入户门可能处于未关闭状态,存在安全隐患(也可能是传感器未及时上报关门事件)。\",\n \"推理步骤9: 其他系统正常——漏水传感器无报警,烟雾报警器未触发烟雾告警(仅CO),卧室和客厅温度变化符合自然昼夜规律和空调使用模式,窗帘、灯光操作均与人员活动一致。\"\n ],\n \"key_evidence\": [\n \"21:00 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event:COAlarm()\",\n \"19:14和19:34 kitchen_temp_sensor 两次报告 MeasuredValue=None,传感器在烹饪期间故障\",\n \"19:00 厨房温度异常跳升至28.25°C(灶具19:13才开启,升温早于烹饪)\",\n \"CO报警后至住户22:50入睡,无任何应急响应动作记录\",\n \"18:03入户门打开后至22:10才记录关闭,长时间处于开启状态\"\n ],\n \"recommended_actions\": [\n \"立即确认住户安全状态——CO(一氧化碳)无色无味,21:00报警后住户仍在家中活动至22:50入睡,需紧急确认住户是否出现头晕、恶心等CO中毒症状\",\n \"开窗通风并检查燃气管路——打开所有门窗通风,检查厨房燃气灶具、热水器等是否存在燃气泄漏或不完全燃烧\",\n \"检修厨房温度传感器——两次None读数表明传感器存在间歇性故障,需检查传感器连接和供电,必要时更换\",\n \"检查CO报警器是否正常工作——确认报警器声光提醒功能是否正常触发,考虑在卧室增设CO报警器以确保睡眠时能被唤醒\",\n \"排查19:00厨房异常升温原因——灶具未开启时温度骤升3.66°C不正常,需检查是否有其他热源或燃气微泄漏\",\n \"检查入户门传感器——确认门磁传感器是否工作正常,排除长时间未报告关门状态的可能性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器在21:00触发一氧化碳(CO)报警,同时厨房温度传感器在烹饪期间两次报告None值,存在CO中毒风险及传感器故障。", "reasoning": ["推理步骤1: 住户行为画像——住户约06:17起床,07:36出门上班(关灯、锁门),18:03回家(开门、开灯、开空调),22:50入睡。这是典型的单人上班族作息,整体生活节奏正常。", "推理步骤2: 入侵分析——全天仅有两次开门事件(07:36出门、18:03回家),均为Manual手动操作,门锁在无人时段保持锁定(LockState=1),门传感器保持关闭(StateValue=True),无人在家期间无任何运动传感器触发,排除入侵威胁。", "推理步骤3: 厨房温度异常跳变——19:00时厨房温度从18:30的24.59°C骤升至28.25°C(+3.66°C/30min),而此时灶具尚未开启(19:13才开启)。这一异常升温缺乏合理解释,可能是传感器受干扰或存在其他热源。", "推理步骤4: 厨房温度传感器故障——19:14和19:34两个时间点,kitchen_temp_sensor报告MeasuredValue=None,说明传感器在烹饪高温期间出现读数丢失/故障。传感器在20:00恢复正常读数(24.07°C),但间歇性故障意味着在关键时刻(烹饪期间)无法可靠监测厨房温度。", "推理步骤5: 一氧化碳报警事件——21:00厨房烟雾报警器触发CO报警:COState=1(CO检测到)、ExpressedState=2(CO报警状态)、并产生COAlarm事件。此时距灶具关闭(19:33)已过约1.5小时,CO仍被检测到,说明这不是简单的烹饪烟气残留。", "推理步骤6: CO报警后续处理缺失——从21:00 CO报警触发到22:10住户准备睡觉,日志中未见任何针对CO报警的响应动作(如开窗通风、关闭燃气、报警器消音等)。住户可能未注意到报警,或报警器未有效提醒,这增加了CO中毒的风险。", "推理步骤7: 厨房窗户状态——19:33烹饪结束后厨房窗户被打开(StateValue=False),但日志中未见关闭记录,说明厨房窗户可能一直保持打开状态,这对通风有利但也说明住户可能意识到了厨房空气问题。", "推理步骤8: 入户门未在回家时关闭——18:03回家时front_door_contact变为False(门打开),但直到22:10才记录到StateValue=True(门关闭)并自动上锁。超过4小时入户门可能处于未关闭状态,存在安全隐患(也可能是传感器未及时上报关门事件)。", "推理步骤9: 其他系统正常——漏水传感器无报警,烟雾报警器未触发烟雾告警(仅CO),卧室和客厅温度变化符合自然昼夜规律和空调使用模式,窗帘、灯光操作均与人员活动一致。"], "key_evidence": ["21:00 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event:COAlarm()", "19:14和19:34 kitchen_temp_sensor 两次报告 MeasuredValue=None,传感器在烹饪期间故障", "19:00 厨房温度异常跳升至28.25°C(灶具19:13才开启,升温早于烹饪)", "CO报警后至住户22:50入睡,无任何应急响应动作记录", "18:03入户门打开后至22:10才记录关闭,长时间处于开启状态"], "recommended_actions": ["立即确认住户安全状态——CO(一氧化碳)无色无味,21:00报警后住户仍在家中活动至22:50入睡,需紧急确认住户是否出现头晕、恶心等CO中毒症状", "开窗通风并检查燃气管路——打开所有门窗通风,检查厨房燃气灶具、热水器等是否存在燃气泄漏或不完全燃烧", "检修厨房温度传感器——两次None读数表明传感器存在间歇性故障,需检查传感器连接和供电,必要时更换", "检查CO报警器是否正常工作——确认报警器声光提醒功能是否正常触发,考虑在卧室增设CO报警器以确保睡眠时能被唤醒", "排查19:00厨房异常升温原因——灶具未开启时温度骤升3.66°C不正常,需检查是否有其他热源或燃气微泄漏", "检查入户门传感器——确认门磁传感器是否工作正常,排除长时间未报告关门状态的可能性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 46.825090646743774, "api_error": null} {"episode_id": "SQ3_TP_A_0474", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0474.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261103, "scenario_id": "INS-04", "total_events": 190, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-27T10:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 29.89°C,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的日志,同时回溯全天上下文寻找异常模式。\",\n \"推理步骤2: 厨房温度传感器在全天中多次报告 MeasuredValue = None(08:57、09:49、12:06、12:31、18:00、18:40),共计6次。其他两个温度传感器从未出现 None 值,说明这不是系统性通信问题,而是该传感器自身的故障。\",\n \"推理步骤3: 在 12:00 时,厨房温度传感器报告 2989(即 29.89°C),而同一时刻客厅为 25.85°C、卧室为 24.80°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 12:05 才打开)。这一异常高温读数进一步佐证传感器数据不可靠。\",\n \"推理步骤4: 12:30 灶具关闭后,厨房温度仍报告 2972(29.72°C),随后紧接着又报告 None,说明传感器在高温区间工作不稳定,可能存在硬件老化或接触不良。\",\n \"推理步骤5: 厨房温度传感器的 None 值出现时间与灶具开启/厨房窗户开关存在时间关联(灶具开启后约30秒到1分钟内出现 None),推测传感器可能受热或振动影响导致间歇性失联。\",\n \"推理步骤6: 除传感器问题外,其余设备行为均属正常——住户约 08:17 起床、做早餐、午餐、晚餐,23:01 关灯锁门就寝,符合一室一厅单人居住的日常作息。空调制冷模式(SystemMode=3)在夏季高温天合理。入户门自动上锁、窗帘开合等均为正常操作。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器全天出现6次 MeasuredValue = None(08:57、09:49、12:06、12:31、18:00、18:40),其他传感器无此现象\",\n \"12:00 厨房温度异常飙升至 29.89°C(灶具当时未开启),12:30 仍为 29.72°C,远高于同期客厅(25.75°C)和卧室(24.81°C)\",\n \"None 值多与灶具开启或厨房窗户操作时间高度相关,提示传感器受环境干扰导致间歇性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新安装到远离热源的位置\",\n \"检查该传感器的供电和通信连接(电池电量或有线接口),排除接触不良问题\",\n \"如传感器持续出现 None 值和异常读数,建议更换传感器硬件\",\n \"在传感器修复前,注意厨房烟雾报警器作为安全兜底——当前烟雾报警器全天未触发,说明无实际火灾风险,但温度监测盲区需要尽快补上\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数 29.89°C,疑似传感器故障。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的日志,同时回溯全天上下文寻找异常模式。", "推理步骤2: 厨房温度传感器在全天中多次报告 MeasuredValue = None(08:57、09:49、12:06、12:31、18:00、18:40),共计6次。其他两个温度传感器从未出现 None 值,说明这不是系统性通信问题,而是该传感器自身的故障。", "推理步骤3: 在 12:00 时,厨房温度传感器报告 2989(即 29.89°C),而同一时刻客厅为 25.85°C、卧室为 24.80°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未开启(灶具在 12:05 才打开)。这一异常高温读数进一步佐证传感器数据不可靠。", "推理步骤4: 12:30 灶具关闭后,厨房温度仍报告 2972(29.72°C),随后紧接着又报告 None,说明传感器在高温区间工作不稳定,可能存在硬件老化或接触不良。", "推理步骤5: 厨房温度传感器的 None 值出现时间与灶具开启/厨房窗户开关存在时间关联(灶具开启后约30秒到1分钟内出现 None),推测传感器可能受热或振动影响导致间歇性失联。", "推理步骤6: 除传感器问题外,其余设备行为均属正常——住户约 08:17 起床、做早餐、午餐、晚餐,23:01 关灯锁门就寝,符合一室一厅单人居住的日常作息。空调制冷模式(SystemMode=3)在夏季高温天合理。入户门自动上锁、窗帘开合等均为正常操作。"], "key_evidence": ["厨房温度传感器全天出现6次 MeasuredValue = None(08:57、09:49、12:06、12:31、18:00、18:40),其他传感器无此现象", "12:00 厨房温度异常飙升至 29.89°C(灶具当时未开启),12:30 仍为 29.72°C,远高于同期客厅(25.75°C)和卧室(24.81°C)", "None 值多与灶具开启或厨房窗户操作时间高度相关,提示传感器受环境干扰导致间歇性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新安装到远离热源的位置", "检查该传感器的供电和通信连接(电池电量或有线接口),排除接触不良问题", "如传感器持续出现 None 值和异常读数,建议更换传感器硬件", "在传感器修复前,注意厨房烟雾报警器作为安全兜底——当前烟雾报警器全天未触发,说明无实际火灾风险,但温度监测盲区需要尽快补上"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.91484022140503, "api_error": null} {"episode_id": "SQ3_TP_A_0477", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0477.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261106, "scenario_id": "DF-01", "total_events": 200, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-09T01:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温跳变、读数为 None 以及之后持续固定值不变,高度疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~24.58°C 跳升至 28.38°C,30 分钟内升幅近 4°C,而同一时段客厅和卧室温度仅正常小幅下降。即使灶具在 19:11 才开启,19:00 时灶具尚未工作,无法解释这一跳变。\",\n \"推理步骤2: 19:12 和 19:51 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这在 Matter TemperatureMeasurement Cluster 中意味着传感器无法完成有效测量,属于明确的设备异常信号。\",\n \"推理步骤3: 19:30 传感器恢复报告后数值为 28.35°C,与 19:00 的 28.38°C 几乎一致,而此时灶具正在工作,温度理应继续上升而非持平,说明传感器可能卡在某个错误状态。\",\n \"推理步骤4: 从 6 月 9 日 22:00 起,厨房温度传感器出现了一条非标准格式的上报(缺少 TemperatureMeasurement 前缀,仅为 MeasuredValue = 2280),之后在 6 月 10 日和 11 日的所有上报均为固定值 2350 且格式异常,不随昼夜温度周期变化。对比客厅和卧室传感器在同期有正常的昼夜温差波动,厨房传感器的恒定值进一步确认其已故障或固件异常。\",\n \"推理步骤5: 入户门锁在 18:10 回家时开锁后,直到 22:13 才自动上锁,期间 front_door_contact 的关门状态未明确记录(18:10:02 开门后无对应关门事件,直到 22:13:40 才记录 StateValue=True)。虽然这可能是日志省略了中间事件,但也值得关注门锁状态是否正常。\",\n \"推理步骤6: 厨房窗户在 19:50 被打开(做完饭通风),但日志中直到当天结束都没有关闭记录。住户 22:54 已入睡,厨房窗户整夜未关存在一定安全隐患,但这属于生活习惯范畴,不构成设备故障。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器在灶具未开启时突然跳升至 2838(28.38°C),偏离正常值约 4°C\",\n \"19:12 和 19:51 厨房温度传感器两次报告 MeasuredValue = None\",\n \"6月9日 22:00 起厨房温度传感器上报格式变为非标准(缺少 TemperatureMeasurement Cluster 前缀)\",\n \"6月10日-11日厨房温度传感器持续报告固定值 2350,完全不随环境温度变化,而同期客厅/卧室传感器有正常昼夜波动\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器硬件状态,尝试断电重启恢复;若重启后仍报固定值或 None,应更换传感器\",\n \"检查厨房温度传感器固件版本,确认是否有已知的上报格式异常 Bug,必要时进行 OTA 升级\",\n \"在传感器修复前,将厨房烟雾报警器灵敏度适当提高,作为温度监测失效期间的补偿手段\",\n \"确认入户门在回家后是否正常关闭并上锁,检查门锁自动上锁策略是否需要调整(当前仅在睡前才触发自动锁定)\",\n \"考虑添加自动化规则:当厨房窗户打开超过一定时间且住户进入睡眠模式时,发送提醒关窗通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温跳变、读数为 None 以及之后持续固定值不变,高度疑似传感器故障。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~24.58°C 跳升至 28.38°C,30 分钟内升幅近 4°C,而同一时段客厅和卧室温度仅正常小幅下降。即使灶具在 19:11 才开启,19:00 时灶具尚未工作,无法解释这一跳变。", "推理步骤2: 19:12 和 19:51 厨房温度传感器连续两次报告 MeasuredValue = None(空值),这在 Matter TemperatureMeasurement Cluster 中意味着传感器无法完成有效测量,属于明确的设备异常信号。", "推理步骤3: 19:30 传感器恢复报告后数值为 28.35°C,与 19:00 的 28.38°C 几乎一致,而此时灶具正在工作,温度理应继续上升而非持平,说明传感器可能卡在某个错误状态。", "推理步骤4: 从 6 月 9 日 22:00 起,厨房温度传感器出现了一条非标准格式的上报(缺少 TemperatureMeasurement 前缀,仅为 MeasuredValue = 2280),之后在 6 月 10 日和 11 日的所有上报均为固定值 2350 且格式异常,不随昼夜温度周期变化。对比客厅和卧室传感器在同期有正常的昼夜温差波动,厨房传感器的恒定值进一步确认其已故障或固件异常。", "推理步骤5: 入户门锁在 18:10 回家时开锁后,直到 22:13 才自动上锁,期间 front_door_contact 的关门状态未明确记录(18:10:02 开门后无对应关门事件,直到 22:13:40 才记录 StateValue=True)。虽然这可能是日志省略了中间事件,但也值得关注门锁状态是否正常。", "推理步骤6: 厨房窗户在 19:50 被打开(做完饭通风),但日志中直到当天结束都没有关闭记录。住户 22:54 已入睡,厨房窗户整夜未关存在一定安全隐患,但这属于生活习惯范畴,不构成设备故障。"], "key_evidence": ["19:00 厨房温度传感器在灶具未开启时突然跳升至 2838(28.38°C),偏离正常值约 4°C", "19:12 和 19:51 厨房温度传感器两次报告 MeasuredValue = None", "6月9日 22:00 起厨房温度传感器上报格式变为非标准(缺少 TemperatureMeasurement Cluster 前缀)", "6月10日-11日厨房温度传感器持续报告固定值 2350,完全不随环境温度变化,而同期客厅/卧室传感器有正常昼夜波动"], "recommended_actions": ["立即检查厨房温度传感器硬件状态,尝试断电重启恢复;若重启后仍报固定值或 None,应更换传感器", "检查厨房温度传感器固件版本,确认是否有已知的上报格式异常 Bug,必要时进行 OTA 升级", "在传感器修复前,将厨房烟雾报警器灵敏度适当提高,作为温度监测失效期间的补偿手段", "确认入户门在回家后是否正常关闭并上锁,检查门锁自动上锁策略是否需要调整(当前仅在睡前才触发自动锁定)", "考虑添加自动化规则:当厨房窗户打开超过一定时间且住户进入睡眠模式时,发送提醒关窗通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.642635583877563, "api_error": null} {"episode_id": "SQ3_TP_A_0478", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0478.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261107, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-12T14:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次出现异常读数(突然飙升至28.3-28.8°C并报告None值),同时烟雾报警器电池低电量,存在安全监控盲区风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式正常——早晨6:29起床、7:14出门上班、18:10回家、22:46入睡,属于典型单人上班族作息,门锁操作均为Manual开锁+Auto自动上锁,无入侵迹象。\",\n \"推理步骤2: 14:51厨房灶具开启(OnOff=True),但此时住户已于7:14出门且未回家(18:10才回),家中无人时灶具被启动是严重异常。15:01厨房温度从25.22°C骤升至28.76°C,随后15:30又恢复至25.22°C。这可能是灶具误触发/远程误操作,或温度传感器故障产生的虚假联动。\",\n \"推理步骤3: 19:00厨房温度再次异常飙升至28.36°C(此时住户在家,19:11才开厨房灯和灶具),灶具尚未开启时温度就已飙高,说明该读数并非烹饪导致,而是传感器本身存在间歇性故障。\",\n \"推理步骤4: 19:12和19:28厨房温度传感器连续两次报告MeasuredValue=None(空值),这是明确的设备故障信号——正常传感器不应返回空值。19:30又恢复为28.30°C的异常高值,进一步印证传感器工作不稳定。\",\n \"推理步骤5: 对比同时段客厅和卧室温度,它们的变化平滑且符合日间升温/夜间降温的自然规律(客厅22.9-25.7°C,卧室21.9-24.8°C),唯独厨房出现两次突发性高温尖峰和空值,排除了环境因素。\",\n \"推理步骤6: 厨房烟雾报警器在6月11日14:51已报告BatteryAlert=1(低电量警告)。如果厨房温度传感器同时存在故障,意味着厨房的两道安全防线(烟雾检测+温度监测)都处于不可靠状态,一旦发生真实火灾,可能无法及时报警。\",\n \"推理步骤7: 14:51灶具无人时开启的事件需要特别关注——虽然温度传感器故障可能导致日志中的温度数据不可信,但灶具的OnOff状态是独立上报的,不排除灶具确实被远程/误操作启动的可能性,这本身就是火灾隐患。\"\n ],\n \"key_evidence\": [\n \"14:51 家中无人时厨房灶具被开启(住户7:14出门、18:10回家),灶具OnOff状态独立于温度传感器上报\",\n \"19:00 厨房温度在灶具未开启时飙升至28.36°C(19:11灶具才开启),排除烹饪导致\",\n \"19:12 和 19:28 厨房温度传感器连续返回 MeasuredValue=None,属于明确的设备故障\",\n \"厨房烟雾报警器 BatteryAlert=1(低电量),安全监控能力下降\",\n \"同时段客厅和卧室温度变化平滑正常,仅厨房出现异常尖峰,定位问题在厨房传感器\"\n ],\n \"recommended_actions\": [\n \"立即检查并更换厨房烟雾报警器电池,确保其处于正常工作状态\",\n \"检修或更换厨房温度传感器,排查间歇性故障和空值上报的根因\",\n \"排查14:51灶具无人启动的原因——检查是否存在误设的定时任务、自动化规则或远程控制记录,必要时禁用灶具的远程控制功能\",\n \"在厨房温度传感器修复前,考虑临时增加额外的安全监测手段(如独立烟感或手动巡检)\",\n \"检查厨房灶具是否具备无人自动关闭功能,如无则建议加装燃气/电力自动切断装置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次出现异常读数(突然飙升至28.3-28.8°C并报告None值),同时烟雾报警器电池低电量,存在安全监控盲区风险。", "reasoning": ["推理步骤1: 住户行为模式正常——早晨6:29起床、7:14出门上班、18:10回家、22:46入睡,属于典型单人上班族作息,门锁操作均为Manual开锁+Auto自动上锁,无入侵迹象。", "推理步骤2: 14:51厨房灶具开启(OnOff=True),但此时住户已于7:14出门且未回家(18:10才回),家中无人时灶具被启动是严重异常。15:01厨房温度从25.22°C骤升至28.76°C,随后15:30又恢复至25.22°C。这可能是灶具误触发/远程误操作,或温度传感器故障产生的虚假联动。", "推理步骤3: 19:00厨房温度再次异常飙升至28.36°C(此时住户在家,19:11才开厨房灯和灶具),灶具尚未开启时温度就已飙高,说明该读数并非烹饪导致,而是传感器本身存在间歇性故障。", "推理步骤4: 19:12和19:28厨房温度传感器连续两次报告MeasuredValue=None(空值),这是明确的设备故障信号——正常传感器不应返回空值。19:30又恢复为28.30°C的异常高值,进一步印证传感器工作不稳定。", "推理步骤5: 对比同时段客厅和卧室温度,它们的变化平滑且符合日间升温/夜间降温的自然规律(客厅22.9-25.7°C,卧室21.9-24.8°C),唯独厨房出现两次突发性高温尖峰和空值,排除了环境因素。", "推理步骤6: 厨房烟雾报警器在6月11日14:51已报告BatteryAlert=1(低电量警告)。如果厨房温度传感器同时存在故障,意味着厨房的两道安全防线(烟雾检测+温度监测)都处于不可靠状态,一旦发生真实火灾,可能无法及时报警。", "推理步骤7: 14:51灶具无人时开启的事件需要特别关注——虽然温度传感器故障可能导致日志中的温度数据不可信,但灶具的OnOff状态是独立上报的,不排除灶具确实被远程/误操作启动的可能性,这本身就是火灾隐患。"], "key_evidence": ["14:51 家中无人时厨房灶具被开启(住户7:14出门、18:10回家),灶具OnOff状态独立于温度传感器上报", "19:00 厨房温度在灶具未开启时飙升至28.36°C(19:11灶具才开启),排除烹饪导致", "19:12 和 19:28 厨房温度传感器连续返回 MeasuredValue=None,属于明确的设备故障", "厨房烟雾报警器 BatteryAlert=1(低电量),安全监控能力下降", "同时段客厅和卧室温度变化平滑正常,仅厨房出现异常尖峰,定位问题在厨房传感器"], "recommended_actions": ["立即检查并更换厨房烟雾报警器电池,确保其处于正常工作状态", "检修或更换厨房温度传感器,排查间歇性故障和空值上报的根因", "排查14:51灶具无人启动的原因——检查是否存在误设的定时任务、自动化规则或远程控制记录,必要时禁用灶具的远程控制功能", "在厨房温度传感器修复前,考虑临时增加额外的安全监测手段(如独立烟感或手动巡检)", "检查厨房灶具是否具备无人自动关闭功能,如无则建议加装燃气/电力自动切断装置"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.38741445541382, "api_error": null} {"episode_id": "SQ3_TP_A_0481", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0481.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261110, "scenario_id": "FG-04", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-21T20:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现异常高温读数,同时烟雾报警器电池低电量,存在火灾监测盲区风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内共 5 次报告 MeasuredValue = None(09:13、09:43、12:09、12:52、18:04、18:43),均发生在灶具开启或关闭前后。传感器在灶具使用期间频繁失效,说明该传感器可能受高温影响出现故障或通信中断。\",\n \"推理步骤2: 12:00 时厨房温度传感器报告 2980(29.80°C),而同一时刻客厅为 25.79°C、卧室为 24.71°C。厨房比其他房间高出约 4-5°C,但灶具此时并未开启(上一次灶具关闭在 09:42,下一次开启在 12:08)。这一异常高温读数可能是传感器漂移或故障的表现。\",\n \"推理步骤3: 更严重的是,20:11 灶具再次开启,20:21 厨房温度飙升至 3167(31.67°C),比同时段客厅(约 24°C)高出近 8°C。虽然烟雾报警器此时报告 SmokeState = 0(无烟),但该报警器在前一天 20:11 已报告 BatteryAlert = 1(低电量警告)。低电量状态下报警器的可靠性存疑。\",\n \"推理步骤4: 20:11 灶具开启后,日志中没有对应的关闭记录(OnOff = False),直到日志结束(23:30)灶具状态仍未明确关闭。如果灶具确实持续运行超过 3 小时无人关闭,这是一个显著的火灾隐患。\",\n \"推理步骤5: 综合来看:温度传感器间歇性失效 + 异常高温读数 + 烟雾报警器低电量 + 灶具可能未关闭,这些因素叠加形成了一个火灾监测盲区。即使当前没有发生火灾,安全监测链条已经不完整。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 5 次以上报告 MeasuredValue = None,传感器工作不稳定\",\n \"12:00 厨房温度异常读数 2980(29.80°C),灶具未开启状态下比其他房间高 4-5°C\",\n \"20:21 厨房温度飙升至 3167(31.67°C),比客厅高约 8°C\",\n \"厨房烟雾报警器于 2026-06-20T20:11 报告 BatteryAlert = 1(低电量),降低了火灾报警可靠性\",\n \"20:11 灶具开启后日志中无关闭记录,可能存在灶具长时间无人看管的情况\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具是否仍在运行,如是则关闭\",\n \"尽快更换厨房烟雾报警器电池,恢复火灾报警能力\",\n \"检查或更换厨房温度传感器,排查其频繁报告 None 值和异常高温读数的原因\",\n \"考虑为灶具设置自动超时关闭规则(如持续运行超过 1 小时未检测到人员活动则自动关闭并发送告警)\",\n \"在传感器修复前,增加厨房区域的人工巡检频率\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现异常高温读数,同时烟雾报警器电池低电量,存在火灾监测盲区风险。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内共 5 次报告 MeasuredValue = None(09:13、09:43、12:09、12:52、18:04、18:43),均发生在灶具开启或关闭前后。传感器在灶具使用期间频繁失效,说明该传感器可能受高温影响出现故障或通信中断。", "推理步骤2: 12:00 时厨房温度传感器报告 2980(29.80°C),而同一时刻客厅为 25.79°C、卧室为 24.71°C。厨房比其他房间高出约 4-5°C,但灶具此时并未开启(上一次灶具关闭在 09:42,下一次开启在 12:08)。这一异常高温读数可能是传感器漂移或故障的表现。", "推理步骤3: 更严重的是,20:11 灶具再次开启,20:21 厨房温度飙升至 3167(31.67°C),比同时段客厅(约 24°C)高出近 8°C。虽然烟雾报警器此时报告 SmokeState = 0(无烟),但该报警器在前一天 20:11 已报告 BatteryAlert = 1(低电量警告)。低电量状态下报警器的可靠性存疑。", "推理步骤4: 20:11 灶具开启后,日志中没有对应的关闭记录(OnOff = False),直到日志结束(23:30)灶具状态仍未明确关闭。如果灶具确实持续运行超过 3 小时无人关闭,这是一个显著的火灾隐患。", "推理步骤5: 综合来看:温度传感器间歇性失效 + 异常高温读数 + 烟雾报警器低电量 + 灶具可能未关闭,这些因素叠加形成了一个火灾监测盲区。即使当前没有发生火灾,安全监测链条已经不完整。"], "key_evidence": ["厨房温度传感器一天内 5 次以上报告 MeasuredValue = None,传感器工作不稳定", "12:00 厨房温度异常读数 2980(29.80°C),灶具未开启状态下比其他房间高 4-5°C", "20:21 厨房温度飙升至 3167(31.67°C),比客厅高约 8°C", "厨房烟雾报警器于 2026-06-20T20:11 报告 BatteryAlert = 1(低电量),降低了火灾报警可靠性", "20:11 灶具开启后日志中无关闭记录,可能存在灶具长时间无人看管的情况"], "recommended_actions": ["立即检查厨房灶具是否仍在运行,如是则关闭", "尽快更换厨房烟雾报警器电池,恢复火灾报警能力", "检查或更换厨房温度传感器,排查其频繁报告 None 值和异常高温读数的原因", "考虑为灶具设置自动超时关闭规则(如持续运行超过 1 小时未检测到人员活动则自动关闭并发送告警)", "在传感器修复前,增加厨房区域的人工巡检频率"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.953679084777832, "api_error": null} {"episode_id": "SQ3_TP_A_0493", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0493.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261122, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-01T20:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数和离线,卧室温度传感器出现非标准格式的异常高温尖峰,厨房烟雾报警器在灶具关闭后触发,多个传感器行为异常需要排查。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约2464跳升至2837(即从约24.6°C跳到28.4°C),升幅近4°C,而此时灶具尚未开启(19:12才开),这一跳变缺乏合理的物理解释。\",\n \"推理步骤2: 厨房温度传感器在19:13和19:50连续两次报告MeasuredValue=None,表明传感器读数丢失或设备故障。19:30的读数仍停留在2837,说明传感器可能卡在异常值上未刷新。\",\n \"推理步骤3: 卧室温度传感器在20:24和20:29报告了MeasuredValue=3237和3200(约32.4°C和32.0°C),且上报格式缺少Cluster前缀'TemperatureMeasurement.',与正常的半小时周期上报不同。而20:30的正常周期读数恢复为2310(23.1°C),前后温差近10°C,物理上不可能在几分钟内发生如此剧烈变化,高度怀疑是传感器故障或数据异常。\",\n \"推理步骤4: 厨房烟雾报警器在20:34触发(SmokeState=1),但此时灶具已于19:49关闭,且厨房窗户已于19:49打开通风,厨房温度在20:00和20:30分别为2417和2401(正常范围)。灶具关闭45分钟后烟雾报警触发,可能是传感器误报或存在残留烟雾/设备灵敏度问题。\",\n \"推理步骤5: 入户门在18:16开锁进门后,门传感器(front_door_contact)一直未报告关门(StateValue=True),直到22:04:40才恢复关闭状态,意味着入户门可能敞开了近4小时。虽然这本身不构成入侵威胁(住户在家),但属于安全隐患。\",\n \"推理步骤6: 住户的整体活动模式是正常的——早晨起床、出门上班、傍晚回家、做饭、睡觉,不存在入侵迹象。核心问题集中在多个传感器的数据异常上。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器19:00异常跳升至2837,19:13和19:50读数为None(传感器离线/故障)\",\n \"卧室温度传感器20:24和20:29出现非标准格式的异常高温读数3237/3200,与前后正常读数偏差约10°C\",\n \"厨房烟雾报警器20:34触发SmokeState=1,距灶具关闭已过45分钟\",\n \"入户门从18:16开门到22:04关门,长时间处于未关闭状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清理或更换传感器,排查None读数和异常跳变的原因\",\n \"检查卧室温度传感器是否存在固件问题或通信异常,关注其非标准上报格式(缺少Cluster前缀)\",\n \"检查厨房烟雾报警器是否需要清洁或校准,确认是否为误报;如持续触发应现场排查是否有隐蔽火源\",\n \"建议设置入户门长时间未关闭的自动提醒,避免安全隐患\",\n \"考虑对传感器数据增加异常值过滤和格式校验机制,及时发现设备故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数和离线,卧室温度传感器出现非标准格式的异常高温尖峰,厨房烟雾报警器在灶具关闭后触发,多个传感器行为异常需要排查。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约2464跳升至2837(即从约24.6°C跳到28.4°C),升幅近4°C,而此时灶具尚未开启(19:12才开),这一跳变缺乏合理的物理解释。", "推理步骤2: 厨房温度传感器在19:13和19:50连续两次报告MeasuredValue=None,表明传感器读数丢失或设备故障。19:30的读数仍停留在2837,说明传感器可能卡在异常值上未刷新。", "推理步骤3: 卧室温度传感器在20:24和20:29报告了MeasuredValue=3237和3200(约32.4°C和32.0°C),且上报格式缺少Cluster前缀'TemperatureMeasurement.',与正常的半小时周期上报不同。而20:30的正常周期读数恢复为2310(23.1°C),前后温差近10°C,物理上不可能在几分钟内发生如此剧烈变化,高度怀疑是传感器故障或数据异常。", "推理步骤4: 厨房烟雾报警器在20:34触发(SmokeState=1),但此时灶具已于19:49关闭,且厨房窗户已于19:49打开通风,厨房温度在20:00和20:30分别为2417和2401(正常范围)。灶具关闭45分钟后烟雾报警触发,可能是传感器误报或存在残留烟雾/设备灵敏度问题。", "推理步骤5: 入户门在18:16开锁进门后,门传感器(front_door_contact)一直未报告关门(StateValue=True),直到22:04:40才恢复关闭状态,意味着入户门可能敞开了近4小时。虽然这本身不构成入侵威胁(住户在家),但属于安全隐患。", "推理步骤6: 住户的整体活动模式是正常的——早晨起床、出门上班、傍晚回家、做饭、睡觉,不存在入侵迹象。核心问题集中在多个传感器的数据异常上。"], "key_evidence": ["厨房温度传感器19:00异常跳升至2837,19:13和19:50读数为None(传感器离线/故障)", "卧室温度传感器20:24和20:29出现非标准格式的异常高温读数3237/3200,与前后正常读数偏差约10°C", "厨房烟雾报警器20:34触发SmokeState=1,距灶具关闭已过45分钟", "入户门从18:16开门到22:04关门,长时间处于未关闭状态"], "recommended_actions": ["检查厨房温度传感器硬件状态,清理或更换传感器,排查None读数和异常跳变的原因", "检查卧室温度传感器是否存在固件问题或通信异常,关注其非标准上报格式(缺少Cluster前缀)", "检查厨房烟雾报警器是否需要清洁或校准,确认是否为误报;如持续触发应现场排查是否有隐蔽火源", "建议设置入户门长时间未关闭的自动提醒,避免安全隐患", "考虑对传感器数据增加异常值过滤和格式校验机制,及时发现设备故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.164151191711426, "api_error": null} {"episode_id": "SQ3_TP_A_0495", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0495.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261124, "scenario_id": "INS-01", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-17T00:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题\",\n \"reasoning\": [\n \"推理步骤1: 确定分析时段为过去6小时,即 2026-06-17T18:00:00 ~ 2026-06-17T23:30:00。住户于 18:09 回家,行为链(开门→开灯→开空调→做饭→洗碗→睡觉)整体合理。\",\n \"推理步骤2: 18:30 厨房温度为 2454(约24.5°C),但到 19:00 突然跳升至 2841(约28.4°C),30分钟内上升近 4°C。此时灶具尚未开启(19:01:30 才开),且客厅/卧室温度同期在正常下降,说明这不是全屋升温,而是厨房传感器的孤立异常。\",\n \"推理步骤3: 19:02 厨房温度传感器报告 MeasuredValue = None(null),灶具刚开启约30秒就出现空值,这不是正常的温度上升表现,而是传感器读数丢失。\",\n \"推理步骤4: 19:30 传感器恢复,读数为 2843(约28.4°C),与 19:00 的异常高值几乎一致,但此时灶具已运行约30分钟,厨房实际温度应有所上升,读数却没有变化,进一步说明传感器可能卡在异常值上。\",\n \"推理步骤5: 19:51 灶具关闭后,19:52 传感器再次报告 None。两次 null 读数集中出现在短时间内,属于明显的设备异常。\",\n \"推理步骤6: 20:00 之后传感器恢复正常(2408→2412→2388→…→2325),读数回归合理范围并随夜间自然降温,说明传感器并非永久损坏,但间歇性故障已经发生。\",\n \"推理步骤7: 烟雾报警器在整个时段内未触发,灶具使用时长约50分钟后正常关闭,排除火灾风险。入户门锁操作正常(手动开锁→自动上锁),无入侵迹象。\",\n \"推理步骤8: 其余设备行为均正常:空调制冷模式(SystemMode=3)开启后客厅温度稳步下降;卧室窗帘关闭、灯光调暗后关闭,符合就寝习惯;洗碗机正常启动运行。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2454 异常跳升至 2841(+3.87°C/30min),同期灶具尚未开启,客厅和卧室温度正常下降\",\n \"19:02 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,出现空值读数\",\n \"19:30 读数 2843 与 19:00 的 2841 几乎相同,灶具运行30分钟后温度未进一步变化,传感器疑似卡值\",\n \"20:00 之后传感器恢复正常读数并呈自然降温趋势,说明是间歇性故障而非永久损坏\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的供电和通信连接,清理探头表面,排除灰尘或油污导致的接触不良\",\n \"在系统中为温度传感器设置 null 值告警规则,出现连续空值时及时通知住户\",\n \"考虑为厨房增加一个冗余温度传感器,与烟雾报警器配合,确保烹饪场景下的安全监测不中断\",\n \"持续观察该传感器未来几天的表现,如果 null 读数或异常跳变反复出现,建议更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题", "reasoning": ["推理步骤1: 确定分析时段为过去6小时,即 2026-06-17T18:00:00 ~ 2026-06-17T23:30:00。住户于 18:09 回家,行为链(开门→开灯→开空调→做饭→洗碗→睡觉)整体合理。", "推理步骤2: 18:30 厨房温度为 2454(约24.5°C),但到 19:00 突然跳升至 2841(约28.4°C),30分钟内上升近 4°C。此时灶具尚未开启(19:01:30 才开),且客厅/卧室温度同期在正常下降,说明这不是全屋升温,而是厨房传感器的孤立异常。", "推理步骤3: 19:02 厨房温度传感器报告 MeasuredValue = None(null),灶具刚开启约30秒就出现空值,这不是正常的温度上升表现,而是传感器读数丢失。", "推理步骤4: 19:30 传感器恢复,读数为 2843(约28.4°C),与 19:00 的异常高值几乎一致,但此时灶具已运行约30分钟,厨房实际温度应有所上升,读数却没有变化,进一步说明传感器可能卡在异常值上。", "推理步骤5: 19:51 灶具关闭后,19:52 传感器再次报告 None。两次 null 读数集中出现在短时间内,属于明显的设备异常。", "推理步骤6: 20:00 之后传感器恢复正常(2408→2412→2388→…→2325),读数回归合理范围并随夜间自然降温,说明传感器并非永久损坏,但间歇性故障已经发生。", "推理步骤7: 烟雾报警器在整个时段内未触发,灶具使用时长约50分钟后正常关闭,排除火灾风险。入户门锁操作正常(手动开锁→自动上锁),无入侵迹象。", "推理步骤8: 其余设备行为均正常:空调制冷模式(SystemMode=3)开启后客厅温度稳步下降;卧室窗帘关闭、灯光调暗后关闭,符合就寝习惯;洗碗机正常启动运行。"], "key_evidence": ["19:00 厨房温度从 2454 异常跳升至 2841(+3.87°C/30min),同期灶具尚未开启,客厅和卧室温度正常下降", "19:02 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,出现空值读数", "19:30 读数 2843 与 19:00 的 2841 几乎相同,灶具运行30分钟后温度未进一步变化,传感器疑似卡值", "20:00 之后传感器恢复正常读数并呈自然降温趋势,说明是间歇性故障而非永久损坏"], "recommended_actions": ["检查厨房温度传感器的供电和通信连接,清理探头表面,排除灰尘或油污导致的接触不良", "在系统中为温度传感器设置 null 值告警规则,出现连续空值时及时通知住户", "考虑为厨房增加一个冗余温度传感器,与烟雾报警器配合,确保烹饪场景下的安全监测不中断", "持续观察该传感器未来几天的表现,如果 null 读数或异常跳变反复出现,建议更换设备"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.9727566242218, "api_error": null} {"episode_id": "SQ3_TP_A_0507", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0507.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261136, "scenario_id": "BA-03", "total_events": 197, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-22T16:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次数据丢失(None),卧室灯在无人时快速闪烁,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约2482跳升至2856(即28.56°C),相比前一个读数(17:30的2482,约24.82°C)骤升近4°C,且该时段灶具未开启、住户尚未进厨房,此跳变不合理。18:30仍维持2856,持续异常。\",\n \"推理步骤2: 厨房温度传感器在18:58和19:56两次报告MeasuredValue=None,表示传感器读数丢失。正常传感器不应返回空值,这是传感器硬件故障或通信异常的典型表现。\",\n \"推理步骤3: 卧室灯在16:34:00至16:34:14的14秒内发生了7次开关状态变化(快速闪烁),此时卧室运动传感器无人体检测(住户07:15已出门,18:18才回家),排除人为操作的可能。这种无人状态下的快速闪烁指向设备故障、线路接触不良或控制模块异常。\",\n \"推理步骤4: 入户门在18:18开锁进门后,front_door_contact在18:18:02变为False(门开),但直到21:46:39才变为True(门关)。门保持开启状态超过3.5小时。虽然住户在家时这不构成入侵威胁,但属于安全隐患,尤其是一室一厅的住宅。\",\n \"推理步骤5: 其余行为模式正常——住户约06:31起床、07:15出门上班、18:18回家、21:46就寝、22:52关灯睡觉,符合典型上班族作息。空调制冷、做饭、洗碗机使用等均在合理时段。\"\n ],\n \"key_evidence\": [\n \"18:00和18:30厨房温度传感器读数异常飙升至2856(28.56°C),与其他房间温度趋势不一致\",\n \"18:58和19:56厨房温度传感器两次返回None值,表明传感器故障\",\n \"16:34:00-16:34:14卧室灯在无人状态下14秒内发生7次快速开关闪烁\",\n \"入户门从18:18:02至21:46:39保持开启状态超过3.5小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认通信连接是否稳定,必要时更换传感器\",\n \"检查卧室灯的控制模块、接线和智能开关,排查是否存在接触不良、固件bug或电气故障\",\n \"设置入户门长时间未关闭的自动提醒(建议阈值5-10分钟),避免安全隐患\",\n \"为温度传感器设置异常值过滤规则:单次跳变超过3°C或返回None时触发告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次数据丢失(None),卧室灯在无人时快速闪烁,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约2482跳升至2856(即28.56°C),相比前一个读数(17:30的2482,约24.82°C)骤升近4°C,且该时段灶具未开启、住户尚未进厨房,此跳变不合理。18:30仍维持2856,持续异常。", "推理步骤2: 厨房温度传感器在18:58和19:56两次报告MeasuredValue=None,表示传感器读数丢失。正常传感器不应返回空值,这是传感器硬件故障或通信异常的典型表现。", "推理步骤3: 卧室灯在16:34:00至16:34:14的14秒内发生了7次开关状态变化(快速闪烁),此时卧室运动传感器无人体检测(住户07:15已出门,18:18才回家),排除人为操作的可能。这种无人状态下的快速闪烁指向设备故障、线路接触不良或控制模块异常。", "推理步骤4: 入户门在18:18开锁进门后,front_door_contact在18:18:02变为False(门开),但直到21:46:39才变为True(门关)。门保持开启状态超过3.5小时。虽然住户在家时这不构成入侵威胁,但属于安全隐患,尤其是一室一厅的住宅。", "推理步骤5: 其余行为模式正常——住户约06:31起床、07:15出门上班、18:18回家、21:46就寝、22:52关灯睡觉,符合典型上班族作息。空调制冷、做饭、洗碗机使用等均在合理时段。"], "key_evidence": ["18:00和18:30厨房温度传感器读数异常飙升至2856(28.56°C),与其他房间温度趋势不一致", "18:58和19:56厨房温度传感器两次返回None值,表明传感器故障", "16:34:00-16:34:14卧室灯在无人状态下14秒内发生7次快速开关闪烁", "入户门从18:18:02至21:46:39保持开启状态超过3.5小时"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认通信连接是否稳定,必要时更换传感器", "检查卧室灯的控制模块、接线和智能开关,排查是否存在接触不良、固件bug或电气故障", "设置入户门长时间未关闭的自动提醒(建议阈值5-10分钟),避免安全隐患", "为温度传感器设置异常值过滤规则:单次跳变超过3°C或返回None时触发告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.450045108795166, "api_error": null} {"episode_id": "SQ3_TP_A_0510", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0510.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261139, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-29T00:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温跳变(约28.6°C),且在19:00和19:51两次报告None值,表明传感器存在故障或数据异常。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约18:00-23:30)的厨房温度数据。17:30时厨房温度为2472(24.72°C),18:00突然跳升至2860(28.60°C),涨幅约3.9°C,而同一时刻客厅和卧室温度仅正常下降。18:30厨房温度仍为2867(28.67°C),但此时灶具尚未开启(灶具在18:59才开),无合理热源解释这一跳变。\",\n \"推理步骤2: 19:00时厨房温度传感器报告了一次None值(空读数),紧接着又报告了正常值2441。19:51再次报告None值。两次None读数说明传感器出现了间歇性读取失败,这是典型的传感器硬件故障或通信异常信号。\",\n \"推理步骤3: 对比18:00异常高温与灶具时间线——灶具在18:59:30才开启、19:50关闭,而异常高温出现在18:00-18:30,灶具尚未使用,排除了烹饪导致温度升高的可能。如果是真实环境温度升高(如火灾),烟雾报警器应有触发记录,但日志中无任何smoke_co_alarm事件,且客厅/卧室温度同期正常下降,排除了火灾风险。\",\n \"推理步骤4: 综合判断:18:00的温度跳变是传感器虚高读数(非真实环境温度),加上两次None值,高度指向厨房温度传感器本身存在硬件故障或连接不稳定。\",\n \"推理步骤5: 其余设备行为均正常——住户早晨6:23起床、7:39出门上锁、18:30回家开灯开空调、18:59做饭、19:50关灶开窗通风、20:13启动洗碗机、21:57回卧室关灯就寝,符合典型的工作日单人生活模式。门锁在00:12的两次LockDoor命令和DoorLockAlarm(AlarmCode=0)属于锁定确认/螺栓卡顿告警,但门已成功锁定,属于低风险事件。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从2472突跳至2860(+3.88°C),18:30仍为2867,而此时灶具未开启、烟雾报警器无触发、其他房间温度正常下降\",\n \"19:00和19:51厨房温度传感器两次报告None值(读数缺失),表明传感器间歇性故障\",\n \"00:12:15 门锁触发 DoorLockAlarm(AlarmCode=0),表示锁定螺栓卡顿告警(低风险,但值得关注)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和供电/通信连接,必要时更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保smoke_co_alarm工作正常,作为厨房安全的备用监测手段\",\n \"检查入户门锁(front_door_lock)的机械部件,00:12的DoorLockAlarm(AlarmCode=0)提示螺栓可能存在卡顿,建议润滑或维护锁体\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温跳变(约28.6°C),且在19:00和19:51两次报告None值,表明传感器存在故障或数据异常。", "reasoning": ["推理步骤1: 梳理过去6小时(约18:00-23:30)的厨房温度数据。17:30时厨房温度为2472(24.72°C),18:00突然跳升至2860(28.60°C),涨幅约3.9°C,而同一时刻客厅和卧室温度仅正常下降。18:30厨房温度仍为2867(28.67°C),但此时灶具尚未开启(灶具在18:59才开),无合理热源解释这一跳变。", "推理步骤2: 19:00时厨房温度传感器报告了一次None值(空读数),紧接着又报告了正常值2441。19:51再次报告None值。两次None读数说明传感器出现了间歇性读取失败,这是典型的传感器硬件故障或通信异常信号。", "推理步骤3: 对比18:00异常高温与灶具时间线——灶具在18:59:30才开启、19:50关闭,而异常高温出现在18:00-18:30,灶具尚未使用,排除了烹饪导致温度升高的可能。如果是真实环境温度升高(如火灾),烟雾报警器应有触发记录,但日志中无任何smoke_co_alarm事件,且客厅/卧室温度同期正常下降,排除了火灾风险。", "推理步骤4: 综合判断:18:00的温度跳变是传感器虚高读数(非真实环境温度),加上两次None值,高度指向厨房温度传感器本身存在硬件故障或连接不稳定。", "推理步骤5: 其余设备行为均正常——住户早晨6:23起床、7:39出门上锁、18:30回家开灯开空调、18:59做饭、19:50关灶开窗通风、20:13启动洗碗机、21:57回卧室关灯就寝,符合典型的工作日单人生活模式。门锁在00:12的两次LockDoor命令和DoorLockAlarm(AlarmCode=0)属于锁定确认/螺栓卡顿告警,但门已成功锁定,属于低风险事件。"], "key_evidence": ["18:00厨房温度从2472突跳至2860(+3.88°C),18:30仍为2867,而此时灶具未开启、烟雾报警器无触发、其他房间温度正常下降", "19:00和19:51厨房温度传感器两次报告None值(读数缺失),表明传感器间歇性故障", "00:12:15 门锁触发 DoorLockAlarm(AlarmCode=0),表示锁定螺栓卡顿告警(低风险,但值得关注)"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和供电/通信连接,必要时更换传感器", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保smoke_co_alarm工作正常,作为厨房安全的备用监测手段", "检查入户门锁(front_door_lock)的机械部件,00:12的DoorLockAlarm(AlarmCode=0)提示螺栓可能存在卡顿,建议润滑或维护锁体"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.373504161834717, "api_error": null} {"episode_id": "SQ3_TP_A_0520", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0520.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261149, "scenario_id": "DF-03", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-13T12:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数(29.90°C),疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中共 5 次报告 MeasuredValue = None(08:58、09:50、12:03、12:32、18:03、18:39),每次都发生在灶具开启或关闭前后。正常传感器即使在高温环境下也应返回数值而非 None,频繁丢失读数说明传感器可能存在故障或安装位置不当,受灶具热量直接影响导致超量程。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2990(29.90°C),而同一时刻客厅为 25.70°C、卧室为 24.85°C。厨房比其他房间高出约 4-5°C,且此时灶具尚未开启(12:02 才开灯和点火)。这意味着要么传感器在灶具未使用时就出现了异常高读数,要么存在其他热源。12:30 仍为 29.89°C,灶具 12:31 才关闭,说明高温持续了至少 30 分钟。这个温差虽不构成火灾风险,但读数异常值得关注。\",\n \"推理步骤3: 客厅运动传感器在 12:55-12:56 期间出现快速抖动(1→0→1→0→1,间隔仅 5-30 秒),这种高频率的占用状态切换可能是传感器灵敏度问题或有人在传感器边缘区域活动。单次出现可归为正常,但值得持续观察。\",\n \"推理步骤4: 其余行为模式均属正常——住户约 08:22 起床、08:45 使用卫生间、09:00 前后做早餐、12:00 做午餐、18:00 做晚餐、22:50 就寝。门锁在就寝时自动上锁,窗帘按作息开合,空调白天制冷运行,温度曲线符合夏季昼夜变化规律。无入侵、漏水或烟雾报警事件。\",\n \"推理步骤5: 厨房窗户传感器在做饭后打开通风(09:49、12:31、18:38)属于合理行为,但日志中只记录了打开(StateValue=False)而未记录关闭,需确认窗户是否仍处于开启状态——夜间厨房窗户未关存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 08:58、09:50、12:03、12:32、18:03、18:39 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度异常读数 2990(29.90°C),灶具 12:02 才开启,比同期客厅/卧室高 4-5°C\",\n \"客厅运动传感器 12:55-12:56 在 70 秒内发生 5 次状态切换\",\n \"厨房窗户传感器仅记录了 3 次打开事件,未见关闭事件,最后一次打开在 18:38\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超量程返回 None;考虑重新校准或更换位置\",\n \"确认厨房窗户当前状态,若仍处于开启状态建议关闭,夜间开窗存在安防风险\",\n \"持续观察客厅运动传感器是否频繁出现快速抖动,若反复出现建议调整灵敏度或检查是否有窗帘/宠物等干扰源\",\n \"建议为厨房温度传感器设置异常值告警规则(如读数为 None 或超过 28°C 时推送通知),以便及时发现问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 12:00 出现异常高温读数(29.90°C),疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中共 5 次报告 MeasuredValue = None(08:58、09:50、12:03、12:32、18:03、18:39),每次都发生在灶具开启或关闭前后。正常传感器即使在高温环境下也应返回数值而非 None,频繁丢失读数说明传感器可能存在故障或安装位置不当,受灶具热量直接影响导致超量程。", "推理步骤2: 12:00 厨房温度传感器报告 2990(29.90°C),而同一时刻客厅为 25.70°C、卧室为 24.85°C。厨房比其他房间高出约 4-5°C,且此时灶具尚未开启(12:02 才开灯和点火)。这意味着要么传感器在灶具未使用时就出现了异常高读数,要么存在其他热源。12:30 仍为 29.89°C,灶具 12:31 才关闭,说明高温持续了至少 30 分钟。这个温差虽不构成火灾风险,但读数异常值得关注。", "推理步骤3: 客厅运动传感器在 12:55-12:56 期间出现快速抖动(1→0→1→0→1,间隔仅 5-30 秒),这种高频率的占用状态切换可能是传感器灵敏度问题或有人在传感器边缘区域活动。单次出现可归为正常,但值得持续观察。", "推理步骤4: 其余行为模式均属正常——住户约 08:22 起床、08:45 使用卫生间、09:00 前后做早餐、12:00 做午餐、18:00 做晚餐、22:50 就寝。门锁在就寝时自动上锁,窗帘按作息开合,空调白天制冷运行,温度曲线符合夏季昼夜变化规律。无入侵、漏水或烟雾报警事件。", "推理步骤5: 厨房窗户传感器在做饭后打开通风(09:49、12:31、18:38)属于合理行为,但日志中只记录了打开(StateValue=False)而未记录关闭,需确认窗户是否仍处于开启状态——夜间厨房窗户未关存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在 08:58、09:50、12:03、12:32、18:03、18:39 共 6 次报告 MeasuredValue = None", "12:00 厨房温度异常读数 2990(29.90°C),灶具 12:02 才开启,比同期客厅/卧室高 4-5°C", "客厅运动传感器 12:55-12:56 在 70 秒内发生 5 次状态切换", "厨房窗户传感器仅记录了 3 次打开事件,未见关闭事件,最后一次打开在 18:38"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超量程返回 None;考虑重新校准或更换位置", "确认厨房窗户当前状态,若仍处于开启状态建议关闭,夜间开窗存在安防风险", "持续观察客厅运动传感器是否频繁出现快速抖动,若反复出现建议调整灵敏度或检查是否有窗帘/宠物等干扰源", "建议为厨房温度传感器设置异常值告警规则(如读数为 None 或超过 28°C 时推送通知),以便及时发现问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.9438419342041, "api_error": null} {"episode_id": "SQ3_TP_A_0527", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0527.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261156, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-18T17:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在17:18-17:23出现两次异常高温读数(353.4°C、320.0°C),厨房烟雾报警器随后触发,但实际温度数据并不支持真实火灾,高度疑似传感器故障导致虚假告警;同时厨房温度传感器多次报告None值,存在设备通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 17:18客厅温度传感器报告MeasuredValue=3534(即353.4°C),17:23报告3200(320.0°C)。这两个值远超正常室温范围,且上报格式缺少完整的Cluster前缀(TemperatureMeasurement.),属于异常数据点。\",\n \"推理步骤2: 仅5分钟后(17:28),厨房烟雾报警器触发SmokeState=1。但查看同时段厨房温度传感器读数(17:30为2472即24.72°C),以及客厅温度传感器在17:30恢复正常(2475即24.75°C),说明实际环境温度并未出现剧烈升高。\",\n \"推理步骤3: 如果真的发生火灾,温度不可能在几分钟内从353°C骤降回24°C,且周围其他传感器(卧室、厨房)在同一时段温度完全正常。因此353°C和320°C的读数极大概率是传感器故障或数据传输错误。\",\n \"推理步骤4: 厨房烟雾报警器在17:28触发SmokeState=1,但此时灶具尚未开启(灶具在18:53才开启),且厨房温度正常。烟雾报警可能是受传感器异常数据联动触发,或自身存在误报。日志中未见SmokeState恢复为0的记录,需要确认报警器是否仍处于告警状态。\",\n \"推理步骤5: 厨房温度传感器在18:54和19:35两次报告MeasuredValue=None,说明该传感器存在通信中断或数据丢失问题。值得注意的是18:00时厨房温度为2870(28.7°C),相比17:30的2472突然升高约4°C,但这可能与傍晚时段或灶具预热前的环境变化有关,18:30仍为2862,之后在灶具开启使用后反而恢复正常(19:00为2443),整体走势不符合持续性热源特征。\",\n \"推理步骤6: 住户行为模式完全正常——06:34起床、07:25出门并自动锁门、18:11回家开灯开空调、18:53做饭、19:34关灶开窗通风、22:05关灯就寝、22:44熄灯入睡。入户门锁操作均为正常手动开锁/自动上锁,无异常入侵迹象。\",\n \"推理步骤7: 18:11回家时入户门开门后约16秒未关门(18:11:02开门,直到22:05:29才记录门关闭),但结合住户在家活动的场景,这属于正常行为,不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"17:18 客厅温度传感器报告 MeasuredValue=3534(353.4°C),17:23 报告 3200(320.0°C),格式异常且数值不合理\",\n \"17:28 厨房烟雾报警器 SmokeState=1 触发,但同时段所有温度传感器实际读数正常(24-25°C),不支持真实火灾\",\n \"17:30 客厅温度传感器恢复正常值 2475(24.75°C),温度不可能在2分钟内从353°C降至24°C\",\n \"厨房温度传感器在 18:54 和 19:35 两次报告 MeasuredValue=None,存在设备通信故障\",\n \"烟雾报警器触发时灶具处于关闭状态,日志中未见 SmokeState 恢复为 0 的记录\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器硬件状态,清洁探头或更换设备,排除传感器故障或电磁干扰\",\n \"检查厨房烟雾报警器当前状态,确认是否仍处于告警中;清洁传感器腔体,排除灰尘或油烟残留导致的误报\",\n \"检查厨房温度传感器的网络连接和供电状态,排查两次报告None值的通信故障原因\",\n \"审查智能家居系统中是否存在基于温度传感器异常值联动触发烟雾报警的自动化规则,避免传感器故障引发级联误报\",\n \"考虑为关键安全传感器(烟雾报警器、温度传感器)设置数据合理性校验,当单次读数偏离历史均值超过阈值时标记为可疑数据而非直接触发告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在17:18-17:23出现两次异常高温读数(353.4°C、320.0°C),厨房烟雾报警器随后触发,但实际温度数据并不支持真实火灾,高度疑似传感器故障导致虚假告警;同时厨房温度传感器多次报告None值,存在设备通信异常。", "reasoning": ["推理步骤1: 17:18客厅温度传感器报告MeasuredValue=3534(即353.4°C),17:23报告3200(320.0°C)。这两个值远超正常室温范围,且上报格式缺少完整的Cluster前缀(TemperatureMeasurement.),属于异常数据点。", "推理步骤2: 仅5分钟后(17:28),厨房烟雾报警器触发SmokeState=1。但查看同时段厨房温度传感器读数(17:30为2472即24.72°C),以及客厅温度传感器在17:30恢复正常(2475即24.75°C),说明实际环境温度并未出现剧烈升高。", "推理步骤3: 如果真的发生火灾,温度不可能在几分钟内从353°C骤降回24°C,且周围其他传感器(卧室、厨房)在同一时段温度完全正常。因此353°C和320°C的读数极大概率是传感器故障或数据传输错误。", "推理步骤4: 厨房烟雾报警器在17:28触发SmokeState=1,但此时灶具尚未开启(灶具在18:53才开启),且厨房温度正常。烟雾报警可能是受传感器异常数据联动触发,或自身存在误报。日志中未见SmokeState恢复为0的记录,需要确认报警器是否仍处于告警状态。", "推理步骤5: 厨房温度传感器在18:54和19:35两次报告MeasuredValue=None,说明该传感器存在通信中断或数据丢失问题。值得注意的是18:00时厨房温度为2870(28.7°C),相比17:30的2472突然升高约4°C,但这可能与傍晚时段或灶具预热前的环境变化有关,18:30仍为2862,之后在灶具开启使用后反而恢复正常(19:00为2443),整体走势不符合持续性热源特征。", "推理步骤6: 住户行为模式完全正常——06:34起床、07:25出门并自动锁门、18:11回家开灯开空调、18:53做饭、19:34关灶开窗通风、22:05关灯就寝、22:44熄灯入睡。入户门锁操作均为正常手动开锁/自动上锁,无异常入侵迹象。", "推理步骤7: 18:11回家时入户门开门后约16秒未关门(18:11:02开门,直到22:05:29才记录门关闭),但结合住户在家活动的场景,这属于正常行为,不构成安全威胁。"], "key_evidence": ["17:18 客厅温度传感器报告 MeasuredValue=3534(353.4°C),17:23 报告 3200(320.0°C),格式异常且数值不合理", "17:28 厨房烟雾报警器 SmokeState=1 触发,但同时段所有温度传感器实际读数正常(24-25°C),不支持真实火灾", "17:30 客厅温度传感器恢复正常值 2475(24.75°C),温度不可能在2分钟内从353°C降至24°C", "厨房温度传感器在 18:54 和 19:35 两次报告 MeasuredValue=None,存在设备通信故障", "烟雾报警器触发时灶具处于关闭状态,日志中未见 SmokeState 恢复为 0 的记录"], "recommended_actions": ["立即检查客厅温度传感器硬件状态,清洁探头或更换设备,排除传感器故障或电磁干扰", "检查厨房烟雾报警器当前状态,确认是否仍处于告警中;清洁传感器腔体,排除灰尘或油烟残留导致的误报", "检查厨房温度传感器的网络连接和供电状态,排查两次报告None值的通信故障原因", "审查智能家居系统中是否存在基于温度传感器异常值联动触发烟雾报警的自动化规则,避免传感器故障引发级联误报", "考虑为关键安全传感器(烟雾报警器、温度传感器)设置数据合理性校验,当单次读数偏离历史均值超过阈值时标记为可疑数据而非直接触发告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.446555376052856, "api_error": null} {"episode_id": "SQ3_TP_A_0535", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0535.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261164, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-12T01:38:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在做饭期间出现异常读数跳变和两次 None 值,表明传感器可能故障或受高温影响失灵,同时凌晨 CO 报警事件未得到任何后续处置。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时窗口(约17:30–23:30)。住户18:22回家,开灯、开空调,19:03开始做饭,19:46关灶,22:05进卧室准备睡觉,22:37关灯入睡——整体生活节奏正常。\",\n \"推理步骤2: 厨房温度传感器在19:00突然从约2464跳至2826(+3.6°C瞬间跃升),这在灶具尚未开启(19:03才开)的时间点出现,属于异常跳变。正常烹饪升温应在灶具开启后逐渐上升,而非提前突变。\",\n \"推理步骤3: 19:04和19:47厨房温度传感器两次报告 MeasuredValue = None,说明传感器在烹饪期间完全丢失读数。Matter协议下温度传感器返回 None 通常意味着测量失败或传感器通信异常。\",\n \"推理步骤4: 19:30厨房温度读数为2844(约28.4°C),虽然做饭时厨房升温合理,但结合19:00的异常跳变和两次None值,传感器的可靠性存疑——无法确定这些高温读数是真实环境温度还是传感器故障产生的错误数据。\",\n \"推理步骤5: 回顾全天日志,凌晨01:38厨房烟雾报警器触发了CO报警(COState=1, ExpressedState=2, COAlarm事件),但此后没有任何人员活动响应(住户当时在睡觉),也没有日志显示报警被确认或消除。虽然此事件在6小时窗口之外,但它与厨房设备健康状况直接相关。\",\n \"推理步骤6: CO报警后厨房温度并未出现异常升高(反而略有下降),排除了持续燃气泄漏或明火的可能性,但CO报警本身仍需要排查来源。\",\n \"推理步骤7: 住户18:22进门后未关闭入户门(front_door_contact 未恢复 True),直到22:05才关门上锁。虽然这可能是住户习惯(在家时不锁门),但独居一室一厅长时间不关门存在一定安全隐患,属于低风险提醒项。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.6°C 瞬间跳至 28.26°C,此时灶具尚未开启(19:03才开)\",\n \"19:04 和 19:47 厨房温度传感器两次返回 None(测量失败)\",\n \"01:38 厨房烟雾报警器触发 CO 报警(COState=1),全天未见确认/消除操作\",\n \"入户门从 18:22 开门到 22:05 才关闭上锁,持续敞开近 4 小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否过于靠近灶具或排烟口,必要时更换传感器\",\n \"排查凌晨 CO 报警原因:检查燃气管路、灶具阀门是否存在微漏,确认热水器等燃气设备排烟是否通畅\",\n \"手动确认并复位烟雾/CO 报警器状态,确保报警器功能正常、未处于持续报警锁定状态\",\n \"建议设置自动化规则:入户门开启超过一定时间(如30分钟)且无人在玄关活动时,推送提醒关门\",\n \"建议设置自动化规则:CO 报警触发时自动推送紧急通知到手机,避免睡眠中错过关键报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在做饭期间出现异常读数跳变和两次 None 值,表明传感器可能故障或受高温影响失灵,同时凌晨 CO 报警事件未得到任何后续处置。", "reasoning": ["推理步骤1: 分析过去6小时窗口(约17:30–23:30)。住户18:22回家,开灯、开空调,19:03开始做饭,19:46关灶,22:05进卧室准备睡觉,22:37关灯入睡——整体生活节奏正常。", "推理步骤2: 厨房温度传感器在19:00突然从约2464跳至2826(+3.6°C瞬间跃升),这在灶具尚未开启(19:03才开)的时间点出现,属于异常跳变。正常烹饪升温应在灶具开启后逐渐上升,而非提前突变。", "推理步骤3: 19:04和19:47厨房温度传感器两次报告 MeasuredValue = None,说明传感器在烹饪期间完全丢失读数。Matter协议下温度传感器返回 None 通常意味着测量失败或传感器通信异常。", "推理步骤4: 19:30厨房温度读数为2844(约28.4°C),虽然做饭时厨房升温合理,但结合19:00的异常跳变和两次None值,传感器的可靠性存疑——无法确定这些高温读数是真实环境温度还是传感器故障产生的错误数据。", "推理步骤5: 回顾全天日志,凌晨01:38厨房烟雾报警器触发了CO报警(COState=1, ExpressedState=2, COAlarm事件),但此后没有任何人员活动响应(住户当时在睡觉),也没有日志显示报警被确认或消除。虽然此事件在6小时窗口之外,但它与厨房设备健康状况直接相关。", "推理步骤6: CO报警后厨房温度并未出现异常升高(反而略有下降),排除了持续燃气泄漏或明火的可能性,但CO报警本身仍需要排查来源。", "推理步骤7: 住户18:22进门后未关闭入户门(front_door_contact 未恢复 True),直到22:05才关门上锁。虽然这可能是住户习惯(在家时不锁门),但独居一室一厅长时间不关门存在一定安全隐患,属于低风险提醒项。"], "key_evidence": ["19:00 厨房温度从 ~24.6°C 瞬间跳至 28.26°C,此时灶具尚未开启(19:03才开)", "19:04 和 19:47 厨房温度传感器两次返回 None(测量失败)", "01:38 厨房烟雾报警器触发 CO 报警(COState=1),全天未见确认/消除操作", "入户门从 18:22 开门到 22:05 才关闭上锁,持续敞开近 4 小时"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否过于靠近灶具或排烟口,必要时更换传感器", "排查凌晨 CO 报警原因:检查燃气管路、灶具阀门是否存在微漏,确认热水器等燃气设备排烟是否通畅", "手动确认并复位烟雾/CO 报警器状态,确保报警器功能正常、未处于持续报警锁定状态", "建议设置自动化规则:入户门开启超过一定时间(如30分钟)且无人在玄关活动时,推送提醒关门", "建议设置自动化规则:CO 报警触发时自动推送紧急通知到手机,避免睡眠中错过关键报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.355008363723755, "api_error": null} {"episode_id": "SQ3_TP_A_0548", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0548.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261177, "scenario_id": "WD-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-19T15:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在住户外出期间持续报警超过30分钟,存在真实漏水风险,需立即处理。\",\n \"reasoning\": [\n \"推理步骤1: 住户于07:31离家(关灯、锁门、门关闭),18:24回家(开锁、开门、开灯开空调),期间家中无人。\",\n \"推理步骤2: 15:26首次触发卫生间漏水报警(StateValue=True),随后15:36和15:56再次报警,说明漏水状态持续至少30分钟未消除。\",\n \"推理步骤3: 漏水发生时无人在家、卫生间无运动检测、无任何用水设备操作记录,排除人为用水导致误报的可能。\",\n \"推理步骤4: 厨房温度传感器在19:00出现异常高值2839(约28.4°C),19:03报告None,但结合灶具19:02开启、19:38关闭、随后开窗通风的行为链,属于正常烹饪活动,非独立威胁。\",\n \"推理步骤5: 入户门锁操作均为Manual/Auto正常模式,进出时间合理,无入侵迹象。整体温度曲线符合夏季昼夜变化规律。\"\n ],\n \"key_evidence\": [\n \"15:26/15:36/15:56 卫生间漏水传感器连续三次报告 StateValue=True,持续超过30分钟\",\n \"漏水期间住户不在家(07:31出门,18:24回家),卫生间无人活动,排除正常用水\",\n \"住户18:24回家后未见任何针对漏水的处理动作(未进入卫生间检查)\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送漏水警报通知,提示检查卫生间水管、马桶、热水器等可能漏水点\",\n \"如系统支持,远程关闭卫生间总水阀以防止损失扩大\",\n \"住户回家后应优先检查卫生间地面积水情况,确认漏水源并修复\",\n \"检查厨房温度传感器健康状态——19:03和19:39两次报告None值,可能存在传感器过热保护或故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在住户外出期间持续报警超过30分钟,存在真实漏水风险,需立即处理。", "reasoning": ["推理步骤1: 住户于07:31离家(关灯、锁门、门关闭),18:24回家(开锁、开门、开灯开空调),期间家中无人。", "推理步骤2: 15:26首次触发卫生间漏水报警(StateValue=True),随后15:36和15:56再次报警,说明漏水状态持续至少30分钟未消除。", "推理步骤3: 漏水发生时无人在家、卫生间无运动检测、无任何用水设备操作记录,排除人为用水导致误报的可能。", "推理步骤4: 厨房温度传感器在19:00出现异常高值2839(约28.4°C),19:03报告None,但结合灶具19:02开启、19:38关闭、随后开窗通风的行为链,属于正常烹饪活动,非独立威胁。", "推理步骤5: 入户门锁操作均为Manual/Auto正常模式,进出时间合理,无入侵迹象。整体温度曲线符合夏季昼夜变化规律。"], "key_evidence": ["15:26/15:36/15:56 卫生间漏水传感器连续三次报告 StateValue=True,持续超过30分钟", "漏水期间住户不在家(07:31出门,18:24回家),卫生间无人活动,排除正常用水", "住户18:24回家后未见任何针对漏水的处理动作(未进入卫生间检查)"], "recommended_actions": ["立即向住户发送漏水警报通知,提示检查卫生间水管、马桶、热水器等可能漏水点", "如系统支持,远程关闭卫生间总水阀以防止损失扩大", "住户回家后应优先检查卫生间地面积水情况,确认漏水源并修复", "检查厨房温度传感器健康状态——19:03和19:39两次报告None值,可能存在传感器过热保护或故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.719865560531616, "api_error": null} {"episode_id": "SQ3_TP_A_0541", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0541.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261170, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-15T13:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在13:13-13:18出现异常高温尖峰读数,厨房烟雾报警器随后触发但无后续火灾证据,同时厨房温度传感器在19:06和19:32两次报告None值,存在多个传感器故障迹象。\",\n \"reasoning\": [\n \"推理步骤1: 13:13客厅温度传感器突然从2556(25.56°C)飙升至3693(36.93°C),5分钟后为3200(32.00°C),但13:30恢复至2556(25.56°C)。这种瞬间升高约11°C再迅速恢复的模式不符合真实环境温度变化规律(房间热惯性大,不可能在7分钟内升降11°C),更像是传感器故障或数据异常。\",\n \"推理步骤2: 13:23厨房烟雾报警器SmokeState=1(报警),但同时段厨房温度传感器读数稳定在2556-2567范围,无温度异常上升;住户07:17已出门且18:25才回家,家中无人操作灶具,不存在烹饪产烟的条件。此外报警后无任何后续事件(无人响应、无持续报警、无温度持续升高),说明这很可能是烟雾报警器误报。\",\n \"推理步骤3: 19:00厨房温度传感器读数为2832(28.32°C),相比其他房间同时段读数偏高约4°C,但住户19:05开灶做饭,烹饪导致厨房升温是合理的。然而19:06和19:32传感器两次报告MeasuredValue=None,说明传感器在高温工作环境下出现了读数丢失/通信故障。20:00恢复正常读数2409。\",\n \"推理步骤4: 综合来看,客厅温度传感器的尖峰异常、厨房烟雾报警器的无因触发、厨房温度传感器的None值,三个传感器在同一天出现异常行为。虽然不构成入侵或火灾等即时安全威胁,但传感器可靠性下降会削弱整个安全监控体系的有效性。\",\n \"推理步骤5: 排除火灾风险——如果13:13-13:23是真实火情,温度应持续上升而非迅速恢复,且应有多个传感器交叉印证;排除入侵风险——住户出入门锁操作正常(手动开锁、自动上锁),活动时间线合理(早起、出门上班、傍晚回家、晚间就寝)。\"\n ],\n \"key_evidence\": [\n \"13:13 客厅温度传感器从25.56°C瞬间跳至36.93°C,13:18降至32.00°C,13:30恢复25.56°C——不符合物理规律的尖峰\",\n \"13:23 厨房烟雾报警器SmokeState=1触发,但家中无人(住户07:17出门),厨房温度正常,无任何烹饪或火源活动\",\n \"19:06和19:32 厨房温度传感器两次报告MeasuredValue=None,传感器读数丢失\",\n \"13:13和13:18的温度上报缺少完整的Cluster前缀(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能暗示通信协议层面的异常\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器硬件状态,清洁探头并确认固件版本,必要时更换设备\",\n \"检查厨房烟雾报警器,清理灰尘积累,测试传感器灵敏度,排除误报原因\",\n \"检查厨房温度传感器的供电和通信连接,排查None值产生的原因(可能是高温环境下的通信超时或传感器过载)\",\n \"检查Matter网络的通信质量,13:13-13:18的不完整属性路径上报可能指示网关或协议栈存在间歇性问题\",\n \"在传感器问题修复前,考虑增加交叉验证逻辑:单一传感器异常时参考相邻房间传感器数据再决定是否报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在13:13-13:18出现异常高温尖峰读数,厨房烟雾报警器随后触发但无后续火灾证据,同时厨房温度传感器在19:06和19:32两次报告None值,存在多个传感器故障迹象。", "reasoning": ["推理步骤1: 13:13客厅温度传感器突然从2556(25.56°C)飙升至3693(36.93°C),5分钟后为3200(32.00°C),但13:30恢复至2556(25.56°C)。这种瞬间升高约11°C再迅速恢复的模式不符合真实环境温度变化规律(房间热惯性大,不可能在7分钟内升降11°C),更像是传感器故障或数据异常。", "推理步骤2: 13:23厨房烟雾报警器SmokeState=1(报警),但同时段厨房温度传感器读数稳定在2556-2567范围,无温度异常上升;住户07:17已出门且18:25才回家,家中无人操作灶具,不存在烹饪产烟的条件。此外报警后无任何后续事件(无人响应、无持续报警、无温度持续升高),说明这很可能是烟雾报警器误报。", "推理步骤3: 19:00厨房温度传感器读数为2832(28.32°C),相比其他房间同时段读数偏高约4°C,但住户19:05开灶做饭,烹饪导致厨房升温是合理的。然而19:06和19:32传感器两次报告MeasuredValue=None,说明传感器在高温工作环境下出现了读数丢失/通信故障。20:00恢复正常读数2409。", "推理步骤4: 综合来看,客厅温度传感器的尖峰异常、厨房烟雾报警器的无因触发、厨房温度传感器的None值,三个传感器在同一天出现异常行为。虽然不构成入侵或火灾等即时安全威胁,但传感器可靠性下降会削弱整个安全监控体系的有效性。", "推理步骤5: 排除火灾风险——如果13:13-13:23是真实火情,温度应持续上升而非迅速恢复,且应有多个传感器交叉印证;排除入侵风险——住户出入门锁操作正常(手动开锁、自动上锁),活动时间线合理(早起、出门上班、傍晚回家、晚间就寝)。"], "key_evidence": ["13:13 客厅温度传感器从25.56°C瞬间跳至36.93°C,13:18降至32.00°C,13:30恢复25.56°C——不符合物理规律的尖峰", "13:23 厨房烟雾报警器SmokeState=1触发,但家中无人(住户07:17出门),厨房温度正常,无任何烹饪或火源活动", "19:06和19:32 厨房温度传感器两次报告MeasuredValue=None,传感器读数丢失", "13:13和13:18的温度上报缺少完整的Cluster前缀(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能暗示通信协议层面的异常"], "recommended_actions": ["检查客厅温度传感器硬件状态,清洁探头并确认固件版本,必要时更换设备", "检查厨房烟雾报警器,清理灰尘积累,测试传感器灵敏度,排除误报原因", "检查厨房温度传感器的供电和通信连接,排查None值产生的原因(可能是高温环境下的通信超时或传感器过载)", "检查Matter网络的通信质量,13:13-13:18的不完整属性路径上报可能指示网关或协议栈存在间歇性问题", "在传感器问题修复前,考虑增加交叉验证逻辑:单一传感器异常时参考相邻房间传感器数据再决定是否报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.609673023223877, "api_error": null} {"episode_id": "SQ3_TP_A_0555", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0555.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261184, "scenario_id": "BA-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-02T08:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),可能存在传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2485(24.85°C)跳升至 2852(28.52°C),而同一时刻客厅和卧室温度正常下降,说明这不是全屋升温,而是厨房局部异常。\",\n \"推理步骤2: 18:30 厨房温度继续维持在 2858(28.58°C),但灶具直到 18:50 才开启,排除了烹饪导致的升温。此时无任何设备活动能解释这一突增。\",\n \"推理步骤3: 18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None,表示传感器读数丢失或通信异常。两次 None 出现在灶具开启和关闭前后,可能是高温环境导致传感器暂时失灵。\",\n \"推理步骤4: 19:00 之后厨房温度恢复正常(2433),与客厅/卧室趋势一致,说明异常是暂时性的。\",\n \"推理步骤5: 凌晨 02:30 的客厅活动(运动检测、开灯、开厨房灯)属于住户夜间起身的正常行为,未触发门锁或门窗传感器,不构成入侵威胁。\",\n \"推理步骤6: 其余所有事件(早起、出门上锁、傍晚回家开空调、做饭、洗碗机、睡前关灯锁门)均符合单人住户的正常生活规律,无安全威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.85°C 骤升至 28.52°C,而灶具 18:50 才开启,无法解释此升温\",\n \"18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None(数据丢失)\",\n \"同时段客厅和卧室温度正常下降,排除全屋性环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受到阳光直射、热源辐射或其他干扰\",\n \"查看传感器固件版本,考虑重启或更换传感器以排除硬件故障\",\n \"如果异常重复出现,建议增加一个冗余温度传感器进行交叉验证\",\n \"关注厨房烟雾报警器在此时段是否有未上报的事件,排除潜在火灾隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),可能存在传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2485(24.85°C)跳升至 2852(28.52°C),而同一时刻客厅和卧室温度正常下降,说明这不是全屋升温,而是厨房局部异常。", "推理步骤2: 18:30 厨房温度继续维持在 2858(28.58°C),但灶具直到 18:50 才开启,排除了烹饪导致的升温。此时无任何设备活动能解释这一突增。", "推理步骤3: 18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None,表示传感器读数丢失或通信异常。两次 None 出现在灶具开启和关闭前后,可能是高温环境导致传感器暂时失灵。", "推理步骤4: 19:00 之后厨房温度恢复正常(2433),与客厅/卧室趋势一致,说明异常是暂时性的。", "推理步骤5: 凌晨 02:30 的客厅活动(运动检测、开灯、开厨房灯)属于住户夜间起身的正常行为,未触发门锁或门窗传感器,不构成入侵威胁。", "推理步骤6: 其余所有事件(早起、出门上锁、傍晚回家开空调、做饭、洗碗机、睡前关灯锁门)均符合单人住户的正常生活规律,无安全威胁。"], "key_evidence": ["18:00 厨房温度从 ~24.85°C 骤升至 28.52°C,而灶具 18:50 才开启,无法解释此升温", "18:51 和 19:26 厨房温度传感器报告 MeasuredValue = None(数据丢失)", "同时段客厅和卧室温度正常下降,排除全屋性环境因素"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受到阳光直射、热源辐射或其他干扰", "查看传感器固件版本,考虑重启或更换传感器以排除硬件故障", "如果异常重复出现,建议增加一个冗余温度传感器进行交叉验证", "关注厨房烟雾报警器在此时段是否有未上报的事件,排除潜在火灾隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.841848373413086, "api_error": null} {"episode_id": "SQ3_TP_A_0551", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0551.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261180, "scenario_id": "WD-01", "total_events": 186, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-06T15:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak/device_fault\",\n \"threat_description\": \"卫生间漏水传感器在无人使用时触发且持续未消除,同时厨房温度传感器存在异常读数和多次离线,需要立即关注。\",\n \"reasoning\": [\n \"推理步骤1: 15:45 卫生间漏水传感器报告 StateValue=True,表明检测到漏水。回溯日志发现住户最后一次使用卫生间是 08:53-09:08,之后卫生间再无任何人员活动记录,说明漏水发生在无人使用卫生间的情况下。\",\n \"推理步骤2: 从 15:45 漏水报警触发后,直到日志结束(23:30)未见任何漏水消除事件(StateValue=False),说明漏水状态持续了近 8 小时未被处理。这可能导致水损扩大。\",\n \"推理步骤3: 厨房温度传感器在 11:00 和 11:30 出现异常高温读数——2957 和 2953(约 29.5°C),而同时段客厅约 25.5°C、卧室约 24.5°C。此时灶具并未开启(09:38 已关闭,11:57 才再次开启),厨房不应出现比其他房间高出约 4°C 的温度跳变。这可能是传感器故障或存在未记录的热源。\",\n \"推理步骤4: 厨房温度传感器多次报告 MeasuredValue=None(09:09、09:39、11:58、12:53、17:46、18:30),虽然部分与灶具使用时间重合(可能是高温导致传感器量程溢出或设计性屏蔽),但频率较高,结合 11:00 的异常高温读数,提示该传感器可能存在硬件故障或连接不稳定。\",\n \"推理步骤5: 其他行为模式均属正常——住户约 08:16 起床、09:08 进厨房做早餐、11:57 做午餐、17:45 做晚餐、23:13 关灯锁门就寝,符合独居一室一厅的日常作息。入户门锁在 23:13 自动上锁、门传感器显示关闭(StateValue=True 表示门关闭),无入侵迹象。空调在 09:57 开启制冷模式(SystemMode=3)、23:13 关闭,与夏季白天使用习惯一致。\"\n ],\n \"key_evidence\": [\n \"[15:45] bathroom_water_leak StateValue=True 且直到日志结束未恢复为 False,漏水持续近 8 小时\",\n \"漏水发生时卫生间无人(最后一次使用在 09:08 结束),排除正常用水导致的误报\",\n \"[11:00] 和 [11:30] 厨房温度传感器读数突增至约 29.5°C,而灶具处于关闭状态(09:38 关 → 11:57 开),与客厅/卧室温度趋势不一致\",\n \"厨房温度传感器在一天内 6 次报告 None 值,显示设备工作状态不稳定\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否存在实际漏水情况(管道、马桶、水龙头等),如确认漏水应关闭卫生间水阀止损\",\n \"检查卫生间地面及相邻区域是否已有积水或渗水痕迹,评估水损范围\",\n \"检查厨房温度传感器是否安装位置不当(如靠近热源)或存在硬件故障,必要时更换传感器\",\n \"建议为漏水传感器配置自动化规则:触发后自动发送紧急通知并联动关闭水阀(如有智能水阀)\",\n \"建议为温度传感器配置健康监测:连续报告 None 值超过阈值时自动告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak/device_fault", "threat_description": "卫生间漏水传感器在无人使用时触发且持续未消除,同时厨房温度传感器存在异常读数和多次离线,需要立即关注。", "reasoning": ["推理步骤1: 15:45 卫生间漏水传感器报告 StateValue=True,表明检测到漏水。回溯日志发现住户最后一次使用卫生间是 08:53-09:08,之后卫生间再无任何人员活动记录,说明漏水发生在无人使用卫生间的情况下。", "推理步骤2: 从 15:45 漏水报警触发后,直到日志结束(23:30)未见任何漏水消除事件(StateValue=False),说明漏水状态持续了近 8 小时未被处理。这可能导致水损扩大。", "推理步骤3: 厨房温度传感器在 11:00 和 11:30 出现异常高温读数——2957 和 2953(约 29.5°C),而同时段客厅约 25.5°C、卧室约 24.5°C。此时灶具并未开启(09:38 已关闭,11:57 才再次开启),厨房不应出现比其他房间高出约 4°C 的温度跳变。这可能是传感器故障或存在未记录的热源。", "推理步骤4: 厨房温度传感器多次报告 MeasuredValue=None(09:09、09:39、11:58、12:53、17:46、18:30),虽然部分与灶具使用时间重合(可能是高温导致传感器量程溢出或设计性屏蔽),但频率较高,结合 11:00 的异常高温读数,提示该传感器可能存在硬件故障或连接不稳定。", "推理步骤5: 其他行为模式均属正常——住户约 08:16 起床、09:08 进厨房做早餐、11:57 做午餐、17:45 做晚餐、23:13 关灯锁门就寝,符合独居一室一厅的日常作息。入户门锁在 23:13 自动上锁、门传感器显示关闭(StateValue=True 表示门关闭),无入侵迹象。空调在 09:57 开启制冷模式(SystemMode=3)、23:13 关闭,与夏季白天使用习惯一致。"], "key_evidence": ["[15:45] bathroom_water_leak StateValue=True 且直到日志结束未恢复为 False,漏水持续近 8 小时", "漏水发生时卫生间无人(最后一次使用在 09:08 结束),排除正常用水导致的误报", "[11:00] 和 [11:30] 厨房温度传感器读数突增至约 29.5°C,而灶具处于关闭状态(09:38 关 → 11:57 开),与客厅/卧室温度趋势不一致", "厨房温度传感器在一天内 6 次报告 None 值,显示设备工作状态不稳定"], "recommended_actions": ["立即检查卫生间是否存在实际漏水情况(管道、马桶、水龙头等),如确认漏水应关闭卫生间水阀止损", "检查卫生间地面及相邻区域是否已有积水或渗水痕迹,评估水损范围", "检查厨房温度传感器是否安装位置不当(如靠近热源)或存在硬件故障,必要时更换传感器", "建议为漏水传感器配置自动化规则:触发后自动发送紧急通知并联动关闭水阀(如有智能水阀)", "建议为温度传感器配置健康监测:连续报告 None 值超过阈值时自动告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.883822441101074, "api_error": null} {"episode_id": "SQ3_TP_A_0557", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_A_0557.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261186, "scenario_id": "INS-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-04T02:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨2:19发生连续4次门锁操作失败并触发防撬报警,高度疑似非法入侵尝试。\",\n \"reasoning\": [\n \"推理步骤1: 在02:19:00至02:19:40的短短40秒内,front_door_lock连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示远程/外部操作来源,OperationError=1表示凭证无效(如错误的PIN码或密钥)。\",\n \"推理步骤2: 紧接着在02:19:50,门锁触发了DoorLockAlarm(AlarmCode=3)。在Matter DoorLock Cluster中,AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码尝试次数超限触发的安全警报。\",\n \"推理步骤3: 事件发生在凌晨2:19,属于深夜时段。此时卧室传感器显示住户在室内(bedroom_occupancy在06:28才变为0,说明住户一直在卧室睡觉),排除了住户自己忘记密码在门外尝试开锁的可能性。\",\n \"推理步骤4: 入侵尝试未成功——日志中没有出现front_door_contact的StateValue=False(门未被打开),也没有后续的LockOperation成功事件,说明入侵者未能进入。\",\n \"推理步骤5: 其余日志中的行为模式完全正常:住户约06:27起床去卫生间,06:42回卧室开灯开窗帘,07:18出门上班(手动开锁、开关门、自动上锁),18:00回家(开锁、开灯、开空调),19:15做饭,21:49回卧室睡觉。温度曲线也符合夏季昼夜变化规律。\",\n \"推理步骤6: 厨房温度传感器在19:00和19:30报告了约28.3°C的读数,以及19:16和19:44两次报告None值,属于做饭期间的正常波动和传感器短暂异常,不构成独立威胁,但传感器故障值得关注。\"\n ],\n \"key_evidence\": [\n \"02:19:00-02:19:40 连续4次LockOperationError(OperationError=1, OperationSource=3),40秒内密集尝试\",\n \"02:19:50 触发DoorLockAlarm(AlarmCode=3),错误密码超限报警\",\n \"事件发生在凌晨2点,住户在卧室睡觉中,排除自身操作\",\n \"门未被打开(无front_door_contact状态变化),入侵未成功\"\n ],\n \"recommended_actions\": [\n \"立即检查门锁及入户门周围是否有物理破坏痕迹,查看门外监控录像(如有)确认可疑人员\",\n \"检查门锁的访问日志,确认OperationSource=3的具体来源(远程指令/蓝牙/键盘),排查是否有凭证泄露\",\n \"考虑更换门锁密码或重置远程访问凭证,并启用更严格的锁定策略(如减少允许的错误尝试次数)\",\n \"在入户门区域增设摄像头或运动传感器,提升入口监控能力\",\n \"向物业或社区安保报告此次事件,提醒邻居注意安全\",\n \"(次要)排查厨房温度传感器两次报告None值的原因,可能存在传感器故障或连接不稳定\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨2:19发生连续4次门锁操作失败并触发防撬报警,高度疑似非法入侵尝试。", "reasoning": ["推理步骤1: 在02:19:00至02:19:40的短短40秒内,front_door_lock连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示远程/外部操作来源,OperationError=1表示凭证无效(如错误的PIN码或密钥)。", "推理步骤2: 紧接着在02:19:50,门锁触发了DoorLockAlarm(AlarmCode=3)。在Matter DoorLock Cluster中,AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码尝试次数超限触发的安全警报。", "推理步骤3: 事件发生在凌晨2:19,属于深夜时段。此时卧室传感器显示住户在室内(bedroom_occupancy在06:28才变为0,说明住户一直在卧室睡觉),排除了住户自己忘记密码在门外尝试开锁的可能性。", "推理步骤4: 入侵尝试未成功——日志中没有出现front_door_contact的StateValue=False(门未被打开),也没有后续的LockOperation成功事件,说明入侵者未能进入。", "推理步骤5: 其余日志中的行为模式完全正常:住户约06:27起床去卫生间,06:42回卧室开灯开窗帘,07:18出门上班(手动开锁、开关门、自动上锁),18:00回家(开锁、开灯、开空调),19:15做饭,21:49回卧室睡觉。温度曲线也符合夏季昼夜变化规律。", "推理步骤6: 厨房温度传感器在19:00和19:30报告了约28.3°C的读数,以及19:16和19:44两次报告None值,属于做饭期间的正常波动和传感器短暂异常,不构成独立威胁,但传感器故障值得关注。"], "key_evidence": ["02:19:00-02:19:40 连续4次LockOperationError(OperationError=1, OperationSource=3),40秒内密集尝试", "02:19:50 触发DoorLockAlarm(AlarmCode=3),错误密码超限报警", "事件发生在凌晨2点,住户在卧室睡觉中,排除自身操作", "门未被打开(无front_door_contact状态变化),入侵未成功"], "recommended_actions": ["立即检查门锁及入户门周围是否有物理破坏痕迹,查看门外监控录像(如有)确认可疑人员", "检查门锁的访问日志,确认OperationSource=3的具体来源(远程指令/蓝牙/键盘),排查是否有凭证泄露", "考虑更换门锁密码或重置远程访问凭证,并启用更严格的锁定策略(如减少允许的错误尝试次数)", "在入户门区域增设摄像头或运动传感器,提升入口监控能力", "向物业或社区安保报告此次事件,提醒邻居注意安全", "(次要)排查厨房温度传感器两次报告None值的原因,可能存在传感器故障或连接不稳定"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.119349479675293, "api_error": null} {"episode_id": "SQ3_TP_B_0434", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0434.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261063, "scenario_id": "BA-04", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-12T11:37:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:06 入户门开锁进入后未关门/未上锁,持续超过 2 小时。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57、07:08、18:24、19:14 四次上报 MeasuredValue = None。虽然其中两次与灶具使用时间接近,但 Matter 协议下温度传感器不应因灶具开关而丢失读数,正常情况应上报具体温度值,None 表示测量失败。\",\n \"推理步骤2: 分析 None 出现的规律——每次都在灶具开启或关闭后约 30 秒至 1 分钟出现,可能是灶具产生的电磁干扰或热冲击导致传感器暂时失效,但下一个整点读数又恢复正常,说明传感器硬件可能存在间歇性故障。\",\n \"推理步骤3: 16:06 入户门通过手动方式解锁(LockOperationType=1),门被打开(contact=False),玄关检测到有人。但此后直到 18:11 下一次开门事件之前,日志中没有关门(StateValue=True)和上锁记录。这意味着入户门在无人看管状态下敞开了约 2 小时,存在安全隐患。\",\n \"推理步骤4: 对比 07:31 的出门流程——解锁→开门→关门→自动上锁,整个过程在 7 秒内完成,非常规范。而 16:06 只有解锁和开门,缺少关门和上锁步骤,行为模式明显异常。\",\n \"推理步骤5: 11:37 阳台门传感器打开(StateValue=False),之后无关闭记录,但结合主卧检测到有人、客厅无人的状态,推测住户可能在阳台活动(如晾衣服),属于日常行为,但阳台门长时间未关也值得留意。\",\n \"推理步骤6: 其余行为模式均正常——凌晨全屋安静无活动,06:33 起床开灯,06:56 做早餐,07:31 出门上锁,18:11 回家开灯开空调做晚饭,22:18 关灯关空调睡觉,符合单人居住的日常作息。温度曲线呈现正常的日间升温、夜间降温趋势,各房间温差在合理范围内。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:57、07:08、18:24、19:14 四次上报 MeasuredValue = None,均与灶具操作时间高度关联,指向传感器间歇性故障\",\n \"16:06 front_door_lock 解锁并开门后,直到 18:11 才有下一次门锁事件,期间无 front_door_contact StateValue=True(关门)记录,入户门疑似敞开约 2 小时\",\n \"对比 07:31 正常出门流程(解锁→开门→3秒关门→自动上锁),16:06 的开门流程缺少关门和上锁环节\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰;如问题持续,建议更换传感器\",\n \"设置入户门未关闭超时告警(建议阈值 5 分钟),当门处于打开状态超过阈值时推送通知\",\n \"排查 16:06 开门未关门的原因——可能是门磁传感器漏报,也可能确实未关门;建议检查 front_door_contact 传感器电量和安装状态\",\n \"考虑为阳台门传感器也设置未关闭提醒,避免长时间敞开带来的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:06 入户门开锁进入后未关门/未上锁,持续超过 2 小时。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:57、07:08、18:24、19:14 四次上报 MeasuredValue = None。虽然其中两次与灶具使用时间接近,但 Matter 协议下温度传感器不应因灶具开关而丢失读数,正常情况应上报具体温度值,None 表示测量失败。", "推理步骤2: 分析 None 出现的规律——每次都在灶具开启或关闭后约 30 秒至 1 分钟出现,可能是灶具产生的电磁干扰或热冲击导致传感器暂时失效,但下一个整点读数又恢复正常,说明传感器硬件可能存在间歇性故障。", "推理步骤3: 16:06 入户门通过手动方式解锁(LockOperationType=1),门被打开(contact=False),玄关检测到有人。但此后直到 18:11 下一次开门事件之前,日志中没有关门(StateValue=True)和上锁记录。这意味着入户门在无人看管状态下敞开了约 2 小时,存在安全隐患。", "推理步骤4: 对比 07:31 的出门流程——解锁→开门→关门→自动上锁,整个过程在 7 秒内完成,非常规范。而 16:06 只有解锁和开门,缺少关门和上锁步骤,行为模式明显异常。", "推理步骤5: 11:37 阳台门传感器打开(StateValue=False),之后无关闭记录,但结合主卧检测到有人、客厅无人的状态,推测住户可能在阳台活动(如晾衣服),属于日常行为,但阳台门长时间未关也值得留意。", "推理步骤6: 其余行为模式均正常——凌晨全屋安静无活动,06:33 起床开灯,06:56 做早餐,07:31 出门上锁,18:11 回家开灯开空调做晚饭,22:18 关灯关空调睡觉,符合单人居住的日常作息。温度曲线呈现正常的日间升温、夜间降温趋势,各房间温差在合理范围内。"], "key_evidence": ["kitchen_temp_sensor 在 06:57、07:08、18:24、19:14 四次上报 MeasuredValue = None,均与灶具操作时间高度关联,指向传感器间歇性故障", "16:06 front_door_lock 解锁并开门后,直到 18:11 才有下一次门锁事件,期间无 front_door_contact StateValue=True(关门)记录,入户门疑似敞开约 2 小时", "对比 07:31 正常出门流程(解锁→开门→3秒关门→自动上锁),16:06 的开门流程缺少关门和上锁环节"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热或电磁干扰;如问题持续,建议更换传感器", "设置入户门未关闭超时告警(建议阈值 5 分钟),当门处于打开状态超过阈值时推送通知", "排查 16:06 开门未关门的原因——可能是门磁传感器漏报,也可能确实未关门;建议检查 front_door_contact 传感器电量和安装状态", "考虑为阳台门传感器也设置未关闭提醒,避免长时间敞开带来的安全风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.368342876434326, "api_error": null} {"episode_id": "SQ3_TP_B_0437", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0437.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261066, "scenario_id": "INS-04", "total_events": 243, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-09T11:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:18 入户门解锁进入后未关门且未重新上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、07:19、18:46、18:58 四次报告 MeasuredValue = None。这些时间点与灶具开启/关闭时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在故障。\",\n \"推理步骤2: 16:18 入户门锁被手动解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),玄关检测到有人进入,但此后日志中没有门关闭(StateValue=True)和重新上锁的记录,直到 22:42 才出现门关闭并自动上锁。这意味着入户门在 16:18 至 22:42 之间约 6.5 小时处于未关闭/未上锁状态。\",\n \"推理步骤3: 对比 07:16 的出门流程——解锁→开门→关门(StateValue=True)→自动上锁(LockState=1),整个过程在 3 秒内完成,非常正常。而 16:18 进门后缺少关门和上锁动作,属于异常模式。\",\n \"推理步骤4: 11:35 主卧窗户传感器打开(StateValue=False),11:38 关闭(StateValue=True),期间主卧有人活动,持续约 3 分钟,属于正常通风行为。\",\n \"推理步骤5: 17:50 的第二次进门事件同样只有解锁和开门记录,没有关门记录,但考虑到住户已在家(16:18 已进入),这可能是另一位住户回家,门的关闭状态延续了 16:18 的未关闭状态。\",\n \"推理步骤6: 全天温度变化趋势合理——凌晨约 23°C,午间升至约 25.8°C,傍晚回落,符合夏季自然温度曲线。各房间温差在 1°C 以内,无异常热源迹象。\",\n \"推理步骤7: 烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。灶具使用时间合理(早餐约 30 分钟、晚餐约 12 分钟),使用后均已关闭。\",\n \"推理步骤8: 厨房窗户在灶具关闭后打开(07:18:30 和 18:57:30),属于做饭后通风的正常行为,但日志中没有关闭记录,需要确认窗户当前状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:46、07:19、18:46、18:58 四次报告 MeasuredValue = None\",\n \"16:18 入户门解锁并打开后,直到 22:42 才有关门和上锁记录,中间约 6.5 小时门处于开启/未锁状态\",\n \"17:50 第二次进门事件同样缺少关门记录\",\n \"厨房窗户两次打开后均无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否正常工作,确认其安装位置是否受灶具热量或电磁干扰影响,必要时更换或重新定位传感器\",\n \"检查入户门的自动上锁机制,确认为何 16:18 进门后门未自动关闭和上锁(07:16 出门时自动上锁正常工作),可能是门锁或门磁传感器需要维护\",\n \"确认厨房窗户当前是否处于打开状态,如果是,建议关闭以保障夜间安全\",\n \"建议设置入户门长时间未关闭/未上锁的自动提醒规则,例如门打开超过 5 分钟未关闭时发送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时 16:18 入户门解锁进入后未关门且未重新上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、07:19、18:46、18:58 四次报告 MeasuredValue = None。这些时间点与灶具开启/关闭时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在故障。", "推理步骤2: 16:18 入户门锁被手动解锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),玄关检测到有人进入,但此后日志中没有门关闭(StateValue=True)和重新上锁的记录,直到 22:42 才出现门关闭并自动上锁。这意味着入户门在 16:18 至 22:42 之间约 6.5 小时处于未关闭/未上锁状态。", "推理步骤3: 对比 07:16 的出门流程——解锁→开门→关门(StateValue=True)→自动上锁(LockState=1),整个过程在 3 秒内完成,非常正常。而 16:18 进门后缺少关门和上锁动作,属于异常模式。", "推理步骤4: 11:35 主卧窗户传感器打开(StateValue=False),11:38 关闭(StateValue=True),期间主卧有人活动,持续约 3 分钟,属于正常通风行为。", "推理步骤5: 17:50 的第二次进门事件同样只有解锁和开门记录,没有关门记录,但考虑到住户已在家(16:18 已进入),这可能是另一位住户回家,门的关闭状态延续了 16:18 的未关闭状态。", "推理步骤6: 全天温度变化趋势合理——凌晨约 23°C,午间升至约 25.8°C,傍晚回落,符合夏季自然温度曲线。各房间温差在 1°C 以内,无异常热源迹象。", "推理步骤7: 烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。灶具使用时间合理(早餐约 30 分钟、晚餐约 12 分钟),使用后均已关闭。", "推理步骤8: 厨房窗户在灶具关闭后打开(07:18:30 和 18:57:30),属于做饭后通风的正常行为,但日志中没有关闭记录,需要确认窗户当前状态。"], "key_evidence": ["厨房温度传感器在 06:46、07:19、18:46、18:58 四次报告 MeasuredValue = None", "16:18 入户门解锁并打开后,直到 22:42 才有关门和上锁记录,中间约 6.5 小时门处于开启/未锁状态", "17:50 第二次进门事件同样缺少关门记录", "厨房窗户两次打开后均无关闭记录"], "recommended_actions": ["检查厨房温度传感器是否正常工作,确认其安装位置是否受灶具热量或电磁干扰影响,必要时更换或重新定位传感器", "检查入户门的自动上锁机制,确认为何 16:18 进门后门未自动关闭和上锁(07:16 出门时自动上锁正常工作),可能是门锁或门磁传感器需要维护", "确认厨房窗户当前是否处于打开状态,如果是,建议关闭以保障夜间安全", "建议设置入户门长时间未关闭/未上锁的自动提醒规则,例如门打开超过 5 分钟未关闭时发送通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.16241145133972, "api_error": null} {"episode_id": "SQ3_TP_B_0438", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0438.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261067, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-08T17:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次数据丢失(None),同时厨房窗户在做饭结束后开启但日志中未见关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,白天逐步升至25.8°C左右(12:30峰值),傍晚回落,符合夏季自然昼夜温差规律,整体正常。\",\n \"推理步骤2: 厨房温度传感器异常跳变——19:00时厨房温度突然从约24.5°C飙升至28.28°C,而此时灶具尚未开启(19:02:30才开启)。灶具开启前温度就已异常偏高约3.8°C,与其他房间同时段温度(约24.4°C)严重偏离,说明该读数不太可能仅由烹饪引起。\",\n \"推理步骤3: 厨房温度传感器两次报告None——19:03:00和19:51:00两个时间点,厨房温度传感器返回MeasuredValue=None,表示传感器读数丢失或通信故障。其他三个温度传感器在同一时段均正常上报数据,说明问题出在厨房温度传感器本身。\",\n \"推理步骤4: 19:30时厨房温度仍为28.32°C的异常高值,但到20:00恢复至24.02°C(与其他房间一致),结合两次None读数,该传感器存在间歇性故障的特征。\",\n \"推理步骤5: 厨房窗户在19:50:30被打开(StateValue=False),但在日志结束(23:30)前未见关闭事件。夜间无人时厨房窗户持续开启,存在安全风险。\",\n \"推理步骤6: 其他行为模式均正常——早晨06:38起床洗漱、07:11出门上班并自动锁门、17:36回家(多人,客厅和次卧同时有人)、18:18开灯开空调、19:02-19:50做饭、22:03关灯关空调就寝、门锁自动上锁,均符合典型双人家庭工作日作息。\",\n \"推理步骤7: 入户门锁操作正常——早晨手动开锁出门后自动锁闭,傍晚17:36通过UserIndex=1(已注册用户)开锁,18:18手动开锁(可能是第二位住户到家),22:03自动锁门,无异常开锁事件。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度突然跳至2828(28.28°C),较其他房间高出约3.8°C,且此时灶具尚未开启\",\n \"19:03:00和19:51:00厨房温度传感器两次报告MeasuredValue=None,其他传感器同期正常\",\n \"19:30厨房温度仍为2832(28.32°C)的异常高值\",\n \"19:50:30厨房窗户打开后至日志结束(23:30)未见关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和安装位置,排查是否靠近热源或存在接线/电池问题,必要时更换传感器\",\n \"关闭厨房窗户或设置自动化规则:当无人在厨房且窗户持续开启超过一定时间时发送提醒\",\n \"为厨房温度传感器设置异常值告警规则:当读数为None或与其他房间温差超过3°C时触发通知\",\n \"考虑将厨房烟雾报警器与温度传感器联动,当温度传感器离线时提升烟雾报警器的灵敏度,避免因传感器故障导致火灾风险监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次数据丢失(None),同时厨房窗户在做饭结束后开启但日志中未见关闭,存在安全隐患。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,白天逐步升至25.8°C左右(12:30峰值),傍晚回落,符合夏季自然昼夜温差规律,整体正常。", "推理步骤2: 厨房温度传感器异常跳变——19:00时厨房温度突然从约24.5°C飙升至28.28°C,而此时灶具尚未开启(19:02:30才开启)。灶具开启前温度就已异常偏高约3.8°C,与其他房间同时段温度(约24.4°C)严重偏离,说明该读数不太可能仅由烹饪引起。", "推理步骤3: 厨房温度传感器两次报告None——19:03:00和19:51:00两个时间点,厨房温度传感器返回MeasuredValue=None,表示传感器读数丢失或通信故障。其他三个温度传感器在同一时段均正常上报数据,说明问题出在厨房温度传感器本身。", "推理步骤4: 19:30时厨房温度仍为28.32°C的异常高值,但到20:00恢复至24.02°C(与其他房间一致),结合两次None读数,该传感器存在间歇性故障的特征。", "推理步骤5: 厨房窗户在19:50:30被打开(StateValue=False),但在日志结束(23:30)前未见关闭事件。夜间无人时厨房窗户持续开启,存在安全风险。", "推理步骤6: 其他行为模式均正常——早晨06:38起床洗漱、07:11出门上班并自动锁门、17:36回家(多人,客厅和次卧同时有人)、18:18开灯开空调、19:02-19:50做饭、22:03关灯关空调就寝、门锁自动上锁,均符合典型双人家庭工作日作息。", "推理步骤7: 入户门锁操作正常——早晨手动开锁出门后自动锁闭,傍晚17:36通过UserIndex=1(已注册用户)开锁,18:18手动开锁(可能是第二位住户到家),22:03自动锁门,无异常开锁事件。"], "key_evidence": ["19:00厨房温度突然跳至2828(28.28°C),较其他房间高出约3.8°C,且此时灶具尚未开启", "19:03:00和19:51:00厨房温度传感器两次报告MeasuredValue=None,其他传感器同期正常", "19:30厨房温度仍为2832(28.32°C)的异常高值", "19:50:30厨房窗户打开后至日志结束(23:30)未见关闭事件"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和安装位置,排查是否靠近热源或存在接线/电池问题,必要时更换传感器", "关闭厨房窗户或设置自动化规则:当无人在厨房且窗户持续开启超过一定时间时发送提醒", "为厨房温度传感器设置异常值告警规则:当读数为None或与其他房间温差超过3°C时触发通知", "考虑将厨房烟雾报警器与温度传感器联动,当温度传感器离线时提升烟雾报警器的灵敏度,避免因传感器故障导致火灾风险监测盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.2256076335907, "api_error": null} {"episode_id": "SQ3_TP_B_0440", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0440.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261069, "scenario_id": "FG-01", "total_events": 244, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T02:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨2:17厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 02:17厨房灶具(cook_surface)被开启,但同一时刻客厅运动传感器显示Occupancy=0,且整个深夜时段(00:00-05:57)无任何房间检测到人体活动,说明住户处于深度睡眠或不在家。\",\n \"推理步骤2: 灶具开启后,厨房温度从正常的约23°C(2310)在5分钟内飙升至31°C(3104),10分钟内达到35°C(3500),温升速率极其异常(约每分钟1.2°C)。\",\n \"推理步骤3: 02:32烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认厨房已产生烟雾,存在实际火灾危险。\",\n \"推理步骤4: 日志中未见任何人手动关闭灶具的记录,也未见厨房灯开启(正常做饭会先开灯),灶具在无人操作、无照明的情况下启动,高度可疑。\",\n \"推理步骤5: 对比早晨06:48和傍晚18:13的正常烹饪行为——均伴随厨房灯开启、有人活动迹象、烹饪后关闭灶具并开窗通风——凌晨事件完全不符合正常使用模式。\"\n ],\n \"key_evidence\": [\n \"02:17 厨房灶具在深夜无人活动时被开启(living_room_occupancy=0,无任何房间有人体检测)\",\n \"厨房温度在10分钟内从23°C飙升至35°C(2310→3500),远超正常烹饪温升\",\n \"02:32 烟雾报警器触发 SmokeAlarm 事件,确认产生烟雾\",\n \"无厨房灯开启记录,不符合人为操作灶具的行为模式\",\n \"日志中未见灶具被关闭的记录(直到早晨06:48才有下一次正常使用)\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(如支持远程控制),并切断燃气/电源供应\",\n \"检查灶具是否存在设备故障或被异常触发的原因(如控制系统漏洞、电气故障、宠物误触等)\",\n \"设置自动化规则:深夜时段(23:00-06:00)如灶具被开启且无人体活动检测,立即发送紧急告警并自动关闭\",\n \"检查烟雾报警器当前状态,确认火情是否已完全消除\",\n \"建议安装厨房摄像头或额外的安全传感器,排查凌晨灶具启动的根本原因\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨2:17厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 02:17厨房灶具(cook_surface)被开启,但同一时刻客厅运动传感器显示Occupancy=0,且整个深夜时段(00:00-05:57)无任何房间检测到人体活动,说明住户处于深度睡眠或不在家。", "推理步骤2: 灶具开启后,厨房温度从正常的约23°C(2310)在5分钟内飙升至31°C(3104),10分钟内达到35°C(3500),温升速率极其异常(约每分钟1.2°C)。", "推理步骤3: 02:32烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认厨房已产生烟雾,存在实际火灾危险。", "推理步骤4: 日志中未见任何人手动关闭灶具的记录,也未见厨房灯开启(正常做饭会先开灯),灶具在无人操作、无照明的情况下启动,高度可疑。", "推理步骤5: 对比早晨06:48和傍晚18:13的正常烹饪行为——均伴随厨房灯开启、有人活动迹象、烹饪后关闭灶具并开窗通风——凌晨事件完全不符合正常使用模式。"], "key_evidence": ["02:17 厨房灶具在深夜无人活动时被开启(living_room_occupancy=0,无任何房间有人体检测)", "厨房温度在10分钟内从23°C飙升至35°C(2310→3500),远超正常烹饪温升", "02:32 烟雾报警器触发 SmokeAlarm 事件,确认产生烟雾", "无厨房灯开启记录,不符合人为操作灶具的行为模式", "日志中未见灶具被关闭的记录(直到早晨06:48才有下一次正常使用)"], "recommended_actions": ["立即远程关闭厨房灶具(如支持远程控制),并切断燃气/电源供应", "检查灶具是否存在设备故障或被异常触发的原因(如控制系统漏洞、电气故障、宠物误触等)", "设置自动化规则:深夜时段(23:00-06:00)如灶具被开启且无人体活动检测,立即发送紧急告警并自动关闭", "检查烟雾报警器当前状态,确认火情是否已完全消除", "建议安装厨房摄像头或额外的安全传感器,排查凌晨灶具启动的根本原因"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.98319125175476, "api_error": null} {"episode_id": "SQ3_TP_B_0439", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0439.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261068, "scenario_id": "BA-05", "total_events": 232, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-09T08:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次 null 值,疑似传感器故障或存在局部过热隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无活动,06:48 起床如厕,07:04-07:39 厨房早餐后出门,门锁手动开锁→关门→自动上锁,18:24 回家开灯开空调,19:09 做饭,21:50 关灯锁门就寝,属于典型单人上班族作息。\",\n \"推理步骤2: 入侵排查——两次入户门操作(07:39 出门、18:24 回家)均为 Manual 开锁后 Auto 上锁,全天无异常开锁事件,无深夜运动传感器触发,无窗户异常打开,排除入侵威胁。\",\n \"推理步骤3: 温度趋势整体合理——夜间约 22.9-23.1°C,白天随日照升至 25.8°C 峰值(12:00-12:30),傍晚回落,开空调(18:24 制冷模式 SystemMode=3)后客厅温度从 24.6°C 逐步降至 23.6°C,符合夏季规律。\",\n \"推理步骤4: 关键异常——19:00 厨房温度传感器突然报告 2844(28.44°C),而同一时刻其他三个房间温度在 24.26-24.34°C 范围内,厨房比其他房间高出约 4°C。注意此时灶具尚未开启(19:09 才开),做饭前不应出现如此大的温差。\",\n \"推理步骤5: 19:10 和 19:54 厨房温度传感器连续两次报告 MeasuredValue = None(null),说明传感器读数丢失。正常传感器不会返回 null,这是设备故障的典型信号。\",\n \"推理步骤6: 19:30 厨房温度传感器报告 2829(28.29°C),此时灶具已开启约 20 分钟,虽然做饭会升温,但 28°C+ 的读数与做饭结束后 20:00 立刻恢复到 24.05°C 的跳变幅度过大(约 4°C 瞬降),进一步佐证传感器读数不可靠。\",\n \"推理步骤7: 综合判断——异常高温读数 + null 值 + 不合理的温度跳变,最可能的解释是厨房温度传感器本身出现故障(如受热损坏、连接不稳定)。但也不能完全排除厨房存在局部热源异常的可能性,需要现场确认。\",\n \"推理步骤8: 其他设备状态正常——烟雾报警器全天未触发,漏水传感器无报警,洗碗机正常运行,厨房窗户在做饭后打开通风(19:53),均为合理行为。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数 2844(28.44°C),灶具尚未开启,比同时刻其他房间高约 4°C\",\n \"19:10 和 19:54 厨房温度传感器连续两次返回 MeasuredValue = None,表明传感器数据丢失\",\n \"19:30 读数 2829(28.29°C)→ 20:00 读数 2405(24.05°C),30 分钟内骤降 4.2°C,跳变幅度不合理\",\n \"全天其他三个温度传感器读数一致且平滑变化,唯独厨房传感器出现离群值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如灶具、烤箱排气口)导致读数偏高\",\n \"重启厨房温度传感器并观察是否仍出现 null 值,如持续出现则需更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的关注,避免因温度传感器失效而遗漏真实的过热风险\",\n \"考虑为厨房增加一个冗余温度传感器,提高厨房(高风险区域)的监测可靠性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次 null 值,疑似传感器故障或存在局部过热隐患。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无活动,06:48 起床如厕,07:04-07:39 厨房早餐后出门,门锁手动开锁→关门→自动上锁,18:24 回家开灯开空调,19:09 做饭,21:50 关灯锁门就寝,属于典型单人上班族作息。", "推理步骤2: 入侵排查——两次入户门操作(07:39 出门、18:24 回家)均为 Manual 开锁后 Auto 上锁,全天无异常开锁事件,无深夜运动传感器触发,无窗户异常打开,排除入侵威胁。", "推理步骤3: 温度趋势整体合理——夜间约 22.9-23.1°C,白天随日照升至 25.8°C 峰值(12:00-12:30),傍晚回落,开空调(18:24 制冷模式 SystemMode=3)后客厅温度从 24.6°C 逐步降至 23.6°C,符合夏季规律。", "推理步骤4: 关键异常——19:00 厨房温度传感器突然报告 2844(28.44°C),而同一时刻其他三个房间温度在 24.26-24.34°C 范围内,厨房比其他房间高出约 4°C。注意此时灶具尚未开启(19:09 才开),做饭前不应出现如此大的温差。", "推理步骤5: 19:10 和 19:54 厨房温度传感器连续两次报告 MeasuredValue = None(null),说明传感器读数丢失。正常传感器不会返回 null,这是设备故障的典型信号。", "推理步骤6: 19:30 厨房温度传感器报告 2829(28.29°C),此时灶具已开启约 20 分钟,虽然做饭会升温,但 28°C+ 的读数与做饭结束后 20:00 立刻恢复到 24.05°C 的跳变幅度过大(约 4°C 瞬降),进一步佐证传感器读数不可靠。", "推理步骤7: 综合判断——异常高温读数 + null 值 + 不合理的温度跳变,最可能的解释是厨房温度传感器本身出现故障(如受热损坏、连接不稳定)。但也不能完全排除厨房存在局部热源异常的可能性,需要现场确认。", "推理步骤8: 其他设备状态正常——烟雾报警器全天未触发,漏水传感器无报警,洗碗机正常运行,厨房窗户在做饭后打开通风(19:53),均为合理行为。"], "key_evidence": ["19:00 厨房温度传感器读数 2844(28.44°C),灶具尚未开启,比同时刻其他房间高约 4°C", "19:10 和 19:54 厨房温度传感器连续两次返回 MeasuredValue = None,表明传感器数据丢失", "19:30 读数 2829(28.29°C)→ 20:00 读数 2405(24.05°C),30 分钟内骤降 4.2°C,跳变幅度不合理", "全天其他三个温度传感器读数一致且平滑变化,唯独厨房传感器出现离群值"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如灶具、烤箱排气口)导致读数偏高", "重启厨房温度传感器并观察是否仍出现 null 值,如持续出现则需更换传感器", "在传感器修复前,加强对厨房烟雾报警器的关注,避免因温度传感器失效而遗漏真实的过热风险", "考虑为厨房增加一个冗余温度传感器,提高厨房(高风险区域)的监测可靠性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.927644968032837, "api_error": null} {"episode_id": "SQ3_TP_B_0455", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0455.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261084, "scenario_id": "WD-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-02T00:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨触发且持续未恢复,同时厨房温度传感器出现异常读数和离线,存在水损和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 00:50 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,表示检测到漏水。此时是凌晨,无人活动(卫生间运动传感器直到 06:47 才触发),说明漏水并非人为用水导致。\",\n \"推理步骤2: 在整个 24 小时日志中,漏水传感器没有恢复为 False 的记录,意味着漏水状态可能持续了超过 23 小时未被处理,存在严重水损风险。\",\n \"推理步骤3: 00:45 洗碗机 OperationalState=1(运行中),00:50 漏水传感器触发,时间高度吻合。可能是洗碗机在深夜运行时发生管路泄漏或排水异常,导致卫生间区域积水(管路可能共用或相邻)。\",\n \"推理步骤4: 厨房温度传感器在 19:00 出现异常跳变——从 18:00 的 2467(约24.7°C)突然升至 2841(约28.4°C),升幅约 3.7°C,而同一时刻其他房间温度均在正常下降。19:02 灶具开启,但异常读数出现在灶具开启之前,说明这不是烹饪导致的正常升温。\",\n \"推理步骤5: 19:03 和 19:51 厨房温度传感器两次报告 MeasuredValue=None(空值),表明传感器出现故障或离线。19:30 再次报告 2835 的异常高值,之后 20:00 恢复到 2419。该传感器行为不稳定,可能受潮或硬件故障。\",\n \"推理步骤6: 厨房窗户在 19:50 灶具关闭后被打开(StateValue=False),但在后续日志中没有关闭记录,深夜仍处于开启状态。住户已于 22:04 关灯就寝,厨房窗户未关存在一定安全隐患。\",\n \"推理步骤7: 其余行为模式正常——住户约 06:47 起床、07:37 出门上班、18:10 回家、19:02 做饭、22:04 就寝,门锁开关和自动上锁均正常,温度曲线符合夏季昼夜变化规律。\"\n ],\n \"key_evidence\": [\n \"00:50 bathroom_water_leak StateValue=True 触发,且全天无恢复记录,漏水状态持续超过 23 小时\",\n \"00:45 洗碗机开始运行,5 分钟后漏水传感器触发,时间强相关\",\n \"19:00 厨房温度传感器异常跳至 2841(28.4°C),比其他房间高出约 4°C,且灶具尚未开启\",\n \"19:03 和 19:51 厨房温度传感器两次报告 None 值,传感器工作异常\",\n \"19:50 厨房窗户打开后全天未关闭,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间现场,确认漏水位置和严重程度,必要时关闭水阀止损\",\n \"检查洗碗机进水管、排水管及接头是否有泄漏,暂停使用洗碗机直到排除故障\",\n \"检查厨房温度传感器是否受潮或损坏,必要时更换传感器\",\n \"关闭厨房窗户,夜间开窗存在安全和天气风险\",\n \"建议设置自动化规则:漏水传感器触发时立即推送告警并联动关闭水阀(如有智能水阀)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨触发且持续未恢复,同时厨房温度传感器出现异常读数和离线,存在水损和设备故障双重风险。", "reasoning": ["推理步骤1: 00:50 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,表示检测到漏水。此时是凌晨,无人活动(卫生间运动传感器直到 06:47 才触发),说明漏水并非人为用水导致。", "推理步骤2: 在整个 24 小时日志中,漏水传感器没有恢复为 False 的记录,意味着漏水状态可能持续了超过 23 小时未被处理,存在严重水损风险。", "推理步骤3: 00:45 洗碗机 OperationalState=1(运行中),00:50 漏水传感器触发,时间高度吻合。可能是洗碗机在深夜运行时发生管路泄漏或排水异常,导致卫生间区域积水(管路可能共用或相邻)。", "推理步骤4: 厨房温度传感器在 19:00 出现异常跳变——从 18:00 的 2467(约24.7°C)突然升至 2841(约28.4°C),升幅约 3.7°C,而同一时刻其他房间温度均在正常下降。19:02 灶具开启,但异常读数出现在灶具开启之前,说明这不是烹饪导致的正常升温。", "推理步骤5: 19:03 和 19:51 厨房温度传感器两次报告 MeasuredValue=None(空值),表明传感器出现故障或离线。19:30 再次报告 2835 的异常高值,之后 20:00 恢复到 2419。该传感器行为不稳定,可能受潮或硬件故障。", "推理步骤6: 厨房窗户在 19:50 灶具关闭后被打开(StateValue=False),但在后续日志中没有关闭记录,深夜仍处于开启状态。住户已于 22:04 关灯就寝,厨房窗户未关存在一定安全隐患。", "推理步骤7: 其余行为模式正常——住户约 06:47 起床、07:37 出门上班、18:10 回家、19:02 做饭、22:04 就寝,门锁开关和自动上锁均正常,温度曲线符合夏季昼夜变化规律。"], "key_evidence": ["00:50 bathroom_water_leak StateValue=True 触发,且全天无恢复记录,漏水状态持续超过 23 小时", "00:45 洗碗机开始运行,5 分钟后漏水传感器触发,时间强相关", "19:00 厨房温度传感器异常跳至 2841(28.4°C),比其他房间高出约 4°C,且灶具尚未开启", "19:03 和 19:51 厨房温度传感器两次报告 None 值,传感器工作异常", "19:50 厨房窗户打开后全天未关闭,住户已就寝"], "recommended_actions": ["立即检查卫生间现场,确认漏水位置和严重程度,必要时关闭水阀止损", "检查洗碗机进水管、排水管及接头是否有泄漏,暂停使用洗碗机直到排除故障", "检查厨房温度传感器是否受潮或损坏,必要时更换传感器", "关闭厨房窗户,夜间开窗存在安全和天气风险", "建议设置自动化规则:漏水传感器触发时立即推送告警并联动关闭水阀(如有智能水阀)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.310572862625122, "api_error": null} {"episode_id": "SQ3_TP_B_0452", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0452.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261081, "scenario_id": "WD-01", "total_events": 233, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-17T05:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和多次空值,同时卫生间漏水传感器在凌晨触发且全天未复位,存在设备故障和潜在漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在05:55触发StateValue=True,表示检测到漏水。但之后整个日志中再无该传感器的复位事件(StateValue=False),说明漏水状态持续了超过18小时未被处理。住户06:31进入卫生间使用约30分钟后离开,但漏水传感器仍未复位——要么漏水仍在持续,要么传感器本身卡在报警状态。\",\n \"推理步骤2: 厨房温度传感器在19:00突然从约2452跳到2838(即从24.52°C跳到28.38°C),这一跳变幅度约4°C,远超其他房间同时段的变化。虽然19:06灶具开启可以解释厨房升温,但灶具尚未开启时(19:00)温度就已异常飙升,时间线不匹配。\",\n \"推理步骤3: 厨房温度传感器在19:07和19:53两次报告MeasuredValue=None(空值),这是典型的传感器故障或通信异常表现。正常传感器不应返回null值,其他三个温度传感器全天均无此现象。\",\n \"推理步骤4: 19:30厨房温度仍为2835(28.35°C),而灶具在19:52关闭后,20:00温度骤降回2404(24.04°C),30分钟内下降超4°C。结合之前的异常跳变和null值,高度怀疑厨房温度传感器存在硬件故障或受到灶具热辐射干扰导致读数不可靠。\",\n \"推理步骤5: 其余行为模式正常——住户07:36出门(手动开锁、开门、关门、自动上锁),18:05回家(开锁、开灯、开空调),19:06-19:52做饭,21:49关灯关空调就寝,符合单人上班族的典型作息。入户门锁操作均为Manual或Auto来源,无异常远程解锁。\",\n \"推理步骤6: 全屋温度整体趋势合理:夜间约23°C,白天逐步升至25-26°C(6月夏季),傍晚回落,开空调后客厅降温明显。除厨房传感器外无异常温度模式。\"\n ],\n \"key_evidence\": [\n \"05:55 卫生间漏水传感器触发(StateValue=True),全天未见复位事件,漏水状态持续超18小时\",\n \"19:00 厨房温度传感器在灶具未开启时异常跳变至2838(28.38°C),偏离其他房间约4°C\",\n \"19:07 和 19:53 厨房温度传感器两次报告 MeasuredValue=None,其他传感器全天无此现象\",\n \"19:52灶具关闭后,厨房温度在8分钟内从2835骤降至2404,降幅异常剧烈\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否存在实际漏水情况(水管接头、马桶底部、洗手台下方),如确认无漏水则检查传感器是否故障或需要复位\",\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰;清洁传感器探头,检查供电和通信连接\",\n \"如厨房温度传感器持续出现null值,建议更换设备或重新配对入网\",\n \"建议为漏水传感器配置持续报警通知规则,避免触发后长时间无人响应\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和多次空值,同时卫生间漏水传感器在凌晨触发且全天未复位,存在设备故障和潜在漏水风险。", "reasoning": ["推理步骤1: 卫生间漏水传感器在05:55触发StateValue=True,表示检测到漏水。但之后整个日志中再无该传感器的复位事件(StateValue=False),说明漏水状态持续了超过18小时未被处理。住户06:31进入卫生间使用约30分钟后离开,但漏水传感器仍未复位——要么漏水仍在持续,要么传感器本身卡在报警状态。", "推理步骤2: 厨房温度传感器在19:00突然从约2452跳到2838(即从24.52°C跳到28.38°C),这一跳变幅度约4°C,远超其他房间同时段的变化。虽然19:06灶具开启可以解释厨房升温,但灶具尚未开启时(19:00)温度就已异常飙升,时间线不匹配。", "推理步骤3: 厨房温度传感器在19:07和19:53两次报告MeasuredValue=None(空值),这是典型的传感器故障或通信异常表现。正常传感器不应返回null值,其他三个温度传感器全天均无此现象。", "推理步骤4: 19:30厨房温度仍为2835(28.35°C),而灶具在19:52关闭后,20:00温度骤降回2404(24.04°C),30分钟内下降超4°C。结合之前的异常跳变和null值,高度怀疑厨房温度传感器存在硬件故障或受到灶具热辐射干扰导致读数不可靠。", "推理步骤5: 其余行为模式正常——住户07:36出门(手动开锁、开门、关门、自动上锁),18:05回家(开锁、开灯、开空调),19:06-19:52做饭,21:49关灯关空调就寝,符合单人上班族的典型作息。入户门锁操作均为Manual或Auto来源,无异常远程解锁。", "推理步骤6: 全屋温度整体趋势合理:夜间约23°C,白天逐步升至25-26°C(6月夏季),傍晚回落,开空调后客厅降温明显。除厨房传感器外无异常温度模式。"], "key_evidence": ["05:55 卫生间漏水传感器触发(StateValue=True),全天未见复位事件,漏水状态持续超18小时", "19:00 厨房温度传感器在灶具未开启时异常跳变至2838(28.38°C),偏离其他房间约4°C", "19:07 和 19:53 厨房温度传感器两次报告 MeasuredValue=None,其他传感器全天无此现象", "19:52灶具关闭后,厨房温度在8分钟内从2835骤降至2404,降幅异常剧烈"], "recommended_actions": ["立即检查卫生间是否存在实际漏水情况(水管接头、马桶底部、洗手台下方),如确认无漏水则检查传感器是否故障或需要复位", "检查厨房温度传感器的安装位置,确认是否距灶具过近导致热辐射干扰;清洁传感器探头,检查供电和通信连接", "如厨房温度传感器持续出现null值,建议更换设备或重新配对入网", "建议为漏水传感器配置持续报警通知规则,避免触发后长时间无人响应"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.528724431991577, "api_error": null} {"episode_id": "SQ3_TP_B_0457", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0457.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261086, "scenario_id": "WD-03", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-13T02:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨持续报警,且厨房温度传感器存在异常读数,需立即排查漏水情况并检修厨房温度传感器。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在凌晨 02:57、03:07、03:27 连续三次报告 StateValue=True,间隔约10-20分钟,说明漏水状态持续存在而非瞬时误报。此时段(凌晨3点前后)住户大概率在睡眠中,无人用水,漏水不应发生。\",\n \"推理步骤2: 漏水持续至少30分钟(02:57~03:27),且之后没有任何日志显示 StateValue=False(恢复正常),意味着漏水可能一直未被处理,存在水损风险。\",\n \"推理步骤3: 厨房温度传感器在 12:00 和 12:30 报告了 2977 和 2978(约29.8°C),而同时段其他房间温度约为 25.7-25.9°C,厨房温度比其他房间高出约4°C。但此时灶具尚未开启(12:15才开),这个异常高温读数缺乏合理解释,可能是传感器故障或数据异常。\",\n \"推理步骤4: 厨房温度传感器多次报告 MeasuredValue=None(09:00:10、09:42、12:16、12:52、17:55、18:26),每次都发生在灶具开启或关闭前后。虽然部分可能是灶具高温导致传感器暂时超量程,但频率较高,需关注传感器可靠性。\",\n \"推理步骤5: 其他设备行为均属正常模式——住户约08:49起床,早中晚三次使用厨房做饭,09:48开启客厅空调和灯光,23:02关灯关空调并锁门就寝,符合典型的单人/双人居住作息规律。入户门锁在23:02自动上锁,门窗传感器无异常开合,不存在入侵迹象。\"\n ],\n \"key_evidence\": [\n \"bathroom_water_leak 在 02:57、03:07、03:27 连续三次报告 StateValue=True,凌晨无人活动时段持续漏水\",\n \"漏水报警后无 StateValue=False 恢复记录,漏水状态可能持续未解除\",\n \"kitchen_temp_sensor 在 12:00 和 12:30 报告约 29.8°C,比同时段其他房间高约 4°C,且灶具 12:15 才开启,时间上无法解释该高温\",\n \"kitchen_temp_sensor 全天出现 6 次 MeasuredValue=None,传感器可靠性存疑\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间是否存在实际漏水,重点排查水管接头、马桶底部密封圈、洗手盆下方管道等位置\",\n \"确认漏水传感器当前状态,若仍为 True 则尽快关闭卫生间水阀止损\",\n \"检查卫生间地面及相邻房间(如有)是否已出现渗水痕迹,评估水损程度\",\n \"检修或更换厨房温度传感器,其频繁报告 None 值及异常高温读数表明可能存在硬件故障或安装位置不当(如距灶具过近)\",\n \"建议为漏水传感器配置即时推送告警,避免凌晨漏水长时间无人处理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨持续报警,且厨房温度传感器存在异常读数,需立即排查漏水情况并检修厨房温度传感器。", "reasoning": ["推理步骤1: 卫生间漏水传感器在凌晨 02:57、03:07、03:27 连续三次报告 StateValue=True,间隔约10-20分钟,说明漏水状态持续存在而非瞬时误报。此时段(凌晨3点前后)住户大概率在睡眠中,无人用水,漏水不应发生。", "推理步骤2: 漏水持续至少30分钟(02:57~03:27),且之后没有任何日志显示 StateValue=False(恢复正常),意味着漏水可能一直未被处理,存在水损风险。", "推理步骤3: 厨房温度传感器在 12:00 和 12:30 报告了 2977 和 2978(约29.8°C),而同时段其他房间温度约为 25.7-25.9°C,厨房温度比其他房间高出约4°C。但此时灶具尚未开启(12:15才开),这个异常高温读数缺乏合理解释,可能是传感器故障或数据异常。", "推理步骤4: 厨房温度传感器多次报告 MeasuredValue=None(09:00:10、09:42、12:16、12:52、17:55、18:26),每次都发生在灶具开启或关闭前后。虽然部分可能是灶具高温导致传感器暂时超量程,但频率较高,需关注传感器可靠性。", "推理步骤5: 其他设备行为均属正常模式——住户约08:49起床,早中晚三次使用厨房做饭,09:48开启客厅空调和灯光,23:02关灯关空调并锁门就寝,符合典型的单人/双人居住作息规律。入户门锁在23:02自动上锁,门窗传感器无异常开合,不存在入侵迹象。"], "key_evidence": ["bathroom_water_leak 在 02:57、03:07、03:27 连续三次报告 StateValue=True,凌晨无人活动时段持续漏水", "漏水报警后无 StateValue=False 恢复记录,漏水状态可能持续未解除", "kitchen_temp_sensor 在 12:00 和 12:30 报告约 29.8°C,比同时段其他房间高约 4°C,且灶具 12:15 才开启,时间上无法解释该高温", "kitchen_temp_sensor 全天出现 6 次 MeasuredValue=None,传感器可靠性存疑"], "recommended_actions": ["立即检查卫生间是否存在实际漏水,重点排查水管接头、马桶底部密封圈、洗手盆下方管道等位置", "确认漏水传感器当前状态,若仍为 True 则尽快关闭卫生间水阀止损", "检查卫生间地面及相邻房间(如有)是否已出现渗水痕迹,评估水损程度", "检修或更换厨房温度传感器,其频繁报告 None 值及异常高温读数表明可能存在硬件故障或安装位置不当(如距灶具过近)", "建议为漏水传感器配置即时推送告警,避免凌晨漏水长时间无人处理"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.186458110809326, "api_error": null} {"episode_id": "SQ3_TP_B_0465", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0465.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261094, "scenario_id": "FG-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-16T01:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨1:25厨房灶具在无人在家时自动开启,厨房温度骤升至30.45°C,且烟雾报警器因电池低电量可能无法正常工作;此外厨房温传感器多次报告None值,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式分析——06:40卫生间有人活动,07:11住户通过手动开锁出门并自动上锁,18:13住户回家开门。说明07:11~18:13期间家中无人。\",\n \"推理步骤2: 凌晨01:25厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时所有运动传感器均无触发,无任何灯光开启,表明无人在厨房操作。灶具在深夜无人状态下启动极为异常。\",\n \"推理步骤3: 灶具开启10分钟后(01:35),厨房温度从约23.0°C骤升至30.45°C(MeasuredValue=3045),升幅约7.5°C,远超同时段其他房间的正常波动(±0.1°C),说明灶具确实在工作产热。\",\n \"推理步骤4: 01:35烟雾报警器报告SmokeState=0(正常/无烟),但前一天(06-15 01:25)该报警器已报告BatteryAlert=1(低电量警告)。低电量状态下传感器的检测可靠性存疑,可能无法在真正产生烟雾时及时报警。\",\n \"推理步骤5: 灶具开启后,日志中没有任何关闭记录,直到住户18:46回家后再次开启灶具做饭。这意味着灶具可能在无人看管的情况下持续运行了近17小时(01:25~18:46期间状态不明),或者存在设备通信异常。\",\n \"推理步骤6: 02:00厨房温度回落至23.04°C,可能是灶具自动进入待机或火焰熄灭,但设备OnOff状态未报告关闭,存在干烧或燃气泄漏隐患。\",\n \"推理步骤7: 18:00厨房温度再次异常飙升至28.65°C(MeasuredValue=2865),而此时灶具尚未被住户开启(18:46才开启),其他房间温度仅约24.5°C,温差超过4°C,来源不明。18:30仍为28.50°C。\",\n \"推理步骤8: 厨房温度传感器在18:47和19:42两次报告MeasuredValue=None,表明传感器出现故障或通信中断,在灶具使用期间失去温度监控能力,增加了安全盲区。\"\n ],\n \"key_evidence\": [\n \"01:25 厨房灶具在深夜无人时开启,无任何运动传感器触发、无灯光操作\",\n \"01:35 厨房温度骤升至30.45°C,同时段其他房间温度仅约23°C\",\n \"06-15 01:25 烟雾报警器已报告低电量(BatteryAlert=1),检测可靠性下降\",\n \"18:00 住户尚未开启灶具,厨房温度异常达28.65°C,比其他房间高约4°C\",\n \"18:47和19:42 厨房温度传感器两次报告None值,存在设备故障\",\n \"灶具凌晨开启后无关闭记录,长时间无人看管状态不明\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾检测能力正常\",\n \"检查厨房灶具是否存在远程误触发或硬件故障,排查凌晨无人时自动开启的原因\",\n \"检查厨房温度传感器,排除传感器故障(多次报告None值),必要时更换\",\n \"为灶具设置安全规则:无人在家或深夜时段自动禁止开启,或开启后超时无操作自动关闭\",\n \"排查18:00厨房异常高温的来源,确认是否存在余热、燃气泄漏或其他热源\",\n \"建议安装独立燃气泄漏检测器作为额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨1:25厨房灶具在无人在家时自动开启,厨房温度骤升至30.45°C,且烟雾报警器因电池低电量可能无法正常工作;此外厨房温传感器多次报告None值,存在设备故障风险。", "reasoning": ["推理步骤1: 住户行为模式分析——06:40卫生间有人活动,07:11住户通过手动开锁出门并自动上锁,18:13住户回家开门。说明07:11~18:13期间家中无人。", "推理步骤2: 凌晨01:25厨房灶具(kitchen_cook_surface)被开启(OnOff=True),此时所有运动传感器均无触发,无任何灯光开启,表明无人在厨房操作。灶具在深夜无人状态下启动极为异常。", "推理步骤3: 灶具开启10分钟后(01:35),厨房温度从约23.0°C骤升至30.45°C(MeasuredValue=3045),升幅约7.5°C,远超同时段其他房间的正常波动(±0.1°C),说明灶具确实在工作产热。", "推理步骤4: 01:35烟雾报警器报告SmokeState=0(正常/无烟),但前一天(06-15 01:25)该报警器已报告BatteryAlert=1(低电量警告)。低电量状态下传感器的检测可靠性存疑,可能无法在真正产生烟雾时及时报警。", "推理步骤5: 灶具开启后,日志中没有任何关闭记录,直到住户18:46回家后再次开启灶具做饭。这意味着灶具可能在无人看管的情况下持续运行了近17小时(01:25~18:46期间状态不明),或者存在设备通信异常。", "推理步骤6: 02:00厨房温度回落至23.04°C,可能是灶具自动进入待机或火焰熄灭,但设备OnOff状态未报告关闭,存在干烧或燃气泄漏隐患。", "推理步骤7: 18:00厨房温度再次异常飙升至28.65°C(MeasuredValue=2865),而此时灶具尚未被住户开启(18:46才开启),其他房间温度仅约24.5°C,温差超过4°C,来源不明。18:30仍为28.50°C。", "推理步骤8: 厨房温度传感器在18:47和19:42两次报告MeasuredValue=None,表明传感器出现故障或通信中断,在灶具使用期间失去温度监控能力,增加了安全盲区。"], "key_evidence": ["01:25 厨房灶具在深夜无人时开启,无任何运动传感器触发、无灯光操作", "01:35 厨房温度骤升至30.45°C,同时段其他房间温度仅约23°C", "06-15 01:25 烟雾报警器已报告低电量(BatteryAlert=1),检测可靠性下降", "18:00 住户尚未开启灶具,厨房温度异常达28.65°C,比其他房间高约4°C", "18:47和19:42 厨房温度传感器两次报告None值,存在设备故障", "灶具凌晨开启后无关闭记录,长时间无人看管状态不明"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾检测能力正常", "检查厨房灶具是否存在远程误触发或硬件故障,排查凌晨无人时自动开启的原因", "检查厨房温度传感器,排除传感器故障(多次报告None值),必要时更换", "为灶具设置安全规则:无人在家或深夜时段自动禁止开启,或开启后超时无操作自动关闭", "排查18:00厨房异常高温的来源,确认是否存在余热、燃气泄漏或其他热源", "建议安装独立燃气泄漏检测器作为额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.859938144683838, "api_error": null} {"episode_id": "SQ3_TP_B_0468", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0468.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261097, "scenario_id": "INS-02", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-10T21:41:00", "variant": "TP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.7200803756713867, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ3_TP_B_0467", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0467.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261096, "scenario_id": "DF-03", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-04T10:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;入户门在16:14开锁进入后长时间未关门,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的日志,同时回溯白天上下文以建立行为基线。住户约06:06起床,07:17出门,17:49回家,22:26就寝,属于典型单人上班族作息。\",\n \"推理步骤2: 厨房温度传感器在07:09、07:22、18:49、19:06四次报告 MeasuredValue = None。前两次发生在灶具使用前后(07:08开灶、07:21关灶),后两次同样与18:48开灶、19:05关灶高度关联。灶具运行时传感器读数丢失,可能是高温导致传感器暂时失效或通信中断,属于设备异常。\",\n \"推理步骤3: 16:14入户门锁解锁(Manual)、门打开(StateValue=False)、玄关检测到人,但之后直到22:26才记录到门关闭(StateValue=True)并自动上锁。这意味着入户门敞开了超过6小时。虽然17:49有第二次开锁记录(住户回家),但16:14的开门事件没有对应的关门记录,说明门在16:14到22:26之间一直处于未关状态。\",\n \"推理步骤4: 16:14的开门事件本身也值得关注——住户07:17出门后门已自动上锁,16:14却有人手动开锁进入,但没有后续的关门和活动痕迹(客厅/卧室无运动检测、无灯光变化),直到17:49住户才正式回家开灯开空调。16:14进入者的身份和目的不明确。\",\n \"推理步骤5: 10:05–10:06主卧运动传感器出现快速交替触发(30秒内Occupancy在0和1之间切换3次),此时住户已出门,可能是传感器误触发(宠物、窗帘飘动等),也可能是有人在室内活动。结合16:14的异常开门,需要留意。\",\n \"推理步骤6: 其余行为均属正常:17:49回家后开灯开空调(制冷模式SystemMode=3,符合夏季25°C+的室温)、18:48做饭、19:29开洗碗机、22:26关灯关空调就寝、厨房窗户开启通风等都是合理的日常操作。温度曲线呈现正常的日间升温夜间降温趋势。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间4次报告 MeasuredValue = None(07:09、07:22、18:49、19:06)\",\n \"16:14入户门手动解锁并打开,但无对应关门记录,直到22:26才关门上锁(间隔超6小时)\",\n \"16:14开门后无任何室内活动迹象(无灯光、无运动检测),17:49住户才真正回家产生活动\",\n \"10:05–10:06主卧运动传感器在住户外出期间快速交替触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时通信异常,必要时更换耐高温型号或调整位置\",\n \"核实16:14的开门事件——确认是否为家庭成员或预期访客(如保洁、快递),若无法确认身份建议查看门口监控\",\n \"检查入户门的自动关门机制(闭门器)是否正常工作,避免长时间敞开带来的安全风险\",\n \"考虑为入户门设置「超时未关门」告警规则(如开门超过5分钟未关闭则推送提醒)\",\n \"排查主卧运动传感器在无人时段的误触发原因(宠物、传感器灵敏度、窗帘等)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;入户门在16:14开锁进入后长时间未关门,存在安全隐患。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的日志,同时回溯白天上下文以建立行为基线。住户约06:06起床,07:17出门,17:49回家,22:26就寝,属于典型单人上班族作息。", "推理步骤2: 厨房温度传感器在07:09、07:22、18:49、19:06四次报告 MeasuredValue = None。前两次发生在灶具使用前后(07:08开灶、07:21关灶),后两次同样与18:48开灶、19:05关灶高度关联。灶具运行时传感器读数丢失,可能是高温导致传感器暂时失效或通信中断,属于设备异常。", "推理步骤3: 16:14入户门锁解锁(Manual)、门打开(StateValue=False)、玄关检测到人,但之后直到22:26才记录到门关闭(StateValue=True)并自动上锁。这意味着入户门敞开了超过6小时。虽然17:49有第二次开锁记录(住户回家),但16:14的开门事件没有对应的关门记录,说明门在16:14到22:26之间一直处于未关状态。", "推理步骤4: 16:14的开门事件本身也值得关注——住户07:17出门后门已自动上锁,16:14却有人手动开锁进入,但没有后续的关门和活动痕迹(客厅/卧室无运动检测、无灯光变化),直到17:49住户才正式回家开灯开空调。16:14进入者的身份和目的不明确。", "推理步骤5: 10:05–10:06主卧运动传感器出现快速交替触发(30秒内Occupancy在0和1之间切换3次),此时住户已出门,可能是传感器误触发(宠物、窗帘飘动等),也可能是有人在室内活动。结合16:14的异常开门,需要留意。", "推理步骤6: 其余行为均属正常:17:49回家后开灯开空调(制冷模式SystemMode=3,符合夏季25°C+的室温)、18:48做饭、19:29开洗碗机、22:26关灯关空调就寝、厨房窗户开启通风等都是合理的日常操作。温度曲线呈现正常的日间升温夜间降温趋势。"], "key_evidence": ["厨房温度传感器在灶具使用期间4次报告 MeasuredValue = None(07:09、07:22、18:49、19:06)", "16:14入户门手动解锁并打开,但无对应关门记录,直到22:26才关门上锁(间隔超6小时)", "16:14开门后无任何室内活动迹象(无灯光、无运动检测),17:49住户才真正回家产生活动", "10:05–10:06主卧运动传感器在住户外出期间快速交替触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时通信异常,必要时更换耐高温型号或调整位置", "核实16:14的开门事件——确认是否为家庭成员或预期访客(如保洁、快递),若无法确认身份建议查看门口监控", "检查入户门的自动关门机制(闭门器)是否正常工作,避免长时间敞开带来的安全风险", "考虑为入户门设置「超时未关门」告警规则(如开门超过5分钟未关闭则推送提醒)", "排查主卧运动传感器在无人时段的误触发原因(宠物、传感器灵敏度、窗帘等)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.439704418182373, "api_error": null} {"episode_id": "SQ3_TP_B_0476", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0476.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261105, "scenario_id": "DF-04", "total_events": 231, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-06T21:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.82°C),同时入户门锁出现重复锁门失败并触发告警,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 09:09、09:45、12:14、12:53、18:12、18:41 共 6 次报告 MeasuredValue = None。虽然其中部分与灶具使用时间重合(可能是传感器在高温下的保护机制),但频率过高且在灶具关闭后仍出现 None 值(如 09:45 灶具刚关、12:53 灶具刚关时均报 None),说明传感器可能存在硬件故障或通信不稳定。\",\n \"推理步骤2: 12:00 厨房温度传感器读数为 2982(29.82°C),而同一时刻其他房间温度在 25.73-25.86°C 范围内,厨房比其他房间高出约 4°C。此时灶具尚未开启(12:13 才开),这个异常高温读数无法用烹饪解释,进一步佐证传感器读数不可靠。12:30 读数 2989(29.89°C)同样异常偏高。\",\n \"推理步骤3: 21:50 入户门锁在 5 秒内连续收到两次 LockDoor 命令,两次均返回 LockState = 2(未完全上锁),随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中通常表示锁定失败告警。这说明门锁机械结构或电机可能存在故障,无法正常上锁。\",\n \"推理步骤4: 22:50 入户门接触传感器报告 StateValue = True(门被打开),随后门锁以 Auto 方式执行了 Unlock 操作(LockOperationType=0),LockState 变为 1(已解锁)。在住户已关闭客厅灯和空调准备休息的深夜时段,门被打开且自动解锁,结合之前门锁告警,这一行为链值得关注——可能是住户正常出入,但也可能是门锁故障导致的非预期解锁。\",\n \"推理步骤5: 其余设备行为基本正常——温度随日照呈现合理的昼夜变化曲线(夜间约 23°C,午后峰值约 25.8°C);早晨卫生间使用、三餐时段厨房灶具使用、做饭后开窗通风和使用洗碗机等均符合正常生活规律;客厅空调在白天制冷模式运行(SystemMode=3)也合理。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 MeasuredValue = None\",\n \"12:00 和 12:30 厨房温度异常飙升至 29.82°C / 29.89°C,灶具此时尚未开启,与其他房间温差达 4°C\",\n \"21:50 入户门锁 5 秒内两次 LockDoor 命令均返回 LockState=2(未完全锁定),触发 DoorLockAlarm(AlarmCode=0)\",\n \"22:50 深夜时段入户门被打开并自动解锁(LockOperationType=0, OperationSource=Auto)\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁机械结构和电池电量,确认门锁能否正常上锁,必要时更换门锁或维修\",\n \"检查厨房温度传感器的安装位置和硬件状态,清洁传感器探头,排查是否受油烟或高温损坏导致读数异常和频繁丢失\",\n \"在门锁修复前,建议启用入户门接触传感器的实时告警,任何非预期开门事件立即推送通知\",\n \"考虑为厨房增加备用温度监测手段,避免因传感器故障导致烹饪安全监控盲区(如灶具开启时无法监测厨房温度)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.82°C),同时入户门锁出现重复锁门失败并触发告警,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 09:09、09:45、12:14、12:53、18:12、18:41 共 6 次报告 MeasuredValue = None。虽然其中部分与灶具使用时间重合(可能是传感器在高温下的保护机制),但频率过高且在灶具关闭后仍出现 None 值(如 09:45 灶具刚关、12:53 灶具刚关时均报 None),说明传感器可能存在硬件故障或通信不稳定。", "推理步骤2: 12:00 厨房温度传感器读数为 2982(29.82°C),而同一时刻其他房间温度在 25.73-25.86°C 范围内,厨房比其他房间高出约 4°C。此时灶具尚未开启(12:13 才开),这个异常高温读数无法用烹饪解释,进一步佐证传感器读数不可靠。12:30 读数 2989(29.89°C)同样异常偏高。", "推理步骤3: 21:50 入户门锁在 5 秒内连续收到两次 LockDoor 命令,两次均返回 LockState = 2(未完全上锁),随后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中通常表示锁定失败告警。这说明门锁机械结构或电机可能存在故障,无法正常上锁。", "推理步骤4: 22:50 入户门接触传感器报告 StateValue = True(门被打开),随后门锁以 Auto 方式执行了 Unlock 操作(LockOperationType=0),LockState 变为 1(已解锁)。在住户已关闭客厅灯和空调准备休息的深夜时段,门被打开且自动解锁,结合之前门锁告警,这一行为链值得关注——可能是住户正常出入,但也可能是门锁故障导致的非预期解锁。", "推理步骤5: 其余设备行为基本正常——温度随日照呈现合理的昼夜变化曲线(夜间约 23°C,午后峰值约 25.8°C);早晨卫生间使用、三餐时段厨房灶具使用、做饭后开窗通风和使用洗碗机等均符合正常生活规律;客厅空调在白天制冷模式运行(SystemMode=3)也合理。"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 MeasuredValue = None", "12:00 和 12:30 厨房温度异常飙升至 29.82°C / 29.89°C,灶具此时尚未开启,与其他房间温差达 4°C", "21:50 入户门锁 5 秒内两次 LockDoor 命令均返回 LockState=2(未完全锁定),触发 DoorLockAlarm(AlarmCode=0)", "22:50 深夜时段入户门被打开并自动解锁(LockOperationType=0, OperationSource=Auto)"], "recommended_actions": ["立即检查入户门锁机械结构和电池电量,确认门锁能否正常上锁,必要时更换门锁或维修", "检查厨房温度传感器的安装位置和硬件状态,清洁传感器探头,排查是否受油烟或高温损坏导致读数异常和频繁丢失", "在门锁修复前,建议启用入户门接触传感器的实时告警,任何非预期开门事件立即推送通知", "考虑为厨房增加备用温度监测手段,避免因传感器故障导致烹饪安全监控盲区(如灶具开启时无法监测厨房温度)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.255924701690674, "api_error": null} {"episode_id": "SQ3_TP_B_0483", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0483.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261112, "scenario_id": "INS-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-25T16:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:13 住户外出期间,入户门锁在37秒内连续4次解锁失败并触发强制入侵报警,疑似有人尝试非法闯入。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:35 手动开锁出门,门锁随后自动上锁,之后全屋无任何人体活动,判断为家中无人状态。\",\n \"推理步骤2: 16:13:00 至 16:13:40,入户门锁在短短40秒内连续报告4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常对应远程/无线方式,OperationError=1 表示凭证无效,这是典型的暴力尝试解锁模式。\",\n \"推理步骤3: 16:13:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"Wrong Code Entry Limit\"报警,即错误密码/凭证尝试次数超限,门锁主动发出入侵警报。\",\n \"推理步骤4: 此时段前后无对应的入户门开启(BooleanState 未变为 False)、无玄关运动传感器触发,说明入侵者未能成功进入,但尝试行为确实发生。\",\n \"推理步骤5: 住户直到 18:13 才正常手动开锁回家,进一步确认 16:13 的解锁尝试并非住户本人操作。\"\n ],\n \"key_evidence\": [\n \"16:13:00-16:13:40 入户门锁连续4次 LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒\",\n \"16:13:50 门锁触发 DoorLockAlarm(AlarmCode=3)——错误尝试次数超限报警\",\n \"07:35 住户出门后至 18:13 回家前,家中无人(无任何运动传感器触发)\",\n \"该时段入户门传感器未报告开启,说明门未被打开,入侵未成功\"\n ],\n \"recommended_actions\": [\n \"立即检查门锁物理状态,确认门锁未被损坏或篡改\",\n \"查看楼道/小区监控录像,确认 16:13 前后是否有可疑人员在门前逗留\",\n \"考虑更换门锁密码或凭证,防止已泄露的密码被再次尝试\",\n \"启用门锁异常报警的实时推送通知,确保类似事件能第一时间告知住户\",\n \"如有条件,在入户门外加装摄像头以增强监控能力\",\n \"向物业或警方报备此次可疑事件\"\n ]\n}\n```\n\n补充说明几个次要观察点(未达到威胁级别,但值得留意):\n\n- 厨房温度传感器在 19:00 出现异常跳升(2838,即 28.38°C,而其他房间约 24.4°C),随后 19:08 和 19:47 两次报告 `None`(读数丢失)。结合灶具正在使用,温度升高本身可解释,但 `None` 值可能表示传感器受高温影响暂时故障,建议关注该传感器的健康状态。\n- 厨房窗户在 19:46:30 打开后,日志中未见关闭记录。考虑到住户 21:48 已就寝/离开客厅区域,厨房窗户可能整夜处于开启状态,存在轻微安全隐患。", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:13 住户外出期间,入户门锁在37秒内连续4次解锁失败并触发强制入侵报警,疑似有人尝试非法闯入。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:35 手动开锁出门,门锁随后自动上锁,之后全屋无任何人体活动,判断为家中无人状态。\",\n \"推理步骤2: 16:13:00 至 16:13:40,入户门锁在短短40秒内连续报告4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常对应远程/无线方式,OperationError=1 表示凭证无效,这是典型的暴力尝试解锁模式。\",\n \"推理步骤3: 16:13:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"Wrong Code"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 27.17725706100464, "api_error": null} {"episode_id": "SQ3_TP_B_0489", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0489.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261118, "scenario_id": "BA-03", "total_events": 233, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-06T06:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.89°C),客厅主灯在凌晨出现快速闪烁,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 分析时间范围——任务要求过去6小时,即 2026-06-06 约 17:30 至 23:30,但日志提供了全天数据,需结合全天上下文进行分析。\",\n \"推理步骤2: 厨房温度传感器异常——在 09:03、09:48、12:03、12:37、17:54、18:49 多次报告 MeasuredValue = None。虽然每次都与灶具开启/关闭时间相关,可能是灶具运行时传感器被设计为屏蔽读数,但 None 值出现频率高,且在 18:49 灶具已关闭后仍报告 None,值得关注。\",\n \"推理步骤3: 厨房 12:00 温度异常飙升——其他房间温度约 25.7-25.9°C 时,厨房传感器报告 29.89°C,偏差约 4°C。12:30 仍为 29.84°C。虽然灶具在 12:02 开启可解释部分升温,但灶具刚开启不到 1 分钟就出现如此大的温差,且 12:00 的读数是在灶具开启之前记录的,说明这个高温并非灶具导致,传感器可能存在读数漂移或故障。\",\n \"推理步骤4: 客厅主灯 06:21 快速闪烁——在 14 秒内出现 7 次开关切换(开-关-开-关-开-开-关),这不是正常的人为操作模式。可能原因包括:电气接触不良、智能开关固件故障、或通信协议干扰。凌晨 6:21 住户大概率还在睡眠,无人操作灯具。\",\n \"推理步骤5: 正常行为确认——早晨 08:31 卫生间使用、09:02-09:47 早餐做饭、10:07 客厅活动并开空调、12:02-12:36 午餐做饭、17:53-18:48 晚餐做饭并启动洗碗机、22:51 关灯关空调并自动锁门就寝,这些都是合理的日常生活模式。\",\n \"推理步骤6: 安全方面确认——全天无烟雾报警触发、无漏水报警、无异常入侵迹象(门锁操作正常、无深夜非授权开门),整体安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 12:00(灶具开启前)读数为 2989(29.89°C),比同时段其他房间高出约 4°C,属于异常偏高\",\n \"厨房温度传感器全天 6 次报告 MeasuredValue = None,包括 18:49 灶具关闭后仍出现 None\",\n \"客厅主灯在 06:21:00-06:21:14 的 14 秒内发生 7 次开关状态变化,呈现非正常的快速闪烁模式\",\n \"06:21 时段无运动传感器触发,排除人为操作可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热辐射影响导致读数偏高,必要时重新校准或更换\",\n \"排查厨房温度传感器频繁报告 None 的原因,检查其与灶具之间是否存在已知的联动屏蔽逻辑,若无则可能是通信故障\",\n \"检查客厅主灯(living_room_light_1)的电气连接和智能控制模块,排查快速闪烁是否由接触不良或固件 bug 引起\",\n \"持续监控上述设备,若厨房传感器异常读数或主灯闪烁再次出现,建议安排维修\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.89°C),客厅主灯在凌晨出现快速闪烁,存在设备故障风险。", "reasoning": ["推理步骤1: 分析时间范围——任务要求过去6小时,即 2026-06-06 约 17:30 至 23:30,但日志提供了全天数据,需结合全天上下文进行分析。", "推理步骤2: 厨房温度传感器异常——在 09:03、09:48、12:03、12:37、17:54、18:49 多次报告 MeasuredValue = None。虽然每次都与灶具开启/关闭时间相关,可能是灶具运行时传感器被设计为屏蔽读数,但 None 值出现频率高,且在 18:49 灶具已关闭后仍报告 None,值得关注。", "推理步骤3: 厨房 12:00 温度异常飙升——其他房间温度约 25.7-25.9°C 时,厨房传感器报告 29.89°C,偏差约 4°C。12:30 仍为 29.84°C。虽然灶具在 12:02 开启可解释部分升温,但灶具刚开启不到 1 分钟就出现如此大的温差,且 12:00 的读数是在灶具开启之前记录的,说明这个高温并非灶具导致,传感器可能存在读数漂移或故障。", "推理步骤4: 客厅主灯 06:21 快速闪烁——在 14 秒内出现 7 次开关切换(开-关-开-关-开-开-关),这不是正常的人为操作模式。可能原因包括:电气接触不良、智能开关固件故障、或通信协议干扰。凌晨 6:21 住户大概率还在睡眠,无人操作灯具。", "推理步骤5: 正常行为确认——早晨 08:31 卫生间使用、09:02-09:47 早餐做饭、10:07 客厅活动并开空调、12:02-12:36 午餐做饭、17:53-18:48 晚餐做饭并启动洗碗机、22:51 关灯关空调并自动锁门就寝,这些都是合理的日常生活模式。", "推理步骤6: 安全方面确认——全天无烟雾报警触发、无漏水报警、无异常入侵迹象(门锁操作正常、无深夜非授权开门),整体安防状态良好。"], "key_evidence": ["厨房温度传感器在 12:00(灶具开启前)读数为 2989(29.89°C),比同时段其他房间高出约 4°C,属于异常偏高", "厨房温度传感器全天 6 次报告 MeasuredValue = None,包括 18:49 灶具关闭后仍出现 None", "客厅主灯在 06:21:00-06:21:14 的 14 秒内发生 7 次开关状态变化,呈现非正常的快速闪烁模式", "06:21 时段无运动传感器触发,排除人为操作可能"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热辐射影响导致读数偏高,必要时重新校准或更换", "排查厨房温度传感器频繁报告 None 的原因,检查其与灶具之间是否存在已知的联动屏蔽逻辑,若无则可能是通信故障", "检查客厅主灯(living_room_light_1)的电气连接和智能控制模块,排查快速闪烁是否由接触不良或固件 bug 引起", "持续监控上述设备,若厨房传感器异常读数或主灯闪烁再次出现,建议安排维修"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.364154815673828, "api_error": null} {"episode_id": "SQ3_TP_B_0500", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0500.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261129, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-28T13:43:00", "variant": "TP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.8781423568725586, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ3_TP_B_0491", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0491.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261120, "scenario_id": "DF-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T18:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体温度趋势正常——凌晨约 22.9-23.1°C,白天升至 25.8°C 峰值(12:30),傍晚逐步回落,符合夏季(6月30日)自然昼夜温差规律。\",\n \"推理步骤2: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.27°C,而同一时刻其他房间温度均在 24.2-24.5°C 范围内,差值超过 3.8°C。虽然 19:07 灶具开启可以解释厨房升温,但该跳变发生在灶具开启前 7 分钟,时序不合理。\",\n \"推理步骤3: 19:08 和 19:44 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器无法完成测量,这是设备异常的明确信号。\",\n \"推理步骤4: 19:30 厨房温度仍高达 28.34°C(灶具运行中可理解),但到 20:00 突然恢复到 24.01°C,与其他房间温度完全一致,降幅达 4.3°C/30min,远超自然散热速率,进一步说明 19:00-19:30 的高温读数可能是传感器漂移而非真实温度。\",\n \"推理步骤5: 19:43 厨房窗户传感器报告 StateValue=False(窗户打开),但在后续日志中未见关闭事件。做饭后开窗通风合理,但如果住户已在 22:07 关灯、锁门准备就寝,窗户仍处于打开状态存在安全隐患。\",\n \"推理步骤6: 入侵风险排查——07:19 和 18:18 两次出入均为手动开锁、正常开关门、自动上锁,时间符合上班/下班规律;22:07 关灯关空调后门锁确认上锁,无异常入侵迹象。\",\n \"推理步骤7: 火灾风险排查——灶具 19:07 开启、19:43 关闭,使用时长约 36 分钟属正常烹饪;烟雾报警器全天无触发;无持续异常高温。\",\n \"推理步骤8: 漏水风险排查——卫生间漏水传感器全天无报告,无异常。\",\n \"推理步骤9: 其他设备行为均正常——卫生间 06:48 使用约 10 分钟、洗碗机 19:56 启动、客厅空调制冷模式(SystemMode=3)运行期间客厅温度从 24.5°C 降至 23.6°C,均合理。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2827(28.27°C),此时灶具尚未开启(19:07才开),且其他房间温度仅约 24.3-24.5°C\",\n \"19:08 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,表明传感器测量失败\",\n \"19:30 厨房温度 28.34°C 到 20:00 骤降至 24.01°C,30 分钟内降幅 4.3°C 不符合物理散热规律\",\n \"19:43 厨房窗户打开后在剩余日志中未见关闭事件,住户就寝时窗户可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否存在硬件故障或安装位置问题(如过于靠近灶具),必要时更换或重新校准\",\n \"确认厨房窗户当前状态,如仍处于打开状态建议关闭,避免夜间安全隐患\",\n \"考虑为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或出现 null 值时自动告警\",\n \"建议为厨房窗户添加就寝模式联动规则:当全屋灯光关闭且门锁上锁时,检查并提醒关闭所有窗户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 整体温度趋势正常——凌晨约 22.9-23.1°C,白天升至 25.8°C 峰值(12:30),傍晚逐步回落,符合夏季(6月30日)自然昼夜温差规律。", "推理步骤2: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.27°C,而同一时刻其他房间温度均在 24.2-24.5°C 范围内,差值超过 3.8°C。虽然 19:07 灶具开启可以解释厨房升温,但该跳变发生在灶具开启前 7 分钟,时序不合理。", "推理步骤3: 19:08 和 19:44 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器无法完成测量,这是设备异常的明确信号。", "推理步骤4: 19:30 厨房温度仍高达 28.34°C(灶具运行中可理解),但到 20:00 突然恢复到 24.01°C,与其他房间温度完全一致,降幅达 4.3°C/30min,远超自然散热速率,进一步说明 19:00-19:30 的高温读数可能是传感器漂移而非真实温度。", "推理步骤5: 19:43 厨房窗户传感器报告 StateValue=False(窗户打开),但在后续日志中未见关闭事件。做饭后开窗通风合理,但如果住户已在 22:07 关灯、锁门准备就寝,窗户仍处于打开状态存在安全隐患。", "推理步骤6: 入侵风险排查——07:19 和 18:18 两次出入均为手动开锁、正常开关门、自动上锁,时间符合上班/下班规律;22:07 关灯关空调后门锁确认上锁,无异常入侵迹象。", "推理步骤7: 火灾风险排查——灶具 19:07 开启、19:43 关闭,使用时长约 36 分钟属正常烹饪;烟雾报警器全天无触发;无持续异常高温。", "推理步骤8: 漏水风险排查——卫生间漏水传感器全天无报告,无异常。", "推理步骤9: 其他设备行为均正常——卫生间 06:48 使用约 10 分钟、洗碗机 19:56 启动、客厅空调制冷模式(SystemMode=3)运行期间客厅温度从 24.5°C 降至 23.6°C,均合理。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2827(28.27°C),此时灶具尚未开启(19:07才开),且其他房间温度仅约 24.3-24.5°C", "19:08 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,表明传感器测量失败", "19:30 厨房温度 28.34°C 到 20:00 骤降至 24.01°C,30 分钟内降幅 4.3°C 不符合物理散热规律", "19:43 厨房窗户打开后在剩余日志中未见关闭事件,住户就寝时窗户可能仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否存在硬件故障或安装位置问题(如过于靠近灶具),必要时更换或重新校准", "确认厨房窗户当前状态,如仍处于打开状态建议关闭,避免夜间安全隐患", "考虑为厨房温度传感器设置异常值过滤规则:当读数突变超过 3°C/30min 或出现 null 值时自动告警", "建议为厨房窗户添加就寝模式联动规则:当全屋灯光关闭且门锁上锁时,检查并提醒关闭所有窗户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.826075077056885, "api_error": null} {"episode_id": "SQ3_TP_B_0512", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0512.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261141, "scenario_id": "DF-01", "total_events": 202, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-14T05:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧温度传感器存在异常:周期性上报格式不规范的数据,且读数与同时刻正常上报值存在固定偏差,疑似传感器固件故障或被篡改。\",\n \"reasoning\": [\n \"推理步骤1: 日志中 second_bedroom_temp_sensor 除了正常的 TemperatureMeasurement.MeasuredValue 上报外,还额外出现了多条仅标记为 MeasuredValue(缺少 Cluster 前缀 TemperatureMeasurement)的异常上报,时间点分别为 6/14 08:00、12:00、18:00、22:00 以及 6/15 和 6/16 的多个时间点。\",\n \"推理步骤2: 这些异常上报的数值与同一时刻正常上报值之间存在显著且一致的负偏差——08:00 正常值 2460 vs 异常值 2350(差 -110)、12:00 正常值 2582 vs 异常值 2510(差 -72)、18:00 正常值 2469 vs 异常值 2400(差 -69)、22:00 正常值 2358 vs 异常值 2280(差 -78)。这不是随机噪声,而是系统性偏低。\",\n \"推理步骤3: 从 6/15 开始,异常格式的上报仍在继续(08:00、12:00、18:00、22:00 以及 6/16 的 08:00、12:00),但正常格式的 TemperatureMeasurement.MeasuredValue 上报已完全消失,说明传感器的正常上报通道可能已经失效,仅剩异常通道在工作。\",\n \"推理步骤4: 6/15-6/16 的异常上报值全部固定为 2350(23.50°C),不再随环境温度变化,而同期其他房间传感器应有正常的昼夜温度波动。一个温度传感器持续输出固定值,高度指向传感器硬件故障或固件异常。\",\n \"推理步骤5: 其他三个温度传感器(客厅、主卧、厨房)全天的温度曲线一致且合理——夜间约 22.9-23.1°C,午间峰值约 25.7-25.9°C,符合 6 月夏季昼夜温差规律,排除了全局性环境异常。问题仅出现在次卧传感器上。\",\n \"推理步骤6: 上报属性名缺少 Cluster 前缀(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue)不符合 Matter 协议标准格式,可能是固件 bug 导致的非标上报,也不排除设备被恶意篡改后伪造数据的可能性。\"\n ],\n \"key_evidence\": [\n \"second_bedroom_temp_sensor 在 6/14 出现 4 次格式异常的 MeasuredValue 上报(缺少 TemperatureMeasurement Cluster 前缀),值系统性低于同时刻正常上报值\",\n \"从 6/15 起正常格式上报完全消失,仅剩异常格式上报,且读数固定为 2350 不再变化\",\n \"其他三个房间的温度传感器全天数据正常,排除环境因素\",\n \"异常上报间隔呈现规律性(约每 4-6 小时一次),与正常的每 30 分钟上报周期不同\"\n ],\n \"recommended_actions\": [\n \"立即检查次卧温度传感器的物理状态和固件版本,确认是否存在硬件故障\",\n \"对该传感器进行固件重刷或恢复出厂设置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报\",\n \"检查该设备的 Matter 协议通信日志,排查是否存在未授权的固件更新或配置篡改\",\n \"在传感器修复前,不要依赖次卧温度数据进行空调联动等自动化控制,避免因错误读数导致异常动作\",\n \"如果重置后问题仍存在,建议更换传感器硬件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "次卧温度传感器存在异常:周期性上报格式不规范的数据,且读数与同时刻正常上报值存在固定偏差,疑似传感器固件故障或被篡改。", "reasoning": ["推理步骤1: 日志中 second_bedroom_temp_sensor 除了正常的 TemperatureMeasurement.MeasuredValue 上报外,还额外出现了多条仅标记为 MeasuredValue(缺少 Cluster 前缀 TemperatureMeasurement)的异常上报,时间点分别为 6/14 08:00、12:00、18:00、22:00 以及 6/15 和 6/16 的多个时间点。", "推理步骤2: 这些异常上报的数值与同一时刻正常上报值之间存在显著且一致的负偏差——08:00 正常值 2460 vs 异常值 2350(差 -110)、12:00 正常值 2582 vs 异常值 2510(差 -72)、18:00 正常值 2469 vs 异常值 2400(差 -69)、22:00 正常值 2358 vs 异常值 2280(差 -78)。这不是随机噪声,而是系统性偏低。", "推理步骤3: 从 6/15 开始,异常格式的上报仍在继续(08:00、12:00、18:00、22:00 以及 6/16 的 08:00、12:00),但正常格式的 TemperatureMeasurement.MeasuredValue 上报已完全消失,说明传感器的正常上报通道可能已经失效,仅剩异常通道在工作。", "推理步骤4: 6/15-6/16 的异常上报值全部固定为 2350(23.50°C),不再随环境温度变化,而同期其他房间传感器应有正常的昼夜温度波动。一个温度传感器持续输出固定值,高度指向传感器硬件故障或固件异常。", "推理步骤5: 其他三个温度传感器(客厅、主卧、厨房)全天的温度曲线一致且合理——夜间约 22.9-23.1°C,午间峰值约 25.7-25.9°C,符合 6 月夏季昼夜温差规律,排除了全局性环境异常。问题仅出现在次卧传感器上。", "推理步骤6: 上报属性名缺少 Cluster 前缀(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue)不符合 Matter 协议标准格式,可能是固件 bug 导致的非标上报,也不排除设备被恶意篡改后伪造数据的可能性。"], "key_evidence": ["second_bedroom_temp_sensor 在 6/14 出现 4 次格式异常的 MeasuredValue 上报(缺少 TemperatureMeasurement Cluster 前缀),值系统性低于同时刻正常上报值", "从 6/15 起正常格式上报完全消失,仅剩异常格式上报,且读数固定为 2350 不再变化", "其他三个房间的温度传感器全天数据正常,排除环境因素", "异常上报间隔呈现规律性(约每 4-6 小时一次),与正常的每 30 分钟上报周期不同"], "recommended_actions": ["立即检查次卧温度传感器的物理状态和固件版本,确认是否存在硬件故障", "对该传感器进行固件重刷或恢复出厂设置,观察是否恢复正常的 TemperatureMeasurement.MeasuredValue 上报", "检查该设备的 Matter 协议通信日志,排查是否存在未授权的固件更新或配置篡改", "在传感器修复前,不要依赖次卧温度数据进行空调联动等自动化控制,避免因错误读数导致异常动作", "如果重置后问题仍存在,建议更换传感器硬件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.999258995056152, "api_error": null} {"episode_id": "SQ3_TP_B_0513", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0513.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261142, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-07T21:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在短时间内连续两次上锁失败并触发了锁定告警(AlarmCode=0),提示门锁可能存在机械或电气故障。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据方面,四个传感器全天呈现一致的昼夜变化曲线——凌晨约22.9°C,中午峰值约25.9°C,夜间回落至约23.3°C,各房间温差始终在2°C以内,属于夏季正常室温波动,无异常。\",\n \"推理步骤2: 在21:30:00,入户门锁收到第一次 LockDoor 命令,5秒后报告 LockState=2;紧接着21:30:10又收到第二次 LockDoor 命令,5秒后再次报告 LockState=2。Matter门锁协议中 LockState 枚举值:0=NotFullyLocked, 1=Locked, 2=Unlocked, 3=Unlatched。LockState=2 表示门锁仍处于未锁定状态,说明两次上锁命令均未成功执行。\",\n \"推理步骤3: 在第二次上锁失败后(21:30:15),门锁立即触发了 DoorLockAlarm 事件,AlarmCode=0 对应 'LockJammed'(锁舌卡住),这是门锁自检发现机械故障后主动上报的告警。\",\n \"推理步骤4: 两次上锁命令间隔仅10秒,像是系统自动重试机制。重试后仍然失败并触发告警,说明这不是偶发的通信延迟,而是门锁本身存在持续性的机械问题。\",\n \"推理步骤5: 整个24小时日志中没有任何入侵相关的辅助证据——无运动传感器触发、无门窗接触传感器状态变化、无其他异常设备活动,因此排除入侵可能,判定为设备故障。但门锁故障本身会导致入户门无法正常锁闭,存在间接安全隐患。\"\n ],\n \"key_evidence\": [\n \"21:30:00 和 21:30:10 连续两次 LockDoor 命令后,LockState 均为 2(Unlocked),上锁失败\",\n \"21:30:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁舌卡住告警\",\n \"入户门当前处于未锁定状态,存在物理安全风险\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁锁舌是否被异物卡住或存在机械磨损,尝试手动上锁确认门锁物理状态\",\n \"在门锁修复前,确保通过其他方式(如门链、插销)保障入户门的物理安全\",\n \"联系门锁厂商或专业锁匠检修,排查锁体、电机或锁舌导轨的机械故障\",\n \"检查门锁电池电量是否充足,低电量也可能导致电机驱动力不足而无法完成上锁动作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在短时间内连续两次上锁失败并触发了锁定告警(AlarmCode=0),提示门锁可能存在机械或电气故障。", "reasoning": ["推理步骤1: 温度数据方面,四个传感器全天呈现一致的昼夜变化曲线——凌晨约22.9°C,中午峰值约25.9°C,夜间回落至约23.3°C,各房间温差始终在2°C以内,属于夏季正常室温波动,无异常。", "推理步骤2: 在21:30:00,入户门锁收到第一次 LockDoor 命令,5秒后报告 LockState=2;紧接着21:30:10又收到第二次 LockDoor 命令,5秒后再次报告 LockState=2。Matter门锁协议中 LockState 枚举值:0=NotFullyLocked, 1=Locked, 2=Unlocked, 3=Unlatched。LockState=2 表示门锁仍处于未锁定状态,说明两次上锁命令均未成功执行。", "推理步骤3: 在第二次上锁失败后(21:30:15),门锁立即触发了 DoorLockAlarm 事件,AlarmCode=0 对应 'LockJammed'(锁舌卡住),这是门锁自检发现机械故障后主动上报的告警。", "推理步骤4: 两次上锁命令间隔仅10秒,像是系统自动重试机制。重试后仍然失败并触发告警,说明这不是偶发的通信延迟,而是门锁本身存在持续性的机械问题。", "推理步骤5: 整个24小时日志中没有任何入侵相关的辅助证据——无运动传感器触发、无门窗接触传感器状态变化、无其他异常设备活动,因此排除入侵可能,判定为设备故障。但门锁故障本身会导致入户门无法正常锁闭,存在间接安全隐患。"], "key_evidence": ["21:30:00 和 21:30:10 连续两次 LockDoor 命令后,LockState 均为 2(Unlocked),上锁失败", "21:30:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁舌卡住告警", "入户门当前处于未锁定状态,存在物理安全风险"], "recommended_actions": ["立即检查入户门锁锁舌是否被异物卡住或存在机械磨损,尝试手动上锁确认门锁物理状态", "在门锁修复前,确保通过其他方式(如门链、插销)保障入户门的物理安全", "联系门锁厂商或专业锁匠检修,排查锁体、电机或锁舌导轨的机械故障", "检查门锁电池电量是否充足,低电量也可能导致电机驱动力不足而无法完成上锁动作"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.50759720802307, "api_error": null} {"episode_id": "SQ3_TP_B_0532", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0532.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261161, "scenario_id": "FG-02", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-06T05:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨5点厨房温度传感器出现剧烈异常飙升并触发烟雾报警,且11点厨房温度再次异常偏高,同时传感器多次报告null值,存在火灾风险与设备故障双重隐患。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨00:00-05:00期间全屋温度稳定在22.9-23.1°C范围,属于夏季夜间正常水平。但在05:06厨房温度突然从约23.0°C飙升至37.35°C(MeasuredValue=3735),05:11仍高达32.0°C(MeasuredValue=3200),短短6分钟内升温超过14°C,这在无人操作灶具的情况下极不正常。\",\n \"推理步骤2: 05:16烟雾报警器触发(SmokeState=1),与厨房温度异常飙升在时间上高度吻合(间隔仅10分钟),形成了'温度骤升→烟雾报警'的火灾特征链。此时段无灶具开启记录、无人员活动记录,排除正常烹饪导致的可能。\",\n \"推理步骤3: 05:30厨房温度恢复至23.02°C,烟雾报警后无后续火灾扩散迹象(其他房间温度未受影响),说明可能是短暂的热源事件(如电器短路、小型明火)自行熄灭,或为传感器故障产生的异常读数。但烟雾报警器同步触发增加了真实热源事件的可信度。\",\n \"推理步骤4: 11:00和11:30厨房温度再次异常,分别达到29.57°C和29.53°C(MeasuredValue=2957/2953),而同时段其他房间温度仅约25.5°C,厨房比其他房间高出约4°C。此时段无灶具开启记录,这一异常偏差无法用正常环境因素解释。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(09:08、09:42、11:58、12:26、17:46、18:52),共6次。虽然部分可能与灶具高温导致传感器量程溢出有关,但频率过高,提示传感器本身可能存在间歇性故障,这也可能是凌晨异常读数的原因之一。\",\n \"推理步骤6: 日间住户活动模式正常——08:55起床如厕、09:07开始做早餐、11:57做午餐、17:45做晚餐、22:46关灯锁门就寝,灶具使用后开窗通风,均为合理的生活习惯。入户门锁自动上锁、无异常开锁事件,排除入侵可能。\"\n ],\n \"key_evidence\": [\n \"05:06厨房温度从~23°C骤升至37.35°C,05:11仍达32°C,期间无灶具开启、无人员活动\",\n \"05:16烟雾报警器触发(SmokeState=1),与温度异常时间高度关联\",\n \"11:00-11:30厨房温度异常达29.5°C,高出同时段其他房间约4°C,无灶具使用记录\",\n \"厨房温度传感器全天6次报告null值,存在间歇性故障嫌疑\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房是否存在隐患热源,重点排查电器线路、插座、冰箱压缩机等可能在无人操作时产生高温的设备\",\n \"检查厨房烟雾报警器状态,确认05:16的报警是否已复位,若仍处于报警状态需现场排查\",\n \"对厨房温度传感器进行校准或更换,频繁的null值和异常读数表明设备可能存在硬件故障\",\n \"检查11点前后厨房是否有阳光直射传感器、或其他局部热源导致的温度偏高\",\n \"建议在厨房增设独立的温度监测设备进行交叉验证,避免单一传感器故障导致误判或漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨5点厨房温度传感器出现剧烈异常飙升并触发烟雾报警,且11点厨房温度再次异常偏高,同时传感器多次报告null值,存在火灾风险与设备故障双重隐患。", "reasoning": ["推理步骤1: 凌晨00:00-05:00期间全屋温度稳定在22.9-23.1°C范围,属于夏季夜间正常水平。但在05:06厨房温度突然从约23.0°C飙升至37.35°C(MeasuredValue=3735),05:11仍高达32.0°C(MeasuredValue=3200),短短6分钟内升温超过14°C,这在无人操作灶具的情况下极不正常。", "推理步骤2: 05:16烟雾报警器触发(SmokeState=1),与厨房温度异常飙升在时间上高度吻合(间隔仅10分钟),形成了'温度骤升→烟雾报警'的火灾特征链。此时段无灶具开启记录、无人员活动记录,排除正常烹饪导致的可能。", "推理步骤3: 05:30厨房温度恢复至23.02°C,烟雾报警后无后续火灾扩散迹象(其他房间温度未受影响),说明可能是短暂的热源事件(如电器短路、小型明火)自行熄灭,或为传感器故障产生的异常读数。但烟雾报警器同步触发增加了真实热源事件的可信度。", "推理步骤4: 11:00和11:30厨房温度再次异常,分别达到29.57°C和29.53°C(MeasuredValue=2957/2953),而同时段其他房间温度仅约25.5°C,厨房比其他房间高出约4°C。此时段无灶具开启记录,这一异常偏差无法用正常环境因素解释。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(09:08、09:42、11:58、12:26、17:46、18:52),共6次。虽然部分可能与灶具高温导致传感器量程溢出有关,但频率过高,提示传感器本身可能存在间歇性故障,这也可能是凌晨异常读数的原因之一。", "推理步骤6: 日间住户活动模式正常——08:55起床如厕、09:07开始做早餐、11:57做午餐、17:45做晚餐、22:46关灯锁门就寝,灶具使用后开窗通风,均为合理的生活习惯。入户门锁自动上锁、无异常开锁事件,排除入侵可能。"], "key_evidence": ["05:06厨房温度从~23°C骤升至37.35°C,05:11仍达32°C,期间无灶具开启、无人员活动", "05:16烟雾报警器触发(SmokeState=1),与温度异常时间高度关联", "11:00-11:30厨房温度异常达29.5°C,高出同时段其他房间约4°C,无灶具使用记录", "厨房温度传感器全天6次报告null值,存在间歇性故障嫌疑"], "recommended_actions": ["立即检查厨房是否存在隐患热源,重点排查电器线路、插座、冰箱压缩机等可能在无人操作时产生高温的设备", "检查厨房烟雾报警器状态,确认05:16的报警是否已复位,若仍处于报警状态需现场排查", "对厨房温度传感器进行校准或更换,频繁的null值和异常读数表明设备可能存在硬件故障", "检查11点前后厨房是否有阳光直射传感器、或其他局部热源导致的温度偏高", "建议在厨房增设独立的温度监测设备进行交叉验证,避免单一传感器故障导致误判或漏报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.539514541625977, "api_error": null} {"episode_id": "SQ3_TP_B_0538", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0538.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261167, "scenario_id": "BA-04", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-16T23:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"深夜23:51阳台门被打开,主卧检测到人体活动但客厅无人,且入户门未有开锁记录,存在非正常入侵嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息模式分析——06:05起床,07:24出门上班,18:08回家,22:24关灯/锁门/进主卧就寝,符合单人独居的规律作息。\",\n \"推理步骤2: 22:24入户门关闭并自动上锁(LockState=1),主卧灯关闭,住户已入睡。此后至23:50无任何人体活动或设备操作事件。\",\n \"推理步骤3: 23:51:00 阳台门传感器触发(StateValue=False,即门被打开),这是当天阳台门首次出现开启事件,时间点为深夜近午夜。\",\n \"推理步骤4: 23:51:03 主卧运动传感器检测到人体(Occupancy=1),同时客厅运动传感器显示无人(Occupancy=0)。如果是住户自己去开阳台门,应先经过客厅触发客厅运动传感器,但客厅传感器反而变为0。\",\n \"推理步骤5: 入户门在16:24被开锁进入后一直处于开启状态(无关门记录),直到22:24才关闭上锁。但阳台门事件发生时入户门无任何新的开锁记录,排除从正门进入的可能。\",\n \"推理步骤6: 阳台门从外部被打开、客厅无人而主卧有人的组合模式,提示可能有人从阳台方向进入,而非住户自身的正常活动。\",\n \"推理步骤7: 置信度定为medium而非high,因为也存在其他可能性:住户可能从主卧直接到达阳台(如果户型允许主卧直通阳台),或者是风吹开了未锁好的阳台门导致传感器触发,同时主卧的occupancy是住户翻身触发。但客厅occupancy同时变为0这一点仍然可疑。\"\n ],\n \"key_evidence\": [\n \"23:51:00 阳台门传感器打开(balcony_door_contact StateValue=False),为当天首次且发生在深夜\",\n \"23:51:03 主卧运动传感器触发(Occupancy=1)而客厅运动传感器同时显示无人(Occupancy=0),不符合住户从室内前往阳台的动线\",\n \"入户门在22:24已上锁(LockState=1),此后无任何开锁事件,排除正门进入\",\n \"16:24至22:24期间入户门长时间未关闭(约6小时无关门记录),存在安全隐患\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级告警,确认是否为本人操作\",\n \"如有阳台摄像头或室内摄像头,立即调取23:51前后的实时画面\",\n \"自动开启客厅和阳台灯光,起到威慑作用\",\n \"如住户未响应确认,考虑触发报警或通知物业/安保\",\n \"建议住户检查阳台门锁具状态,日常离家和就寝前确保阳台门锁闭\",\n \"建议在阳台区域增设运动传感器或摄像头,补充监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "深夜23:51阳台门被打开,主卧检测到人体活动但客厅无人,且入户门未有开锁记录,存在非正常入侵嫌疑。", "reasoning": ["推理步骤1: 住户作息模式分析——06:05起床,07:24出门上班,18:08回家,22:24关灯/锁门/进主卧就寝,符合单人独居的规律作息。", "推理步骤2: 22:24入户门关闭并自动上锁(LockState=1),主卧灯关闭,住户已入睡。此后至23:50无任何人体活动或设备操作事件。", "推理步骤3: 23:51:00 阳台门传感器触发(StateValue=False,即门被打开),这是当天阳台门首次出现开启事件,时间点为深夜近午夜。", "推理步骤4: 23:51:03 主卧运动传感器检测到人体(Occupancy=1),同时客厅运动传感器显示无人(Occupancy=0)。如果是住户自己去开阳台门,应先经过客厅触发客厅运动传感器,但客厅传感器反而变为0。", "推理步骤5: 入户门在16:24被开锁进入后一直处于开启状态(无关门记录),直到22:24才关闭上锁。但阳台门事件发生时入户门无任何新的开锁记录,排除从正门进入的可能。", "推理步骤6: 阳台门从外部被打开、客厅无人而主卧有人的组合模式,提示可能有人从阳台方向进入,而非住户自身的正常活动。", "推理步骤7: 置信度定为medium而非high,因为也存在其他可能性:住户可能从主卧直接到达阳台(如果户型允许主卧直通阳台),或者是风吹开了未锁好的阳台门导致传感器触发,同时主卧的occupancy是住户翻身触发。但客厅occupancy同时变为0这一点仍然可疑。"], "key_evidence": ["23:51:00 阳台门传感器打开(balcony_door_contact StateValue=False),为当天首次且发生在深夜", "23:51:03 主卧运动传感器触发(Occupancy=1)而客厅运动传感器同时显示无人(Occupancy=0),不符合住户从室内前往阳台的动线", "入户门在22:24已上锁(LockState=1),此后无任何开锁事件,排除正门进入", "16:24至22:24期间入户门长时间未关闭(约6小时无关门记录),存在安全隐患"], "recommended_actions": ["立即向住户手机推送高优先级告警,确认是否为本人操作", "如有阳台摄像头或室内摄像头,立即调取23:51前后的实时画面", "自动开启客厅和阳台灯光,起到威慑作用", "如住户未响应确认,考虑触发报警或通知物业/安保", "建议住户检查阳台门锁具状态,日常离家和就寝前确保阳台门锁闭", "建议在阳台区域增设运动传感器或摄像头,补充监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.50802969932556, "api_error": null} {"episode_id": "SQ3_TP_B_0539", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0539.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261168, "scenario_id": "BA-05", "total_events": 238, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T04:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;另外 16:00 入户门解锁开门后未见关门和上锁记录,存在门户安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:17、18:22、19:14 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。虽然可能是灶具辐射热导致传感器暂时超量程,但正常传感器应报告上限值而非 None,这提示传感器可能存在故障或安装位置不当。\",\n \"推理步骤2: 16:00 入户门锁被手动解锁(LockOperationType=1),门传感器显示门打开(StateValue=False),玄关检测到有人,但之后日志中直到 22:47 才出现门关闭(StateValue=True)和自动上锁记录。这意味着入户门在无人看管的情况下可能长时间处于未关闭/未上锁状态。\",\n \"推理步骤3: 04:31 客厅运动传感器检测到占用,但当时全屋灯光均关闭、无任何人为操作跟随,且住户约 05:56 才在主卧起床。凌晨的孤立运动事件可能是宠物、传感器误触发,也不能完全排除入侵可能,但因无后续异常活动,置信度不高。\",\n \"推理步骤4: 其余行为模式正常——住户约 06:00 起床、07:04 做早餐、07:19 出门并自动上锁、17:55 回家开灯开空调、18:21 做晚餐、22:47 睡前关灯锁门,符合典型单人上班族作息。\",\n \"推理步骤5: 温度整体趋势合理:夜间约 23°C,白天随气温升至 25-26°C,傍晚开空调后逐步降温,无异常高温或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None(07:05、07:17、18:22、19:14),均与灶具操作时间高度相关\",\n \"16:00 入户门解锁开门后,直到 22:47 才有关门上锁记录,中间近 7 小时无门状态变化\",\n \"04:31 凌晨客厅运动传感器触发,无后续任何人为活动佐证\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致超量程;如传感器本身故障建议更换\",\n \"核实 16:00 至 22:47 期间入户门的实际状态——如确实长时间未关,建议设置门未关超时告警自动化规则\",\n \"对 04:31 凌晨运动事件保持关注,如反复出现建议排查是否有宠物活动或传感器灵敏度过高,必要时查看摄像头回放\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;另外 16:00 入户门解锁开门后未见关门和上锁记录,存在门户安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:17、18:22、19:14 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。虽然可能是灶具辐射热导致传感器暂时超量程,但正常传感器应报告上限值而非 None,这提示传感器可能存在故障或安装位置不当。", "推理步骤2: 16:00 入户门锁被手动解锁(LockOperationType=1),门传感器显示门打开(StateValue=False),玄关检测到有人,但之后日志中直到 22:47 才出现门关闭(StateValue=True)和自动上锁记录。这意味着入户门在无人看管的情况下可能长时间处于未关闭/未上锁状态。", "推理步骤3: 04:31 客厅运动传感器检测到占用,但当时全屋灯光均关闭、无任何人为操作跟随,且住户约 05:56 才在主卧起床。凌晨的孤立运动事件可能是宠物、传感器误触发,也不能完全排除入侵可能,但因无后续异常活动,置信度不高。", "推理步骤4: 其余行为模式正常——住户约 06:00 起床、07:04 做早餐、07:19 出门并自动上锁、17:55 回家开灯开空调、18:21 做晚餐、22:47 睡前关灯锁门,符合典型单人上班族作息。", "推理步骤5: 温度整体趋势合理:夜间约 23°C,白天随气温升至 25-26°C,傍晚开空调后逐步降温,无异常高温或火灾迹象。"], "key_evidence": ["厨房温度传感器 4 次报告 None(07:05、07:17、18:22、19:14),均与灶具操作时间高度相关", "16:00 入户门解锁开门后,直到 22:47 才有关门上锁记录,中间近 7 小时无门状态变化", "04:31 凌晨客厅运动传感器触发,无后续任何人为活动佐证"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距灶具过近导致超量程;如传感器本身故障建议更换", "核实 16:00 至 22:47 期间入户门的实际状态——如确实长时间未关,建议设置门未关超时告警自动化规则", "对 04:31 凌晨运动事件保持关注,如反复出现建议排查是否有宠物活动或传感器灵敏度过高,必要时查看摄像头回放"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.213465452194214, "api_error": null} {"episode_id": "SQ3_TP_B_0559", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_B_0559.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261188, "scenario_id": "FG-01", "total_events": 244, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-12T16:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"16:53 开启灶具后厨房温度急剧飙升并触发烟雾报警,存在明显的火灾/干烧风险,且入户门处于未锁未关状态长达近2小时。\",\n \"reasoning\": [\n \"推理步骤1: 16:21 入户门通过手动方式解锁开门,玄关检测到有人进入,但此后直到 18:09 之前没有关门/锁门记录,说明入户门在近2小时内处于开启未锁状态。\",\n \"推理步骤2: 16:53 厨房灶具开启,但日志中没有厨房灯开启的记录,也没有厨房区域的运动传感器(该房间未配置运动传感器,无法确认是否有人在场)。结合次卧运动传感器在 16:53 显示 Occupancy=0,无法确认是否有人在厨房看管灶具。\",\n \"推理步骤3: 16:58 厨房温度传感器报告 2838(约28.38°C),而同一时刻其他房间温度约为 24.7-24.9°C,厨房温度比其他房间高出约 3.5°C,这是灶具刚开启5分钟的正常升温。\",\n \"推理步骤4: 17:03 厨房温度飙升至 3500(约35.00°C),仅5分钟内从28.38°C跳升至35°C,升温速率异常剧烈(约6.6°C/5min),远超正常烹饪的温度变化。而同时刻(17:00)厨房常规温度读数为 2475(24.75°C),出现了两个矛盾的读数,说明 17:03 的 3500 是灶具附近的极端高温。\",\n \"推理步骤5: 17:08 厨房烟雾报警器触发——SmokeState=1(检测到烟雾)、ExpressedState=1(报警激活)、并产生 SmokeAlarm 事件。这是整个日志中唯一的烟雾报警事件,确认厨房出现了真实的烟雾。\",\n \"推理步骤6: 从 16:53 灶具开启到 17:08 烟雾报警触发,期间约15分钟,没有任何人为干预的记录(没有关灶、没有开窗、没有开灯),强烈暗示灶具处于无人看管状态下干烧。\",\n \"推理步骤7: 烟雾报警触发后,日志中也没有立即的灶具关闭记录。直到 18:09 才有人回家(入户门再次解锁),18:21 才重新开始正常的厨房操作。这意味着灶具可能在无人看管的情况下持续运行了较长时间。\",\n \"推理步骤8: 对比早晨 06:38 的正常烹饪模式——开灯→开灶→做饭约20分钟→关灶→开窗通风,流程完整且有人在场。而 16:53 的事件缺少开灯、缺少关灶、缺少通风操作,模式明显异常。\",\n \"推理步骤9: 另外注意到厨房温度传感器多次报告 None 值(06:39、06:59、18:22、19:06),均出现在灶具使用期间,可能是高温导致传感器暂时超出量程或故障,这也是一个设备健康隐患。\"\n ],\n \"key_evidence\": [\n \"16:53 灶具开启,但无厨房灯开启记录,无明确有人看管的证据\",\n \"16:58 厨房温度 2838(28.38°C)→ 17:03 飙升至 3500(35.00°C),5分钟内升温约6.6°C,速率异常\",\n \"17:08 烟雾报警器触发:SmokeState=1, ExpressedState=1, SmokeAlarm 事件\",\n \"16:53 至 18:09 期间(约75分钟)无任何人为关灶或干预操作记录\",\n \"16:21 入户门解锁开门后,直到 22:10 才有关门锁门记录,门长时间处于未关闭状态\",\n \"厨房温度传感器多次报告 None 值,可能存在传感器过热故障\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(如支持远程控制),防止持续干烧引发火灾\",\n \"向住户手机发送高优先级火灾风险告警通知,提示厨房烟雾报警已触发\",\n \"如住户无法及时响应,考虑联系物业或消防部门进行现场确认\",\n \"建议设置自动化规则:灶具开启超过一定时间且无人活动时自动关闭灶具并发出警告\",\n \"检查厨房温度传感器的健康状态,多次 None 值可能表明传感器需要维护或更换\",\n \"建议设置入户门未关闭超时提醒,16:21 开门后长时间未关存在安全隐患\",\n \"建议在厨房增设运动传感器,以便更准确判断烹饪时是否有人在场\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "16:53 开启灶具后厨房温度急剧飙升并触发烟雾报警,存在明显的火灾/干烧风险,且入户门处于未锁未关状态长达近2小时。", "reasoning": ["推理步骤1: 16:21 入户门通过手动方式解锁开门,玄关检测到有人进入,但此后直到 18:09 之前没有关门/锁门记录,说明入户门在近2小时内处于开启未锁状态。", "推理步骤2: 16:53 厨房灶具开启,但日志中没有厨房灯开启的记录,也没有厨房区域的运动传感器(该房间未配置运动传感器,无法确认是否有人在场)。结合次卧运动传感器在 16:53 显示 Occupancy=0,无法确认是否有人在厨房看管灶具。", "推理步骤3: 16:58 厨房温度传感器报告 2838(约28.38°C),而同一时刻其他房间温度约为 24.7-24.9°C,厨房温度比其他房间高出约 3.5°C,这是灶具刚开启5分钟的正常升温。", "推理步骤4: 17:03 厨房温度飙升至 3500(约35.00°C),仅5分钟内从28.38°C跳升至35°C,升温速率异常剧烈(约6.6°C/5min),远超正常烹饪的温度变化。而同时刻(17:00)厨房常规温度读数为 2475(24.75°C),出现了两个矛盾的读数,说明 17:03 的 3500 是灶具附近的极端高温。", "推理步骤5: 17:08 厨房烟雾报警器触发——SmokeState=1(检测到烟雾)、ExpressedState=1(报警激活)、并产生 SmokeAlarm 事件。这是整个日志中唯一的烟雾报警事件,确认厨房出现了真实的烟雾。", "推理步骤6: 从 16:53 灶具开启到 17:08 烟雾报警触发,期间约15分钟,没有任何人为干预的记录(没有关灶、没有开窗、没有开灯),强烈暗示灶具处于无人看管状态下干烧。", "推理步骤7: 烟雾报警触发后,日志中也没有立即的灶具关闭记录。直到 18:09 才有人回家(入户门再次解锁),18:21 才重新开始正常的厨房操作。这意味着灶具可能在无人看管的情况下持续运行了较长时间。", "推理步骤8: 对比早晨 06:38 的正常烹饪模式——开灯→开灶→做饭约20分钟→关灶→开窗通风,流程完整且有人在场。而 16:53 的事件缺少开灯、缺少关灶、缺少通风操作,模式明显异常。", "推理步骤9: 另外注意到厨房温度传感器多次报告 None 值(06:39、06:59、18:22、19:06),均出现在灶具使用期间,可能是高温导致传感器暂时超出量程或故障,这也是一个设备健康隐患。"], "key_evidence": ["16:53 灶具开启,但无厨房灯开启记录,无明确有人看管的证据", "16:58 厨房温度 2838(28.38°C)→ 17:03 飙升至 3500(35.00°C),5分钟内升温约6.6°C,速率异常", "17:08 烟雾报警器触发:SmokeState=1, ExpressedState=1, SmokeAlarm 事件", "16:53 至 18:09 期间(约75分钟)无任何人为关灶或干预操作记录", "16:21 入户门解锁开门后,直到 22:10 才有关门锁门记录,门长时间处于未关闭状态", "厨房温度传感器多次报告 None 值,可能存在传感器过热故障"], "recommended_actions": ["立即远程关闭厨房灶具(如支持远程控制),防止持续干烧引发火灾", "向住户手机发送高优先级火灾风险告警通知,提示厨房烟雾报警已触发", "如住户无法及时响应,考虑联系物业或消防部门进行现场确认", "建议设置自动化规则:灶具开启超过一定时间且无人活动时自动关闭灶具并发出警告", "检查厨房温度传感器的健康状态,多次 None 值可能表明传感器需要维护或更换", "建议设置入户门未关闭超时提醒,16:21 开门后长时间未关存在安全隐患", "建议在厨房增设运动传感器,以便更准确判断烹饪时是否有人在场"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 35.504549980163574, "api_error": null} {"episode_id": "SQ3_TP_C_0431", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0431.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261060, "scenario_id": "BA-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-26T04:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;凌晨 2:30 出现无后续解释的活动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:11、07:31、18:22、18:56 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器在高温环境下工作不稳定,可能存在硬件故障或连接问题。\",\n \"推理步骤2: 凌晨 02:30-02:40,客厅运动传感器检测到活动,随后客厅主灯和厨房灯被打开,玄关也检测到运动。这个时间段全家应处于睡眠状态,但没有入户门开锁/开门记录,说明是家庭成员内部活动(如起夜喝水),属于可解释行为,但灯在之后未见关闭记录,直到早上 07:39 才统一关灯,存在轻微异常。\",\n \"推理步骤3: 整体生活模式合理——06:16 主卧起床、06:29 儿童房起床、07:10 做早餐、07:30 早餐、07:39 全家出门并自动锁门;16:17 孩子放学回家、18:20 大人回家做晚饭、20:48 孩子就寝、22:17 大人就寝。入户门的开锁/关锁操作均正常配对,无未授权入侵迹象。\",\n \"推理步骤4: 温度趋势正常,符合夏季昼夜变化规律:夜间约 22.9-23.1°C,午间峰值约 25.7-25.8°C,傍晚逐步回落。客厅空调 18:20 开启制冷(SystemMode=3),22:17 关闭,温度从约 24.7°C 降至约 23.6°C,表现合理。\",\n \"推理步骤5: 厨房窗户在 07:30 和 18:55 打开(StateValue=False),均在做饭后通风,属正常行为,但日志中未见对应的关闭记录(StateValue=True),可能是窗户一直保持打开状态,外出期间厨房窗户未关存在一定安全隐患。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为 Manual 开锁 + Auto 自动上锁的正常配对,无异常安全事件。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:11、07:31、18:22、18:56 四次报告 MeasuredValue = None,指示传感器故障\",\n \"厨房窗户 07:30 和 18:55 两次打开,日志中无对应关闭记录,外出期间窗户可能处于开启状态\",\n \"凌晨 02:30-02:40 客厅和玄关出现活动,02:35 开灯后无关灯记录直到次日早晨\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,确保其在灶具使用时能正常工作\",\n \"确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;建议设置外出模式自动检查门窗关闭状态\",\n \"考虑为凌晨开灯设置自动关闭超时策略,避免无人区域长时间亮灯造成能源浪费\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;凌晨 2:30 出现无后续解释的活动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:11、07:31、18:22、18:56 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器在高温环境下工作不稳定,可能存在硬件故障或连接问题。", "推理步骤2: 凌晨 02:30-02:40,客厅运动传感器检测到活动,随后客厅主灯和厨房灯被打开,玄关也检测到运动。这个时间段全家应处于睡眠状态,但没有入户门开锁/开门记录,说明是家庭成员内部活动(如起夜喝水),属于可解释行为,但灯在之后未见关闭记录,直到早上 07:39 才统一关灯,存在轻微异常。", "推理步骤3: 整体生活模式合理——06:16 主卧起床、06:29 儿童房起床、07:10 做早餐、07:30 早餐、07:39 全家出门并自动锁门;16:17 孩子放学回家、18:20 大人回家做晚饭、20:48 孩子就寝、22:17 大人就寝。入户门的开锁/关锁操作均正常配对,无未授权入侵迹象。", "推理步骤4: 温度趋势正常,符合夏季昼夜变化规律:夜间约 22.9-23.1°C,午间峰值约 25.7-25.8°C,傍晚逐步回落。客厅空调 18:20 开启制冷(SystemMode=3),22:17 关闭,温度从约 24.7°C 降至约 23.6°C,表现合理。", "推理步骤5: 厨房窗户在 07:30 和 18:55 打开(StateValue=False),均在做饭后通风,属正常行为,但日志中未见对应的关闭记录(StateValue=True),可能是窗户一直保持打开状态,外出期间厨房窗户未关存在一定安全隐患。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为 Manual 开锁 + Auto 自动上锁的正常配对,无异常安全事件。"], "key_evidence": ["厨房温度传感器在 07:11、07:31、18:22、18:56 四次报告 MeasuredValue = None,指示传感器故障", "厨房窗户 07:30 和 18:55 两次打开,日志中无对应关闭记录,外出期间窗户可能处于开启状态", "凌晨 02:30-02:40 客厅和玄关出现活动,02:35 开灯后无关灯记录直到次日早晨"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,确保其在灶具使用时能正常工作", "确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;建议设置外出模式自动检查门窗关闭状态", "考虑为凌晨开灯设置自动关闭超时策略,避免无人区域长时间亮灯造成能源浪费"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.502692699432373, "api_error": null} {"episode_id": "SQ3_TP_C_0441", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0441.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261070, "scenario_id": "CH-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01", "scenario_name": "儿童独自在家异常", "category": "child_specific", "is_anomaly": true, "threat_type": "child_alone_unexpected", "key_evidence": ["工作日上午学校时段", "家长已出门(LockOperation 记录)", "仅儿童房有活动信号,其他房间无人", "活动模式像小孩(仅在一个房间)"], "expected_response": "通知家长确认孩子是否生病在家/逃学", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-28T22:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"过去24小时内家庭设备状态正常,未发现安全威胁或异常行为模式。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个房间的温度传感器在24小时内呈现一致的自然昼夜变化曲线:凌晨最低约22.9°C,中午峰值约25.9°C,晚间回落至23.3°C左右。各房间温差始终在1°C以内,无任何单点异常升温(排除火灾风险)或骤降(排除门窗异常敞开)。\",\n \"推理步骤2: 门锁事件分析——07:30 入户门锁记录了一次 LockOperationType=1(解锁,UserIndex=1 为已注册用户)随后立即 LockOperationType=0(上锁)。这符合住户早晨出门的典型模式:用已授权凭证开锁、出门、随即锁门。无未授权用户解锁、暴力开锁或异常时段的门锁操作。\",\n \"推理步骤3: 人体活动分析——09:00 儿童房运动传感器检测到有人(Occupancy=1),同时儿童房灯打开。这是周末(2026-06-28为周日)孩子晚起的正常行为,时间合理,且灯光与运动传感器联动一致,不存在无人时灯光异常开启的情况。\",\n \"推理步骤4: 安全设备静默确认——整个24小时内,烟雾报警器(厨房、客厅)无告警事件,漏水传感器(厨房、主卫、次卫)无触发,所有门窗接触传感器无异常开合报告。这表明无火灾、漏水或入侵迹象。\",\n \"推理步骤5: 设备活跃度评估——除温度传感器的周期性上报外,仅有3条非温度事件(门锁开关、儿童房运动+灯光),整体设备活动极少,符合家中大部分时间无人或安静状态的特征。无设备频繁离线/上线等故障迹象。\"\n ],\n \"key_evidence\": [\n \"四个房间温度在22.9°C~25.9°C之间平稳波动,呈标准昼夜曲线,各房间高度一致\",\n \"07:30 入户门锁由已授权用户(UserIndex=1)正常解锁后立即上锁,符合出门场景\",\n \"09:00 儿童房运动传感器与灯光联动触发,符合周末孩子起床的正常行为\",\n \"全天无烟雾报警、漏水报警、门窗异常开合等安全告警事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"可考虑在住户外出期间(07:30之后)启用离家安防模式,以便在门窗异常开合时及时告警\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "过去24小时内家庭设备状态正常,未发现安全威胁或异常行为模式。", "reasoning": ["推理步骤1: 温度数据分析——四个房间的温度传感器在24小时内呈现一致的自然昼夜变化曲线:凌晨最低约22.9°C,中午峰值约25.9°C,晚间回落至23.3°C左右。各房间温差始终在1°C以内,无任何单点异常升温(排除火灾风险)或骤降(排除门窗异常敞开)。", "推理步骤2: 门锁事件分析——07:30 入户门锁记录了一次 LockOperationType=1(解锁,UserIndex=1 为已注册用户)随后立即 LockOperationType=0(上锁)。这符合住户早晨出门的典型模式:用已授权凭证开锁、出门、随即锁门。无未授权用户解锁、暴力开锁或异常时段的门锁操作。", "推理步骤3: 人体活动分析——09:00 儿童房运动传感器检测到有人(Occupancy=1),同时儿童房灯打开。这是周末(2026-06-28为周日)孩子晚起的正常行为,时间合理,且灯光与运动传感器联动一致,不存在无人时灯光异常开启的情况。", "推理步骤4: 安全设备静默确认——整个24小时内,烟雾报警器(厨房、客厅)无告警事件,漏水传感器(厨房、主卫、次卫)无触发,所有门窗接触传感器无异常开合报告。这表明无火灾、漏水或入侵迹象。", "推理步骤5: 设备活跃度评估——除温度传感器的周期性上报外,仅有3条非温度事件(门锁开关、儿童房运动+灯光),整体设备活动极少,符合家中大部分时间无人或安静状态的特征。无设备频繁离线/上线等故障迹象。"], "key_evidence": ["四个房间温度在22.9°C~25.9°C之间平稳波动,呈标准昼夜曲线,各房间高度一致", "07:30 入户门锁由已授权用户(UserIndex=1)正常解锁后立即上锁,符合出门场景", "09:00 儿童房运动传感器与灯光联动触发,符合周末孩子起床的正常行为", "全天无烟雾报警、漏水报警、门窗异常开合等安全告警事件"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "可考虑在住户外出期间(07:30之后)启用离家安防模式,以便在门窗异常开合时及时告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.269179344177246, "api_error": null} {"episode_id": "SQ3_TP_C_0432", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0432.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261061, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-22T21:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"21:21 入户门锁在30秒内连续4次解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 21:21:00 至 21:21:40,入户门锁连续报告 4 次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/外部操作来源,OperationError=1 表示凭证无效(错误PIN或错误凭证)。4次失败集中在40秒内,频率极高。\",\n \"推理步骤2: 紧接着 21:21:50 触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"Wrong Code Entry Limit\"报警,即错误密码尝试次数超限,门锁主动触发安全告警。这是门锁内置的防暴力破解机制被激活的标志。\",\n \"推理步骤3: 此时家中有人——18:03 家庭成员回家后客厅灯和空调开启,16:16 儿童已回家,晚间活动正常进行中。但 21:21 的解锁尝试并非来自家庭成员的正常操作:当天所有成功的开锁操作均为 OperationSource=Manual(手动/物理操作),而此次失败尝试来源为 OperationSource=3(远程/键盘输入),且全部失败。\",\n \"推理步骤4: 排除误报可能性——如果是家庭成员忘记密码,通常会在1-2次失败后改用其他方式(如手动钥匙),不会在30秒内连续尝试4次直到触发报警。这种高频、短时间、全部失败的模式更符合暴力破解或试探性攻击的特征。\",\n \"推理步骤5: 附带发现——厨房温度传感器在 07:02 和 18:36 灶具开启后报告 MeasuredValue=None,属于设备故障(传感器在高温环境下读数异常或通信中断),但这是次要问题,不构成安全威胁。另外 16:16 入户门开锁后未见关门和上锁记录,直到 22:27 才确认门关闭并自动上锁,期间入户门可能处于未锁状态长达6小时,增加了安全风险。\"\n ],\n \"key_evidence\": [\n \"21:21:00-21:21:40 入户门锁连续4次 LockOperationError(OperationError=1, OperationSource=3),40秒内密集失败\",\n \"21:21:50 触发 DoorLockAlarm(AlarmCode=3)——错误密码尝试超限报警\",\n \"失败尝试的 OperationSource=3(远程/键盘)与当天正常开锁的 OperationSource=Manual 不同\",\n \"16:16 开门后至 22:27 期间无关门/上锁记录,入户门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"立即确认家庭所有成员是否安全,检查入户门当前状态是否已锁好\",\n \"查看门锁的详细访问日志和门口摄像头(如有)录像,确认 21:21 时段是否有可疑人员\",\n \"立即更换入户门锁密码,并检查是否有未授权的远程访问凭证被添加\",\n \"启用门锁的入侵锁定功能(连续失败后一定时间内禁止再次尝试),如尚未启用\",\n \"考虑在玄关增加摄像头或设置门锁失败告警的即时推送通知\",\n \"排查厨房温度传感器故障问题——灶具使用时传感器多次报告 None 值,建议检查传感器位置或更换设备\",\n \"建议设置入户门未关闭/未上锁超时提醒,避免长时间门户大开\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"21:21 入户门锁在30秒内连续4次解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 21:21:00 至 21:21:40,入户门锁连续报告 4 次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程/外部操作来源,OperationError=1 表示凭证无效(错误PIN或错误凭证)。4次失败集中在40秒内,频率极高。\",\n \"推理步骤2: 紧接着 21:21:50 触发了 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"Wrong Code Entry Limit\"报警,即错误密码尝试次数超限,门锁主动触发安全告警。这是门锁内置的防暴力破解机制被激活"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 29.161970853805542, "api_error": null} {"episode_id": "SQ3_TP_C_0442", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0442.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261071, "scenario_id": "CH-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "CH-04", "scenario_name": "儿童尝试开门外出", "category": "child_specific", "is_anomaly": true, "threat_type": "child_escape_attempt", "key_evidence": ["玄关运动 + 门锁解锁失败", "密码错误(小孩可能记不准密码)", "无成人在玄关区域", "跟 INS-02 的区别:这里不是暴力破解,只有1-2次尝试,且家中有其他房间的活动(说明有人在家)"], "expected_response": "通知家长孩子在尝试开门", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-22T21:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"21:31 玄关检测到有人活动并连续两次门锁操作失败(错误密码/凭证),疑似非法入侵尝试。\",\n \"reasoning\": [\n \"推理步骤1: 21:31 玄关运动传感器触发(entrance_occupancy = 1),说明入户门外/玄关区域有人出现。\",\n \"推理步骤2: 紧接着 21:31:05 和 21:31:15 连续发生两次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程或密码键盘操作,OperationError=1 表示凭证无效/密码错误。10秒内连续两次失败,符合暴力尝试开锁的模式。\",\n \"推理步骤3: 此时家中有人——客厅灯和空调仍开着,住户在家。但此次门锁操作并非住户行为:住户当天早上 07:32 和下午 16:14、18:06 的开锁均为 Manual 方式且成功,而 21:31 的尝试来源不同(OperationSource=3)且失败。\",\n \"推理步骤4: 排除住户自身操作失误的可能——住户全天使用手动开锁均一次成功,不存在反复输错密码的习惯;且 22:22 住户正常就寝流程中门锁通过 Auto 方式自动上锁,说明住户并未在 21:31 尝试开门。\",\n \"推理步骤5: 附带发现——厨房温度传感器在 06:45、07:24、18:13、19:27 四次报告 MeasuredValue = None,属于设备故障(传感器读数丢失),但均发生在灶具使用前后,可能是高温导致传感器暂时异常,属于次要问题。\",\n \"推理步骤6: 16:14 有人进门后入户门未关闭/未上锁(日志中无 front_door_contact 恢复 True 和 LockState=1 的记录),直到 22:22 才确认门关闭并自动上锁,这意味着 16:14 至 22:22 期间入户门可能处于未锁状态,增加了入侵风险窗口。\"\n ],\n \"key_evidence\": [\n \"21:31:00 entrance_occupancy 触发,检测到玄关有人\",\n \"21:31:05 LockOperationError(OperationError=1, OperationSource=3) — 第一次开锁失败(无效凭证)\",\n \"21:31:15 LockOperationError(OperationError=1, OperationSource=3) — 第二次开锁失败(无效凭证),10秒内连续两次\",\n \"OperationSource=3(远程/键盘)与住户全天使用的 Manual 方式不一致\",\n \"16:14 开门后至 22:22 期间无门锁上锁记录,入户门可能长时间未锁\",\n \"厨房温度传感器四次报告 None 值,存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即确认家中所有成员是否安全,检查入户门当前是否已锁好\",\n \"查看门口摄像头(如有)回放 21:31 前后的影像,确认是否有可疑人员\",\n \"检查门锁操作日志中 OperationSource=3 对应的具体凭证/用户ID,排查是否有泄露的密码或未授权的远程访问\",\n \"考虑更换门锁密码,并启用连续失败锁定策略(如3次失败后锁定5分钟)\",\n \"设置自动化规则:入户门开启超过一定时间未关闭时发送提醒,避免长时间未锁门\",\n \"检修厨房温度传感器,排查其在灶具使用时频繁报 None 的原因\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "21:31 玄关检测到有人活动并连续两次门锁操作失败(错误密码/凭证),疑似非法入侵尝试。", "reasoning": ["推理步骤1: 21:31 玄关运动传感器触发(entrance_occupancy = 1),说明入户门外/玄关区域有人出现。", "推理步骤2: 紧接着 21:31:05 和 21:31:15 连续发生两次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常表示远程或密码键盘操作,OperationError=1 表示凭证无效/密码错误。10秒内连续两次失败,符合暴力尝试开锁的模式。", "推理步骤3: 此时家中有人——客厅灯和空调仍开着,住户在家。但此次门锁操作并非住户行为:住户当天早上 07:32 和下午 16:14、18:06 的开锁均为 Manual 方式且成功,而 21:31 的尝试来源不同(OperationSource=3)且失败。", "推理步骤4: 排除住户自身操作失误的可能——住户全天使用手动开锁均一次成功,不存在反复输错密码的习惯;且 22:22 住户正常就寝流程中门锁通过 Auto 方式自动上锁,说明住户并未在 21:31 尝试开门。", "推理步骤5: 附带发现——厨房温度传感器在 06:45、07:24、18:13、19:27 四次报告 MeasuredValue = None,属于设备故障(传感器读数丢失),但均发生在灶具使用前后,可能是高温导致传感器暂时异常,属于次要问题。", "推理步骤6: 16:14 有人进门后入户门未关闭/未上锁(日志中无 front_door_contact 恢复 True 和 LockState=1 的记录),直到 22:22 才确认门关闭并自动上锁,这意味着 16:14 至 22:22 期间入户门可能处于未锁状态,增加了入侵风险窗口。"], "key_evidence": ["21:31:00 entrance_occupancy 触发,检测到玄关有人", "21:31:05 LockOperationError(OperationError=1, OperationSource=3) — 第一次开锁失败(无效凭证)", "21:31:15 LockOperationError(OperationError=1, OperationSource=3) — 第二次开锁失败(无效凭证),10秒内连续两次", "OperationSource=3(远程/键盘)与住户全天使用的 Manual 方式不一致", "16:14 开门后至 22:22 期间无门锁上锁记录,入户门可能长时间未锁", "厨房温度传感器四次报告 None 值,存在设备故障"], "recommended_actions": ["立即确认家中所有成员是否安全,检查入户门当前是否已锁好", "查看门口摄像头(如有)回放 21:31 前后的影像,确认是否有可疑人员", "检查门锁操作日志中 OperationSource=3 对应的具体凭证/用户ID,排查是否有泄露的密码或未授权的远程访问", "考虑更换门锁密码,并启用连续失败锁定策略(如3次失败后锁定5分钟)", "设置自动化规则:入户门开启超过一定时间未关闭时发送提醒,避免长时间未锁门", "检修厨房温度传感器,排查其在灶具使用时频繁报 None 的原因"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.615954399108887, "api_error": null} {"episode_id": "SQ3_TP_C_0444", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0444.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261073, "scenario_id": "CH-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-03", "scenario_name": "儿童深夜活动", "category": "child_specific", "is_anomaly": true, "threat_type": "child_nighttime_wandering", "key_evidence": ["凌晨时段儿童房活动 → 离开房间去其他区域", "家长卧室无活动(不是家长带着孩子)", "低龄儿童深夜独自活动有安全风险(摔倒、误触电器等)"], "expected_response": "通知家长(轻柔方式),建议查看孩子情况", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-05T08:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:07开锁后长时间未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:45、07:30、18:39、19:16 共四次报告 MeasuredValue = None。虽然其中两次发生在灶具开启期间(可能因高温导致读数异常),但灶具关闭后(19:15关闭,19:16仍报None)也出现了该现象,说明传感器本身可能存在间歇性故障。\",\n \"推理步骤2: 16:07 入户门解锁并打开(front_door_contact StateValue=False),但日志中直到 22:50:31 才记录到门关闭(StateValue=True)。这意味着入户门处于开启状态近7小时,存在安全隐患。虽然18:00也有一次开锁记录,但中间没有关门记录,说明门可能一直未关。\",\n \"推理步骤3: 其余行为模式均属正常——凌晨1:30儿童房短暂活动(小孩起夜)、早晨5:57-7:43的起床/做饭/出门流程、16:07放学回家、18:00大人回家做饭、22:50就寝锁门,均符合三口之家的典型作息。\",\n \"推理步骤4: 温度趋势正常,夜间约23°C,午间峰值约25.9°C,傍晚逐步回落,符合6月初夏季昼夜温差规律。空调在18:00开启制冷模式(SystemMode=3),22:50关闭,温度从约24.5°C降至约23.4°C,合理。\",\n \"推理步骤5: 门锁操作均为手动开锁+自动上锁,无异常PIN码尝试或远程操作,不存在入侵迹象。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:45、07:30、18:39、19:16 四次报告 MeasuredValue = None\",\n \"front_door_contact 在 16:07:02 报告 StateValue=False(门开),直到 22:50:31 才报告 StateValue=True(门关),中间约6小时43分钟无关门记录\",\n \"07:30 出现两条 kitchen_temp_sensor 记录(一条 None,一条正常值2435),传感器数据不稳定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,必要时更换传感器或重新配对\",\n \"设置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免安全疏忽\",\n \"考虑为入户门传感器增加定期状态上报机制,确保门的开关状态能被及时感知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:07开锁后长时间未关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:45、07:30、18:39、19:16 共四次报告 MeasuredValue = None。虽然其中两次发生在灶具开启期间(可能因高温导致读数异常),但灶具关闭后(19:15关闭,19:16仍报None)也出现了该现象,说明传感器本身可能存在间歇性故障。", "推理步骤2: 16:07 入户门解锁并打开(front_door_contact StateValue=False),但日志中直到 22:50:31 才记录到门关闭(StateValue=True)。这意味着入户门处于开启状态近7小时,存在安全隐患。虽然18:00也有一次开锁记录,但中间没有关门记录,说明门可能一直未关。", "推理步骤3: 其余行为模式均属正常——凌晨1:30儿童房短暂活动(小孩起夜)、早晨5:57-7:43的起床/做饭/出门流程、16:07放学回家、18:00大人回家做饭、22:50就寝锁门,均符合三口之家的典型作息。", "推理步骤4: 温度趋势正常,夜间约23°C,午间峰值约25.9°C,傍晚逐步回落,符合6月初夏季昼夜温差规律。空调在18:00开启制冷模式(SystemMode=3),22:50关闭,温度从约24.5°C降至约23.4°C,合理。", "推理步骤5: 门锁操作均为手动开锁+自动上锁,无异常PIN码尝试或远程操作,不存在入侵迹象。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:45、07:30、18:39、19:16 四次报告 MeasuredValue = None", "front_door_contact 在 16:07:02 报告 StateValue=False(门开),直到 22:50:31 才报告 StateValue=True(门关),中间约6小时43分钟无关门记录", "07:30 出现两条 kitchen_temp_sensor 记录(一条 None,一条正常值2435),传感器数据不稳定"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,必要时更换传感器或重新配对", "设置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免安全疏忽", "考虑为入户门传感器增加定期状态上报机制,确保门的开关状态能被及时感知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.229960441589355, "api_error": null} {"episode_id": "SQ3_TP_C_0447", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0447.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261076, "scenario_id": "DF-05", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-07T02:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器在凌晨 02:50 报告硬件故障,该设备已失去烟雾/CO 检测能力,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 在 02:50,kitchen_smoke_alarm 连续上报了三条事件——HardwareFaultAlert = True、ExpressedState = 5(对应 Matter SmokeCoAlarm Cluster 中的 HardwareFault 状态)、以及 HardwareFault 事件,三者一致指向设备自身硬件故障。\",\n \"推理步骤2: 检查厨房温度传感器数据,故障前后(02:30 约 22.94°C → 03:00 约 22.98°C)温度平稳,没有异常升温,排除因真实火灾或烟雾触发的可能——这不是误报,而是设备本身出了问题。\",\n \"推理步骤3: 全屋四个温度传感器在整个 24 小时内呈现一致的昼夜温度曲线(夜间约 22.9-23.1°C,午间峰值约 25.9°C,傍晚回落),各房间温差始终在 1°C 以内,未见任何局部异常升温,进一步确认不存在火灾风险。\",\n \"推理步骤4: 除烟雾报警器硬件故障外,日志中无门锁、门窗传感器、运动传感器、漏水传感器等任何其他设备的异常事件,入侵、漏水等威胁均可排除。\",\n \"推理步骤5: 烟雾报警器处于 HardwareFault 状态意味着其烟雾和 CO 检测功能可能已丧失。厨房是火灾高发区域,该设备失效会造成关键安全监控盲区,风险等级较高。\"\n ],\n \"key_evidence\": [\n \"02:50 kitchen_smoke_alarm | HardwareFaultAlert = True\",\n \"02:50 kitchen_smoke_alarm | ExpressedState = 5(HardwareFault 状态)\",\n \"02:50 kitchen_smoke_alarm | Event: HardwareFault()\",\n \"厨房温度在故障前后保持稳定(约 22.9-23.0°C),排除真实烟雾/火灾触发\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房烟雾报警器硬件状态,尝试重启或复位设备,确认故障是否可恢复\",\n \"若复位无效,尽快更换厨房烟雾报警器,厨房是火灾高风险区域,不应长时间处于无烟雾监控状态\",\n \"在报警器修复前,可将客厅烟雾报警器(living_room_smoke_alarm)的灵敏度适当提高,作为临时补充监控\",\n \"检查报警器的生产日期和使用年限,烟雾报警器通常建议 10 年内更换,硬件故障可能与老化有关\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器在凌晨 02:50 报告硬件故障,该设备已失去烟雾/CO 检测能力,存在安全监控盲区。", "reasoning": ["推理步骤1: 在 02:50,kitchen_smoke_alarm 连续上报了三条事件——HardwareFaultAlert = True、ExpressedState = 5(对应 Matter SmokeCoAlarm Cluster 中的 HardwareFault 状态)、以及 HardwareFault 事件,三者一致指向设备自身硬件故障。", "推理步骤2: 检查厨房温度传感器数据,故障前后(02:30 约 22.94°C → 03:00 约 22.98°C)温度平稳,没有异常升温,排除因真实火灾或烟雾触发的可能——这不是误报,而是设备本身出了问题。", "推理步骤3: 全屋四个温度传感器在整个 24 小时内呈现一致的昼夜温度曲线(夜间约 22.9-23.1°C,午间峰值约 25.9°C,傍晚回落),各房间温差始终在 1°C 以内,未见任何局部异常升温,进一步确认不存在火灾风险。", "推理步骤4: 除烟雾报警器硬件故障外,日志中无门锁、门窗传感器、运动传感器、漏水传感器等任何其他设备的异常事件,入侵、漏水等威胁均可排除。", "推理步骤5: 烟雾报警器处于 HardwareFault 状态意味着其烟雾和 CO 检测功能可能已丧失。厨房是火灾高发区域,该设备失效会造成关键安全监控盲区,风险等级较高。"], "key_evidence": ["02:50 kitchen_smoke_alarm | HardwareFaultAlert = True", "02:50 kitchen_smoke_alarm | ExpressedState = 5(HardwareFault 状态)", "02:50 kitchen_smoke_alarm | Event: HardwareFault()", "厨房温度在故障前后保持稳定(约 22.9-23.0°C),排除真实烟雾/火灾触发"], "recommended_actions": ["立即检查厨房烟雾报警器硬件状态,尝试重启或复位设备,确认故障是否可恢复", "若复位无效,尽快更换厨房烟雾报警器,厨房是火灾高风险区域,不应长时间处于无烟雾监控状态", "在报警器修复前,可将客厅烟雾报警器(living_room_smoke_alarm)的灵敏度适当提高,作为临时补充监控", "检查报警器的生产日期和使用年限,烟雾报警器通常建议 10 年内更换,硬件故障可能与老化有关"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.135599613189697, "api_error": null} {"episode_id": "SQ3_TP_C_0446", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0446.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261075, "scenario_id": "CH-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-06T09:54:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人明确在场的情况下已持续开启超过14小时,存在火灾/干烧风险。\",\n \"reasoning\": [\n \"推理步骤1: 09:55:30 厨房灶具被打开(kitchen_cook_surface OnOff=True),但整个日志中没有出现对应的关闭事件(OnOff=False),说明灶具至少从09:55持续运行到日志结束的23:30,超过13.5小时。\",\n \"推理步骤2: 灶具开启前的活动轨迹显示,09:54 儿童房检测到有人,09:55 儿童房无人、次卧检测到有人,随后09:55:30 灶具开启。操作者似乎从儿童房移动到次卧附近,但之后日志中再无任何运动传感器或门锁/门磁事件,无法确认是否有人持续关注灶具。\",\n \"推理步骤3: 厨房温度传感器数据显示,灶具开启后厨房温度从约25.1°C逐步升至约25.8°C(12:30峰值),之后随室外温度自然回落。温度变化幅度不大且与其他房间趋势一致,说明目前尚未发生明火或严重过热,但长时间无人看管的灶具仍是显著隐患。\",\n \"推理步骤4: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段内未触发报警,说明当前没有烟雾或CO泄漏,但这不能排除干烧或油脂缓慢积热的潜在风险。\",\n \"推理步骤5: 温度数据整体呈现正常的昼夜变化曲线(夜间22-23°C,午间25-26°C),各房间温度同步变化,无单一房间异常升温,排除了局部火情或设备故障导致的异常发热。\"\n ],\n \"key_evidence\": [\n \"09:55:30 kitchen_cook_surface OnOff=True,之后整个日志(至23:30)无关闭记录,灶具持续运行超过13.5小时\",\n \"灶具开启后无任何厨房区域的运动传感器事件,无法确认有人在厨房看管\",\n \"厨房烟雾报警器未触发,厨房温度未出现异常飙升,说明尚未发生紧急情况但风险在累积\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具状态,如无人使用应远程关闭灶具(kitchen_cook_surface OnOff=False)\",\n \"检查灶具上是否有锅具或可燃物,排除干烧风险\",\n \"建议设置灶具自动关闭规则:当灶具持续开启超过一定时长(如2小时)且厨房无人活动时,自动关闭并发送告警通知\",\n \"确认09:54-09:55期间的活动者身份,如果是儿童独自操作灶具,需加强安全管控(如灶具童锁功能)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人明确在场的情况下已持续开启超过14小时,存在火灾/干烧风险。", "reasoning": ["推理步骤1: 09:55:30 厨房灶具被打开(kitchen_cook_surface OnOff=True),但整个日志中没有出现对应的关闭事件(OnOff=False),说明灶具至少从09:55持续运行到日志结束的23:30,超过13.5小时。", "推理步骤2: 灶具开启前的活动轨迹显示,09:54 儿童房检测到有人,09:55 儿童房无人、次卧检测到有人,随后09:55:30 灶具开启。操作者似乎从儿童房移动到次卧附近,但之后日志中再无任何运动传感器或门锁/门磁事件,无法确认是否有人持续关注灶具。", "推理步骤3: 厨房温度传感器数据显示,灶具开启后厨房温度从约25.1°C逐步升至约25.8°C(12:30峰值),之后随室外温度自然回落。温度变化幅度不大且与其他房间趋势一致,说明目前尚未发生明火或严重过热,但长时间无人看管的灶具仍是显著隐患。", "推理步骤4: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段内未触发报警,说明当前没有烟雾或CO泄漏,但这不能排除干烧或油脂缓慢积热的潜在风险。", "推理步骤5: 温度数据整体呈现正常的昼夜变化曲线(夜间22-23°C,午间25-26°C),各房间温度同步变化,无单一房间异常升温,排除了局部火情或设备故障导致的异常发热。"], "key_evidence": ["09:55:30 kitchen_cook_surface OnOff=True,之后整个日志(至23:30)无关闭记录,灶具持续运行超过13.5小时", "灶具开启后无任何厨房区域的运动传感器事件,无法确认有人在厨房看管", "厨房烟雾报警器未触发,厨房温度未出现异常飙升,说明尚未发生紧急情况但风险在累积"], "recommended_actions": ["立即确认厨房灶具状态,如无人使用应远程关闭灶具(kitchen_cook_surface OnOff=False)", "检查灶具上是否有锅具或可燃物,排除干烧风险", "建议设置灶具自动关闭规则:当灶具持续开启超过一定时长(如2小时)且厨房无人活动时,自动关闭并发送告警通知", "确认09:54-09:55期间的活动者身份,如果是儿童独自操作灶具,需加强安全管控(如灶具童锁功能)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.368658304214478, "api_error": null} {"episode_id": "SQ3_TP_C_0448", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0448.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261077, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-17T12:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"中午12:53有人通过客厅窗户进入室内,当时家中无人且入户门未开启,存在入侵嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 早上07:28全家出门(关灯、锁门、门锁自动上锁),直到16:20才有人通过入户门回家,说明07:28-16:20期间家中应无人。\",\n \"推理步骤2: 12:53客厅窗户传感器(living_room_window_contact_1)报告打开(StateValue=False),随后12:53:08客厅运动传感器检测到有人(Occupancy=1)。\",\n \"推理步骤3: 12:55主卧运动传感器也检测到有人(Occupancy=1),说明有人从客厅移动到了主卧。\",\n \"推理步骤4: 12:56窗户关闭(StateValue=True),随后客厅运动传感器恢复无人状态(Occupancy=0)。整个过程仅持续约3分钟。\",\n \"推理步骤5: 在此期间入户门锁未有任何操作记录,入户门传感器也未报告开门,排除了住户通过正门进入的可能。\",\n \"推理步骤6: 没有灯被打开,行为隐蔽且短暂,符合入侵者快速进出的模式。\"\n ],\n \"key_evidence\": [\n \"12:53 客厅窗户打开(living_room_window_contact_1 StateValue=False),家中无人时段\",\n \"12:53-12:55 客厅和主卧运动传感器先后检测到人体存在\",\n \"整个过程未触发入户门锁/门传感器,无合法入户记录\",\n \"12:56 窗户关闭后运动传感器恢复无人,行为持续仅约3分钟\"\n ],\n \"recommended_actions\": [\n \"立即检查主卧是否有财物丢失或被翻动的痕迹\",\n \"查看是否有安防摄像头记录12:53前后客厅窗户附近的影像\",\n \"检查客厅窗户锁具是否完好,考虑加装窗户防盗锁或报警器\",\n \"向物业或警方报告此次可疑入侵事件\",\n \"考虑为窗户传感器配置离家模式下的即时告警规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "中午12:53有人通过客厅窗户进入室内,当时家中无人且入户门未开启,存在入侵嫌疑。", "reasoning": ["推理步骤1: 早上07:28全家出门(关灯、锁门、门锁自动上锁),直到16:20才有人通过入户门回家,说明07:28-16:20期间家中应无人。", "推理步骤2: 12:53客厅窗户传感器(living_room_window_contact_1)报告打开(StateValue=False),随后12:53:08客厅运动传感器检测到有人(Occupancy=1)。", "推理步骤3: 12:55主卧运动传感器也检测到有人(Occupancy=1),说明有人从客厅移动到了主卧。", "推理步骤4: 12:56窗户关闭(StateValue=True),随后客厅运动传感器恢复无人状态(Occupancy=0)。整个过程仅持续约3分钟。", "推理步骤5: 在此期间入户门锁未有任何操作记录,入户门传感器也未报告开门,排除了住户通过正门进入的可能。", "推理步骤6: 没有灯被打开,行为隐蔽且短暂,符合入侵者快速进出的模式。"], "key_evidence": ["12:53 客厅窗户打开(living_room_window_contact_1 StateValue=False),家中无人时段", "12:53-12:55 客厅和主卧运动传感器先后检测到人体存在", "整个过程未触发入户门锁/门传感器,无合法入户记录", "12:56 窗户关闭后运动传感器恢复无人,行为持续仅约3分钟"], "recommended_actions": ["立即检查主卧是否有财物丢失或被翻动的痕迹", "查看是否有安防摄像头记录12:53前后客厅窗户附近的影像", "检查客厅窗户锁具是否完好,考虑加装窗户防盗锁或报警器", "向物业或警方报告此次可疑入侵事件", "考虑为窗户传感器配置离家模式下的即时告警规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.55042314529419, "api_error": null} {"episode_id": "SQ3_TP_C_0450", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0450.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261079, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-05T07:41:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现两次异常高温读数(32.10°C / 32.00°C),与同时段其他传感器读数严重偏离,疑似传感器故障或通信异常。同时客厅烟雾报警器在无人在家时触发,需排查是否为误报或真实隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:43、07:15、18:28、19:18 四次报告 MeasuredValue = None,说明传感器存在间歇性数据丢失,可能是设备通信不稳定或硬件故障。\",\n \"推理步骤2: 07:41 和 07:46 厨房温度传感器上报值为 3210 和 3200(即 32.1°C 和 32.0°C),而同时段(07:30)其他房间温度均在 24.2°C~24.4°C 范围内,厨房自身在 07:30 也仅为 24.37°C。此时灶具已于 07:14 关闭,不应出现如此剧烈的温度跳变。此外这两条日志的属性格式缺少 Cluster 前缀(仅为 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),进一步暗示传感器上报异常。\",\n \"推理步骤3: 07:47 全家关灯、锁门出门,07:51 客厅烟雾报警器触发 SmokeState = 1。此时家中无人、无任何设备运行(灶具 07:14 已关),没有合理的烟雾来源。结合厨房传感器的异常高温读数,需要排查两种可能:a) 厨房确实存在残余热源/隐患导致烟雾扩散到客厅;b) 烟雾报警器本身误报。\",\n \"推理步骤4: 16:15 有人回家后入户门未关闭/未上锁(日志中无 front_door_contact 恢复 True 和 LockState = 1 的记录),直到 22:15 才记录到门关闭并自动上锁。这意味着入户门可能长时间处于未锁状态,存在安全隐患。\",\n \"推理步骤5: 其余行为模式正常——早晨起床开灯、做早餐、出门上班、下午孩子回家、傍晚大人回家做晚饭、晚间休息,符合三口之家的典型作息。温度整体随日照变化呈正常的先升后降曲线。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None 值(06:43, 07:15, 18:28, 19:18)\",\n \"07:41 和 07:46 厨房温度异常飙升至 3210/3200(32.1°C/32.0°C),与其他传感器偏差约 8°C,且属性上报格式异常(缺少 TemperatureMeasurement 前缀)\",\n \"07:51 客厅烟雾报警器触发 SmokeState = 1,此时全家已出门、无设备运行\",\n \"16:15 入户门开锁进入后,未见关门/上锁记录,直到 22:15 才恢复\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的硬件状态和网络连接,清洁或更换传感器\",\n \"排查客厅烟雾报警器触发原因:检查是否有残留烟雾、灰尘积累导致误报,或厨房是否存在未完全关闭的热源\",\n \"检查厨房烟雾报警器为何未同步触发——如果客厅报警而厨房未报警,可能厨房报警器也存在故障\",\n \"确认入户门锁的自动上锁策略,建议设置开门超时未关闭时推送提醒,避免长时间门户大开\",\n \"对厨房温度传感器的异常高温读数设置告警阈值(如超过周围传感器均值 5°C 以上时触发告警),以便及时发现真实火灾隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现两次异常高温读数(32.10°C / 32.00°C),与同时段其他传感器读数严重偏离,疑似传感器故障或通信异常。同时客厅烟雾报警器在无人在家时触发,需排查是否为误报或真实隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:43、07:15、18:28、19:18 四次报告 MeasuredValue = None,说明传感器存在间歇性数据丢失,可能是设备通信不稳定或硬件故障。", "推理步骤2: 07:41 和 07:46 厨房温度传感器上报值为 3210 和 3200(即 32.1°C 和 32.0°C),而同时段(07:30)其他房间温度均在 24.2°C~24.4°C 范围内,厨房自身在 07:30 也仅为 24.37°C。此时灶具已于 07:14 关闭,不应出现如此剧烈的温度跳变。此外这两条日志的属性格式缺少 Cluster 前缀(仅为 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),进一步暗示传感器上报异常。", "推理步骤3: 07:47 全家关灯、锁门出门,07:51 客厅烟雾报警器触发 SmokeState = 1。此时家中无人、无任何设备运行(灶具 07:14 已关),没有合理的烟雾来源。结合厨房传感器的异常高温读数,需要排查两种可能:a) 厨房确实存在残余热源/隐患导致烟雾扩散到客厅;b) 烟雾报警器本身误报。", "推理步骤4: 16:15 有人回家后入户门未关闭/未上锁(日志中无 front_door_contact 恢复 True 和 LockState = 1 的记录),直到 22:15 才记录到门关闭并自动上锁。这意味着入户门可能长时间处于未锁状态,存在安全隐患。", "推理步骤5: 其余行为模式正常——早晨起床开灯、做早餐、出门上班、下午孩子回家、傍晚大人回家做晚饭、晚间休息,符合三口之家的典型作息。温度整体随日照变化呈正常的先升后降曲线。"], "key_evidence": ["厨房温度传感器 4 次报告 None 值(06:43, 07:15, 18:28, 19:18)", "07:41 和 07:46 厨房温度异常飙升至 3210/3200(32.1°C/32.0°C),与其他传感器偏差约 8°C,且属性上报格式异常(缺少 TemperatureMeasurement 前缀)", "07:51 客厅烟雾报警器触发 SmokeState = 1,此时全家已出门、无设备运行", "16:15 入户门开锁进入后,未见关门/上锁记录,直到 22:15 才恢复"], "recommended_actions": ["立即检查厨房温度传感器的硬件状态和网络连接,清洁或更换传感器", "排查客厅烟雾报警器触发原因:检查是否有残留烟雾、灰尘积累导致误报,或厨房是否存在未完全关闭的热源", "检查厨房烟雾报警器为何未同步触发——如果客厅报警而厨房未报警,可能厨房报警器也存在故障", "确认入户门锁的自动上锁策略,建议设置开门超时未关闭时推送提醒,避免长时间门户大开", "对厨房温度传感器的异常高温读数设置告警阈值(如超过周围传感器均值 5°C 以上时触发告警),以便及时发现真实火灾隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.332282066345215, "api_error": null} {"episode_id": "SQ3_TP_C_0451", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0451.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261080, "scenario_id": "INS-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-28T01:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房窗户传感器在凌晨1:04报告打开状态后,整个日志周期内再无关闭记录,且次卫灯在深夜被开启后也无关闭记录,存在设备状态异常或住户疏忽。\",\n \"reasoning\": [\n \"推理步骤1: 在01:04,厨房窗户传感器(kitchen_window_contact)报告 StateValue=False,表示窗户被打开。但在之后长达22小时的日志中,没有任何该传感器报告 StateValue=True(关闭)的记录。厨房窗户长时间敞开本身就是安全隐患。\",\n \"推理步骤2: 01:04:05和01:04:30客厅运动传感器连续两次检测到有人活动(Occupancy=1),随后01:04:45次卫灯被打开。这个时间序列表明凌晨1点有人起夜活动,这本身是合理的——但厨房窗户在此时被打开却不太寻常,且没有厨房运动传感器的记录来佐证有人在厨房操作。\",\n \"推理步骤3: 次卫灯在01:04:45开启后,整个日志中也没有关闭记录。虽然可能是住户忘记关灯,但结合厨房窗户的情况,可能存在传感器状态上报异常或遗漏。\",\n \"推理步骤4: 温度数据方面,所有房间呈现一致的日变化曲线——凌晨约23°C,中午升至约25.8°C,晚间回落至约23.3°C。各房间温度高度同步,无局部异常升温,排除火灾或厨房灶具异常使用的可能。\",\n \"推理步骤5: 入户门锁和入户门传感器在整个周期内无任何事件,阳台门传感器也无事件,说明没有外部入侵迹象。烟雾报警器和漏水传感器均无告警,排除火灾和漏水风险。\",\n \"推理步骤6: 综合来看,没有高危安全威胁,但厨房窗户长时间处于打开状态且无人关闭,属于需要关注的异常——既可能是住户疏忽,也可能是传感器故障未能上报关闭事件。\"\n ],\n \"key_evidence\": [\n \"01:04 厨房窗户传感器报告打开(StateValue=False),此后22+小时内无关闭记录\",\n \"01:04 凌晨客厅检测到人体活动,但厨房无运动传感器数据佐证有人操作厨房窗户\",\n \"01:04:45 次卫灯开启后无关闭记录\",\n \"全天温度曲线正常,无局部异常升温;烟雾/漏水报警器均无触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房窗户当前实际状态,确认是否确实处于打开状态;若已关闭则说明传感器存在上报故障,需检修或更换\",\n \"若厨房窗户确实未关闭,建议立即关闭——长时间开窗在无人看管时存在安全隐患(入侵、雨水、虫害等)\",\n \"检查次卫灯是否仍在亮着,避免不必要的能耗\",\n \"考虑为厨房添加运动传感器,以便更好地关联厨房区域的人员活动与设备状态变化\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房窗户传感器在凌晨1:04报告打开状态后,整个日志周期内再无关闭记录,且次卫灯在深夜被开启后也无关闭记录,存在设备状态异常或住户疏忽。", "reasoning": ["推理步骤1: 在01:04,厨房窗户传感器(kitchen_window_contact)报告 StateValue=False,表示窗户被打开。但在之后长达22小时的日志中,没有任何该传感器报告 StateValue=True(关闭)的记录。厨房窗户长时间敞开本身就是安全隐患。", "推理步骤2: 01:04:05和01:04:30客厅运动传感器连续两次检测到有人活动(Occupancy=1),随后01:04:45次卫灯被打开。这个时间序列表明凌晨1点有人起夜活动,这本身是合理的——但厨房窗户在此时被打开却不太寻常,且没有厨房运动传感器的记录来佐证有人在厨房操作。", "推理步骤3: 次卫灯在01:04:45开启后,整个日志中也没有关闭记录。虽然可能是住户忘记关灯,但结合厨房窗户的情况,可能存在传感器状态上报异常或遗漏。", "推理步骤4: 温度数据方面,所有房间呈现一致的日变化曲线——凌晨约23°C,中午升至约25.8°C,晚间回落至约23.3°C。各房间温度高度同步,无局部异常升温,排除火灾或厨房灶具异常使用的可能。", "推理步骤5: 入户门锁和入户门传感器在整个周期内无任何事件,阳台门传感器也无事件,说明没有外部入侵迹象。烟雾报警器和漏水传感器均无告警,排除火灾和漏水风险。", "推理步骤6: 综合来看,没有高危安全威胁,但厨房窗户长时间处于打开状态且无人关闭,属于需要关注的异常——既可能是住户疏忽,也可能是传感器故障未能上报关闭事件。"], "key_evidence": ["01:04 厨房窗户传感器报告打开(StateValue=False),此后22+小时内无关闭记录", "01:04 凌晨客厅检测到人体活动,但厨房无运动传感器数据佐证有人操作厨房窗户", "01:04:45 次卫灯开启后无关闭记录", "全天温度曲线正常,无局部异常升温;烟雾/漏水报警器均无触发"], "recommended_actions": ["检查厨房窗户当前实际状态,确认是否确实处于打开状态;若已关闭则说明传感器存在上报故障,需检修或更换", "若厨房窗户确实未关闭,建议立即关闭——长时间开窗在无人看管时存在安全隐患(入侵、雨水、虫害等)", "检查次卫灯是否仍在亮着,避免不必要的能耗", "考虑为厨房添加运动传感器,以便更好地关联厨房区域的人员活动与设备状态变化"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.533201694488525, "api_error": null} {"episode_id": "SQ3_TP_C_0453", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0453.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261082, "scenario_id": "DF-06", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-04T13:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时客厅窗帘关闭指令后持续处于运动状态未到达目标位置,可能存在机械故障。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)的关键事件——18:15家人回家开门、开灯、开空调;18:33开始做饭;19:03做饭结束、餐厅用餐;20:00洗碗机启动;20:51儿童房关灯就寝;22:47客厅关灯关空调、主卧就寝、前门自动上锁。整体生活节奏正常,无入侵迹象。\",\n \"推理步骤2: 厨房温度传感器在18:34、19:04分别报告 MeasuredValue = None。回溯全天日志发现07:02、07:18也出现过同样的None值。每次都发生在灶具使用前后,可能是灶具产生的高温或油烟干扰了传感器,也可能是传感器本身存在间歇性故障。虽然19:00和19:30的读数恢复正常,但反复出现None值不应被忽视。\",\n \"推理步骤3: 13:25客厅窗帘1收到 DownOrClose 指令后,OperationalStatus 持续为 0b000010(正在关闭),13:25:30时位置仅到50%,13:26:00仍在运动中,之后日志中再无该窗帘到达终点或停止的记录。正常窗帘关闭操作应在1-2分钟内完成并报告 OperationalStatus=0。这可能意味着窗帘电机卡住或轨道有障碍物。\",\n \"推理步骤4: 安全方面——前门在07:24和22:47两次自动上锁,16:11和18:15的开门均为手动解锁且伴随正常的人员活动(运动传感器触发、灯光开启),无异常入侵特征。厨房窗户在做饭后打开通风(07:17和19:03),属于正常行为。烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤5: 温度趋势正常——夜间约23°C,白天逐步升至25-26°C,傍晚回落,18:15开空调后客厅温度从24.6°C降至22:00的23.6°C,符合制冷预期。无异常温升,不存在火灾风险信号。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:34和19:04报告 MeasuredValue = None(全天共出现4次),均与灶具使用时间高度相关\",\n \"客厅窗帘1在13:25收到关闭指令后,至13:26仍处于运动状态(OperationalStatus = 0b000010),位置仅到50%,此后无完成记录\",\n \"前门锁操作均为手动解锁+自动上锁,配合运动传感器和灯光联动,无未授权访问迹象\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或检查其无线通信稳定性\",\n \"检查客厅窗帘1的轨道是否有异物阻挡、电机是否正常工作,手动测试窗帘能否完全关闭\",\n \"在厨房温度传感器不可靠期间,可适当提高烟雾报警器的监控优先级,确保厨房安全不存在监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时客厅窗帘关闭指令后持续处于运动状态未到达目标位置,可能存在机械故障。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30–23:30)的关键事件——18:15家人回家开门、开灯、开空调;18:33开始做饭;19:03做饭结束、餐厅用餐;20:00洗碗机启动;20:51儿童房关灯就寝;22:47客厅关灯关空调、主卧就寝、前门自动上锁。整体生活节奏正常,无入侵迹象。", "推理步骤2: 厨房温度传感器在18:34、19:04分别报告 MeasuredValue = None。回溯全天日志发现07:02、07:18也出现过同样的None值。每次都发生在灶具使用前后,可能是灶具产生的高温或油烟干扰了传感器,也可能是传感器本身存在间歇性故障。虽然19:00和19:30的读数恢复正常,但反复出现None值不应被忽视。", "推理步骤3: 13:25客厅窗帘1收到 DownOrClose 指令后,OperationalStatus 持续为 0b000010(正在关闭),13:25:30时位置仅到50%,13:26:00仍在运动中,之后日志中再无该窗帘到达终点或停止的记录。正常窗帘关闭操作应在1-2分钟内完成并报告 OperationalStatus=0。这可能意味着窗帘电机卡住或轨道有障碍物。", "推理步骤4: 安全方面——前门在07:24和22:47两次自动上锁,16:11和18:15的开门均为手动解锁且伴随正常的人员活动(运动传感器触发、灯光开启),无异常入侵特征。厨房窗户在做饭后打开通风(07:17和19:03),属于正常行为。烟雾报警器和漏水传感器全天无告警。", "推理步骤5: 温度趋势正常——夜间约23°C,白天逐步升至25-26°C,傍晚回落,18:15开空调后客厅温度从24.6°C降至22:00的23.6°C,符合制冷预期。无异常温升,不存在火灾风险信号。"], "key_evidence": ["厨房温度传感器在18:34和19:04报告 MeasuredValue = None(全天共出现4次),均与灶具使用时间高度相关", "客厅窗帘1在13:25收到关闭指令后,至13:26仍处于运动状态(OperationalStatus = 0b000010),位置仅到50%,此后无完成记录", "前门锁操作均为手动解锁+自动上锁,配合运动传感器和灯光联动,无未授权访问迹象"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或检查其无线通信稳定性", "检查客厅窗帘1的轨道是否有异物阻挡、电机是否正常工作,手动测试窗帘能否完全关闭", "在厨房温度传感器不可靠期间,可适当提高烟雾报警器的监控优先级,确保厨房安全不存在监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.49393892288208, "api_error": null} {"episode_id": "SQ3_TP_C_0454", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0454.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261083, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-08T11:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房温度传感器疑似故障:持续上报非标准格式的固定温度值,与同房间标准上报数据及其他房间温度趋势严重偏离。\",\n \"reasoning\": [\n \"推理步骤1: 儿童房温度传感器存在两套并行上报数据。一套是标准的 TemperatureMeasurement.MeasuredValue(每30分钟,与其他房间同步),另一套是非标准的 MeasuredValue(缺少 Cluster 前缀),出现在 08:00、12:00、18:00、22:00 等时间点。这种非标准格式不符合 Matter 协议的 Cluster.Attribute 规范,可能是固件异常或传感器模块故障导致的。\",\n \"推理步骤2: 非标准上报的数值与同一时刻标准上报的数值存在显著偏差。例如 08:00 标准值为 2464(24.64°C),非标准值为 2350(23.50°C),差距超过 1°C;12:00 标准值为 2586(25.86°C),非标准值为 2510(25.10°C),差距约 0.76°C;22:00 标准值为 2358(23.58°C),非标准值为 2280(22.80°C),差距约 0.78°C。同一传感器在同一时刻不应产生两个不同的温度读数。\",\n \"推理步骤3: 更关键的是,从 6月9日起,该传感器的标准 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩非标准格式的 MeasuredValue 在持续上报,且数值固定为 2350,不再随时间和环境变化波动。6月9日 08:00/12:00/18:00/22:00 以及 6月10日 08:00/12:00 全部为 2350,这明显不符合正常的昼夜温度变化规律(当天正常数据显示温度在 22.8°C~25.9°C 之间波动)。\",\n \"推理步骤4: 其他三个温度传感器(客厅、主卧、厨房)在整个日志期间均正常工作,格式标准、数值随昼夜自然波动,排除了系统级问题。这进一步确认问题仅出在儿童房温度传感器上。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间(07:09~07:24 和 18:44~18:58)上报 None 值,但灶具关闭后恢复正常读数,这属于已知的烹饪干扰行为,不构成异常。\",\n \"推理步骤6: 其余设备行为均正常——早晨起床、出门上锁、下午回家、晚间做饭、睡前关灯锁门,符合典型的有孩家庭作息模式,未发现入侵、火灾或漏水等安全威胁。\"\n ],\n \"key_evidence\": [\n \"儿童房温度传感器从 6月8日起出现非标准格式上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),与标准上报并存且数值不一致\",\n \"6月9日起标准格式上报完全停止,仅剩非标准格式,且数值锁定在 2350 不再变化,持续至少 2 天(6月9日~6月10日共 6 次上报均为 2350)\",\n \"同时段其他房间温度传感器工作正常,数值随昼夜自然波动,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"立即检查儿童房温度传感器的固件版本,尝试重启或恢复出厂设置\",\n \"检查该传感器的 Matter 协议通信日志,确认非标准格式上报的来源(可能是固件 bug 或硬件故障)\",\n \"在传感器修复前,暂时使用相邻房间的温度数据作为儿童房温控参考,避免因错误读数影响空调等联动设备\",\n \"如重启无效,建议更换该温度传感器模块\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "儿童房温度传感器疑似故障:持续上报非标准格式的固定温度值,与同房间标准上报数据及其他房间温度趋势严重偏离。", "reasoning": ["推理步骤1: 儿童房温度传感器存在两套并行上报数据。一套是标准的 TemperatureMeasurement.MeasuredValue(每30分钟,与其他房间同步),另一套是非标准的 MeasuredValue(缺少 Cluster 前缀),出现在 08:00、12:00、18:00、22:00 等时间点。这种非标准格式不符合 Matter 协议的 Cluster.Attribute 规范,可能是固件异常或传感器模块故障导致的。", "推理步骤2: 非标准上报的数值与同一时刻标准上报的数值存在显著偏差。例如 08:00 标准值为 2464(24.64°C),非标准值为 2350(23.50°C),差距超过 1°C;12:00 标准值为 2586(25.86°C),非标准值为 2510(25.10°C),差距约 0.76°C;22:00 标准值为 2358(23.58°C),非标准值为 2280(22.80°C),差距约 0.78°C。同一传感器在同一时刻不应产生两个不同的温度读数。", "推理步骤3: 更关键的是,从 6月9日起,该传感器的标准 TemperatureMeasurement.MeasuredValue 上报完全消失,仅剩非标准格式的 MeasuredValue 在持续上报,且数值固定为 2350,不再随时间和环境变化波动。6月9日 08:00/12:00/18:00/22:00 以及 6月10日 08:00/12:00 全部为 2350,这明显不符合正常的昼夜温度变化规律(当天正常数据显示温度在 22.8°C~25.9°C 之间波动)。", "推理步骤4: 其他三个温度传感器(客厅、主卧、厨房)在整个日志期间均正常工作,格式标准、数值随昼夜自然波动,排除了系统级问题。这进一步确认问题仅出在儿童房温度传感器上。", "推理步骤5: 厨房温度传感器在灶具使用期间(07:09~07:24 和 18:44~18:58)上报 None 值,但灶具关闭后恢复正常读数,这属于已知的烹饪干扰行为,不构成异常。", "推理步骤6: 其余设备行为均正常——早晨起床、出门上锁、下午回家、晚间做饭、睡前关灯锁门,符合典型的有孩家庭作息模式,未发现入侵、火灾或漏水等安全威胁。"], "key_evidence": ["儿童房温度传感器从 6月8日起出现非标准格式上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),与标准上报并存且数值不一致", "6月9日起标准格式上报完全停止,仅剩非标准格式,且数值锁定在 2350 不再变化,持续至少 2 天(6月9日~6月10日共 6 次上报均为 2350)", "同时段其他房间温度传感器工作正常,数值随昼夜自然波动,排除系统性故障"], "recommended_actions": ["立即检查儿童房温度传感器的固件版本,尝试重启或恢复出厂设置", "检查该传感器的 Matter 协议通信日志,确认非标准格式上报的来源(可能是固件 bug 或硬件故障)", "在传感器修复前,暂时使用相邻房间的温度数据作为儿童房温控参考,避免因错误读数影响空调等联动设备", "如重启无效,建议更换该温度传感器模块"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.670593976974487, "api_error": null} {"episode_id": "SQ3_TP_C_0458", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0458.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261087, "scenario_id": "CH-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-03", "scenario_name": "儿童深夜活动", "category": "child_specific", "is_anomaly": true, "threat_type": "child_nighttime_wandering", "key_evidence": ["凌晨时段儿童房活动 → 离开房间去其他区域", "家长卧室无活动(不是家长带着孩子)", "低龄儿童深夜独自活动有安全风险(摔倒、误触电器等)"], "expected_response": "通知家长(轻柔方式),建议查看孩子情况", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-29T06:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在间歇性故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30–23:30)的日志,同时回溯全天上下文以识别模式。\",\n \"推理步骤2: 厨房温度传感器在全天出现了3次 MeasuredValue = None 的情况(06:52、07:00、18:36、19:23),其中18:36和19:23两次落在分析窗口内。这些 None 值均出现在灶具开启或关闭前后,但温度传感器不应因灶具使用而丢失读数,这指向传感器本身的稳定性问题。\",\n \"推理步骤3: 入户门在15:55和17:54各有一次手动开锁事件,分别对应有人回家的场景(15:55后儿童房有人活动并开灯,17:54后客厅有人活动、开灯、开空调),属于正常的家庭成员归家行为。\",\n \"推理步骤4: 17:54回家后的行为链完全合理:开客厅灯→开空调(制冷模式,SystemMode=3,符合夏季25°C左右的室温)→18:35开始做饭→19:22做完饭→开洗碗机→晚餐→20:59儿童房关灯拉窗帘(孩子睡觉)→22:47客厅关灯关空调→主卧活动→确认前门关闭并自动上锁→主卧关灯就寝。\",\n \"推理步骤5: 15:55开门时未记录到关门和上锁事件,但17:54有人再次开门进入,说明15:55到17:54之间前门可能处于未锁状态。不过考虑到15:55有人先回家(可能是孩子放学),17:54另一人回家,期间家中有人,这在日常生活中是常见的。22:47最终确认门已关闭并自动上锁。\",\n \"推理步骤6: 温度趋势正常:下午到夜间从约25°C逐步降至约23.3°C,符合夏季傍晚自然降温规律。客厅空调17:54开启后,客厅温度从24.6°C降至22:47关闭时的约23.5°C,制冷效果合理。\",\n \"推理步骤7: 厨房窗户在19:22做完饭后打开(StateValue=False表示打开),这是通风散味的正常操作,但日志中未见关闭记录,截至23:30厨房窗户仍处于打开状态,夜间存在轻微安全隐患。\",\n \"推理步骤8: 综合来看,家庭活动模式完全正常,唯一值得关注的是厨房温度传感器的间歇性 None 值故障。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:36和19:23报告 MeasuredValue = None(全天共出现4次),均与灶具操作时间相关但不应导致传感器丢失数据\",\n \"厨房窗户19:22打开后至日志结束(23:30)未见关闭记录,夜间持续开窗\",\n \"15:55开门后未记录关门/上锁事件,直到22:47才确认前门关闭并自动上锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和供电状态,确认是否受灶具热量或油烟影响导致间歇性通信中断,必要时更换或重新定位传感器\",\n \"建议关闭厨房窗户或确认是否有意保持通风,夜间开窗存在安全和蚊虫进入风险\",\n \"考虑为入户门设置自动上锁超时策略(如开门后5分钟未手动锁定则自动上锁),避免长时间处于未锁状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在间歇性故障或通信异常。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30–23:30)的日志,同时回溯全天上下文以识别模式。", "推理步骤2: 厨房温度传感器在全天出现了3次 MeasuredValue = None 的情况(06:52、07:00、18:36、19:23),其中18:36和19:23两次落在分析窗口内。这些 None 值均出现在灶具开启或关闭前后,但温度传感器不应因灶具使用而丢失读数,这指向传感器本身的稳定性问题。", "推理步骤3: 入户门在15:55和17:54各有一次手动开锁事件,分别对应有人回家的场景(15:55后儿童房有人活动并开灯,17:54后客厅有人活动、开灯、开空调),属于正常的家庭成员归家行为。", "推理步骤4: 17:54回家后的行为链完全合理:开客厅灯→开空调(制冷模式,SystemMode=3,符合夏季25°C左右的室温)→18:35开始做饭→19:22做完饭→开洗碗机→晚餐→20:59儿童房关灯拉窗帘(孩子睡觉)→22:47客厅关灯关空调→主卧活动→确认前门关闭并自动上锁→主卧关灯就寝。", "推理步骤5: 15:55开门时未记录到关门和上锁事件,但17:54有人再次开门进入,说明15:55到17:54之间前门可能处于未锁状态。不过考虑到15:55有人先回家(可能是孩子放学),17:54另一人回家,期间家中有人,这在日常生活中是常见的。22:47最终确认门已关闭并自动上锁。", "推理步骤6: 温度趋势正常:下午到夜间从约25°C逐步降至约23.3°C,符合夏季傍晚自然降温规律。客厅空调17:54开启后,客厅温度从24.6°C降至22:47关闭时的约23.5°C,制冷效果合理。", "推理步骤7: 厨房窗户在19:22做完饭后打开(StateValue=False表示打开),这是通风散味的正常操作,但日志中未见关闭记录,截至23:30厨房窗户仍处于打开状态,夜间存在轻微安全隐患。", "推理步骤8: 综合来看,家庭活动模式完全正常,唯一值得关注的是厨房温度传感器的间歇性 None 值故障。"], "key_evidence": ["厨房温度传感器在18:36和19:23报告 MeasuredValue = None(全天共出现4次),均与灶具操作时间相关但不应导致传感器丢失数据", "厨房窗户19:22打开后至日志结束(23:30)未见关闭记录,夜间持续开窗", "15:55开门后未记录关门/上锁事件,直到22:47才确认前门关闭并自动上锁"], "recommended_actions": ["检查厨房温度传感器的安装位置和供电状态,确认是否受灶具热量或油烟影响导致间歇性通信中断,必要时更换或重新定位传感器", "建议关闭厨房窗户或确认是否有意保持通风,夜间开窗存在安全和蚊虫进入风险", "考虑为入户门设置自动上锁超时策略(如开门后5分钟未手动锁定则自动上锁),避免长时间处于未锁状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.548542976379395, "api_error": null} {"episode_id": "SQ3_TP_C_0460", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0460.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261089, "scenario_id": "CH-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-27T20:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在20:01:30开启后,至日志结束(23:30)超过3小时未见关闭记录,存在干烧/火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 过去6小时为17:30–23:30。温度数据方面,各房间温度从约24.8°C平稳下降至约23.3°C,符合夏季傍晚到深夜的自然降温规律,无异常温升。\",\n \"推理步骤2: 20:00儿童房检测到运动(Occupancy=1),20:01运动消失,20:01:15餐厅检测到运动,20:01:30厨房灶具开启。这一连串事件在时间和空间上连贯,推测是住户从儿童房经过餐厅走到厨房准备晚餐,属于正常生活动线。\",\n \"推理步骤3: 然而,灶具在20:01:30开启(OnOff=True)后,整个日志直到23:30都没有出现对应的关闭事件(OnOff=False)。灶具已持续开启超过3.5小时。\",\n \"推理步骤4: 虽然厨房温度传感器未显示异常高温(从24.19°C降至23.38°C),说明目前尚未发生明火或严重过热,但长时间无人关注的灶具仍然是显著的火灾隐患——尤其是如果锅中液体蒸干后可能引发干烧。\",\n \"推理步骤5: 置信度定为medium而非high,原因是:(a)灶具关闭事件可能发生了但未被日志采集到;(b)某些慢炖场景确实需要长时间开灶;(c)厨房温度并未出现异常升高。但从安全角度仍应发出提醒。\"\n ],\n \"key_evidence\": [\n \"20:01:30 kitchen_cook_surface OnOff=True,此后至23:30无关闭记录,持续开启超过3.5小时\",\n \"20:01:15之后无任何运动传感器触发记录,提示住户可能已离开厨房区域较长时间\",\n \"厨房温度未见异常升高,暂无即时危险但不排除干烧隐患\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送通知,确认厨房灶具是否仍需使用,若无人看管应远程关闭\",\n \"设置灶具自动安全规则:无人活动超过一定时长(如30-60分钟)且灶具仍开启时自动告警或关闭\",\n \"检查厨房烟雾报警器(kitchen_smoke_alarm)是否工作正常,确保在真正发生烟雾时能及时报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "fire_risk", "threat_description": "厨房灶具在20:01:30开启后,至日志结束(23:30)超过3小时未见关闭记录,存在干烧/火灾风险。", "reasoning": ["推理步骤1: 过去6小时为17:30–23:30。温度数据方面,各房间温度从约24.8°C平稳下降至约23.3°C,符合夏季傍晚到深夜的自然降温规律,无异常温升。", "推理步骤2: 20:00儿童房检测到运动(Occupancy=1),20:01运动消失,20:01:15餐厅检测到运动,20:01:30厨房灶具开启。这一连串事件在时间和空间上连贯,推测是住户从儿童房经过餐厅走到厨房准备晚餐,属于正常生活动线。", "推理步骤3: 然而,灶具在20:01:30开启(OnOff=True)后,整个日志直到23:30都没有出现对应的关闭事件(OnOff=False)。灶具已持续开启超过3.5小时。", "推理步骤4: 虽然厨房温度传感器未显示异常高温(从24.19°C降至23.38°C),说明目前尚未发生明火或严重过热,但长时间无人关注的灶具仍然是显著的火灾隐患——尤其是如果锅中液体蒸干后可能引发干烧。", "推理步骤5: 置信度定为medium而非high,原因是:(a)灶具关闭事件可能发生了但未被日志采集到;(b)某些慢炖场景确实需要长时间开灶;(c)厨房温度并未出现异常升高。但从安全角度仍应发出提醒。"], "key_evidence": ["20:01:30 kitchen_cook_surface OnOff=True,此后至23:30无关闭记录,持续开启超过3.5小时", "20:01:15之后无任何运动传感器触发记录,提示住户可能已离开厨房区域较长时间", "厨房温度未见异常升高,暂无即时危险但不排除干烧隐患"], "recommended_actions": ["立即向住户发送通知,确认厨房灶具是否仍需使用,若无人看管应远程关闭", "设置灶具自动安全规则:无人活动超过一定时长(如30-60分钟)且灶具仍开启时自动告警或关闭", "检查厨房烟雾报警器(kitchen_smoke_alarm)是否工作正常,确保在真正发生烟雾时能及时报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.021796703338623, "api_error": null} {"episode_id": "SQ3_TP_C_0471", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0471.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261100, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-10T07:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"家人外出期间厨房灶具被异常开启,厨房温度骤升至31.12°C,存在火灾隐患\",\n \"reasoning\": [\n \"推理步骤1: 07:29全家出门(关灯、锁门、自动上锁),直到16:30才有人回家,期间家中应无人\",\n \"推理步骤2: 07:42厨房灶具(kitchen_cook_surface)在无人在家时被开启(OnOff=True),无任何运动传感器触发,无入户门解锁/开门记录\",\n \"推理步骤3: 07:52厨房温度传感器读数飙升至3112(即31.12°C),相比同时段其他房间的24.6°C高出约6.5°C,明显异常\",\n \"推理步骤4: 07:52烟雾报警器报告SmokeState=0(正常),说明尚未产生烟雾,但灶具持续无人看管存在极大火灾风险\",\n \"推理步骤5: 从07:42到16:30(近9小时)无任何灶具关闭记录,08:00厨房温度回落至24.63°C可能是因为灶具短暂运行后自动关闭或传感器采样问题,但无明确关闭事件\",\n \"推理步骤6: 厨房温度传感器在06:34和07:11两次报告MeasuredValue=None,传感器可能存在故障或受高温干扰\",\n \"推理步骤7: 2026-06-09厨房烟雾报警器已报告BatteryAlert=1(电池低电量警告),若发生火情可能无法正常报警\"\n ],\n \"key_evidence\": [\n \"07:29全家出门锁门,07:42灶具在无人时被开启,无任何入侵迹象(门锁未动、无运动检测)\",\n \"07:52厨房温度骤升至31.12°C,远超同时段其他房间温度(约24.6°C)\",\n \"厨房温度传感器多次报告None值,设备可能存在故障\",\n \"厨房烟雾报警器电池低电量(BatteryAlert=1),报警能力可能受损\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,如仍在运行则远程关闭\",\n \"尽快更换厨房烟雾报警器电池,确保报警功能正常\",\n \"检查厨房温度传感器是否故障(多次报告None值)\",\n \"排查灶具无人时自动开启的原因:检查是否有定时任务、自动化规则误触发,或设备本身故障\",\n \"考虑为灶具添加安全联动规则:当家中无人(门锁上锁+无运动检测)时禁止灶具开启\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "家人外出期间厨房灶具被异常开启,厨房温度骤升至31.12°C,存在火灾隐患", "reasoning": ["推理步骤1: 07:29全家出门(关灯、锁门、自动上锁),直到16:30才有人回家,期间家中应无人", "推理步骤2: 07:42厨房灶具(kitchen_cook_surface)在无人在家时被开启(OnOff=True),无任何运动传感器触发,无入户门解锁/开门记录", "推理步骤3: 07:52厨房温度传感器读数飙升至3112(即31.12°C),相比同时段其他房间的24.6°C高出约6.5°C,明显异常", "推理步骤4: 07:52烟雾报警器报告SmokeState=0(正常),说明尚未产生烟雾,但灶具持续无人看管存在极大火灾风险", "推理步骤5: 从07:42到16:30(近9小时)无任何灶具关闭记录,08:00厨房温度回落至24.63°C可能是因为灶具短暂运行后自动关闭或传感器采样问题,但无明确关闭事件", "推理步骤6: 厨房温度传感器在06:34和07:11两次报告MeasuredValue=None,传感器可能存在故障或受高温干扰", "推理步骤7: 2026-06-09厨房烟雾报警器已报告BatteryAlert=1(电池低电量警告),若发生火情可能无法正常报警"], "key_evidence": ["07:29全家出门锁门,07:42灶具在无人时被开启,无任何入侵迹象(门锁未动、无运动检测)", "07:52厨房温度骤升至31.12°C,远超同时段其他房间温度(约24.6°C)", "厨房温度传感器多次报告None值,设备可能存在故障", "厨房烟雾报警器电池低电量(BatteryAlert=1),报警能力可能受损"], "recommended_actions": ["立即确认厨房灶具当前状态,如仍在运行则远程关闭", "尽快更换厨房烟雾报警器电池,确保报警功能正常", "检查厨房温度传感器是否故障(多次报告None值)", "排查灶具无人时自动开启的原因:检查是否有定时任务、自动化规则误触发,或设备本身故障", "考虑为灶具添加安全联动规则:当家中无人(门锁上锁+无运动检测)时禁止灶具开启"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.55417513847351, "api_error": null} {"episode_id": "SQ3_TP_C_0475", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0475.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261104, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "second_bedroom", "injection_time": "2026-06-05T10:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现异常高温尖峰读数,同时厨房烟雾报警器电池低电量,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(07:00:02、07:01:00、18:37:00、19:00:00 第一条),说明传感器在关键时刻(烹饪时)反复失联或故障,无法提供有效的温度监控。\",\n \"推理步骤2: 10:33 厨房温度传感器报告 3102(约31°C),而同一时刻其他房间温度约为 25.1°C,且 10:30 时厨房自身仅 25.26°C。3分钟内跳升近6°C 极不正常。结合 10:23 灶具开启记录,该传感器可能受热源干扰产生异常读数,也可能是传感器本身硬件不稳定。\",\n \"推理步骤3: 10:33 烟雾报警器报告 SmokeState = 0(正常),但前一天(06-04 10:23)该报警器已报告 BatteryAlert = 1(低电量警告)。低电量状态下烟雾报警器的可靠性降低,若真正发生火灾可能无法正常报警。\",\n \"推理步骤4: 温度传感器故障 + 烟雾报警器低电量,意味着厨房的两道安全防线同时存在隐患。烹饪是厨房火灾的首要原因,而恰恰在灶具使用时传感器失联,这构成了严重的安全监控盲区。\",\n \"推理步骤5: 其余行为模式均属正常——早晨起床、出门上班(07:17 关灯锁门)、下午孩子放学回家(16:27)、傍晚大人回家做饭(18:04-18:59)、晚间就寝(22:41)。入户门锁操作均为手动开锁+自动回锁,无异常入侵迹象。各房间温度随昼夜自然波动,符合夏季规律。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:02、07:01:00、18:37:00、19:00:00 多次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"kitchen_temp_sensor 在 10:33 报告 3102(~31°C),3分钟前仅 2526(~25.3°C),异常跳升约5.8°C\",\n \"kitchen_smoke_alarm 于 06-04 10:23 报告 BatteryAlert = 1(低电量),至今未见电池更换或恢复记录\",\n \"10:23 灶具开启后无人关闭记录(日志中未见对应的 OnOff = False),灶具可能处于无人监管的长时间开启状态\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常报警\",\n \"检查并维修/更换厨房温度传感器,排查其反复报告 None 和异常尖峰读数的原因(可能是接线松动、传感器老化或安装位置过于靠近灶具)\",\n \"核查 10:23 开启的灶具当前状态,日志中未记录该次使用的关闭事件,需确认灶具是否仍在运行\",\n \"考虑为厨房增加冗余温度监测手段(如额外的温度传感器),避免单点故障导致监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现异常高温尖峰读数,同时厨房烟雾报警器电池低电量,存在安全监控盲区。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(07:00:02、07:01:00、18:37:00、19:00:00 第一条),说明传感器在关键时刻(烹饪时)反复失联或故障,无法提供有效的温度监控。", "推理步骤2: 10:33 厨房温度传感器报告 3102(约31°C),而同一时刻其他房间温度约为 25.1°C,且 10:30 时厨房自身仅 25.26°C。3分钟内跳升近6°C 极不正常。结合 10:23 灶具开启记录,该传感器可能受热源干扰产生异常读数,也可能是传感器本身硬件不稳定。", "推理步骤3: 10:33 烟雾报警器报告 SmokeState = 0(正常),但前一天(06-04 10:23)该报警器已报告 BatteryAlert = 1(低电量警告)。低电量状态下烟雾报警器的可靠性降低,若真正发生火灾可能无法正常报警。", "推理步骤4: 温度传感器故障 + 烟雾报警器低电量,意味着厨房的两道安全防线同时存在隐患。烹饪是厨房火灾的首要原因,而恰恰在灶具使用时传感器失联,这构成了严重的安全监控盲区。", "推理步骤5: 其余行为模式均属正常——早晨起床、出门上班(07:17 关灯锁门)、下午孩子放学回家(16:27)、傍晚大人回家做饭(18:04-18:59)、晚间就寝(22:41)。入户门锁操作均为手动开锁+自动回锁,无异常入侵迹象。各房间温度随昼夜自然波动,符合夏季规律。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:02、07:01:00、18:37:00、19:00:00 多次报告 MeasuredValue = None,均发生在灶具使用前后", "kitchen_temp_sensor 在 10:33 报告 3102(~31°C),3分钟前仅 2526(~25.3°C),异常跳升约5.8°C", "kitchen_smoke_alarm 于 06-04 10:23 报告 BatteryAlert = 1(低电量),至今未见电池更换或恢复记录", "10:23 灶具开启后无人关闭记录(日志中未见对应的 OnOff = False),灶具可能处于无人监管的长时间开启状态"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常报警", "检查并维修/更换厨房温度传感器,排查其反复报告 None 和异常尖峰读数的原因(可能是接线松动、传感器老化或安装位置过于靠近灶具)", "核查 10:23 开启的灶具当前状态,日志中未记录该次使用的关闭事件,需确认灶具是否仍在运行", "考虑为厨房增加冗余温度监测手段(如额外的温度传感器),避免单点故障导致监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.692209720611572, "api_error": null} {"episode_id": "SQ3_TP_C_0479", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0479.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261108, "scenario_id": "DF-03", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-07T14:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"low\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧运动传感器在无人活动时段出现快速反复触发,疑似传感器故障或小动物干扰。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据方面,四个房间全天温度走势高度一致——凌晨约23.0°C,随日照升温至中午峰值约25.8°C,午后逐步回落至夜间约23.4°C。各房间温差始终在2°C以内,波动幅度和节奏完全符合夏季自然昼夜温差规律,未出现任何单点异常升温(如火灾)或骤降(如门窗异常打开)。\",\n \"推理步骤2: 整个24小时日志中,除温度传感器的周期性上报外,唯一的非温度事件是14:14:00至14:15:10期间主卧运动传感器的5次状态变化:在约1分钟内出现3次Occupancy=1和2次Occupancy=0的快速交替(间隔分别为30秒、5秒、30秒、5秒)。\",\n \"推理步骤3: 下午14:14是正常活动时段,但这种极短间隔的反复触发模式不太像正常人类活动——人进入房间后通常会持续占用一段时间,而不是在30秒内反复进出。更像是传感器边界灵敏度问题(人在检测边缘走动)、宠物/小动物经过、或传感器本身的抖动故障。\",\n \"推理步骤4: 没有其他传感器(入户门锁、门窗接触传感器、其他房间运动传感器)在同一时段有任何事件,说明不存在入侵迹象。也没有烟雾报警、漏水报警等安全事件触发。\",\n \"推理步骤5: 综合来看,这不构成安全威胁,但主卧运动传感器的抖动行为值得关注——如果频繁出现,可能导致基于运动检测的自动化规则误触发(如灯光反复开关、误报警等),属于轻微的设备可靠性问题。\"\n ],\n \"key_evidence\": [\n \"14:14:00-14:15:10 主卧运动传感器在约70秒内出现5次状态翻转(1→0→1→0→1),触发间隔极短(5-30秒)\",\n \"全天温度曲线平稳,四房间走势一致,无异常温升或骤变\",\n \"除主卧运动传感器外,无任何门锁、门窗传感器、烟雾/漏水报警器事件\"\n ],\n \"recommended_actions\": [\n \"检查主卧运动传感器的安装位置和灵敏度设置,确认是否对准了窗帘、空调出风口等可能引起误触发的位置\",\n \"观察该传感器是否在后续日志中继续出现类似快速抖动,如反复出现建议调整灵敏度或更换传感器\",\n \"如家中有宠物,可考虑将运动传感器调整为忽略低位移动的模式\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "low", "threat_type": "device_fault", "threat_description": "主卧运动传感器在无人活动时段出现快速反复触发,疑似传感器故障或小动物干扰。", "reasoning": ["推理步骤1: 温度数据方面,四个房间全天温度走势高度一致——凌晨约23.0°C,随日照升温至中午峰值约25.8°C,午后逐步回落至夜间约23.4°C。各房间温差始终在2°C以内,波动幅度和节奏完全符合夏季自然昼夜温差规律,未出现任何单点异常升温(如火灾)或骤降(如门窗异常打开)。", "推理步骤2: 整个24小时日志中,除温度传感器的周期性上报外,唯一的非温度事件是14:14:00至14:15:10期间主卧运动传感器的5次状态变化:在约1分钟内出现3次Occupancy=1和2次Occupancy=0的快速交替(间隔分别为30秒、5秒、30秒、5秒)。", "推理步骤3: 下午14:14是正常活动时段,但这种极短间隔的反复触发模式不太像正常人类活动——人进入房间后通常会持续占用一段时间,而不是在30秒内反复进出。更像是传感器边界灵敏度问题(人在检测边缘走动)、宠物/小动物经过、或传感器本身的抖动故障。", "推理步骤4: 没有其他传感器(入户门锁、门窗接触传感器、其他房间运动传感器)在同一时段有任何事件,说明不存在入侵迹象。也没有烟雾报警、漏水报警等安全事件触发。", "推理步骤5: 综合来看,这不构成安全威胁,但主卧运动传感器的抖动行为值得关注——如果频繁出现,可能导致基于运动检测的自动化规则误触发(如灯光反复开关、误报警等),属于轻微的设备可靠性问题。"], "key_evidence": ["14:14:00-14:15:10 主卧运动传感器在约70秒内出现5次状态翻转(1→0→1→0→1),触发间隔极短(5-30秒)", "全天温度曲线平稳,四房间走势一致,无异常温升或骤变", "除主卧运动传感器外,无任何门锁、门窗传感器、烟雾/漏水报警器事件"], "recommended_actions": ["检查主卧运动传感器的安装位置和灵敏度设置,确认是否对准了窗帘、空调出风口等可能引起误触发的位置", "观察该传感器是否在后续日志中继续出现类似快速抖动,如反复出现建议调整灵敏度或更换传感器", "如家中有宠物,可考虑将运动传感器调整为忽略低位移动的模式"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "low"}, "latency": 23.623051166534424, "api_error": null} {"episode_id": "SQ3_TP_C_0480", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0480.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261109, "scenario_id": "INS-05", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "master_bedroom", "injection_time": "2026-06-16T01:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时凌晨 1:31 有一次深夜开锁入户事件值得关注但整体行为链合理。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:44、07:01、18:22、18:59 共四次报告 MeasuredValue = None。其他三个温度传感器在同一时段均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。\",\n \"推理步骤2: 分析 None 出现的时机——06:44 和 18:22 都紧跟在厨房灶具开启之后(06:43:35 开灶、18:21:30 开灶),07:01 和 18:59 则出现在灶具关闭后/厨房窗户打开前后。灶具运行可能导致局部温度骤升超出传感器量程,或蒸汽/油烟干扰传感器工作,但正常的温度传感器不应返回 None,这表明传感器存在故障隐患或安装位置不当。\",\n \"推理步骤3: 凌晨 01:31 的入户事件——门锁通过远程方式(OperationSource=8,即 Remote)由 UserIndex=1 解锁,随后门传感器检测到开门,玄关和客厅依次检测到人体存在,之后主卧灯关闭。这符合住户深夜晚归的行为模式:远程开锁进门→经过玄关→到客厅→关主卧灯准备休息。行为链连贯,无入侵特征。\",\n \"推理步骤4: 早晨 06:06 主卧有人活动→洗漱→做早餐→06:28 儿童房有人起床→07:00 餐厅用餐→07:33 全家关灯出门并锁门,这是典型的工作日早晨出门流程。\",\n \"推理步骤5: 下午 16:06 开门后直接去儿童房(推测孩子放学回家),17:48 再次开门后去客厅开灯开空调(推测大人下班回家),18:21 做晚饭,18:58 用餐,19:25 开洗碗机,21:19 孩子关灯拉窗帘睡觉,22:34 大人关灯锁门睡觉。整个生活节奏完全正常。\",\n \"推理步骤6: 温度趋势方面,凌晨约 22.9-23.1°C,06:00 起跳升至约 24°C(符合夏季日出升温),中午峰值约 25.8-25.9°C,傍晚逐步回落,晚间降至约 23.3°C。各房间温度走势一致且合理,无异常热源迹象。\",\n \"推理步骤7: 门锁、门窗传感器、烟雾报警器、漏水传感器在整个周期内均未触发告警事件,厨房窗户两次打开(07:00:30 和 18:58:30)均在做饭前后,属于通风操作。入户门在出门和睡前均自动上锁(LockState=1),安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:44、07:01、18:22、18:59 四次报告 MeasuredValue = None,均与灶具使用时段高度相关,其他传感器同期正常\",\n \"凌晨 01:31 远程开锁(OperationSource=8, UserIndex=1)后行为链连贯:玄关→客厅→主卧关灯,符合晚归模式\",\n \"全天生活节奏规律:早起→出门→孩子放学→大人下班→做饭→睡觉,无异常时段活动\",\n \"所有门锁在离家和睡前均处于锁定状态(LockState=1),烟雾和漏水传感器无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或油烟干扰;如位置合理则考虑更换传感器\",\n \"检查厨房温度传感器的固件版本,确认是否存在已知的 None 值上报 bug,必要时进行固件升级\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当连续出现无效读数时及时通知用户,避免在真正发生火灾时丧失温度监测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时凌晨 1:31 有一次深夜开锁入户事件值得关注但整体行为链合理。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:44、07:01、18:22、18:59 共四次报告 MeasuredValue = None。其他三个温度传感器在同一时段均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。", "推理步骤2: 分析 None 出现的时机——06:44 和 18:22 都紧跟在厨房灶具开启之后(06:43:35 开灶、18:21:30 开灶),07:01 和 18:59 则出现在灶具关闭后/厨房窗户打开前后。灶具运行可能导致局部温度骤升超出传感器量程,或蒸汽/油烟干扰传感器工作,但正常的温度传感器不应返回 None,这表明传感器存在故障隐患或安装位置不当。", "推理步骤3: 凌晨 01:31 的入户事件——门锁通过远程方式(OperationSource=8,即 Remote)由 UserIndex=1 解锁,随后门传感器检测到开门,玄关和客厅依次检测到人体存在,之后主卧灯关闭。这符合住户深夜晚归的行为模式:远程开锁进门→经过玄关→到客厅→关主卧灯准备休息。行为链连贯,无入侵特征。", "推理步骤4: 早晨 06:06 主卧有人活动→洗漱→做早餐→06:28 儿童房有人起床→07:00 餐厅用餐→07:33 全家关灯出门并锁门,这是典型的工作日早晨出门流程。", "推理步骤5: 下午 16:06 开门后直接去儿童房(推测孩子放学回家),17:48 再次开门后去客厅开灯开空调(推测大人下班回家),18:21 做晚饭,18:58 用餐,19:25 开洗碗机,21:19 孩子关灯拉窗帘睡觉,22:34 大人关灯锁门睡觉。整个生活节奏完全正常。", "推理步骤6: 温度趋势方面,凌晨约 22.9-23.1°C,06:00 起跳升至约 24°C(符合夏季日出升温),中午峰值约 25.8-25.9°C,傍晚逐步回落,晚间降至约 23.3°C。各房间温度走势一致且合理,无异常热源迹象。", "推理步骤7: 门锁、门窗传感器、烟雾报警器、漏水传感器在整个周期内均未触发告警事件,厨房窗户两次打开(07:00:30 和 18:58:30)均在做饭前后,属于通风操作。入户门在出门和睡前均自动上锁(LockState=1),安防状态良好。"], "key_evidence": ["厨房温度传感器在 06:44、07:01、18:22、18:59 四次报告 MeasuredValue = None,均与灶具使用时段高度相关,其他传感器同期正常", "凌晨 01:31 远程开锁(OperationSource=8, UserIndex=1)后行为链连贯:玄关→客厅→主卧关灯,符合晚归模式", "全天生活节奏规律:早起→出门→孩子放学→大人下班→做饭→睡觉,无异常时段活动", "所有门锁在离家和睡前均处于锁定状态(LockState=1),烟雾和漏水传感器无告警"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或油烟干扰;如位置合理则考虑更换传感器", "检查厨房温度传感器的固件版本,确认是否存在已知的 None 值上报 bug,必要时进行固件升级", "考虑为厨房温度传感器设置 None 值告警规则,当连续出现无效读数时及时通知用户,避免在真正发生火灾时丧失温度监测能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.967068910598755, "api_error": null} {"episode_id": "SQ3_TP_C_0482", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0482.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261111, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-26T08:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在多项异常:做饭期间读数丢失(None)、出现非标准格式上报,且次日起读数固定为2350不再变化,高度疑似传感器故障或离线。\",\n \"reasoning\": [\n \"推理步骤1: 梳理厨房温度传感器(kitchen_temp_sensor)的上报记录,发现两类异常格式——正常上报使用 'TemperatureMeasurement.MeasuredValue',但在 08:00、12:00、18:00、22:00 以及次日多个时间点出现了缩写格式 'MeasuredValue = 2350',缺少 Cluster 前缀,这不符合 Matter 协议标准上报格式,可能是传感器固件异常或通信协议降级。\",\n \"推理步骤2: 在两次做饭期间(07:01~07:14 和 18:40~18:59),厨房温度传感器连续上报 MeasuredValue = None,表示传感器在高温环境下无法正常采集数据。灶具开启后厨房温度应升高,传感器却丢失读数,说明传感器在极端工况下存在故障。\",\n \"推理步骤3: 对比正常格式上报的数据,厨房温度与其他房间(客厅、主卧、儿童房)的温度走势基本一致,呈现白天升高、夜间降低的合理日变化曲线,说明正常格式的读数本身没有问题。\",\n \"推理步骤4: 非标准格式上报的读数始终固定为 2350(08:00)、2510(12:00)、2400(18:00)、2280(22:00),到了6月27日和28日更是全部锁定在 2350 不再变化。同一时刻正常格式上报的值与非标准格式值存在明显偏差(如 22:00 正常值 2367 vs 非标准值 2280),且次日起正常格式上报完全消失,只剩固定值 2350,强烈暗示传感器已进入故障/离线状态。\",\n \"推理步骤5: 厨房窗户传感器在做饭结束后打开(07:13:30 和 18:58:30),属于通风的正常操作,但日志中未见其关闭记录,无法确认窗户是否一直处于打开状态,这是一个次要关注点。\",\n \"推理步骤6: 其余设备行为均正常——入户门锁的开锁/上锁配对完整且均为手动操作加自动上锁;家庭成员的活动模式(早起、出门、下午回家、晚间就寝)合理;灯光、窗帘、空调的使用与时间和人员活动吻合;烟雾报警器和漏水传感器均未触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在做饭期间(07:01、07:14、18:40、18:59)连续上报 MeasuredValue = None\",\n \"厨房温度传感器多次出现非标准格式上报 'MeasuredValue'(缺少 TemperatureMeasurement Cluster 前缀),不符合 Matter 协议规范\",\n \"6月27日起厨房温度传感器正常格式上报完全消失,仅剩非标准格式且读数固定为 2350,持续超过48小时不变化\",\n \"同一时刻正常格式与非标准格式读数存在偏差(如 22:00 正常值 2367 vs 非标准值 2280),说明数据源不一致\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的物理状态和供电情况,确认是否需要重启或更换设备\",\n \"检查传感器固件版本,非标准格式上报可能是固件 bug 导致的协议降级,考虑升级固件\",\n \"在传感器修复前,加强对厨房烟雾报警器的关注,因为温度传感器失效会削弱厨房的火灾预警能力\",\n \"确认厨房窗户是否仍处于打开状态,长时间未关闭可能存在安全隐患(尤其是夜间和外出期间)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在多项异常:做饭期间读数丢失(None)、出现非标准格式上报,且次日起读数固定为2350不再变化,高度疑似传感器故障或离线。", "reasoning": ["推理步骤1: 梳理厨房温度传感器(kitchen_temp_sensor)的上报记录,发现两类异常格式——正常上报使用 'TemperatureMeasurement.MeasuredValue',但在 08:00、12:00、18:00、22:00 以及次日多个时间点出现了缩写格式 'MeasuredValue = 2350',缺少 Cluster 前缀,这不符合 Matter 协议标准上报格式,可能是传感器固件异常或通信协议降级。", "推理步骤2: 在两次做饭期间(07:01~07:14 和 18:40~18:59),厨房温度传感器连续上报 MeasuredValue = None,表示传感器在高温环境下无法正常采集数据。灶具开启后厨房温度应升高,传感器却丢失读数,说明传感器在极端工况下存在故障。", "推理步骤3: 对比正常格式上报的数据,厨房温度与其他房间(客厅、主卧、儿童房)的温度走势基本一致,呈现白天升高、夜间降低的合理日变化曲线,说明正常格式的读数本身没有问题。", "推理步骤4: 非标准格式上报的读数始终固定为 2350(08:00)、2510(12:00)、2400(18:00)、2280(22:00),到了6月27日和28日更是全部锁定在 2350 不再变化。同一时刻正常格式上报的值与非标准格式值存在明显偏差(如 22:00 正常值 2367 vs 非标准值 2280),且次日起正常格式上报完全消失,只剩固定值 2350,强烈暗示传感器已进入故障/离线状态。", "推理步骤5: 厨房窗户传感器在做饭结束后打开(07:13:30 和 18:58:30),属于通风的正常操作,但日志中未见其关闭记录,无法确认窗户是否一直处于打开状态,这是一个次要关注点。", "推理步骤6: 其余设备行为均正常——入户门锁的开锁/上锁配对完整且均为手动操作加自动上锁;家庭成员的活动模式(早起、出门、下午回家、晚间就寝)合理;灯光、窗帘、空调的使用与时间和人员活动吻合;烟雾报警器和漏水传感器均未触发。"], "key_evidence": ["厨房温度传感器在做饭期间(07:01、07:14、18:40、18:59)连续上报 MeasuredValue = None", "厨房温度传感器多次出现非标准格式上报 'MeasuredValue'(缺少 TemperatureMeasurement Cluster 前缀),不符合 Matter 协议规范", "6月27日起厨房温度传感器正常格式上报完全消失,仅剩非标准格式且读数固定为 2350,持续超过48小时不变化", "同一时刻正常格式与非标准格式读数存在偏差(如 22:00 正常值 2367 vs 非标准值 2280),说明数据源不一致"], "recommended_actions": ["立即检查厨房温度传感器的物理状态和供电情况,确认是否需要重启或更换设备", "检查传感器固件版本,非标准格式上报可能是固件 bug 导致的协议降级,考虑升级固件", "在传感器修复前,加强对厨房烟雾报警器的关注,因为温度传感器失效会削弱厨房的火灾预警能力", "确认厨房窗户是否仍处于打开状态,长时间未关闭可能存在安全隐患(尤其是夜间和外出期间)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 36.128578424453735, "api_error": null} {"episode_id": "SQ3_TP_C_0486", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0486.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261115, "scenario_id": "FG-04", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kids_room", "injection_time": "2026-06-13T00:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨0:30厨房灶具异常开启,导致厨房温度在10分钟内急剧升高近7°C,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 在2026-06-13T00:30:00,厨房灶具(kitchen_cook_surface)的OnOff状态变为True,表示灶具被点燃。凌晨0:30是深夜时段,正常家庭极少在此时使用灶具。\",\n \"推理步骤2: 灶具开启后仅10分钟(00:40),厨房温度从2307(23.07°C)急剧升至2980(29.80°C),升幅约6.7°C,这是异常快速的温升,说明灶具确实在工作且可能处于高火力状态。\",\n \"推理步骤3: 在00:40时刻,烟雾报警器报告SmokeState=0(正常/无烟),说明尚未产生烟雾,但温度已经异常升高。结合此前(6月12日)该烟雾报警器已报告BatteryAlert=1(电池电量低),报警器的可靠性存疑。\",\n \"推理步骤4: 日志中没有任何运动传感器(entrance_occupancy、kitchen区域无运动传感器但可参考其他区域)在该时段触发的记录,也没有门锁解锁记录,说明深夜无人活动的可能性较大,灶具可能是被误触、儿童操作或设备故障导致开启。\",\n \"推理步骤5: 到01:00时厨房温度回落至2310(23.10°C),说明灶具可能在某个时间点被关闭,但日志中未记录关闭事件,这段无人看管的灶具运行时间构成了火灾隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-13T00:30:00 厨房灶具在深夜凌晨异常开启(OnOff=True)\",\n \"2026-06-13T00:40:00 厨房温度10分钟内从23.07°C飙升至29.80°C\",\n \"2026-06-12T00:30:00 厨房烟雾报警器电池电量低(BatteryAlert=1),报警可靠性下降\",\n \"深夜时段无任何人员活动迹象(无运动传感器触发、无门锁操作记录)\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具当前状态,确认是否已关闭;如仍在运行则远程关闭\",\n \"尽快更换厨房烟雾报警器电池,确保火灾预警能力正常\",\n \"排查灶具深夜自动开启的原因(误触、自动化规则错误、设备故障),必要时禁用灶具的远程/自动控制功能\",\n \"考虑为灶具添加深夜时段(22:00-06:00)自动锁定规则,防止无人看管时开启\",\n \"在厨房区域增设运动传感器,以便关联判断灶具使用时是否有人在场\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨0:30厨房灶具异常开启,导致厨房温度在10分钟内急剧升高近7°C,存在火灾风险。", "reasoning": ["推理步骤1: 在2026-06-13T00:30:00,厨房灶具(kitchen_cook_surface)的OnOff状态变为True,表示灶具被点燃。凌晨0:30是深夜时段,正常家庭极少在此时使用灶具。", "推理步骤2: 灶具开启后仅10分钟(00:40),厨房温度从2307(23.07°C)急剧升至2980(29.80°C),升幅约6.7°C,这是异常快速的温升,说明灶具确实在工作且可能处于高火力状态。", "推理步骤3: 在00:40时刻,烟雾报警器报告SmokeState=0(正常/无烟),说明尚未产生烟雾,但温度已经异常升高。结合此前(6月12日)该烟雾报警器已报告BatteryAlert=1(电池电量低),报警器的可靠性存疑。", "推理步骤4: 日志中没有任何运动传感器(entrance_occupancy、kitchen区域无运动传感器但可参考其他区域)在该时段触发的记录,也没有门锁解锁记录,说明深夜无人活动的可能性较大,灶具可能是被误触、儿童操作或设备故障导致开启。", "推理步骤5: 到01:00时厨房温度回落至2310(23.10°C),说明灶具可能在某个时间点被关闭,但日志中未记录关闭事件,这段无人看管的灶具运行时间构成了火灾隐患。"], "key_evidence": ["2026-06-13T00:30:00 厨房灶具在深夜凌晨异常开启(OnOff=True)", "2026-06-13T00:40:00 厨房温度10分钟内从23.07°C飙升至29.80°C", "2026-06-12T00:30:00 厨房烟雾报警器电池电量低(BatteryAlert=1),报警可靠性下降", "深夜时段无任何人员活动迹象(无运动传感器触发、无门锁操作记录)"], "recommended_actions": ["立即检查厨房灶具当前状态,确认是否已关闭;如仍在运行则远程关闭", "尽快更换厨房烟雾报警器电池,确保火灾预警能力正常", "排查灶具深夜自动开启的原因(误触、自动化规则错误、设备故障),必要时禁用灶具的远程/自动控制功能", "考虑为灶具添加深夜时段(22:00-06:00)自动锁定规则,防止无人看管时开启", "在厨房区域增设运动传感器,以便关联判断灶具使用时是否有人在场"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.78623676300049, "api_error": null} {"episode_id": "SQ3_TP_C_0487", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0487.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261116, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "second_bedroom", "injection_time": "2026-06-16T06:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在设备故障风险,可能导致厨房安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:03、07:06、18:36、19:01 四次报告 MeasuredValue = None,均发生在灶具使用前后。传感器在高温环境下反复失效,说明设备可能存在硬件故障或耐温能力不足。\",\n \"推理步骤2: 06:50 灶具开启期间,厨房温度骤升至 2972(约29.7°C),随后传感器在 07:03 和 07:06 连续两次返回 None。晚间 18:35 灶具再次开启后,18:36 和 19:01 又出现 None。这表明传感器在灶具工作时系统性失效,而非偶发通信中断。\",\n \"推理步骤3: 厨房烟雾报警器在 06-15T06:40 已报告 BatteryAlert = 1(低电量警告)。如果温度传感器同时失效,厨房的两道安全防线都存在隐患——烟雾报警器可能因电量不足无法正常报警,温度传感器又无法在灶具使用时提供有效监测。\",\n \"推理步骤4: 06:50 烟雾报警器报告 SmokeState = 0(无烟雾),说明当时并无真实火灾,灶具使用属于正常烹饪行为。但传感器的反复失效意味着如果真正发生危险,系统可能无法及时检测。\",\n \"推理步骤5: 其余行为模式均属正常——早晨 06:08 主卧起床、07:32 全家出门并自动锁门、16:24 孩子放学回家、17:51 大人回家开空调、21:05 孩子关灯睡觉、22:47 大人就寝锁门,完全符合三口之家的日常作息。温度曲线呈现正常的昼夜变化(夜间约23°C,午间峰值约25.8°C)。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:03、07:06、18:36、19:01 四次报告 MeasuredValue = None,均与灶具使用时段高度关联\",\n \"kitchen_smoke_alarm 在 06-15T06:40 报告 BatteryAlert = 1(低电量),距今已超过24小时仍未处理\",\n \"06:50 灶具使用期间厨房温度骤升至 2972(29.7°C),随后传感器立即失效\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保报警功能正常\",\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换\",\n \"在传感器修复前,烹饪时保持厨房窗户开启通风(日志显示住户已有此习惯,07:05:30 和 19:00:30 均开窗)\",\n \"考虑为厨房增加一个备用温度传感器,避免单点故障导致监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且烟雾报警器电池低电量,存在设备故障风险,可能导致厨房安全监控盲区。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:03、07:06、18:36、19:01 四次报告 MeasuredValue = None,均发生在灶具使用前后。传感器在高温环境下反复失效,说明设备可能存在硬件故障或耐温能力不足。", "推理步骤2: 06:50 灶具开启期间,厨房温度骤升至 2972(约29.7°C),随后传感器在 07:03 和 07:06 连续两次返回 None。晚间 18:35 灶具再次开启后,18:36 和 19:01 又出现 None。这表明传感器在灶具工作时系统性失效,而非偶发通信中断。", "推理步骤3: 厨房烟雾报警器在 06-15T06:40 已报告 BatteryAlert = 1(低电量警告)。如果温度传感器同时失效,厨房的两道安全防线都存在隐患——烟雾报警器可能因电量不足无法正常报警,温度传感器又无法在灶具使用时提供有效监测。", "推理步骤4: 06:50 烟雾报警器报告 SmokeState = 0(无烟雾),说明当时并无真实火灾,灶具使用属于正常烹饪行为。但传感器的反复失效意味着如果真正发生危险,系统可能无法及时检测。", "推理步骤5: 其余行为模式均属正常——早晨 06:08 主卧起床、07:32 全家出门并自动锁门、16:24 孩子放学回家、17:51 大人回家开空调、21:05 孩子关灯睡觉、22:47 大人就寝锁门,完全符合三口之家的日常作息。温度曲线呈现正常的昼夜变化(夜间约23°C,午间峰值约25.8°C)。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 07:03、07:06、18:36、19:01 四次报告 MeasuredValue = None,均与灶具使用时段高度关联", "kitchen_smoke_alarm 在 06-15T06:40 报告 BatteryAlert = 1(低电量),距今已超过24小时仍未处理", "06:50 灶具使用期间厨房温度骤升至 2972(29.7°C),随后传感器立即失效"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保报警功能正常", "检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换", "在传感器修复前,烹饪时保持厨房窗户开启通风(日志显示住户已有此习惯,07:05:30 和 19:00:30 均开窗)", "考虑为厨房增加一个备用温度传感器,避免单点故障导致监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.972706079483032, "api_error": null} {"episode_id": "SQ3_TP_C_0488", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0488.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261117, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-01T00:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨00:14发生连续4次门锁操作错误并触发门锁报警,疑似有人尝试暴力破解入户门锁。\",\n \"reasoning\": [\n \"推理步骤1: 在00:14:00至00:14:40的40秒内,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/无线方式操作,OperationError=1表示凭证无效。\",\n \"推理步骤2: 紧接着在00:14:50触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码尝试次数超限,门锁自动锁定。\",\n \"推理步骤3: 事件发生在凌晨00:14,属于深夜时段,住户已入睡(无任何运动传感器触发、灯光全灭),正常住户不太可能在此时段通过远程方式反复输错密码。\",\n \"推理步骤4: 此后门锁未被成功打开,入户门传感器未报告开门事件,说明入侵尝试未成功,但威胁确实存在。\",\n \"推理步骤5: 其余日志中厨房温度传感器多次报告None值属于设备故障(低优先级),整体生活模式(早起、做饭、出门、回家、晚餐、就寝)均正常。\"\n ],\n \"key_evidence\": [\n \"00:14:00-00:14:40 连续4次 LockOperationError(OperationError=1, OperationSource=3),来源为远程操作\",\n \"00:14:50 触发 DoorLockAlarm(AlarmCode=3),错误密码尝试超限报警\",\n \"事件发生在凌晨深夜,全屋无人活动\"\n ],\n \"recommended_actions\": [\n \"立即检查门锁远程访问日志,确认操作来源IP或设备,排查是否有未授权的远程访问凭证\",\n \"临时禁用门锁的远程解锁功能,仅保留物理钥匙和本地密码解锁\",\n \"更换门锁密码/PIN码,并检查是否有共享给他人的旧凭证需要撤销\",\n \"启用门锁异常告警的实时推送通知,确保住户第一时间收到报警\",\n \"关注厨房温度传感器频繁报告None值的问题,建议检查传感器电池或连接状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨00:14发生连续4次门锁操作错误并触发门锁报警,疑似有人尝试暴力破解入户门锁。", "reasoning": ["推理步骤1: 在00:14:00至00:14:40的40秒内,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/无线方式操作,OperationError=1表示凭证无效。", "推理步骤2: 紧接着在00:14:50触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误密码尝试次数超限,门锁自动锁定。", "推理步骤3: 事件发生在凌晨00:14,属于深夜时段,住户已入睡(无任何运动传感器触发、灯光全灭),正常住户不太可能在此时段通过远程方式反复输错密码。", "推理步骤4: 此后门锁未被成功打开,入户门传感器未报告开门事件,说明入侵尝试未成功,但威胁确实存在。", "推理步骤5: 其余日志中厨房温度传感器多次报告None值属于设备故障(低优先级),整体生活模式(早起、做饭、出门、回家、晚餐、就寝)均正常。"], "key_evidence": ["00:14:00-00:14:40 连续4次 LockOperationError(OperationError=1, OperationSource=3),来源为远程操作", "00:14:50 触发 DoorLockAlarm(AlarmCode=3),错误密码尝试超限报警", "事件发生在凌晨深夜,全屋无人活动"], "recommended_actions": ["立即检查门锁远程访问日志,确认操作来源IP或设备,排查是否有未授权的远程访问凭证", "临时禁用门锁的远程解锁功能,仅保留物理钥匙和本地密码解锁", "更换门锁密码/PIN码,并检查是否有共享给他人的旧凭证需要撤销", "启用门锁异常告警的实时推送通知,确保住户第一时间收到报警", "关注厨房温度传感器频繁报告None值的问题,建议检查传感器电池或连接状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.857613563537598, "api_error": null} {"episode_id": "SQ3_TP_C_0494", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0494.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261123, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-10T18:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:35、06:58、18:44、19:28 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点与灶具开启/关闭时间高度相关(06:34 灶具开启 → 06:35 None;18:43 灶具开启 → 18:44 None;06:57 灶具关闭 → 06:58 None;19:27 灶具关闭 → 19:28 None),说明灶具运行可能对传感器产生干扰,或传感器在高温环境下超出量程。\",\n \"推理步骤3: 虽然传感器在下一个整点周期(07:00、19:00 等)恢复了正常读数,但反复出现的 None 值意味着在烹饪期间存在监测盲区,若发生真实火灾风险将无法通过温度数据及时发现。\",\n \"推理步骤4: 其余设备行为均属正常——早晨起床、出门上锁、下午孩子回家、傍晚大人回家做饭、晚间就寝锁门,时间线和动作逻辑一致,无入侵或其他安全威胁迹象。\",\n \"推理步骤5: 玄关运动传感器在 18:57-18:58 出现快速反复触发(1→0→1→0→1),但结合当时家中有人做饭的场景,可能是人员在玄关与厨房之间来回走动,属于正常活动。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:35、06:58、18:44、19:28 四次报告 MeasuredValue = None\",\n \"None 值出现时间与 kitchen_cook_surface 开关操作高度吻合(灶具开启/关闭后约1分钟内出现)\",\n \"其他三个温度传感器在相同时段始终正常上报\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程或热干扰\",\n \"考虑为厨房温度传感器增加隔热防护或将其重新定位到远离灶具的位置\",\n \"在传感器报告 None 期间,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为备用安全监测手段\",\n \"如问题持续出现,建议更换耐高温型温度传感器或联系设备厂商排查固件问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:35、06:58、18:44、19:28 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: None 值出现的时间点与灶具开启/关闭时间高度相关(06:34 灶具开启 → 06:35 None;18:43 灶具开启 → 18:44 None;06:57 灶具关闭 → 06:58 None;19:27 灶具关闭 → 19:28 None),说明灶具运行可能对传感器产生干扰,或传感器在高温环境下超出量程。", "推理步骤3: 虽然传感器在下一个整点周期(07:00、19:00 等)恢复了正常读数,但反复出现的 None 值意味着在烹饪期间存在监测盲区,若发生真实火灾风险将无法通过温度数据及时发现。", "推理步骤4: 其余设备行为均属正常——早晨起床、出门上锁、下午孩子回家、傍晚大人回家做饭、晚间就寝锁门,时间线和动作逻辑一致,无入侵或其他安全威胁迹象。", "推理步骤5: 玄关运动传感器在 18:57-18:58 出现快速反复触发(1→0→1→0→1),但结合当时家中有人做饭的场景,可能是人员在玄关与厨房之间来回走动,属于正常活动。"], "key_evidence": ["kitchen_temp_sensor 在 06:35、06:58、18:44、19:28 四次报告 MeasuredValue = None", "None 值出现时间与 kitchen_cook_surface 开关操作高度吻合(灶具开启/关闭后约1分钟内出现)", "其他三个温度传感器在相同时段始终正常上报"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程或热干扰", "考虑为厨房温度传感器增加隔热防护或将其重新定位到远离灶具的位置", "在传感器报告 None 期间,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为备用安全监测手段", "如问题持续出现,建议更换耐高温型温度传感器或联系设备厂商排查固件问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.776330709457397, "api_error": null} {"episode_id": "SQ3_TP_C_0492", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0492.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261121, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-18T05:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时阳台门传感器在凌晨触发后未见关闭记录,入户门在下午16:00开锁后长时间未见关门记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:16、18:24、19:30 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。多次出现 None 表明传感器可能受高温干扰导致读数失效,或存在间歇性通信/硬件故障。\",\n \"推理步骤2: 阳台门传感器在 05:17 报告 StateValue = False(门打开),但整个日志中没有对应的 StateValue = True(门关闭)记录。凌晨5点开阳台门可能是晨练或通风,但持续未关闭存在安全隐患。\",\n \"推理步骤3: 入户门在 16:00 开锁并打开(front_door_contact = False),但直到 22:37 才出现 front_door_contact = True(关门)。中间长达约6小时37分钟入户门处于开启状态,这不太寻常——虽然家中有人,但入户门长时间不关存在入侵风险。\",\n \"推理步骤4: 其余行为模式均属正常——早晨6点左右起床、洗漱、做早餐、7:25出门上班并自动锁门;下午16:00孩子放学回家进儿童房;17:40大人回家开灯开空调;18:23做晚饭、19:29吃饭、20:00洗碗机启动;21:04孩子关灯睡觉、22:37大人关灯就寝并锁门。这是典型的工作日家庭作息。\",\n \"推理步骤5: 温度趋势正常:夜间约23°C,白天逐步升至25-26°C(中午峰值),傍晚回落。17:40开启空调制冷(SystemMode=3)后温度从约24.7°C降至22:00的约23.5°C,符合预期。\",\n \"推理步骤6: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常的远程解锁或暴力开锁事件。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:53、07:16、18:24、19:30 四次报告 MeasuredValue = None,指示传感器间歇性故障\",\n \"balcony_door_contact 在 05:17 报告 StateValue = False(开门)后全天无关闭记录\",\n \"front_door_contact 在 16:00:02 报告 StateValue = False(开门),直到 22:37:23 才报告 True(关门),入户门开启超过6.5小时\",\n \"厨房窗户传感器在 07:15:30 和 19:29:30 两次报告 StateValue = False(开窗),均无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温影响导致间歇性失效,必要时更换或重新定位传感器\",\n \"确认阳台门当前状态,如确实未关闭请及时关闭;检查阳台门传感器是否工作正常\",\n \"建议设置入户门长时间未关闭的自动提醒(如超过10分钟未关门则推送通知),避免安全隐患\",\n \"检查厨房窗户传感器是否正常,确认窗户实际开关状态\",\n \"考虑为厨房温度传感器设置 None 值告警规则,以便及时发现传感器离线或故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时阳台门传感器在凌晨触发后未见关闭记录,入户门在下午16:00开锁后长时间未见关门记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:16、18:24、19:30 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。多次出现 None 表明传感器可能受高温干扰导致读数失效,或存在间歇性通信/硬件故障。", "推理步骤2: 阳台门传感器在 05:17 报告 StateValue = False(门打开),但整个日志中没有对应的 StateValue = True(门关闭)记录。凌晨5点开阳台门可能是晨练或通风,但持续未关闭存在安全隐患。", "推理步骤3: 入户门在 16:00 开锁并打开(front_door_contact = False),但直到 22:37 才出现 front_door_contact = True(关门)。中间长达约6小时37分钟入户门处于开启状态,这不太寻常——虽然家中有人,但入户门长时间不关存在入侵风险。", "推理步骤4: 其余行为模式均属正常——早晨6点左右起床、洗漱、做早餐、7:25出门上班并自动锁门;下午16:00孩子放学回家进儿童房;17:40大人回家开灯开空调;18:23做晚饭、19:29吃饭、20:00洗碗机启动;21:04孩子关灯睡觉、22:37大人关灯就寝并锁门。这是典型的工作日家庭作息。", "推理步骤5: 温度趋势正常:夜间约23°C,白天逐步升至25-26°C(中午峰值),傍晚回落。17:40开启空调制冷(SystemMode=3)后温度从约24.7°C降至22:00的约23.5°C,符合预期。", "推理步骤6: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常的远程解锁或暴力开锁事件。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:53、07:16、18:24、19:30 四次报告 MeasuredValue = None,指示传感器间歇性故障", "balcony_door_contact 在 05:17 报告 StateValue = False(开门)后全天无关闭记录", "front_door_contact 在 16:00:02 报告 StateValue = False(开门),直到 22:37:23 才报告 True(关门),入户门开启超过6.5小时", "厨房窗户传感器在 07:15:30 和 19:29:30 两次报告 StateValue = False(开窗),均无对应关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温影响导致间歇性失效,必要时更换或重新定位传感器", "确认阳台门当前状态,如确实未关闭请及时关闭;检查阳台门传感器是否工作正常", "建议设置入户门长时间未关闭的自动提醒(如超过10分钟未关门则推送通知),避免安全隐患", "检查厨房窗户传感器是否正常,确认窗户实际开关状态", "考虑为厨房温度传感器设置 None 值告警规则,以便及时发现传感器离线或故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.820428609848022, "api_error": null} {"episode_id": "SQ3_TP_C_0504", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0504.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261133, "scenario_id": "INS-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-29T00:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;次卧窗户深夜开启后整日未关闭也需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:37、07:04、18:25、19:14 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器在厨房温度变化较大时无法正常读数,可能是传感器过热保护、通信中断或硬件故障。\",\n \"推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),它们全天每30分钟稳定上报数据,无任何 None 值。这排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 次卧窗户传感器在 00:21 报告 StateValue=False(窗户打开),之后整个日志中再无该传感器关闭事件。虽然夏季夜间开窗通风属正常行为,但全天外出期间(07:46 至 16:31 家中无人)窗户持续开启存在一定安全隐患。\",\n \"推理步骤4: 整体生活模式正常——早晨 06:13 起床、06:36 做早餐、07:46 出门并自动锁门、16:31 孩子先回家、18:12 大人回家做晚餐、21:06 孩子就寝、22:10 大人就寝并锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。\",\n \"推理步骤5: 温度趋势符合夏季规律(凌晨约 23°C,午间升至约 25.8°C,傍晚回落),无异常温升。烟雾报警器和漏水传感器全天无告警。灶具使用时间合理(早餐约 27 分钟,晚餐约 49 分钟),无火灾风险信号。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37、07:04、18:25、19:14 四次报告 MeasuredValue = None,均与灶具操作时间高度相关\",\n \"second_bedroom_window_contact 在 00:21 报告 StateValue=False 后全天无关闭记录,家中无人时段(07:46-16:31)窗户持续开启\",\n \"其他三个温度传感器全天数据完整无缺失,排除系统级故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时重新定位或更换耐高温型号\",\n \"为次卧窗户设置离家自动提醒规则:当入户门锁定且窗户仍处于打开状态时,推送通知提醒住户\",\n \"对厨房温度传感器进行固件检查或重置,观察后续是否仍出现 None 值;如持续异常则更换设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;次卧窗户深夜开启后整日未关闭也需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:37、07:04、18:25、19:14 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器在厨房温度变化较大时无法正常读数,可能是传感器过热保护、通信中断或硬件故障。", "推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),它们全天每30分钟稳定上报数据,无任何 None 值。这排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 次卧窗户传感器在 00:21 报告 StateValue=False(窗户打开),之后整个日志中再无该传感器关闭事件。虽然夏季夜间开窗通风属正常行为,但全天外出期间(07:46 至 16:31 家中无人)窗户持续开启存在一定安全隐患。", "推理步骤4: 整体生活模式正常——早晨 06:13 起床、06:36 做早餐、07:46 出门并自动锁门、16:31 孩子先回家、18:12 大人回家做晚餐、21:06 孩子就寝、22:10 大人就寝并锁门。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。", "推理步骤5: 温度趋势符合夏季规律(凌晨约 23°C,午间升至约 25.8°C,傍晚回落),无异常温升。烟雾报警器和漏水传感器全天无告警。灶具使用时间合理(早餐约 27 分钟,晚餐约 49 分钟),无火灾风险信号。"], "key_evidence": ["kitchen_temp_sensor 在 06:37、07:04、18:25、19:14 四次报告 MeasuredValue = None,均与灶具操作时间高度相关", "second_bedroom_window_contact 在 00:21 报告 StateValue=False 后全天无关闭记录,家中无人时段(07:46-16:31)窗户持续开启", "其他三个温度传感器全天数据完整无缺失,排除系统级故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时重新定位或更换耐高温型号", "为次卧窗户设置离家自动提醒规则:当入户门锁定且窗户仍处于打开状态时,推送通知提醒住户", "对厨房温度传感器进行固件检查或重置,观察后续是否仍出现 None 值;如持续异常则更换设备"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.114574670791626, "api_error": null} {"episode_id": "SQ3_TP_C_0505", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0505.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261134, "scenario_id": "WD-01", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-03T18:49:00", "variant": "TP"}, "raw_response": "我先梳理一下过去6小时(约18:00–23:30)的关键事件,再给出分析。\n\n核心发现:\n\n1. **次卫漏水传感器报警**(18:49)— `second_bathroom_water_leak | StateValue = True`,且在日志结束时(23:30)没有任何恢复为 False 的记录,说明漏水状态持续了近5小时未处理。\n2. **厨房温度传感器多次报 None** — 07:01、18:11、19:23、20:00 多次出现,虽然中间有恢复,但频繁丢失读数说明传感器工作不稳定。\n3. **入户门在15:55和18:18两次开门后,均未记录关门(StateValue = True)和上锁** — 直到22:24才统一关门上锁。这意味着入户门从15:55到22:24之间处于未关闭/未上锁状态长达约6.5小时。不过结合有人在家活动(客厅灯、空调、做饭等),这可以解释为家人在家时未锁门。\n4. **其余活动均为正常生活模式** — 做饭、开灯、开空调、孩子睡觉、洗碗机运行等。\n\n最关键的异常是次卫漏水报警持续未处理。\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器于18:49触发报警,持续近5小时至日志结束仍未恢复,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:49次卫漏水传感器 second_bathroom_water_leak 状态变为 True 并触发 StateChange 事件,表明检测到实际漏水。\",\n \"推理步骤2: 从18:49到日志结束的23:30,长达约4小时41分钟内,没有任何该传感器恢复为 False 的记录,说明漏水状态一直持续。\",\n \"推理步骤3: 次卫在此期间没有任何灯光或人员活动记录,说明住户可能未察觉漏水情况,也未前往次卫检查。\",\n \"推理步骤4: 长时间未处理的漏水可能导致地板、墙体浸泡损坏,甚至渗漏到楼下邻居,风险随时间持续升高。\",\n \"推理步骤5: 附带发现——厨房温度传感器在07:01、18:11、19:23多次报告 MeasuredValue = None,虽然后续恢复读数,但频繁丢失数据表明该传感器可能存在硬件故障或连接不稳定,需要关注。\"\n ],\n \"key_evidence\": [\n \"[18:49] second_bathroom_water_leak | StateValue = True 且触发 StateChange 事件\",\n \"从18:49至23:30日志结束,无任何 StateValue = False 的恢复记录,漏水持续近5小时\",\n \"次卫在整个时间段内无灯光开启或人员活动记录,住户可能未察觉\",\n \"[07:01][18:11][19:23] kitchen_temp_sensor 多次报告 MeasuredValue = None,传感器工作异常\"\n ],\n \"recommended_actions\": [\n \"立即通知住户前往次卫检查漏水情况,必要时关闭次卫水阀止水\",\n \"检查次卫水管接头、马桶底座密封圈、地漏等常见漏水点\",\n \"评估地面及墙面是否已有水渍浸泡痕迹,防止进一步损坏\",\n \"对厨房温度传感器进行检修或更换,排查其频繁掉线的原因(电池电量、无线信号、固件版本)\",\n \"建议为漏水传感器配置更强的告警策略(如持续5分钟未恢复则电话通知),避免长时间无人响应\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器于18:49触发报警,持续近5小时至日志结束仍未恢复,存在水损风险。", "reasoning": ["推理步骤1: 18:49次卫漏水传感器 second_bathroom_water_leak 状态变为 True 并触发 StateChange 事件,表明检测到实际漏水。", "推理步骤2: 从18:49到日志结束的23:30,长达约4小时41分钟内,没有任何该传感器恢复为 False 的记录,说明漏水状态一直持续。", "推理步骤3: 次卫在此期间没有任何灯光或人员活动记录,说明住户可能未察觉漏水情况,也未前往次卫检查。", "推理步骤4: 长时间未处理的漏水可能导致地板、墙体浸泡损坏,甚至渗漏到楼下邻居,风险随时间持续升高。", "推理步骤5: 附带发现——厨房温度传感器在07:01、18:11、19:23多次报告 MeasuredValue = None,虽然后续恢复读数,但频繁丢失数据表明该传感器可能存在硬件故障或连接不稳定,需要关注。"], "key_evidence": ["[18:49] second_bathroom_water_leak | StateValue = True 且触发 StateChange 事件", "从18:49至23:30日志结束,无任何 StateValue = False 的恢复记录,漏水持续近5小时", "次卫在整个时间段内无灯光开启或人员活动记录,住户可能未察觉", "[07:01][18:11][19:23] kitchen_temp_sensor 多次报告 MeasuredValue = None,传感器工作异常"], "recommended_actions": ["立即通知住户前往次卫检查漏水情况,必要时关闭次卫水阀止水", "检查次卫水管接头、马桶底座密封圈、地漏等常见漏水点", "评估地面及墙面是否已有水渍浸泡痕迹,防止进一步损坏", "对厨房温度传感器进行检修或更换,排查其频繁掉线的原因(电池电量、无线信号、固件版本)", "建议为漏水传感器配置更强的告警策略(如持续5分钟未恢复则电话通知),避免长时间无人响应"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.401593923568726, "api_error": null} {"episode_id": "SQ3_TP_C_0506", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0506.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261135, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-29T06:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器触发一氧化碳(CO)警报,且厨房温度传感器多次报告 None 值,存在 CO 中毒风险和设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 06:47 客厅烟雾报警器触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。此时全家人刚起床(06:20 主卧和儿童房检测到人体活动),主卫灯也在 06:46 亮起,说明家中有人。\",\n \"推理步骤2: CO 警报触发后,日志中没有任何后续处理记录——没有报警器被消音/复位,没有窗户被打开通风(客厅窗户传感器始终无变化),也没有看到报警器恢复正常状态的事件。这意味着 CO 警报可能一直处于激活状态,或者住户忽略了该警报。\",\n \"推理步骤3: 06:54 厨房灶具被关闭(OnOff=False),06:54:30 厨房窗户被打开(StateValue=False),这可能是住户对 CO 警报的部分响应——关火并开窗。但 07:03:36 灶具又被重新打开,说明住户可能认为问题已解决,但报警器并未复位。\",\n \"推理步骤4: 厨房温度传感器在 06:55、07:04:06、18:34、19:10 四次报告 MeasuredValue=None。正常传感器不应返回空值。前两次 None 出现在 CO 警报前后,可能与厨房环境异常有关;后两次出现在晚间做饭时段,说明该传感器存在间歇性故障,无法可靠监测厨房温度。\",\n \"推理步骤5: 06:00 所有房间温度出现一次跳升(约 +9°C 的百分度值,即约 0.9°C),从 ~23°C 区间跳到 ~24°C 区间,之后持续上升至中午 ~25.8°C 再回落,这符合夏季(6月29日)自然气温变化规律,属于正常现象。\",\n \"推理步骤6: 其余生活行为模式正常:早晨 06:20 起床、07:17 出门上班/上学(关灯、锁门)、16:15 孩子先回家、18:00 大人回家、晚间做饭吃饭、21:09 孩子睡觉、22:20 大人睡觉。入户门锁均为手动开锁且自动回锁,无异常入侵迹象。\",\n \"推理步骤7: 综合来看,CO 警报是最严重的问题。即使是误报,也需要排查原因;如果是真实 CO 泄漏,则存在中毒风险。厨房温度传感器的间歇性故障会削弱对厨房火灾/高温的监测能力,需要维修或更换。\"\n ],\n \"key_evidence\": [\n \"06:47 living_room_smoke_alarm 触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),且全天日志中无复位/恢复记录\",\n \"厨房温度传感器在 06:55、07:04、18:34、19:10 四次报告 MeasuredValue=None,表明传感器间歇性失效\",\n \"CO 警报后仅 7 分钟灶具被关闭并开窗,但 16 分钟后灶具又被重新打开,且报警器未见复位\",\n \"CO 警报触发时家中有人(主卧、儿童房、主卫均检测到活动)\"\n ],\n \"recommended_actions\": [\n \"立即检查一氧化碳来源:排查燃气灶具、热水器等可能产生 CO 的设备,必要时联系燃气公司上门检测\",\n \"对客厅烟雾/CO 报警器进行测试和校准,确认是真实警报还是传感器故障,如有必要更换报警器\",\n \"更换或维修厨房温度传感器(kitchen_temp_sensor),其间歇性返回 None 值表明硬件可能存在问题\",\n \"在厨房增设独立的 CO 检测器,目前仅客厅有 CO 检测能力,厨房作为燃气使用区域缺少直接监测\",\n \"建议设置自动化规则:当 CO 警报触发时自动打开所有窗户、关闭燃气灶具、发送紧急通知到手机\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器触发一氧化碳(CO)警报,且厨房温度传感器多次报告 None 值,存在 CO 中毒风险和设备故障。", "reasoning": ["推理步骤1: 06:47 客厅烟雾报警器触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。此时全家人刚起床(06:20 主卧和儿童房检测到人体活动),主卫灯也在 06:46 亮起,说明家中有人。", "推理步骤2: CO 警报触发后,日志中没有任何后续处理记录——没有报警器被消音/复位,没有窗户被打开通风(客厅窗户传感器始终无变化),也没有看到报警器恢复正常状态的事件。这意味着 CO 警报可能一直处于激活状态,或者住户忽略了该警报。", "推理步骤3: 06:54 厨房灶具被关闭(OnOff=False),06:54:30 厨房窗户被打开(StateValue=False),这可能是住户对 CO 警报的部分响应——关火并开窗。但 07:03:36 灶具又被重新打开,说明住户可能认为问题已解决,但报警器并未复位。", "推理步骤4: 厨房温度传感器在 06:55、07:04:06、18:34、19:10 四次报告 MeasuredValue=None。正常传感器不应返回空值。前两次 None 出现在 CO 警报前后,可能与厨房环境异常有关;后两次出现在晚间做饭时段,说明该传感器存在间歇性故障,无法可靠监测厨房温度。", "推理步骤5: 06:00 所有房间温度出现一次跳升(约 +9°C 的百分度值,即约 0.9°C),从 ~23°C 区间跳到 ~24°C 区间,之后持续上升至中午 ~25.8°C 再回落,这符合夏季(6月29日)自然气温变化规律,属于正常现象。", "推理步骤6: 其余生活行为模式正常:早晨 06:20 起床、07:17 出门上班/上学(关灯、锁门)、16:15 孩子先回家、18:00 大人回家、晚间做饭吃饭、21:09 孩子睡觉、22:20 大人睡觉。入户门锁均为手动开锁且自动回锁,无异常入侵迹象。", "推理步骤7: 综合来看,CO 警报是最严重的问题。即使是误报,也需要排查原因;如果是真实 CO 泄漏,则存在中毒风险。厨房温度传感器的间歇性故障会削弱对厨房火灾/高温的监测能力,需要维修或更换。"], "key_evidence": ["06:47 living_room_smoke_alarm 触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),且全天日志中无复位/恢复记录", "厨房温度传感器在 06:55、07:04、18:34、19:10 四次报告 MeasuredValue=None,表明传感器间歇性失效", "CO 警报后仅 7 分钟灶具被关闭并开窗,但 16 分钟后灶具又被重新打开,且报警器未见复位", "CO 警报触发时家中有人(主卧、儿童房、主卫均检测到活动)"], "recommended_actions": ["立即检查一氧化碳来源:排查燃气灶具、热水器等可能产生 CO 的设备,必要时联系燃气公司上门检测", "对客厅烟雾/CO 报警器进行测试和校准,确认是真实警报还是传感器故障,如有必要更换报警器", "更换或维修厨房温度传感器(kitchen_temp_sensor),其间歇性返回 None 值表明硬件可能存在问题", "在厨房增设独立的 CO 检测器,目前仅客厅有 CO 检测能力,厨房作为燃气使用区域缺少直接监测", "建议设置自动化规则:当 CO 警报触发时自动打开所有窗户、关闭燃气灶具、发送紧急通知到手机"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.27319121360779, "api_error": null} {"episode_id": "SQ3_TP_C_0508", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0508.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261137, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-15T00:27:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时客厅运动传感器在深夜出现快速抖动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55、07:03、18:40、18:53 四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,排除系统性通信故障,问题定位在该传感器本身。\",\n \"推理步骤2: None 值均出现在灶具开启期间或刚关闭后(06:54 灶具开→06:55/07:03 报 None;18:39 灶具开→18:40/18:53 报 None),推测灶具工作时的高温或油烟干扰了传感器读数,导致其无法正常测量。这可能是传感器安装位置不当或硬件老化。\",\n \"推理步骤3: 厨房温度传感器是厨房安全监测链的重要一环(配合烟雾报警器、灶具),如果在烹饪高风险时段恰好失效,会削弱火灾/过热的早期预警能力。\",\n \"推理步骤4: 客厅运动传感器在 00:27~00:28 出现快速 Occupancy 抖动(1→0→1→0→1,间隔仅 5~30 秒),此时全屋无灯光开启、无门锁操作,住户应已入睡。这种模式可能是传感器误触发(宠物、窗帘飘动、传感器灵敏度过高),也不能完全排除有人在客厅活动。结合入户门锁全程处于锁定状态(LockState=1),入侵可能性较低,更倾向于传感器误报或宠物活动。\",\n \"推理步骤5: 其余行为模式均属正常——早晨 06:01 起床、07:26 出门(关灯→开锁→关门→自动上锁)、16:23 孩子放学回家、18:10 大人回家做饭、22:18 就寝锁门,符合典型三口之家的作息规律。\",\n \"推理步骤6: 入户门在出门(07:26)和晚间(22:18)均正确自动上锁,16:23 和 18:10 的开锁均为手动操作且伴随正常的入户动线,门禁安全无异常。\",\n \"推理步骤7: 厨房窗户在两次烹饪后均被打开(07:02:30 和 18:52:30),属于通风的正常操作,但日志中未见关闭记录。如果窗户整夜未关,在安全层面是一个小隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:55、07:03、18:40、18:53 四次报告 MeasuredValue = None,均发生在灶具使用期间\",\n \"living_room_occupancy 在 00:27~00:28 出现 5 次快速状态切换(间隔 5~30 秒),此时全屋无其他活动迹象\",\n \"厨房窗户在 07:02:30 和 18:52:30 被打开(StateValue=False),日志中无对应的关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近;清洁传感器探头,排除油烟积累导致的读数异常。如问题持续,建议更换传感器。\",\n \"调整客厅运动传感器的灵敏度或检测区域,减少深夜误触发。如家中有宠物,可考虑启用宠物免疫模式。\",\n \"建议在自动化规则中增加:当厨房温度传感器报告 None 且灶具处于开启状态时,触发告警通知,避免安全监测盲区。\",\n \"确认厨房窗户是否已关闭;可考虑添加就寝模式自动化,在夜间检查所有窗户传感器状态并提醒关窗。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时客厅运动传感器在深夜出现快速抖动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55、07:03、18:40、18:53 四次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,排除系统性通信故障,问题定位在该传感器本身。", "推理步骤2: None 值均出现在灶具开启期间或刚关闭后(06:54 灶具开→06:55/07:03 报 None;18:39 灶具开→18:40/18:53 报 None),推测灶具工作时的高温或油烟干扰了传感器读数,导致其无法正常测量。这可能是传感器安装位置不当或硬件老化。", "推理步骤3: 厨房温度传感器是厨房安全监测链的重要一环(配合烟雾报警器、灶具),如果在烹饪高风险时段恰好失效,会削弱火灾/过热的早期预警能力。", "推理步骤4: 客厅运动传感器在 00:27~00:28 出现快速 Occupancy 抖动(1→0→1→0→1,间隔仅 5~30 秒),此时全屋无灯光开启、无门锁操作,住户应已入睡。这种模式可能是传感器误触发(宠物、窗帘飘动、传感器灵敏度过高),也不能完全排除有人在客厅活动。结合入户门锁全程处于锁定状态(LockState=1),入侵可能性较低,更倾向于传感器误报或宠物活动。", "推理步骤5: 其余行为模式均属正常——早晨 06:01 起床、07:26 出门(关灯→开锁→关门→自动上锁)、16:23 孩子放学回家、18:10 大人回家做饭、22:18 就寝锁门,符合典型三口之家的作息规律。", "推理步骤6: 入户门在出门(07:26)和晚间(22:18)均正确自动上锁,16:23 和 18:10 的开锁均为手动操作且伴随正常的入户动线,门禁安全无异常。", "推理步骤7: 厨房窗户在两次烹饪后均被打开(07:02:30 和 18:52:30),属于通风的正常操作,但日志中未见关闭记录。如果窗户整夜未关,在安全层面是一个小隐患。"], "key_evidence": ["kitchen_temp_sensor 在 06:55、07:03、18:40、18:53 四次报告 MeasuredValue = None,均发生在灶具使用期间", "living_room_occupancy 在 00:27~00:28 出现 5 次快速状态切换(间隔 5~30 秒),此时全屋无其他活动迹象", "厨房窗户在 07:02:30 和 18:52:30 被打开(StateValue=False),日志中无对应的关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近;清洁传感器探头,排除油烟积累导致的读数异常。如问题持续,建议更换传感器。", "调整客厅运动传感器的灵敏度或检测区域,减少深夜误触发。如家中有宠物,可考虑启用宠物免疫模式。", "建议在自动化规则中增加:当厨房温度传感器报告 None 且灶具处于开启状态时,触发告警通知,避免安全监测盲区。", "确认厨房窗户是否已关闭;可考虑添加就寝模式自动化,在夜间检查所有窗户传感器状态并提醒关窗。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.153701066970825, "api_error": null} {"episode_id": "SQ3_TP_C_0514", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0514.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261143, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-05T09:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,客厅温度传感器出现两次极端异常读数,且客厅烟雾报警器被触发但缺乏后续火灾佐证,高度疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:08、18:43、19:11 三个时间点报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器存在通信故障或硬件异常。三次故障分布在早晚不同时段,排除单次偶发的可能。\",\n \"推理步骤2: 注意到 07:08 的两次 None 值恰好发生在厨房灶具开启(07:07:38)之后约 20 秒,18:43 的 None 值也发生在灶具开启(18:42:30)之后约 30 秒。这暗示灶具工作时的高温或电磁干扰可能导致温度传感器失灵。但 19:11 的 None 值发生在灶具已关闭(19:10)之后,说明传感器本身可能已存在持续性故障。\",\n \"推理步骤3: 客厅温度传感器在 09:45 突然报告 3688(约 36.88°C),09:50 报告 3200(约 32.00°C)。而 09:30 的正常读数为 2491(约 24.91°C),10:00 又恢复到 2513(约 25.13°C)。短短 15 分钟内温度飙升近 12°C 再回落,且同一时段其他房间温度均无异常变化,这不符合真实物理环境的热传导规律,属于传感器异常读数。\",\n \"推理步骤4: 09:55 客厅烟雾报警器触发(SmokeState = 1)。但分析上下文:(a) 同时段厨房烟雾报警器未触发;(b) 客厅无灶具等明火源;(c) 10:00 客厅温度已恢复正常的 25.13°C;(d) 没有任何后续的人员疏散、开窗通风、或消防响应记录。这强烈暗示烟雾报警是由传感器异常读数误触发的,而非真实火灾。\",\n \"推理步骤5: 另外注意到 09:45 和 09:50 的日志格式异常——缺少 'TemperatureMeasurement.' 前缀,直接写为 'MeasuredValue = 3688'。这与所有其他温度日志的标准格式 'TemperatureMeasurement.MeasuredValue' 不一致,可能是传感器固件异常导致的上报格式错误,进一步佐证设备故障。\",\n \"推理步骤6: 排除入侵威胁——全天的入户门操作均为正常模式:07:26 手动开锁出门后自动上锁(早晨出门),16:21 手动开锁进门(下午放学/回家),17:52 手动开锁进门(傍晚回家),22:30 确认门关闭并自动上锁(夜间)。所有门锁操作均为 Manual 或 Auto 来源,无异常远程解锁。\",\n \"推理步骤7: 排除漏水威胁——厨房和卫生间的漏水传感器全天无任何报警记录。排除健康威胁——全天的人员活动模式符合典型的三口之家作息(早起、出门、放学、晚归、就寝)。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器三次返回 None 值:07:08:00、07:08:08、18:43:00、19:11:00\",\n \"客厅温度传感器在 09:45 和 09:50 出现异常高温读数 3688 和 3200,前后正常读数约 2490-2513\",\n \"09:45/09:50 的日志格式缺少 'TemperatureMeasurement.' 前缀,与标准格式不一致\",\n \"客厅烟雾报警器 09:55 触发(SmokeState=1),但无其他火灾佐证,10:00 温度已恢复正常\",\n \"厨房温度传感器的 None 值与灶具开启时间高度相关(07:07:38 开灶 → 07:08 故障,18:42:30 开灶 → 18:43 故障)\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器硬件状态,排查固件版本和通信模块是否正常,必要时更换设备\",\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响;考虑重新选址安装或增加屏蔽措施\",\n \"检查客厅烟雾报警器是否与温度传感器存在联动规则,确认 09:55 的触发是否由异常温度读数引起;如是,需修正联动逻辑以避免误报\",\n \"对两个故障传感器进行固件升级或恢复出厂设置,观察后续是否仍出现 None 值和异常读数\",\n \"建议在关键区域增加冗余传感器,避免单点故障导致安全系统误判\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,客厅温度传感器出现两次极端异常读数,且客厅烟雾报警器被触发但缺乏后续火灾佐证,高度疑似传感器故障。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:08、18:43、19:11 三个时间点报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器存在通信故障或硬件异常。三次故障分布在早晚不同时段,排除单次偶发的可能。", "推理步骤2: 注意到 07:08 的两次 None 值恰好发生在厨房灶具开启(07:07:38)之后约 20 秒,18:43 的 None 值也发生在灶具开启(18:42:30)之后约 30 秒。这暗示灶具工作时的高温或电磁干扰可能导致温度传感器失灵。但 19:11 的 None 值发生在灶具已关闭(19:10)之后,说明传感器本身可能已存在持续性故障。", "推理步骤3: 客厅温度传感器在 09:45 突然报告 3688(约 36.88°C),09:50 报告 3200(约 32.00°C)。而 09:30 的正常读数为 2491(约 24.91°C),10:00 又恢复到 2513(约 25.13°C)。短短 15 分钟内温度飙升近 12°C 再回落,且同一时段其他房间温度均无异常变化,这不符合真实物理环境的热传导规律,属于传感器异常读数。", "推理步骤4: 09:55 客厅烟雾报警器触发(SmokeState = 1)。但分析上下文:(a) 同时段厨房烟雾报警器未触发;(b) 客厅无灶具等明火源;(c) 10:00 客厅温度已恢复正常的 25.13°C;(d) 没有任何后续的人员疏散、开窗通风、或消防响应记录。这强烈暗示烟雾报警是由传感器异常读数误触发的,而非真实火灾。", "推理步骤5: 另外注意到 09:45 和 09:50 的日志格式异常——缺少 'TemperatureMeasurement.' 前缀,直接写为 'MeasuredValue = 3688'。这与所有其他温度日志的标准格式 'TemperatureMeasurement.MeasuredValue' 不一致,可能是传感器固件异常导致的上报格式错误,进一步佐证设备故障。", "推理步骤6: 排除入侵威胁——全天的入户门操作均为正常模式:07:26 手动开锁出门后自动上锁(早晨出门),16:21 手动开锁进门(下午放学/回家),17:52 手动开锁进门(傍晚回家),22:30 确认门关闭并自动上锁(夜间)。所有门锁操作均为 Manual 或 Auto 来源,无异常远程解锁。", "推理步骤7: 排除漏水威胁——厨房和卫生间的漏水传感器全天无任何报警记录。排除健康威胁——全天的人员活动模式符合典型的三口之家作息(早起、出门、放学、晚归、就寝)。"], "key_evidence": ["厨房温度传感器三次返回 None 值:07:08:00、07:08:08、18:43:00、19:11:00", "客厅温度传感器在 09:45 和 09:50 出现异常高温读数 3688 和 3200,前后正常读数约 2490-2513", "09:45/09:50 的日志格式缺少 'TemperatureMeasurement.' 前缀,与标准格式不一致", "客厅烟雾报警器 09:55 触发(SmokeState=1),但无其他火灾佐证,10:00 温度已恢复正常", "厨房温度传感器的 None 值与灶具开启时间高度相关(07:07:38 开灶 → 07:08 故障,18:42:30 开灶 → 18:43 故障)"], "recommended_actions": ["立即检查客厅温度传感器硬件状态,排查固件版本和通信模块是否正常,必要时更换设备", "检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响;考虑重新选址安装或增加屏蔽措施", "检查客厅烟雾报警器是否与温度传感器存在联动规则,确认 09:55 的触发是否由异常温度读数引起;如是,需修正联动逻辑以避免误报", "对两个故障传感器进行固件升级或恢复出厂设置,观察后续是否仍出现 None 值和异常读数", "建议在关键区域增加冗余传感器,避免单点故障导致安全系统误判"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.56990647315979, "api_error": null} {"episode_id": "SQ3_TP_C_0516", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0516.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261145, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "balcony", "injection_time": "2026-06-12T04:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且存在异常跳变,同时厨房烟雾报警器电池低电量,灶具曾在凌晨无人活动时段被开启。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:13、18:48、18:58 四次报告 MeasuredValue = None,表明传感器读数丢失或设备通信故障。一个正常工作的温度传感器不应频繁返回空值。\",\n \"推理步骤2: 在 05:00 时刻,厨房温度传感器出现了两条记录——一条正常值 2294(约22.94°C),另一条异常值 2919(约29.19°C),短时间内跳变约6°C。结合灶具在 04:50 被开启的背景,虽然灶具加热会导致厨房升温,但传感器同时报出两个截然不同的值本身就是异常行为,说明传感器数据不可靠。\",\n \"推理步骤3: 厨房灶具在 04:50(凌晨)被开启,此时全屋无任何运动传感器触发占用状态,直到 06:24 儿童房才有第一次人体活动。凌晨无人时段灶具自行开启存在安全隐患——可能是误触、自动化规则错误或设备故障。\",\n \"推理步骤4: 厨房烟雾报警器在 06-11T04:50 报告 BatteryAlert = 1(低电量警告)。作为关键安全设备,烟雾报警器电池不足会削弱火灾预警能力,尤其在灶具存在异常开启的情况下风险更高。\",\n \"推理步骤5: 05:00 时烟雾报警器报告 SmokeState = 0(无烟),说明灶具开启期间未产生实际烟雾,排除了当前的火灾风险,但不排除传感器因低电量导致灵敏度下降的可能。\",\n \"推理步骤6: 其余行为模式均属正常——早晨 06:24-07:27 的起床、开灯、做饭、出门流程合理;下午 16:23 孩子放学回家、17:51 大人回家、18:47 做晚饭、20:51 孩子睡觉、22:39 大人睡觉的作息规律;入户门锁的开关锁操作与进出时间吻合,且出门后自动上锁;全屋温度呈现正常的昼夜波动曲线(夜间约23°C,午间峰值约25.8°C)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:53、07:13、18:48、18:58 四次报告 MeasuredValue = None\",\n \"kitchen_temp_sensor 在 05:00 同时报出 2294 和 2919 两个矛盾的温度值\",\n \"kitchen_cook_surface 在 04:50 凌晨无人活动时段被开启,全屋运动传感器均未检测到人体存在\",\n \"kitchen_smoke_alarm 在 06-11T04:50 报告 BatteryAlert = 1(低电量)\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房温度传感器(kitchen_temp_sensor),排查 None 值和数据跳变的原因,可能需要重新配对或更换设备\",\n \"尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保火灾预警功能正常\",\n \"排查厨房灶具(kitchen_cook_surface)凌晨 04:50 自动开启的原因——检查是否有定时任务、自动化规则误配置,或灶具本身存在硬件故障\",\n \"在厨房温度传感器修复前,建议加强对灶具使用时段的人工监控,避免因传感器失效导致高温异常无法被及时发现\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且存在异常跳变,同时厨房烟雾报警器电池低电量,灶具曾在凌晨无人活动时段被开启。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:13、18:48、18:58 四次报告 MeasuredValue = None,表明传感器读数丢失或设备通信故障。一个正常工作的温度传感器不应频繁返回空值。", "推理步骤2: 在 05:00 时刻,厨房温度传感器出现了两条记录——一条正常值 2294(约22.94°C),另一条异常值 2919(约29.19°C),短时间内跳变约6°C。结合灶具在 04:50 被开启的背景,虽然灶具加热会导致厨房升温,但传感器同时报出两个截然不同的值本身就是异常行为,说明传感器数据不可靠。", "推理步骤3: 厨房灶具在 04:50(凌晨)被开启,此时全屋无任何运动传感器触发占用状态,直到 06:24 儿童房才有第一次人体活动。凌晨无人时段灶具自行开启存在安全隐患——可能是误触、自动化规则错误或设备故障。", "推理步骤4: 厨房烟雾报警器在 06-11T04:50 报告 BatteryAlert = 1(低电量警告)。作为关键安全设备,烟雾报警器电池不足会削弱火灾预警能力,尤其在灶具存在异常开启的情况下风险更高。", "推理步骤5: 05:00 时烟雾报警器报告 SmokeState = 0(无烟),说明灶具开启期间未产生实际烟雾,排除了当前的火灾风险,但不排除传感器因低电量导致灵敏度下降的可能。", "推理步骤6: 其余行为模式均属正常——早晨 06:24-07:27 的起床、开灯、做饭、出门流程合理;下午 16:23 孩子放学回家、17:51 大人回家、18:47 做晚饭、20:51 孩子睡觉、22:39 大人睡觉的作息规律;入户门锁的开关锁操作与进出时间吻合,且出门后自动上锁;全屋温度呈现正常的昼夜波动曲线(夜间约23°C,午间峰值约25.8°C)。"], "key_evidence": ["kitchen_temp_sensor 在 06:53、07:13、18:48、18:58 四次报告 MeasuredValue = None", "kitchen_temp_sensor 在 05:00 同时报出 2294 和 2919 两个矛盾的温度值", "kitchen_cook_surface 在 04:50 凌晨无人活动时段被开启,全屋运动传感器均未检测到人体存在", "kitchen_smoke_alarm 在 06-11T04:50 报告 BatteryAlert = 1(低电量)"], "recommended_actions": ["立即检查或更换厨房温度传感器(kitchen_temp_sensor),排查 None 值和数据跳变的原因,可能需要重新配对或更换设备", "尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保火灾预警功能正常", "排查厨房灶具(kitchen_cook_surface)凌晨 04:50 自动开启的原因——检查是否有定时任务、自动化规则误配置,或灶具本身存在硬件故障", "在厨房温度传感器修复前,建议加强对灶具使用时段的人工监控,避免因传感器失效导致高温异常无法被及时发现"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.679292917251587, "api_error": null} {"episode_id": "SQ3_TP_C_0517", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0517.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261146, "scenario_id": "FG-04", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "balcony", "injection_time": "2026-06-21T11:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器电池电量低,且灶具开启期间厨房温度出现异常尖峰,需关注设备状态与用火安全。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-20T11:33:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低告警。该报警器是厨房唯一的烟雾检测设备,电量不足会直接影响火灾预警能力。\",\n \"推理步骤2: 2026-06-21T11:33:00 厨房灶具开启(OnOff = True),10分钟后(11:43)厨房温度传感器上报 MeasuredValue = 3097(约30.97°C),相比同一时段其他房间约25.4-25.5°C,厨房温度骤升约5.5°C。虽然灶具使用会导致厨房升温,但这一跳变幅度较大且发生迅速。\",\n \"推理步骤3: 11:43 烟雾报警器同时上报 SmokeState = 0(正常/无烟),说明当时并未触发烟雾告警。但考虑到报警器电池已低电量,其检测可靠性存疑——即使当前读数为0,也不能完全信赖。\",\n \"推理步骤4: 到12:00整点采样时,厨房温度已回落至2576(约25.76°C),与其他房间基本一致,说明灶具使用是短时行为,温度尖峰是暂时的。日志中未出现灶具关闭事件(OnOff = False),可能是日志未记录,也可能灶具仍处于开启状态,这一点无法确认。\",\n \"推理步骤5: 全天四个房间的温度变化趋势高度一致——夜间约23°C,午间升至约25.5°C峰值,傍晚逐步回落至约23.3°C,属于夏季自然温度波动,无异常。\",\n \"推理步骤6: 除厨房灶具和烟雾报警器外,整个日志时段内无门锁、门窗传感器、运动传感器、漏水传感器等安防设备的异常事件,入侵和漏水风险可排除。\"\n ],\n \"key_evidence\": [\n \"kitchen_smoke_alarm BatteryAlert = 1(电池低电量告警,时间 6月20日11:33)\",\n \"kitchen_cook_surface OnOff = True(灶具开启,时间 6月21日11:33)\",\n \"kitchen_temp_sensor MeasuredValue 在10分钟内从约2544跳升至3097(升幅约5.5°C),远超同时段其他房间温度\",\n \"kitchen_smoke_alarm SmokeState = 0(烟雾状态正常,但在电池低电量下可靠性存疑)\",\n \"日志中未出现灶具关闭(OnOff = False)的记录\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保火灾预警功能正常可用\",\n \"确认厨房灶具(kitchen_cook_surface)当前是否已关闭,如仍处于开启状态应立即关闭\",\n \"检查厨房温度传感器是否安装位置过于靠近灶具,导致读数偏高;如有必要调整安装位置以获得更准确的环境温度\",\n \"考虑设置自动化规则:当灶具开启超过一定时长(如30分钟)且未手动关闭时,发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器电池电量低,且灶具开启期间厨房温度出现异常尖峰,需关注设备状态与用火安全。", "reasoning": ["推理步骤1: 2026-06-20T11:33:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低告警。该报警器是厨房唯一的烟雾检测设备,电量不足会直接影响火灾预警能力。", "推理步骤2: 2026-06-21T11:33:00 厨房灶具开启(OnOff = True),10分钟后(11:43)厨房温度传感器上报 MeasuredValue = 3097(约30.97°C),相比同一时段其他房间约25.4-25.5°C,厨房温度骤升约5.5°C。虽然灶具使用会导致厨房升温,但这一跳变幅度较大且发生迅速。", "推理步骤3: 11:43 烟雾报警器同时上报 SmokeState = 0(正常/无烟),说明当时并未触发烟雾告警。但考虑到报警器电池已低电量,其检测可靠性存疑——即使当前读数为0,也不能完全信赖。", "推理步骤4: 到12:00整点采样时,厨房温度已回落至2576(约25.76°C),与其他房间基本一致,说明灶具使用是短时行为,温度尖峰是暂时的。日志中未出现灶具关闭事件(OnOff = False),可能是日志未记录,也可能灶具仍处于开启状态,这一点无法确认。", "推理步骤5: 全天四个房间的温度变化趋势高度一致——夜间约23°C,午间升至约25.5°C峰值,傍晚逐步回落至约23.3°C,属于夏季自然温度波动,无异常。", "推理步骤6: 除厨房灶具和烟雾报警器外,整个日志时段内无门锁、门窗传感器、运动传感器、漏水传感器等安防设备的异常事件,入侵和漏水风险可排除。"], "key_evidence": ["kitchen_smoke_alarm BatteryAlert = 1(电池低电量告警,时间 6月20日11:33)", "kitchen_cook_surface OnOff = True(灶具开启,时间 6月21日11:33)", "kitchen_temp_sensor MeasuredValue 在10分钟内从约2544跳升至3097(升幅约5.5°C),远超同时段其他房间温度", "kitchen_smoke_alarm SmokeState = 0(烟雾状态正常,但在电池低电量下可靠性存疑)", "日志中未出现灶具关闭(OnOff = False)的记录"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保火灾预警功能正常可用", "确认厨房灶具(kitchen_cook_surface)当前是否已关闭,如仍处于开启状态应立即关闭", "检查厨房温度传感器是否安装位置过于靠近灶具,导致读数偏高;如有必要调整安装位置以获得更准确的环境温度", "考虑设置自动化规则:当灶具开启超过一定时长(如30分钟)且未手动关闭时,发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.823797941207886, "api_error": null} {"episode_id": "SQ3_TP_C_0519", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0519.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261148, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-12T03:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时凌晨 3:32 阳台门在无人活动区域开启值得关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:33、07:22、18:49、19:20 四次报告 MeasuredValue = None。每次都恰好发生在灶具开启或关闭前后,说明灶具工作时产生的热量或电磁干扰可能导致传感器读数丢失,或传感器本身存在间歇性故障。\",\n \"推理步骤2: 凌晨 03:32 阳台门传感器报告 StateValue = False(门打开),但此时全屋处于深夜静默状态,无任何灯光开启、无入户门操作。3秒后主卧检测到有人(Occupancy=1),客厅无人(Occupancy=0),说明可能是住户起夜去阳台,但深夜阳台门开启后没有对应的关闭记录,整个日志中未见阳台门恢复关闭(StateValue = True),这是一个需要注意的点。\",\n \"推理步骤3: 其余行为模式均属正常——早晨 06:00 起床开灯、06:27 洗漱、06:32 做早餐、07:13 全家出门并自动锁门;下午 16:24 孩子放学回家、17:57 大人回家开空调(制冷模式 SystemMode=3,符合夏季 25°C+ 的室温);晚间做饭、用餐、洗碗机运行、20:56 孩子关灯睡觉拉窗帘、22:24 大人关灯锁门睡觉,均为典型三口之家作息。\",\n \"推理步骤4: 温度趋势合理:夜间约 22.9-23.1°C,白天逐步升至 25.8°C 峰值(约 12:30),午后回落,符合夏季自然温度曲线。17:57 开启空调制冷后,客厅温度从 24.7°C 持续下降至 22:24 关闭时的约 23.5°C,空调工作效果正常。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:24 开门时 kids_room_occupancy 同时触发,说明是孩子进门直奔房间,行为连贯合理。次卫灯 06:27 开启但无对应的运动传感器触发记录,可能是手动开关或联动触发,属于轻微数据不完整但不构成威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:33、07:22、18:49、19:20 四次报告 MeasuredValue = None,均与灶具操作时间高度相关\",\n \"03:32 阳台门开启(balcony_door_contact StateValue=False)后,整个日志中无对应的关闭记录\",\n \"06:27 次卫灯开启但该区域无运动传感器事件(次卫未配置运动传感器,属设备覆盖盲区)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;考虑更换传感器或调整安装位置\",\n \"确认阳台门当前状态是否已关闭,如仍处于开启状态请及时关闭,避免安全隐患\",\n \"建议为阳台门设置长时间未关闭的自动告警规则(如超过 30 分钟未关闭则推送通知)\",\n \"考虑在次卫增加运动传感器,消除监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时凌晨 3:32 阳台门在无人活动区域开启值得关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:33、07:22、18:49、19:20 四次报告 MeasuredValue = None。每次都恰好发生在灶具开启或关闭前后,说明灶具工作时产生的热量或电磁干扰可能导致传感器读数丢失,或传感器本身存在间歇性故障。", "推理步骤2: 凌晨 03:32 阳台门传感器报告 StateValue = False(门打开),但此时全屋处于深夜静默状态,无任何灯光开启、无入户门操作。3秒后主卧检测到有人(Occupancy=1),客厅无人(Occupancy=0),说明可能是住户起夜去阳台,但深夜阳台门开启后没有对应的关闭记录,整个日志中未见阳台门恢复关闭(StateValue = True),这是一个需要注意的点。", "推理步骤3: 其余行为模式均属正常——早晨 06:00 起床开灯、06:27 洗漱、06:32 做早餐、07:13 全家出门并自动锁门;下午 16:24 孩子放学回家、17:57 大人回家开空调(制冷模式 SystemMode=3,符合夏季 25°C+ 的室温);晚间做饭、用餐、洗碗机运行、20:56 孩子关灯睡觉拉窗帘、22:24 大人关灯锁门睡觉,均为典型三口之家作息。", "推理步骤4: 温度趋势合理:夜间约 22.9-23.1°C,白天逐步升至 25.8°C 峰值(约 12:30),午后回落,符合夏季自然温度曲线。17:57 开启空调制冷后,客厅温度从 24.7°C 持续下降至 22:24 关闭时的约 23.5°C,空调工作效果正常。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。16:24 开门时 kids_room_occupancy 同时触发,说明是孩子进门直奔房间,行为连贯合理。次卫灯 06:27 开启但无对应的运动传感器触发记录,可能是手动开关或联动触发,属于轻微数据不完整但不构成威胁。"], "key_evidence": ["kitchen_temp_sensor 在 06:33、07:22、18:49、19:20 四次报告 MeasuredValue = None,均与灶具操作时间高度相关", "03:32 阳台门开启(balcony_door_contact StateValue=False)后,整个日志中无对应的关闭记录", "06:27 次卫灯开启但该区域无运动传感器事件(次卫未配置运动传感器,属设备覆盖盲区)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰;考虑更换传感器或调整安装位置", "确认阳台门当前状态是否已关闭,如仍处于开启状态请及时关闭,避免安全隐患", "建议为阳台门设置长时间未关闭的自动告警规则(如超过 30 分钟未关闭则推送通知)", "考虑在次卫增加运动传感器,消除监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.66674780845642, "api_error": null} {"episode_id": "SQ3_TP_C_0523", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0523.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261152, "scenario_id": "DF-06", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-29T05:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 过去6小时的时间窗口为 2026-06-29 18:00 ~ 23:30。回顾该时段及相关上下文事件。\",\n \"推理步骤2: 入侵检测 — 16:23 有人开锁进门后直奔儿童房(开灯),17:55 又有人开锁进门后到客厅(开灯、开空调)。两次均为手动开锁(Manual),入门后行为合理(接孩子放学回家、大人下班回家),22:10 确认前门关闭并自动上锁,全家进入就寝状态。无入侵迹象。\",\n \"推理步骤3: 火灾风险检测 — 18:45 灶具开启,18:54 关闭,使用时长约9分钟,属正常烹饪。厨房烟雾报警器全天无触发。但灶具开启后 18:46 和 18:55 厨房温度传感器连续报告 MeasuredValue = None。同样的现象在早晨 07:03 和 07:07 也出现过(灶具 07:02 开启、07:06 关闭期间)。\",\n \"推理步骤4: 温度传感器 None 值分析 — 该传感器全天其他时段每30分钟正常上报数值,唯独在灶具使用期间两次出现 None。这说明传感器在高温或灶具电磁干扰下失效。这是一个安全隐患:如果灶具忘关或发生火灾,温度传感器恰好在此时无法提供有效读数,会导致监控盲区。\",\n \"推理步骤5: 漏水检测 — 厨房和卫生间漏水传感器全天无报警,19:20 洗碗机正常启动运行,无异常。\",\n \"推理步骤6: 其他设备状态 — 客厅空调 17:55 开启(制冷模式 SystemMode=3),22:10 关闭,温度从约24.6°C降至约23.5°C,符合正常使用。儿童房窗帘 20:57 关闭(100%),主卧窗帘 22:10 关闭,均为就寝准备。次卧窗帘在 05:51 有一次关闭到50%的操作,可能是定时任务或早起调整。\",\n \"推理步骤7: 入户门在 22:10 确认关闭上锁,16:23 和 17:55 两次开门后均未见异常的门未关闭状态。厨房窗户在 18:54 打开(通风散味),属正常行为,但日志中未见关闭记录,需注意夜间是否仍处于开启状态。\"\n ],\n \"key_evidence\": [\n \"18:46 和 18:55 厨房温度传感器报告 MeasuredValue = None(灶具 18:45~18:54 使用期间)\",\n \"同样现象在早晨 07:03 和 07:07 也出现(灶具 07:02~07:06 使用期间),说明是可复现的故障模式\",\n \"传感器在非灶具使用时段全天正常上报,排除网络或电量问题\",\n \"厨房窗户 18:54 打开后日志中无关闭记录,夜间可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰下失效,必要时重新选址安装\",\n \"考虑更换耐高温型温度传感器,或增加一个冗余传感器以消除灶具使用期间的监控盲区\",\n \"确认厨房窗户当前状态,如已入夜建议关闭,避免夜间安全隐患\",\n \"建议为灶具设置使用超时自动告警规则,弥补温度传感器在灶具使用期间失效的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 过去6小时的时间窗口为 2026-06-29 18:00 ~ 23:30。回顾该时段及相关上下文事件。", "推理步骤2: 入侵检测 — 16:23 有人开锁进门后直奔儿童房(开灯),17:55 又有人开锁进门后到客厅(开灯、开空调)。两次均为手动开锁(Manual),入门后行为合理(接孩子放学回家、大人下班回家),22:10 确认前门关闭并自动上锁,全家进入就寝状态。无入侵迹象。", "推理步骤3: 火灾风险检测 — 18:45 灶具开启,18:54 关闭,使用时长约9分钟,属正常烹饪。厨房烟雾报警器全天无触发。但灶具开启后 18:46 和 18:55 厨房温度传感器连续报告 MeasuredValue = None。同样的现象在早晨 07:03 和 07:07 也出现过(灶具 07:02 开启、07:06 关闭期间)。", "推理步骤4: 温度传感器 None 值分析 — 该传感器全天其他时段每30分钟正常上报数值,唯独在灶具使用期间两次出现 None。这说明传感器在高温或灶具电磁干扰下失效。这是一个安全隐患:如果灶具忘关或发生火灾,温度传感器恰好在此时无法提供有效读数,会导致监控盲区。", "推理步骤5: 漏水检测 — 厨房和卫生间漏水传感器全天无报警,19:20 洗碗机正常启动运行,无异常。", "推理步骤6: 其他设备状态 — 客厅空调 17:55 开启(制冷模式 SystemMode=3),22:10 关闭,温度从约24.6°C降至约23.5°C,符合正常使用。儿童房窗帘 20:57 关闭(100%),主卧窗帘 22:10 关闭,均为就寝准备。次卧窗帘在 05:51 有一次关闭到50%的操作,可能是定时任务或早起调整。", "推理步骤7: 入户门在 22:10 确认关闭上锁,16:23 和 17:55 两次开门后均未见异常的门未关闭状态。厨房窗户在 18:54 打开(通风散味),属正常行为,但日志中未见关闭记录,需注意夜间是否仍处于开启状态。"], "key_evidence": ["18:46 和 18:55 厨房温度传感器报告 MeasuredValue = None(灶具 18:45~18:54 使用期间)", "同样现象在早晨 07:03 和 07:07 也出现(灶具 07:02~07:06 使用期间),说明是可复现的故障模式", "传感器在非灶具使用时段全天正常上报,排除网络或电量问题", "厨房窗户 18:54 打开后日志中无关闭记录,夜间可能仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰下失效,必要时重新选址安装", "考虑更换耐高温型温度传感器,或增加一个冗余传感器以消除灶具使用期间的监控盲区", "确认厨房窗户当前状态,如已入夜建议关闭,避免夜间安全隐患", "建议为灶具设置使用超时自动告警规则,弥补温度传感器在灶具使用期间失效的风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.864803552627563, "api_error": null} {"episode_id": "SQ3_TP_C_0524", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0524.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261153, "scenario_id": "WD-01", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-04T13:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在无人在家期间触发报警,且至今未见复位记录,存在持续漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——06:01 主卧有人起床,06:36 儿童房活动,07:00 前后做早餐,07:48 全家关灯、手动开锁出门、门自动上锁,符合工作日早晨出门规律。\",\n \"推理步骤2: 07:48 出门后至 16:29 期间家中无任何运动传感器触发、无灯光操作,确认家中无人。\",\n \"推理步骤3: 13:19 厨房漏水传感器 kitchen_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到积水。此时家中无人,无法及时处理。\",\n \"推理步骤4: 从 13:19 到日志结束(23:30),未见 kitchen_water_leak 恢复为 False 的记录,说明漏水状态持续超过 10 小时未解除。\",\n \"推理步骤5: 16:29 有人回家(疑似孩子放学),17:57 另一人回家,但均未处理漏水问题,漏水可能未被注意到。\",\n \"推理步骤6: 附带发现——厨房温度传感器在 06:59、07:01、18:15、18:51 四次报告 MeasuredValue=None,可能存在传感器故障或通信异常,但不构成直接安全威胁。\",\n \"推理步骤7: 其余行为模式均正常:入户门锁操作均为 Manual 开锁 + Auto 上锁,温度曲线符合夏季昼夜变化(夜间约 23°C,午间峰值约 25.8°C),灶具使用时段合理(早餐 07:00-07:48、晚餐 18:14-18:50),儿童 21:16 关灯就寝、成人 22:32 就寝,均属正常。\"\n ],\n \"key_evidence\": [\n \"13:19 kitchen_water_leak StateValue=True 且触发 StateChange 事件,家中无人时段发生漏水\",\n \"从 13:19 至 23:30(日志结束)超过 10 小时未见漏水传感器复位为 False\",\n \"kitchen_temp_sensor 在 06:59、07:01、18:15、18:51 四次报告 MeasuredValue=None,存在设备异常嫌疑\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房漏水情况,确认水源(可能来自水管接头、洗碗机连接处或水龙头),必要时关闭厨房水阀\",\n \"检查洗碗机(19:40 启动运行)与漏水点的关联性,排查洗碗机进出水管是否松动\",\n \"确认 kitchen_water_leak 传感器状态是否已恢复,若仍为 True 则说明积水未清除\",\n \"排查厨房温度传感器多次报告 None 的原因,可能需要检查传感器电量或无线连接稳定性\",\n \"建议设置漏水报警的即时推送通知,确保无人在家时也能第一时间收到警报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在无人在家期间触发报警,且至今未见复位记录,存在持续漏水风险。", "reasoning": ["推理步骤1: 整体生活模式正常——06:01 主卧有人起床,06:36 儿童房活动,07:00 前后做早餐,07:48 全家关灯、手动开锁出门、门自动上锁,符合工作日早晨出门规律。", "推理步骤2: 07:48 出门后至 16:29 期间家中无任何运动传感器触发、无灯光操作,确认家中无人。", "推理步骤3: 13:19 厨房漏水传感器 kitchen_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到积水。此时家中无人,无法及时处理。", "推理步骤4: 从 13:19 到日志结束(23:30),未见 kitchen_water_leak 恢复为 False 的记录,说明漏水状态持续超过 10 小时未解除。", "推理步骤5: 16:29 有人回家(疑似孩子放学),17:57 另一人回家,但均未处理漏水问题,漏水可能未被注意到。", "推理步骤6: 附带发现——厨房温度传感器在 06:59、07:01、18:15、18:51 四次报告 MeasuredValue=None,可能存在传感器故障或通信异常,但不构成直接安全威胁。", "推理步骤7: 其余行为模式均正常:入户门锁操作均为 Manual 开锁 + Auto 上锁,温度曲线符合夏季昼夜变化(夜间约 23°C,午间峰值约 25.8°C),灶具使用时段合理(早餐 07:00-07:48、晚餐 18:14-18:50),儿童 21:16 关灯就寝、成人 22:32 就寝,均属正常。"], "key_evidence": ["13:19 kitchen_water_leak StateValue=True 且触发 StateChange 事件,家中无人时段发生漏水", "从 13:19 至 23:30(日志结束)超过 10 小时未见漏水传感器复位为 False", "kitchen_temp_sensor 在 06:59、07:01、18:15、18:51 四次报告 MeasuredValue=None,存在设备异常嫌疑"], "recommended_actions": ["立即检查厨房漏水情况,确认水源(可能来自水管接头、洗碗机连接处或水龙头),必要时关闭厨房水阀", "检查洗碗机(19:40 启动运行)与漏水点的关联性,排查洗碗机进出水管是否松动", "确认 kitchen_water_leak 传感器状态是否已恢复,若仍为 True 则说明积水未清除", "排查厨房温度传感器多次报告 None 的原因,可能需要检查传感器电量或无线连接稳定性", "建议设置漏水报警的即时推送通知,确保无人在家时也能第一时间收到警报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.37875199317932, "api_error": null} {"episode_id": "SQ3_TP_C_0525", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0525.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261154, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-03T11:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似传感器故障或受灶具干扰;同时主卫灯在同一秒内开关,存在设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)的核心事件——18:12入户开门回家、18:37厨房做饭、19:30做饭结束并开洗碗机、21:17儿童房关灯就寝、22:34全家就寝锁门,整体生活节奏正常。\",\n \"推理步骤2: 厨房温度传感器在18:38、19:31报告 MeasuredValue = None,结合早间06:51、06:56也出现同样情况,一天内共出现4次 None 读数,且均与灶具开关时间高度相关(灶具开启或关闭后不久即出现)。这说明传感器可能受灶具热辐射或油烟干扰导致读数丢失,或传感器本身存在间歇性故障。\",\n \"推理步骤3: 回顾早间06:55记录——主卫灯在同一秒内 OnOff=True 后立即 OnOff=False,这不符合正常人为操作节奏,可能是设备固件bug、通信抖动或继电器故障。\",\n \"推理步骤4: 18:12的入户事件序列完全正常:手动开锁→门开→玄关检测到人→客厅检测到人→开灯→开空调(制冷模式SystemMode=3,符合当时约24.6°C的室温和夏季场景)。\",\n \"推理步骤5: 22:34就寝序列正常:关客厅灯和空调→主卧检测到人→关窗帘→确认前门关闭→自动上锁→关主卧灯。门锁最终状态 LockState=1(已锁),入户门 StateValue=True(已关),安防状态良好。\",\n \"推理步骤6: 温度趋势合理——下午至夜间从约24.6°C逐步降至约23.4°C,符合夏季傍晚自然降温规律,无异常温升(排除火灾风险)。烟雾报警器全天无触发。\",\n \"推理步骤7: 16:01有人回家后入户门未见明确的关门上锁记录(直到22:34才确认门锁),中间约6小时门锁状态不明,但18:12又有一次开锁事件,说明门在此期间是关着的,整体无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 18:38 和 19:31 报告 MeasuredValue = None(加上早间06:51、06:56共4次),均与灶具操作时间强相关\",\n \"master_bathroom_light 在 06:55:00 同一秒内 OnOff=True 后立即 OnOff=False,操作间隔为0秒,不符合正常使用模式\",\n \"所有出入事件(16:01、18:12回家,07:22、22:34锁门)均为 Manual/Auto 操作,无异常解锁源\",\n \"烟雾报警器、漏水传感器全天无告警,排除火灾和水患风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数丢失;如有必要重新定位或更换传感器\",\n \"检查主卫灯的开关模块固件版本,排查是否存在已知的继电器抖动或通信重复上报问题\",\n \"建议为厨房温度传感器设置 None 值告警规则,当连续出现无效读数时及时通知用户\",\n \"确认16:01回家后入户门是否正常关闭上锁,建议启用\"门未锁超时提醒\"自动化规则\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似传感器故障或受灶具干扰;同时主卫灯在同一秒内开关,存在设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)的核心事件——18:12入户开门回家、18:37厨房做饭、19:30做饭结束并开洗碗机、21:17儿童房关灯就寝、22:34全家就寝锁门,整体生活节奏正常。\",\n \"推理步骤2: 厨房温度传感器在18:38、19:31报告 MeasuredValue = None,结合早间06:51、06:56也出现同样情况,一天内共出现4次 None 读数,且均与灶具开关时间高度相关(灶具开启或关闭后不久即出现)。这说明传感器可能受灶具热辐射或油烟干扰导致读数丢失,或传感器本身存在间歇性故障。\",\n \"推理步骤3: 回顾早间06:55记录——主卫灯在同"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 29.30927872657776, "api_error": null} {"episode_id": "SQ3_TP_C_0526", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0526.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261155, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-03T03:02:00", "variant": "TP"}, "raw_response": "我先梳理一下整天的日志,重点关注异常信号。\n\n几个关键发现:\n\n1. **03:02 - 03:12 客厅温度飙升 + 烟雾报警**:客厅温度从 ~23.0°C 瞬间跳到 33.29°C(03:02),随后 32.00°C(03:07),然后 03:12 烟雾报警器触发(SmokeState=1)。但到 03:30 温度恢复正常(23.08°C),且没有后续报警、没有人员活动、没有门窗开启。这是一个已经过去的事件。\n\n2. **厨房温度传感器多次报 None**:06:37、07:22、18:48、18:52 四次报告 MeasuredValue = None,说明传感器间歇性故障。且这些 None 出现在灶具使用前后,可能是高温导致传感器异常。\n\n3. **16:20 入户门开锁后未关门/未上锁**:有人进门(front_door_lock 解锁、door_contact 打开),但日志中没有记录门关闭和重新上锁,直到 22:37 才出现门关闭+自动上锁。这意味着入户门可能长时间未锁。\n\n4. **03:12 烟雾报警触发后无复位记录**:SmokeState=1 之后,整天日志中没有看到 SmokeState=0 的复位事件。\n\n不过题目要求分析\"过去6小时\"。当前日志最后时间是 23:30,所以过去6小时大约是 17:30 - 23:30 这个区间。在这个窗口内:\n\n- 厨房温度传感器在 18:48 和 18:52 报 None(设备故障)\n- 入户门在 18:05 开锁进入后,直到 22:37 才关门上锁(超过4.5小时门未确认关闭状态)\n- 烟雾报警器仍未复位\n\n最显著的异常是**厨房温度传感器故障**,这在安全监控中属于设备故障类问题,会导致火灾预警能力下降。\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告空值(None),存在间歇性故障,削弱了厨房火灾/高温预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 在过去6小时窗口内(约17:30-23:30),厨房温度传感器在18:48和18:52连续两次上报 MeasuredValue = None,而同一时段其他房间传感器均正常上报数值。\",\n \"推理步骤2: 这两次 None 出现在灶具开启(18:47:30)到关闭(18:51:00)期间,与早晨06:37和07:22的两次 None 同样发生在灶具使用前后,说明该传感器在厨房高温环境下存在系统性间歇故障。\",\n \"推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助预警手段。传感器在灶具工作时恰好失效,意味着最需要监测的时刻反而失去了温度数据,形成安全监控盲区。\",\n \"推理步骤4: 另外注意到凌晨03:12客厅烟雾报警器触发(SmokeState=1),但整天日志中未见复位记录(SmokeState=0),可能存在报警器状态卡死或未被处理的情况。\",\n \"推理步骤5: 其余事件均属正常生活模式——18:05家人回家开灯开空调、18:47做饭、19:55开洗碗机、20:43孩子关灯睡觉、22:37大人关灯锁门就寝,时间线和设备联动逻辑合理。\"\n ],\n \"key_evidence\": [\n \"18:48 kitchen_temp_sensor MeasuredValue = None(灶具开启后1分钟)\",\n \"18:52 kitchen_temp_sensor MeasuredValue = None(灶具关闭后1分钟)\",\n \"同日早晨06:37和07:22也出现相同的 None 故障,均与灶具使用时段重合\",\n \"19:00恢复正常读数2435,说明是间歇性而非永久性故障\",\n \"03:12 living_room_smoke_alarm SmokeState = 1 后全天无复位记录\"\n ],\n \"recommended_actions\": [\n \"优先检查厨房温度传感器:清洁探头、检查安装位置是否离灶具过近导致高温干扰,必要时更换传感器\",\n \"确认客厅烟雾报警器当前状态,手动复位或检查是否存在硬件卡死问题\",\n \"考虑将厨房温度传感器安装位置调整到远离灶具热源但仍能有效监测的位置\",\n \"在传感器修复前,灶具使用期间保持人员在场监控,避免无人看管烹饪\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告空值(None),存在间歇性故障,削弱了厨房火灾/高温预警能力。", "reasoning": ["推理步骤1: 在过去6小时窗口内(约17:30-23:30),厨房温度传感器在18:48和18:52连续两次上报 MeasuredValue = None,而同一时段其他房间传感器均正常上报数值。", "推理步骤2: 这两次 None 出现在灶具开启(18:47:30)到关闭(18:51:00)期间,与早晨06:37和07:22的两次 None 同样发生在灶具使用前后,说明该传感器在厨房高温环境下存在系统性间歇故障。", "推理步骤3: 厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助预警手段。传感器在灶具工作时恰好失效,意味着最需要监测的时刻反而失去了温度数据,形成安全监控盲区。", "推理步骤4: 另外注意到凌晨03:12客厅烟雾报警器触发(SmokeState=1),但整天日志中未见复位记录(SmokeState=0),可能存在报警器状态卡死或未被处理的情况。", "推理步骤5: 其余事件均属正常生活模式——18:05家人回家开灯开空调、18:47做饭、19:55开洗碗机、20:43孩子关灯睡觉、22:37大人关灯锁门就寝,时间线和设备联动逻辑合理。"], "key_evidence": ["18:48 kitchen_temp_sensor MeasuredValue = None(灶具开启后1分钟)", "18:52 kitchen_temp_sensor MeasuredValue = None(灶具关闭后1分钟)", "同日早晨06:37和07:22也出现相同的 None 故障,均与灶具使用时段重合", "19:00恢复正常读数2435,说明是间歇性而非永久性故障", "03:12 living_room_smoke_alarm SmokeState = 1 后全天无复位记录"], "recommended_actions": ["优先检查厨房温度传感器:清洁探头、检查安装位置是否离灶具过近导致高温干扰,必要时更换传感器", "确认客厅烟雾报警器当前状态,手动复位或检查是否存在硬件卡死问题", "考虑将厨房温度传感器安装位置调整到远离灶具热源但仍能有效监测的位置", "在传感器修复前,灶具使用期间保持人员在场监控,避免无人看管烹饪"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.37507653236389, "api_error": null} {"episode_id": "SQ3_TP_C_0528", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0528.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261157, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-01T07:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似设备故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 梳理过去6小时(约17:30–23:30)的核心事件——17:42家人回家开灯开空调、18:31做饭、19:38洗碗机启动、21:07儿童房熄灯就寝、22:25全家就寝锁门,整体生活节奏正常。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,符合正常出入模式,无异常开锁源(如远程、未知PIN),不存在入侵迹象。\",\n \"推理步骤3: 厨房灶具在18:31开启、18:51关闭,使用约20分钟,时长合理。但在18:32和18:52,厨房温度传感器连续报告 MeasuredValue = None。回溯早间日志发现06:57和06:58也出现了同样的 None 值,均与灶具使用时间高度关联。\",\n \"推理步骤4: 温度传感器报告 None 而非一个数值,说明传感器在灶具工作期间无法正常采样。可能原因包括:高温超出量程导致读数失败、传感器与Hub之间通信被干扰、或传感器本身存在间歇性硬件故障。\",\n \"推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段内未触发任何告警事件,排除火灾风险。厨房漏水传感器也无异常。\",\n \"推理步骤6: 各房间温度从傍晚约24.5°C逐步降至夜间约23.3°C,变化平缓自然,无异常温升。客厅空调17:42开启制冷(SystemMode=3),22:25关闭,温度下降趋势与之吻合。\",\n \"推理步骤7: 阳台门传感器在07:29报告开启(StateValue=False),但此后6小时内未见关闭事件(StateValue=True)。虽然这可能是日志未记录关闭事件,但也存在阳台门长时间未关的可能,值得关注。\",\n \"推理步骤8: 15:59有人开门进入后直接去了儿童房,符合孩子放学回家的模式。17:42再次开门进入后开灯开空调做饭,符合大人下班回家的模式。所有运动传感器触发与灯光、门锁事件在时间和空间上一致,无可疑活动。\"\n ],\n \"key_evidence\": [\n \"18:32 和 18:52 厨房温度传感器报告 MeasuredValue = None,与灶具使用时段(18:31–18:51)高度关联;早间06:57、06:58也出现相同现象\",\n \"阳台门传感器07:29报告开启后,整日日志中未见关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程;考虑更换耐高温型号或调整安装位置\",\n \"检查厨房温度传感器的固件版本和通信质量,排除间歇性通信故障\",\n \"确认阳台门当前是否已关闭,如长时间敞开需及时关闭以保障安全\",\n \"当前无紧急安全威胁,各项设备运行和家庭活动模式正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似设备故障或通信异常。", "reasoning": ["推理步骤1: 梳理过去6小时(约17:30–23:30)的核心事件——17:42家人回家开灯开空调、18:31做饭、19:38洗碗机启动、21:07儿童房熄灯就寝、22:25全家就寝锁门,整体生活节奏正常。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,符合正常出入模式,无异常开锁源(如远程、未知PIN),不存在入侵迹象。", "推理步骤3: 厨房灶具在18:31开启、18:51关闭,使用约20分钟,时长合理。但在18:32和18:52,厨房温度传感器连续报告 MeasuredValue = None。回溯早间日志发现06:57和06:58也出现了同样的 None 值,均与灶具使用时间高度关联。", "推理步骤4: 温度传感器报告 None 而非一个数值,说明传感器在灶具工作期间无法正常采样。可能原因包括:高温超出量程导致读数失败、传感器与Hub之间通信被干扰、或传感器本身存在间歇性硬件故障。", "推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段内未触发任何告警事件,排除火灾风险。厨房漏水传感器也无异常。", "推理步骤6: 各房间温度从傍晚约24.5°C逐步降至夜间约23.3°C,变化平缓自然,无异常温升。客厅空调17:42开启制冷(SystemMode=3),22:25关闭,温度下降趋势与之吻合。", "推理步骤7: 阳台门传感器在07:29报告开启(StateValue=False),但此后6小时内未见关闭事件(StateValue=True)。虽然这可能是日志未记录关闭事件,但也存在阳台门长时间未关的可能,值得关注。", "推理步骤8: 15:59有人开门进入后直接去了儿童房,符合孩子放学回家的模式。17:42再次开门进入后开灯开空调做饭,符合大人下班回家的模式。所有运动传感器触发与灯光、门锁事件在时间和空间上一致,无可疑活动。"], "key_evidence": ["18:32 和 18:52 厨房温度传感器报告 MeasuredValue = None,与灶具使用时段(18:31–18:51)高度关联;早间06:57、06:58也出现相同现象", "阳台门传感器07:29报告开启后,整日日志中未见关闭事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程;考虑更换耐高温型号或调整安装位置", "检查厨房温度传感器的固件版本和通信质量,排除间歇性通信故障", "确认阳台门当前是否已关闭,如长时间敞开需及时关闭以保障安全", "当前无紧急安全威胁,各项设备运行和家庭活动模式正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.523205041885376, "api_error": null} {"episode_id": "SQ3_TP_C_0529", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0529.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261158, "scenario_id": "INS-04", "total_events": 262, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-03T15:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时下午有人从阳台进入但入户门未开锁,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55、06:58、18:16、19:13 四次报告 MeasuredValue = None,每次都发生在灶具使用前后。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能在高温时出现故障或通信中断。\",\n \"推理步骤2: 15:46 阳台门传感器打开,随后客厅和主卧检测到有人活动,15:49 阳台门关闭。此时入户门未开锁,说明有人从阳台方向进入室内。考虑到这是下午时段且未触发任何报警,可能是住户从阳台收衣服,但也需注意这是一个非正门入口的活动。\",\n \"推理步骤3: 16:13 入户门开锁但之后未见关门/锁门记录,直到 22:34 才确认门关闭并自动上锁。这段时间入户门可能处于未锁状态约6小时,存在一定安全隐患。但结合16:13有人进入儿童房(可能是孩子放学回家),17:53又有人回家的模式,这可能是家庭成员陆续回家期间故意不锁门。\",\n \"推理步骤4: 其余活动模式正常——早晨起床、做早餐、出门上班/上学、傍晚回家、做晚饭、孩子睡觉、大人睡觉,符合典型三口之家的作息规律。温度变化也符合夏季白天升温夜间降温的自然规律。\",\n \"推理步骤5: 没有烟雾报警、漏水报警触发,门锁操作均为手动/自动正常操作,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:55、06:58、18:16、19:13 四次报告 MeasuredValue = None\",\n \"16:13 入户门开锁后直到 22:34 才重新锁定,期间约6小时门可能未上锁\",\n \"15:46-15:49 有人从阳台方向进出,未经入户门\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认是否因灶具高温导致传感器过热故障,考虑调整传感器安装位置使其远离灶具热源\",\n \"建议设置入户门未锁定超时提醒(如超过30分钟未锁门则发送通知)\",\n \"确认15:46阳台进入事件是否为住户正常行为,如非预期则检查阳台安防措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时下午有人从阳台进入但入户门未开锁,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55、06:58、18:16、19:13 四次报告 MeasuredValue = None,每次都发生在灶具使用前后。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能在高温时出现故障或通信中断。", "推理步骤2: 15:46 阳台门传感器打开,随后客厅和主卧检测到有人活动,15:49 阳台门关闭。此时入户门未开锁,说明有人从阳台方向进入室内。考虑到这是下午时段且未触发任何报警,可能是住户从阳台收衣服,但也需注意这是一个非正门入口的活动。", "推理步骤3: 16:13 入户门开锁但之后未见关门/锁门记录,直到 22:34 才确认门关闭并自动上锁。这段时间入户门可能处于未锁状态约6小时,存在一定安全隐患。但结合16:13有人进入儿童房(可能是孩子放学回家),17:53又有人回家的模式,这可能是家庭成员陆续回家期间故意不锁门。", "推理步骤4: 其余活动模式正常——早晨起床、做早餐、出门上班/上学、傍晚回家、做晚饭、孩子睡觉、大人睡觉,符合典型三口之家的作息规律。温度变化也符合夏季白天升温夜间降温的自然规律。", "推理步骤5: 没有烟雾报警、漏水报警触发,门锁操作均为手动/自动正常操作,无异常入侵迹象。"], "key_evidence": ["厨房温度传感器在 06:55、06:58、18:16、19:13 四次报告 MeasuredValue = None", "16:13 入户门开锁后直到 22:34 才重新锁定,期间约6小时门可能未上锁", "15:46-15:49 有人从阳台方向进出,未经入户门"], "recommended_actions": ["检查厨房温度传感器,确认是否因灶具高温导致传感器过热故障,考虑调整传感器安装位置使其远离灶具热源", "建议设置入户门未锁定超时提醒(如超过30分钟未锁门则发送通知)", "确认15:46阳台进入事件是否为住户正常行为,如非预期则检查阳台安防措施"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.114495277404785, "api_error": null} {"episode_id": "SQ3_TP_C_0530", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0530.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261159, "scenario_id": "BA-04", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-20T23:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备状态均在正常范围内,未发现安全威胁或异常行为模式。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度数据趋势。四个传感器(客厅、主卧、儿童房、厨房)在24小时内呈现一致的日变化曲线:凌晨低温约22.9-23.1°C,中午升至峰值约25.5-25.9°C,傍晚后逐步回落至23.3°C左右。各房间温差始终在1°C以内,无单一房间出现异常温升,排除火灾风险或设备故障导致的局部过热。\",\n \"推理步骤2: 分析阳台门传感器事件。23:23阳台门传感器报告StateValue=False(门关闭状态)。这是一个单次状态报告,未伴随异常的运动传感器触发序列或入户门开锁事件,不构成入侵指征。\",\n \"推理步骤3: 分析运动传感器事件。23:23:03主卧运动传感器检测到有人(Occupancy=1),同时客厅运动传感器显示无人(Occupancy=0)。这与深夜住户从客厅回到主卧就寝的正常生活习惯完全吻合,时间合理。\",\n \"推理步骤4: 检查安全类传感器。整个日志期间,烟雾报警器(厨房、客厅)未触发,漏水传感器(厨房、主卫、次卫)未触发,入户门锁无异常开锁记录,所有窗户传感器无异常状态变化。\",\n \"推理步骤5: 综合评估。日志中仅包含温度周期性变化和深夜少量人员活动事件,所有数据模式均符合正常居家生活规律,无任何指标偏离预期。\"\n ],\n \"key_evidence\": [\n \"四个房间温度传感器全天呈现同步、平滑的日变化曲线(22.9°C~25.9°C),无异常温升或温差\",\n \"23:23的阳台门关闭和主卧有人/客厅无人的运动传感器变化,符合深夜就寝的正常行为模式\",\n \"全天无烟雾报警、漏水报警、入户门异常开锁或窗户异常开启事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备状态均在正常范围内,未发现安全威胁或异常行为模式。", "reasoning": ["推理步骤1: 分析温度数据趋势。四个传感器(客厅、主卧、儿童房、厨房)在24小时内呈现一致的日变化曲线:凌晨低温约22.9-23.1°C,中午升至峰值约25.5-25.9°C,傍晚后逐步回落至23.3°C左右。各房间温差始终在1°C以内,无单一房间出现异常温升,排除火灾风险或设备故障导致的局部过热。", "推理步骤2: 分析阳台门传感器事件。23:23阳台门传感器报告StateValue=False(门关闭状态)。这是一个单次状态报告,未伴随异常的运动传感器触发序列或入户门开锁事件,不构成入侵指征。", "推理步骤3: 分析运动传感器事件。23:23:03主卧运动传感器检测到有人(Occupancy=1),同时客厅运动传感器显示无人(Occupancy=0)。这与深夜住户从客厅回到主卧就寝的正常生活习惯完全吻合,时间合理。", "推理步骤4: 检查安全类传感器。整个日志期间,烟雾报警器(厨房、客厅)未触发,漏水传感器(厨房、主卫、次卫)未触发,入户门锁无异常开锁记录,所有窗户传感器无异常状态变化。", "推理步骤5: 综合评估。日志中仅包含温度周期性变化和深夜少量人员活动事件,所有数据模式均符合正常居家生活规律,无任何指标偏离预期。"], "key_evidence": ["四个房间温度传感器全天呈现同步、平滑的日变化曲线(22.9°C~25.9°C),无异常温升或温差", "23:23的阳台门关闭和主卧有人/客厅无人的运动传感器变化,符合深夜就寝的正常行为模式", "全天无烟雾报警、漏水报警、入户门异常开锁或窗户异常开启事件"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.472108840942383, "api_error": null} {"episode_id": "SQ3_TP_C_0531", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0531.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261160, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-03T08:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时客厅烟雾报警器在无人在家时触发了一氧化碳(CO)报警,需要重点关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:39、07:04、18:20、19:07 共四次报告 MeasuredValue = None。这些时间点均与灶具开关操作相关(06:38 灶具开启后1分钟、07:03 灶具关闭后1分钟、18:19 灶具开启后1分钟、19:06 灶具关闭后1分钟),说明灶具运行或状态切换时传感器出现读数丢失,可能是传感器受热干扰、通信故障或硬件缺陷。\",\n \"推理步骤2: 08:42 客厅烟雾报警器触发了 CO 报警(COState=1, ExpressedState=2, Event: COAlarm)。此时住户已于 07:45 出门(门锁上锁、入户门关闭),家中无人。厨房灶具在 07:03 已关闭,但厨房窗户在 07:03:30 被打开(StateValue=False 表示开启)。CO 报警发生在灶具关闭约1小时40分钟后,且发生在客厅而非厨房,这不太符合正常烹饪残留气体的模式。\",\n \"推理步骤3: 日志中未见该 CO 报警被消除或复位的记录。住户直到 16:00 才有人回家(孩子放学),18:08 成人回家,但整个过程中没有对 CO 报警进行任何处理的日志,说明报警可能被忽略,或者报警器本身存在误报/故障。\",\n \"推理步骤4: 其余行为模式正常——早晨 06:14 起床、06:38 做早餐、07:45 出门上班/上学、16:00 孩子回家、18:08 成人回家做晚饭、20:48 孩子睡觉、22:21 成人就寝,符合典型三口之家的作息规律。门锁操作均为手动开锁+自动上锁,入户门开关时间合理,无入侵迹象。\",\n \"推理步骤5: 温度趋势整体正常,呈现夏季白天升温(中午峰值约25.9°C)、夜间降温的自然曲线。18:08 开启客厅空调制冷后温度逐步下降,符合预期。无异常温升提示火灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:39、07:04、18:20、19:07 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"08:42 客厅烟雾报警器触发 CO 报警(COState=1, ExpressedState=2),此时家中无人、灶具已关闭近1小时40分钟\",\n \"CO 报警后无任何消除/复位记录,直至日志结束(23:30)\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器硬件状态,确认是否因灶具热辐射或电磁干扰导致读数丢失,必要时更换或重新定位传感器\",\n \"重点排查客厅 CO 报警的原因:检查是否存在真实的一氧化碳泄漏源(燃气管道、热水器等),使用独立 CO 检测仪交叉验证\",\n \"如果 CO 检测仪未发现异常浓度,对客厅烟雾报警器进行校准或更换,排除传感器老化导致的误报\",\n \"建议在厨房也安装 CO 检测器,以便更精确地定位 CO 来源\",\n \"设置自动化规则:当 CO 报警触发且家中无人时,自动推送紧急通知到住户手机,并联动打开窗户通风\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时客厅烟雾报警器在无人在家时触发了一氧化碳(CO)报警,需要重点关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:39、07:04、18:20、19:07 共四次报告 MeasuredValue = None。这些时间点均与灶具开关操作相关(06:38 灶具开启后1分钟、07:03 灶具关闭后1分钟、18:19 灶具开启后1分钟、19:06 灶具关闭后1分钟),说明灶具运行或状态切换时传感器出现读数丢失,可能是传感器受热干扰、通信故障或硬件缺陷。", "推理步骤2: 08:42 客厅烟雾报警器触发了 CO 报警(COState=1, ExpressedState=2, Event: COAlarm)。此时住户已于 07:45 出门(门锁上锁、入户门关闭),家中无人。厨房灶具在 07:03 已关闭,但厨房窗户在 07:03:30 被打开(StateValue=False 表示开启)。CO 报警发生在灶具关闭约1小时40分钟后,且发生在客厅而非厨房,这不太符合正常烹饪残留气体的模式。", "推理步骤3: 日志中未见该 CO 报警被消除或复位的记录。住户直到 16:00 才有人回家(孩子放学),18:08 成人回家,但整个过程中没有对 CO 报警进行任何处理的日志,说明报警可能被忽略,或者报警器本身存在误报/故障。", "推理步骤4: 其余行为模式正常——早晨 06:14 起床、06:38 做早餐、07:45 出门上班/上学、16:00 孩子回家、18:08 成人回家做晚饭、20:48 孩子睡觉、22:21 成人就寝,符合典型三口之家的作息规律。门锁操作均为手动开锁+自动上锁,入户门开关时间合理,无入侵迹象。", "推理步骤5: 温度趋势整体正常,呈现夏季白天升温(中午峰值约25.9°C)、夜间降温的自然曲线。18:08 开启客厅空调制冷后温度逐步下降,符合预期。无异常温升提示火灾风险。"], "key_evidence": ["厨房温度传感器在 06:39、07:04、18:20、19:07 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "08:42 客厅烟雾报警器触发 CO 报警(COState=1, ExpressedState=2),此时家中无人、灶具已关闭近1小时40分钟", "CO 报警后无任何消除/复位记录,直至日志结束(23:30)"], "recommended_actions": ["立即检查厨房温度传感器硬件状态,确认是否因灶具热辐射或电磁干扰导致读数丢失,必要时更换或重新定位传感器", "重点排查客厅 CO 报警的原因:检查是否存在真实的一氧化碳泄漏源(燃气管道、热水器等),使用独立 CO 检测仪交叉验证", "如果 CO 检测仪未发现异常浓度,对客厅烟雾报警器进行校准或更换,排除传感器老化导致的误报", "建议在厨房也安装 CO 检测器,以便更精确地定位 CO 来源", "设置自动化规则:当 CO 报警触发且家中无人时,自动推送紧急通知到住户手机,并联动打开窗户通风"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.80610966682434, "api_error": null} {"episode_id": "SQ3_TP_C_0537", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0537.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261166, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-11T17:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在15:59有人进入后未关锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:41、07:11、18:44、18:52 共4次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统性通信问题,而是该传感器自身的故障。\",\n \"推理步骤2: None 值出现的时间点与灶具使用高度相关——06:40 灶具开启后 06:41 出现 None,18:43 灶具开启后 18:44 出现 None。灶具关闭、厨房窗户打开通风后(07:10/18:51),传感器仍然报告 None(07:11/18:52),直到下一个整点周期才恢复。这暗示灶具产生的高温或油烟可能导致传感器暂时失灵。\",\n \"推理步骤3: 厨房温度传感器的故障会削弱火灾预警能力。虽然厨房有独立的烟雾报警器(kitchen_smoke_alarm),但温度传感器作为辅助监测手段失效后,系统对厨房热异常的感知能力下降。\",\n \"推理步骤4: 15:59 入户门被手动开锁(LockOperationType=1),有人进入(entrance_occupancy=1),随后进入儿童房(kids_room_occupancy=1)。但日志中没有记录该次开门后的关门(front_door_contact 恢复 True)和上锁事件。直到 22:35:28 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在 15:59 至 22:35 之间处于未锁定状态长达约6.5小时。\",\n \"推理步骤5: 对比 07:37 的出门流程(开锁→开门→关门→自动上锁,全程7秒完成)和 22:35 的睡前流程(确认关门→自动上锁),15:59 的进门缺少关门/上锁记录是明显的异常模式。17:34 的进门事件同样缺少明确的上锁记录,但 18:13 又有一次手动开锁,说明中间可能有人手动锁过但未被记录,或者门一直未锁。\",\n \"推理步骤6: 整体生活模式正常——早晨约6点起床、7:37出门、下午陆续回家、晚间22:35就寝,符合有学龄儿童的三口之家作息。温度曲线呈现正常的日间升温、夜间降温趋势。灶具使用时长合理(早餐约30分钟、晚餐约8分钟)。无入侵、火灾或漏水告警触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:41、07:11、18:44、18:52 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"15:59 入户门手动开锁、有人进入后,日志中缺少 front_door_contact 恢复 True(关门)和 LockState=1(上锁)的记录,直到 22:35 才出现关门上锁\",\n \"其他三个温度传感器在相同时段均正常工作,排除系统性故障\",\n \"烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)和漏水传感器全天无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温/油烟干扰,必要时重新定位或更换耐高温型号\",\n \"检查入户门锁的自动上锁策略,建议启用\"开门后N秒未关门则告警\"的提醒功能,避免长时间门户未锁\",\n \"排查 15:59-22:35 期间入户门的实际状态,确认是传感器漏报还是门确实未关/未锁\",\n \"考虑为厨房温度传感器设置 None 值告警规则,在传感器失灵时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在15:59有人进入后未关锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:41、07:11、18:44、18:52 共4次报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是系统性通信问题,而是该传感器自身的故障。\",\n \"推理步骤2: None 值出现的时间点与灶具使用高度相关——06:40 灶具开启后 06:41 出现 None,18:43 灶具开启后 18:44 出现 None。灶具关闭、厨房窗户打开通风后(07:10/18:51),传感器仍然报告 None(07:11/18:52),直到下一个整点周期才恢复。这暗示灶具产生的高温或油烟可能导致传感器暂时失灵。\",\n "], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 30.886412858963013, "api_error": null} {"episode_id": "SQ3_TP_C_0542", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0542.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261171, "scenario_id": "DF-04", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-17T18:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,门锁出现异常告警事件,同时入户门在 16:24 开锁进入后长时间未关闭/上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:11、07:27、18:51、19:13 共四次报告 MeasuredValue = None。虽然灶具使用期间传感器可能受高温影响,但 07:27 灶具已于 07:26 关闭后仍报 None,19:13 灶具已于 19:12 关闭后仍报 None,说明传感器恢复读数存在延迟或故障。到 07:30 和 19:30 时传感器恢复了正常数值,表明这是间歇性故障而非永久损坏。\",\n \"推理步骤2: 18:25 门锁连续收到两次 LockDoor 命令(间隔5秒),两次返回 LockState=2(Unlocked),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这意味着有人或自动化尝试锁门但未能成功,门锁可能存在机械故障或卡滞。\",\n \"推理步骤3: 16:24 入户门开锁(Manual),门传感器显示门打开(StateValue=False),但直到 22:20 才记录到门关闭(StateValue=True)和自动上锁。中间近6小时门处于开启/未锁状态,结合 18:25 锁门失败的告警,说明这段时间入户门安全性存在缺口。\",\n \"推理步骤4: 18:00 再次手动开锁进入,但日志中没有对应的门关闭记录,直到 22:20 才出现 front_door_contact=True。这与 18:25 锁门失败告警吻合——住户可能尝试锁门但失败了,门一直处于未锁定状态。\",\n \"推理步骤5: 其余行为模式正常:早晨 ~06:00 起床、07:17 出门(关灯+锁门)、16:24 孩子放学回家、18:00 大人下班回家、晚间做饭用餐、21:01 孩子就寝、22:20 大人就寝。温度曲线符合夏季日间升温夜间降温的自然规律,空调使用合理,无烟雾/漏水/入侵等告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:11、07:27、18:51、19:13 四次报告 MeasuredValue = None(间歇性传感器故障)\",\n \"18:25:05 和 18:25:10 连续两次 LockDoor 命令均返回 LockState=2(未锁定),并触发 DoorLockAlarm(AlarmCode=0) 锁定失败告警\",\n \"入户门从 16:24 开启到 22:20 关闭,近6小时处于未锁定/开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,确认是否因灶具高温导致间歇性失灵\",\n \"立即检修入户门锁机械结构,排查锁舌、电机或对位问题,确保 LockDoor 命令能正常执行\",\n \"设置门锁告警自动通知规则:当 DoorLockAlarm 触发时立即推送手机通知\",\n \"设置入户门长时间未关闭/未上锁的提醒(如超过10分钟未关门则告警),避免安全缺口\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,门锁出现异常告警事件,同时入户门在 16:24 开锁进入后长时间未关闭/上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:11、07:27、18:51、19:13 共四次报告 MeasuredValue = None。虽然灶具使用期间传感器可能受高温影响,但 07:27 灶具已于 07:26 关闭后仍报 None,19:13 灶具已于 19:12 关闭后仍报 None,说明传感器恢复读数存在延迟或故障。到 07:30 和 19:30 时传感器恢复了正常数值,表明这是间歇性故障而非永久损坏。", "推理步骤2: 18:25 门锁连续收到两次 LockDoor 命令(间隔5秒),两次返回 LockState=2(Unlocked),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这意味着有人或自动化尝试锁门但未能成功,门锁可能存在机械故障或卡滞。", "推理步骤3: 16:24 入户门开锁(Manual),门传感器显示门打开(StateValue=False),但直到 22:20 才记录到门关闭(StateValue=True)和自动上锁。中间近6小时门处于开启/未锁状态,结合 18:25 锁门失败的告警,说明这段时间入户门安全性存在缺口。", "推理步骤4: 18:00 再次手动开锁进入,但日志中没有对应的门关闭记录,直到 22:20 才出现 front_door_contact=True。这与 18:25 锁门失败告警吻合——住户可能尝试锁门但失败了,门一直处于未锁定状态。", "推理步骤5: 其余行为模式正常:早晨 ~06:00 起床、07:17 出门(关灯+锁门)、16:24 孩子放学回家、18:00 大人下班回家、晚间做饭用餐、21:01 孩子就寝、22:20 大人就寝。温度曲线符合夏季日间升温夜间降温的自然规律,空调使用合理,无烟雾/漏水/入侵等告警。"], "key_evidence": ["kitchen_temp_sensor 在 07:11、07:27、18:51、19:13 四次报告 MeasuredValue = None(间歇性传感器故障)", "18:25:05 和 18:25:10 连续两次 LockDoor 命令均返回 LockState=2(未锁定),并触发 DoorLockAlarm(AlarmCode=0) 锁定失败告警", "入户门从 16:24 开启到 22:20 关闭,近6小时处于未锁定/开启状态"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,确认是否因灶具高温导致间歇性失灵", "立即检修入户门锁机械结构,排查锁舌、电机或对位问题,确保 LockDoor 命令能正常执行", "设置门锁告警自动通知规则:当 DoorLockAlarm 触发时立即推送手机通知", "设置入户门长时间未关闭/未上锁的提醒(如超过10分钟未关门则告警),避免安全缺口"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.56680202484131, "api_error": null} {"episode_id": "SQ3_TP_C_0543", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0543.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261172, "scenario_id": "BA-05", "total_events": 257, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-23T19:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或受灶具干扰;同时入户门在16:13有一次开锁后未见明确关门/上锁记录,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:04、07:06、18:28、19:17 四次报告 MeasuredValue = None。前两次发生在早晨灶具使用期间(07:03开灶、07:05关灶),后两次发生在晚间灶具使用期间(18:27开灶、19:16关灶)。传感器在灶具开启后短时间内就丢失读数,说明灶具工作可能导致传感器异常,或传感器本身存在间歇性故障。\",\n \"推理步骤2: 虽然 None 值出现后传感器在下一个半小时整点周期恢复了正常读数(07:30 报 2430、18:30 报 2453),但这种反复丢失数据的模式不正常。厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助监测手段,其可靠性至关重要。\",\n \"推理步骤3: 16:13 入户门手动开锁,门传感器显示开门(StateValue=False),儿童房和玄关检测到有人,儿童房灯打开——这符合孩子放学回家的场景。但日志中没有记录该次开门后的关门(StateValue=True)和上锁事件,直到 22:11 才出现关门上锁记录。这意味着从 16:13 到 17:54(第二次开门)期间,入户门可能一直处于未关闭或未上锁状态。\",\n \"推理步骤4: 17:54 第二次手动开锁进门,随后客厅有人活动、开灯、开空调,符合大人下班回家的模式。22:11 关灯、关空调、进主卧、关窗帘、关门上锁就寝,整体生活节奏正常。\",\n \"推理步骤5: 其余设备行为均正常——温度随日间升温夜间降温自然变化(夜间约23°C,午间峰值约25.8°C);运动传感器与灯光联动合理;洗碗机晚间启动;儿童房窗帘早开晚关;无烟雾报警、漏水报警触发。厨房窗户在做饭后打开通风也属正常操作。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:04、07:06、18:28、19:17 四次报告 MeasuredValue = None,均与灶具使用时段高度关联\",\n \"16:13 入户门开锁开门后,日志中缺少对应的关门(BooleanState.StateValue=True)和上锁记录,直到 22:11 才有关门上锁事件\",\n \"厨房窗户传感器在 07:05:30 和 19:16:30 报告 StateValue=False(开窗),但日志中未见对应的关窗记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器\",\n \"检查入户门门磁传感器是否工作正常,确认 16:13 开门后门是否确实长时间未关闭;如传感器正常,建议设置开门超时未关闭的告警规则\",\n \"确认厨房窗户当前状态,日志中两次开窗均无对应关窗记录,夜间开窗可能存在安全隐患\",\n \"考虑为灶具使用场景添加自动化规则:灶具关闭后若温度传感器持续无读数,触发告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或受灶具干扰;同时入户门在16:13有一次开锁后未见明确关门/上锁记录,存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:04、07:06、18:28、19:17 四次报告 MeasuredValue = None。前两次发生在早晨灶具使用期间(07:03开灶、07:05关灶),后两次发生在晚间灶具使用期间(18:27开灶、19:16关灶)。传感器在灶具开启后短时间内就丢失读数,说明灶具工作可能导致传感器异常,或传感器本身存在间歇性故障。", "推理步骤2: 虽然 None 值出现后传感器在下一个半小时整点周期恢复了正常读数(07:30 报 2430、18:30 报 2453),但这种反复丢失数据的模式不正常。厨房是火灾高风险区域,温度传感器是烟雾报警器之外的重要辅助监测手段,其可靠性至关重要。", "推理步骤3: 16:13 入户门手动开锁,门传感器显示开门(StateValue=False),儿童房和玄关检测到有人,儿童房灯打开——这符合孩子放学回家的场景。但日志中没有记录该次开门后的关门(StateValue=True)和上锁事件,直到 22:11 才出现关门上锁记录。这意味着从 16:13 到 17:54(第二次开门)期间,入户门可能一直处于未关闭或未上锁状态。", "推理步骤4: 17:54 第二次手动开锁进门,随后客厅有人活动、开灯、开空调,符合大人下班回家的模式。22:11 关灯、关空调、进主卧、关窗帘、关门上锁就寝,整体生活节奏正常。", "推理步骤5: 其余设备行为均正常——温度随日间升温夜间降温自然变化(夜间约23°C,午间峰值约25.8°C);运动传感器与灯光联动合理;洗碗机晚间启动;儿童房窗帘早开晚关;无烟雾报警、漏水报警触发。厨房窗户在做饭后打开通风也属正常操作。"], "key_evidence": ["kitchen_temp_sensor 在 07:04、07:06、18:28、19:17 四次报告 MeasuredValue = None,均与灶具使用时段高度关联", "16:13 入户门开锁开门后,日志中缺少对应的关门(BooleanState.StateValue=True)和上锁记录,直到 22:11 才有关门上锁事件", "厨房窗户传感器在 07:05:30 和 19:16:30 报告 StateValue=False(开窗),但日志中未见对应的关窗记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器", "检查入户门门磁传感器是否工作正常,确认 16:13 开门后门是否确实长时间未关闭;如传感器正常,建议设置开门超时未关闭的告警规则", "确认厨房窗户当前状态,日志中两次开窗均无对应关窗记录,夜间开窗可能存在安全隐患", "考虑为灶具使用场景添加自动化规则:灶具关闭后若温度传感器持续无读数,触发告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.06486463546753, "api_error": null} {"episode_id": "SQ3_TP_C_0545", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0545.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261174, "scenario_id": "BA-03", "total_events": 199, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-28T17:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧灯在17:47出现27秒内快速开关5次的异常闪烁,疑似设备故障或线路接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全屋4个温度传感器在24小时内呈现一致的日变化曲线:凌晨低点约22.9-23.1°C,午间高点约25.5-25.9°C,傍晚逐步回落。各房间温差始终在1°C以内,符合夏季自然气温波动规律,无异常热源或火灾迹象。\",\n \"推理步骤2: 主卧灯异常闪烁分析——17:47:00至17:47:14的14秒内,master_bedroom_light发生了7次状态变化(开-关-开-关-开-开-关),平均每2秒切换一次。这种高频开关模式不符合正常人工操作习惯(正常开关灯通常是单次操作)。\",\n \"推理步骤3: 排除入侵可能——该时段(17:47,傍晚)属于正常活动时间,且没有入户门锁/门传感器、窗户传感器等安防设备的异常事件,不支持入侵判断。\",\n \"推理步骤4: 故障模式识别——快速反复开关的模式更符合以下故障场景之一:(a) 智能灯固件异常导致状态抖动;(b) 物理线路接触不良导致间歇性通断;(c) 智能开关/继电器粘连或抖动;(d) 自动化规则冲突导致反复触发。其中17:47:10和17:47:12连续两次报告OnOff=True(未经过False),进一步暗示状态上报或设备本身存在异常。\",\n \"推理步骤5: 置信度评估——仅发生一次短暂闪烁事件,尚不能确定是持续性硬件故障还是偶发性软件抖动,因此置信度定为medium。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_light 在 17:47:00-17:47:14 的14秒内发生7次开关状态变化,平均间隔仅2秒\",\n \"17:47:10 和 17:47:12 连续两次上报 OnOff=True,中间未经过 False 状态,存在状态跳变异常\",\n \"全屋温度曲线正常,无其他安防传感器告警,排除火灾和入侵\"\n ],\n \"recommended_actions\": [\n \"检查主卧灯的自动化规则和场景配置,排除规则冲突导致的反复触发\",\n \"检查主卧灯固件版本,如有更新建议升级以修复潜在的状态抖动问题\",\n \"观察未来几天该灯是否再次出现类似快速闪烁,若反复发生则检查物理线路和开关硬件\",\n \"如闪烁频繁发生,建议暂时将该灯从自动化中移除,改为手动控制,以防继电器频繁通断引发过热风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧灯在17:47出现27秒内快速开关5次的异常闪烁,疑似设备故障或线路接触不良。", "reasoning": ["推理步骤1: 温度数据分析——全屋4个温度传感器在24小时内呈现一致的日变化曲线:凌晨低点约22.9-23.1°C,午间高点约25.5-25.9°C,傍晚逐步回落。各房间温差始终在1°C以内,符合夏季自然气温波动规律,无异常热源或火灾迹象。", "推理步骤2: 主卧灯异常闪烁分析——17:47:00至17:47:14的14秒内,master_bedroom_light发生了7次状态变化(开-关-开-关-开-开-关),平均每2秒切换一次。这种高频开关模式不符合正常人工操作习惯(正常开关灯通常是单次操作)。", "推理步骤3: 排除入侵可能——该时段(17:47,傍晚)属于正常活动时间,且没有入户门锁/门传感器、窗户传感器等安防设备的异常事件,不支持入侵判断。", "推理步骤4: 故障模式识别——快速反复开关的模式更符合以下故障场景之一:(a) 智能灯固件异常导致状态抖动;(b) 物理线路接触不良导致间歇性通断;(c) 智能开关/继电器粘连或抖动;(d) 自动化规则冲突导致反复触发。其中17:47:10和17:47:12连续两次报告OnOff=True(未经过False),进一步暗示状态上报或设备本身存在异常。", "推理步骤5: 置信度评估——仅发生一次短暂闪烁事件,尚不能确定是持续性硬件故障还是偶发性软件抖动,因此置信度定为medium。"], "key_evidence": ["master_bedroom_light 在 17:47:00-17:47:14 的14秒内发生7次开关状态变化,平均间隔仅2秒", "17:47:10 和 17:47:12 连续两次上报 OnOff=True,中间未经过 False 状态,存在状态跳变异常", "全屋温度曲线正常,无其他安防传感器告警,排除火灾和入侵"], "recommended_actions": ["检查主卧灯的自动化规则和场景配置,排除规则冲突导致的反复触发", "检查主卧灯固件版本,如有更新建议升级以修复潜在的状态抖动问题", "观察未来几天该灯是否再次出现类似快速闪烁,若反复发生则检查物理线路和开关硬件", "如闪烁频繁发生,建议暂时将该灯从自动化中移除,改为手动控制,以防继电器频繁通断引发过热风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.413532733917236, "api_error": null} {"episode_id": "SQ3_TP_C_0546", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0546.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261175, "scenario_id": "INS-05", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-14T23:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有设备行为均属正常,未发现安全威胁或异常模式。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)在24小时内呈现一致的自然昼夜温度曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温(排除火灾风险)或骤降(排除设备故障)。\",\n \"推理步骤2: 入户门事件分析——23:20 入户门锁触发 LockOperation,LockOperationType=1(解锁),OperationSource=8(远程/密码/正常方式),UserIndex=1(已注册的主用户)。这是合法用户通过正常认证方式开锁,非暴力破解或未知用户。\",\n \"推理步骤3: 门锁与传感器联动验证——解锁后3秒门磁传感器报告 StateValue=False(门打开),5秒后玄关运动传感器检测到人体(Occupancy=1),20秒后客厅运动传感器检测到人体。这一时序完全符合'开门→进入玄关→走向客厅'的正常入户动线,时间间隔合理。\",\n \"推理步骤4: 客厅灯状态——23:20:25 客厅主灯 OnOff=False(关闭状态)。住户深夜回家未开主灯,可能使用手机照明或其他光源,属于个人习惯范畴,不构成异常。\",\n \"推理步骤5: 安全设备静默确认——整个日志期间,烟雾报警器(厨房、客厅)未触发告警,漏水传感器(厨房、主卫、次卫)未报告异常,所有窗户/阳台门磁传感器无开合事件,灶具无点火记录。无任何安全类设备发出警报。\",\n \"推理步骤6: 整体活动模式评估——全天仅在23:20出现一次入户活动,其余时间家中无人员活动事件,符合住户白天外出、深夜归家的生活模式。无深夜反复开关门、多区域无规律运动等入侵特征。\"\n ],\n \"key_evidence\": [\n \"入户门锁由已注册用户(UserIndex=1)通过正常方式(OperationSource=8)解锁,身份合法\",\n \"开锁→门磁开启→玄关感应→客厅感应的时序链完整且间隔合理(3s→2s→15s),符合正常入户动线\",\n \"四个房间温度传感器全天呈现一致的自然昼夜曲线,无异常温升或骤变\",\n \"烟雾报警器、漏水传感器、窗户门磁等安全设备全天无任何告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取任何措施,当前家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有设备行为均属正常,未发现安全威胁或异常模式。", "reasoning": ["推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)在24小时内呈现一致的自然昼夜温度曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温(排除火灾风险)或骤降(排除设备故障)。", "推理步骤2: 入户门事件分析——23:20 入户门锁触发 LockOperation,LockOperationType=1(解锁),OperationSource=8(远程/密码/正常方式),UserIndex=1(已注册的主用户)。这是合法用户通过正常认证方式开锁,非暴力破解或未知用户。", "推理步骤3: 门锁与传感器联动验证——解锁后3秒门磁传感器报告 StateValue=False(门打开),5秒后玄关运动传感器检测到人体(Occupancy=1),20秒后客厅运动传感器检测到人体。这一时序完全符合'开门→进入玄关→走向客厅'的正常入户动线,时间间隔合理。", "推理步骤4: 客厅灯状态——23:20:25 客厅主灯 OnOff=False(关闭状态)。住户深夜回家未开主灯,可能使用手机照明或其他光源,属于个人习惯范畴,不构成异常。", "推理步骤5: 安全设备静默确认——整个日志期间,烟雾报警器(厨房、客厅)未触发告警,漏水传感器(厨房、主卫、次卫)未报告异常,所有窗户/阳台门磁传感器无开合事件,灶具无点火记录。无任何安全类设备发出警报。", "推理步骤6: 整体活动模式评估——全天仅在23:20出现一次入户活动,其余时间家中无人员活动事件,符合住户白天外出、深夜归家的生活模式。无深夜反复开关门、多区域无规律运动等入侵特征。"], "key_evidence": ["入户门锁由已注册用户(UserIndex=1)通过正常方式(OperationSource=8)解锁,身份合法", "开锁→门磁开启→玄关感应→客厅感应的时序链完整且间隔合理(3s→2s→15s),符合正常入户动线", "四个房间温度传感器全天呈现一致的自然昼夜曲线,无异常温升或骤变", "烟雾报警器、漏水传感器、窗户门磁等安全设备全天无任何告警事件"], "recommended_actions": ["无需采取任何措施,当前家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.990367650985718, "api_error": null} {"episode_id": "SQ3_TP_C_0547", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0547.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261176, "scenario_id": "BA-03", "total_events": 199, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-20T10:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"餐厅灯在10:07出现7秒内快速开关5次的异常闪烁,疑似设备故障或线路接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据方面,全屋四个传感器在24小时内呈现一致的日变化曲线——凌晨约22.9~23.1°C,午间峰值约25.5~25.9°C,夜间回落至23.3°C左右。各房间温差始终在1°C以内,变化平滑且同步,符合夏季自然昼夜温度波动规律,无异常。\",\n \"推理步骤2: 06:00时刻各传感器从约22.9°C跳升至约23.9°C(约1°C),这是日出后室温开始上升的正常表现,不构成异常。\",\n \"推理步骤3: 10:07:00~10:07:14期间,餐厅灯在14秒内发生了5次开关状态切换(True→False→True→False→True→True→False),频率极高。正常的人为操作不会在如此短的时间内反复切换灯的状态。\",\n \"推理步骤4: 同一时段餐厅运动传感器没有任何触发记录,说明该区域可能无人活动,进一步排除了人为手动操作的可能性。\",\n \"推理步骤5: 这种快速闪烁模式常见于:智能开关/继电器故障、线路接触不良、固件bug导致状态抖动,或自动化规则冲突导致的循环触发。虽然不构成即时安全威胁,但持续的继电器快速通断可能导致过热或缩短设备寿命。\"\n ],\n \"key_evidence\": [\n \"餐厅灯在10:07:00至10:07:14的14秒内发生了5次开关切换(On-Off-On-Off-On-On-Off),属于异常高频闪烁\",\n \"同时段餐厅运动传感器无触发,排除人为操作的可能\",\n \"全屋温度曲线正常,无火灾、入侵等其他威胁迹象\"\n ],\n \"recommended_actions\": [\n \"检查餐厅灯的智能开关/继电器是否存在硬件故障,必要时更换\",\n \"排查是否有自动化规则或场景联动冲突导致餐厅灯被反复触发\",\n \"检查餐厅灯的固件版本,如有更新建议升级\",\n \"临时禁用餐厅灯的自动化规则,观察是否仍会出现异常闪烁,以定位问题根因\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "餐厅灯在10:07出现7秒内快速开关5次的异常闪烁,疑似设备故障或线路接触不良。", "reasoning": ["推理步骤1: 温度数据方面,全屋四个传感器在24小时内呈现一致的日变化曲线——凌晨约22.9~23.1°C,午间峰值约25.5~25.9°C,夜间回落至23.3°C左右。各房间温差始终在1°C以内,变化平滑且同步,符合夏季自然昼夜温度波动规律,无异常。", "推理步骤2: 06:00时刻各传感器从约22.9°C跳升至约23.9°C(约1°C),这是日出后室温开始上升的正常表现,不构成异常。", "推理步骤3: 10:07:00~10:07:14期间,餐厅灯在14秒内发生了5次开关状态切换(True→False→True→False→True→True→False),频率极高。正常的人为操作不会在如此短的时间内反复切换灯的状态。", "推理步骤4: 同一时段餐厅运动传感器没有任何触发记录,说明该区域可能无人活动,进一步排除了人为手动操作的可能性。", "推理步骤5: 这种快速闪烁模式常见于:智能开关/继电器故障、线路接触不良、固件bug导致状态抖动,或自动化规则冲突导致的循环触发。虽然不构成即时安全威胁,但持续的继电器快速通断可能导致过热或缩短设备寿命。"], "key_evidence": ["餐厅灯在10:07:00至10:07:14的14秒内发生了5次开关切换(On-Off-On-Off-On-On-Off),属于异常高频闪烁", "同时段餐厅运动传感器无触发,排除人为操作的可能", "全屋温度曲线正常,无火灾、入侵等其他威胁迹象"], "recommended_actions": ["检查餐厅灯的智能开关/继电器是否存在硬件故障,必要时更换", "排查是否有自动化规则或场景联动冲突导致餐厅灯被反复触发", "检查餐厅灯的固件版本,如有更新建议升级", "临时禁用餐厅灯的自动化规则,观察是否仍会出现异常闪烁,以定位问题根因"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.213012218475342, "api_error": null} {"episode_id": "SQ3_TP_C_0549", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0549.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261178, "scenario_id": "INS-01", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-15T01:00:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时儿童房窗户在凌晨处于打开状态存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:11、18:31、19:11 四个时间点报告 MeasuredValue = None。这些时间点均紧跟灶具状态变化(开启或关闭),说明传感器可能在灶具工作产生的高温或油烟环境下出现读数异常或通信中断。\",\n \"推理步骤2: 除厨房传感器的 None 值外,其余温度数据呈现正常的昼夜变化曲线——夜间约 22.9-23.1°C,白天逐步升至 25.5-25.9°C 的峰值后回落,各房间温度趋势一致,无异常高温或骤变,排除火灾风险。\",\n \"推理步骤3: 凌晨 01:00 儿童房窗户传感器报告 StateValue=False(窗户打开),随后 01:00:05 检测到儿童房有人活动,01:00:30 主卫也有人活动,推断是孩子夜间起床上厕所并开窗通风,属于可解释行为,但深夜开窗对儿童安全有轻微隐患。\",\n \"推理步骤4: 入户门锁操作模式正常——早晨 07:45 手动开锁出门后自动上锁(全家出门),下午 16:24 开锁进门(孩子放学回家),17:55 再次开锁(大人回家),22:29 确认门关闭并自动上锁(就寝)。所有开锁均为 Manual 操作,无异常入侵迹象。\",\n \"推理步骤5: 灶具使用集中在早餐(07:10-07:04 前后约 35 分钟)和晚餐(18:30-19:10 约 40 分钟),时长合理。烟雾报警器全天无触发,排除火灾风险。\",\n \"推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,排除水患风险。\",\n \"推理步骤7: 家庭活动时间线完整且合理:起床(06:17-06:42) → 早餐(07:04-07:45) → 出门(07:45) → 孩子回家(16:24) → 大人回家(17:55) → 晚餐(18:30-19:10) → 孩子就寝(21:13) → 大人就寝(22:29),符合典型三口之家的作息规律。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:05、07:11、18:31、19:11 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"凌晨 01:00 儿童房窗户打开(StateValue=False),但日志中未见后续关闭事件\",\n \"入户门全天仅有 3 次手动开锁和 2 次自动上锁,操作模式正常无异常\",\n \"烟雾报警器和漏水传感器全天无任何告警触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰或油烟遮蔽,必要时重新定位或更换耐高温型号\",\n \"设置自动化规则:当儿童房窗户在夜间(23:00-06:00)打开超过一定时间后,向家长手机推送提醒\",\n \"持续监控厨房温度传感器的 None 值出现频率,若问题持续恶化应及时更换设备,避免在真正发生厨房高温异常时无法预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时儿童房窗户在凌晨处于打开状态存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:11、18:31、19:11 四个时间点报告 MeasuredValue = None。这些时间点均紧跟灶具状态变化(开启或关闭),说明传感器可能在灶具工作产生的高温或油烟环境下出现读数异常或通信中断。", "推理步骤2: 除厨房传感器的 None 值外,其余温度数据呈现正常的昼夜变化曲线——夜间约 22.9-23.1°C,白天逐步升至 25.5-25.9°C 的峰值后回落,各房间温度趋势一致,无异常高温或骤变,排除火灾风险。", "推理步骤3: 凌晨 01:00 儿童房窗户传感器报告 StateValue=False(窗户打开),随后 01:00:05 检测到儿童房有人活动,01:00:30 主卫也有人活动,推断是孩子夜间起床上厕所并开窗通风,属于可解释行为,但深夜开窗对儿童安全有轻微隐患。", "推理步骤4: 入户门锁操作模式正常——早晨 07:45 手动开锁出门后自动上锁(全家出门),下午 16:24 开锁进门(孩子放学回家),17:55 再次开锁(大人回家),22:29 确认门关闭并自动上锁(就寝)。所有开锁均为 Manual 操作,无异常入侵迹象。", "推理步骤5: 灶具使用集中在早餐(07:10-07:04 前后约 35 分钟)和晚餐(18:30-19:10 约 40 分钟),时长合理。烟雾报警器全天无触发,排除火灾风险。", "推理步骤6: 所有漏水传感器(厨房、主卫、次卫)全天无报警,排除水患风险。", "推理步骤7: 家庭活动时间线完整且合理:起床(06:17-06:42) → 早餐(07:04-07:45) → 出门(07:45) → 孩子回家(16:24) → 大人回家(17:55) → 晚餐(18:30-19:10) → 孩子就寝(21:13) → 大人就寝(22:29),符合典型三口之家的作息规律。"], "key_evidence": ["厨房温度传感器在 07:05、07:11、18:31、19:11 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "凌晨 01:00 儿童房窗户打开(StateValue=False),但日志中未见后续关闭事件", "入户门全天仅有 3 次手动开锁和 2 次自动上锁,操作模式正常无异常", "烟雾报警器和漏水传感器全天无任何告警触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰或油烟遮蔽,必要时重新定位或更换耐高温型号", "设置自动化规则:当儿童房窗户在夜间(23:00-06:00)打开超过一定时间后,向家长手机推送提醒", "持续监控厨房温度传感器的 None 值出现频率,若问题持续恶化应及时更换设备,避免在真正发生厨房高温异常时无法预警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.480405569076538, "api_error": null} {"episode_id": "SQ3_TP_C_0550", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0550.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261179, "scenario_id": "BA-05", "total_events": 257, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T02:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;凌晨 2:47 客厅出现无后续活动的孤立运动检测;入户门在 16:30 开锁进入后未关门/未上锁长达约 72 分钟。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:34、06:59、18:27、19:09 四次报告 MeasuredValue = None。每次都发生在灶具使用前后,但其他时段该传感器正常上报数值。反复出现 None 表明传感器在高温或油烟环境下工作不稳定,属于设备故障或性能退化。\",\n \"推理步骤2: 凌晨 02:47 客厅运动传感器触发 Occupancy=1,但前后没有任何灯光开启、门锁操作或其他房间的运动检测。全家处于深夜睡眠状态(所有灯关闭,主卧活动要到 05:55 才出现)。这是一个孤立的运动事件,可能是传感器误报(宠物、气流等),但也不能完全排除入侵可能,需要关注。\",\n \"推理步骤3: 16:30 入户门解锁(Manual)并开门(contact=False),有人进入后直接去了儿童房(16:30:09 kids_room_occupancy=1)。但入户门传感器直到 22:24:20 才报告关闭(contact=True),随后自动上锁。这意味着入户门在 16:30 至 22:24 之间约 354 分钟处于未关闭状态。结合 17:42 又有一次开锁进入事件,说明中间确实有人进出,但门长时间未关存在安全隐患。\",\n \"推理步骤4: 次卫灯在 07:04 开启后,整个日志中没有关闭记录。可能是遗忘关灯,也可能是日志截断,属于轻微异常。\",\n \"推理步骤5: 其余行为模式正常——早晨 05:55 起床、做早餐、07:24 出门并自动锁门;下午 16:30 孩子放学回家、17:42 大人回家、做晚饭、21:12 孩子睡觉、22:24 大人睡觉并锁门。温度曲线符合夏季昼夜变化规律(夜间约 22.9°C,午间峰值约 25.8°C)。空调制冷模式(SystemMode=3)在夏季傍晚使用合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:34、06:59、18:27、19:09 四次报告 MeasuredValue = None\",\n \"02:47 客厅运动传感器触发,但无任何关联的灯光、门锁或其他区域活动\",\n \"入户门 16:30:02 开启(contact=False),直到 22:24:20 才关闭(contact=True),中间约 354 分钟未关门\",\n \"次卫灯 07:04 开启后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温/油烟影响导致间歇性故障,必要时更换或重新定位\",\n \"检查客厅运动传感器灵敏度设置,确认凌晨误触发原因(宠物、窗帘飘动、传感器老化等),如家中无宠物则需提高警惕\",\n \"建议设置入户门长时间未关闭的自动告警(如超过 5 分钟未关门则推送通知),避免门户大开的安全风险\",\n \"确认次卫灯是否确实未关闭,考虑为次卫灯添加无人自动关闭的联动规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;凌晨 2:47 客厅出现无后续活动的孤立运动检测;入户门在 16:30 开锁进入后未关门/未上锁长达约 72 分钟。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:34、06:59、18:27、19:09 四次报告 MeasuredValue = None。每次都发生在灶具使用前后,但其他时段该传感器正常上报数值。反复出现 None 表明传感器在高温或油烟环境下工作不稳定,属于设备故障或性能退化。", "推理步骤2: 凌晨 02:47 客厅运动传感器触发 Occupancy=1,但前后没有任何灯光开启、门锁操作或其他房间的运动检测。全家处于深夜睡眠状态(所有灯关闭,主卧活动要到 05:55 才出现)。这是一个孤立的运动事件,可能是传感器误报(宠物、气流等),但也不能完全排除入侵可能,需要关注。", "推理步骤3: 16:30 入户门解锁(Manual)并开门(contact=False),有人进入后直接去了儿童房(16:30:09 kids_room_occupancy=1)。但入户门传感器直到 22:24:20 才报告关闭(contact=True),随后自动上锁。这意味着入户门在 16:30 至 22:24 之间约 354 分钟处于未关闭状态。结合 17:42 又有一次开锁进入事件,说明中间确实有人进出,但门长时间未关存在安全隐患。", "推理步骤4: 次卫灯在 07:04 开启后,整个日志中没有关闭记录。可能是遗忘关灯,也可能是日志截断,属于轻微异常。", "推理步骤5: 其余行为模式正常——早晨 05:55 起床、做早餐、07:24 出门并自动锁门;下午 16:30 孩子放学回家、17:42 大人回家、做晚饭、21:12 孩子睡觉、22:24 大人睡觉并锁门。温度曲线符合夏季昼夜变化规律(夜间约 22.9°C,午间峰值约 25.8°C)。空调制冷模式(SystemMode=3)在夏季傍晚使用合理。"], "key_evidence": ["kitchen_temp_sensor 在 06:34、06:59、18:27、19:09 四次报告 MeasuredValue = None", "02:47 客厅运动传感器触发,但无任何关联的灯光、门锁或其他区域活动", "入户门 16:30:02 开启(contact=False),直到 22:24:20 才关闭(contact=True),中间约 354 分钟未关门", "次卫灯 07:04 开启后无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温/油烟影响导致间歇性故障,必要时更换或重新定位", "检查客厅运动传感器灵敏度设置,确认凌晨误触发原因(宠物、窗帘飘动、传感器老化等),如家中无宠物则需提高警惕", "建议设置入户门长时间未关闭的自动告警(如超过 5 分钟未关门则推送通知),避免门户大开的安全风险", "确认次卫灯是否确实未关闭,考虑为次卫灯添加无人自动关闭的联动规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.883083820343018, "api_error": null} {"episode_id": "SQ3_TP_C_0552", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0552.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261181, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-22T19:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时入户门锁在16:15开锁后长时间未重新上锁,存在安全疏忽。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:49、06:53、18:16、18:54四个时间点报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能因高温超出量程而故障,或存在通信/硬件问题。\",\n \"推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),全天均正常上报数值,无任何 None 值出现,进一步说明厨房温度传感器的 None 是该设备特有的异常。\",\n \"推理步骤3: 入户门在16:15被手动开锁(LockOperationType=1),有人进入(玄关运动传感器触发),但此后直到17:44第二次开门,期间没有任何上锁记录。门锁在约1.5小时内处于未锁定状态,这与07:31和22:25离家/睡前的自动上锁行为形成对比,属于安全疏忽。\",\n \"推理步骤4: 厨房窗户传感器在06:52和18:53两次报告 StateValue=False(窗户打开),但日志中没有对应的关闭(StateValue=True)记录。如果窗户在夜间仍处于打开状态,结合家中无人在厨房活动,存在一定的安全隐患。\",\n \"推理步骤5: 其余行为模式均属正常——早晨06:23起床、07:31全家出门并自动锁门、16:15孩子放学回家、17:44大人回家开空调做饭、20:46孩子关灯睡觉、22:25大人就寝锁门,符合典型三口之家的作息规律。\",\n \"推理步骤6: 温度趋势合理:夜间约22.9°C,白天随气温升高至25.8°C峰值(约12:30),傍晚逐步回落,开空调后客厅温度从24.6°C降至23.5°C,均属正常范围。\",\n \"推理步骤7: 烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。阳台门19:11打开后无关闭记录,但结合主卧有人活动,可能是晚间通风,属于可接受行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:49、06:53、18:16、18:54四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"16:15入户门手动开锁后至17:44期间无上锁记录,门锁处于未锁定状态约1.5小时\",\n \"厨房窗户在06:52和18:53两次打开,日志中无对应关闭记录\",\n \"阳台门19:11打开后无关闭记录,可能整夜处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程;如有必要更换传感器或调整安装位置\",\n \"为入户门锁配置自动上锁策略(如开锁后5分钟无操作自动锁定),避免长时间处于未锁定状态\",\n \"确认厨房窗户和阳台门当前状态,夜间无人时建议关闭以防入侵风险\",\n \"考虑为厨房温度传感器设置 None 值告警规则,及时发现传感器离线或故障情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时入户门锁在16:15开锁后长时间未重新上锁,存在安全疏忽。", "reasoning": ["推理步骤1: 厨房温度传感器在06:49、06:53、18:16、18:54四个时间点报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能因高温超出量程而故障,或存在通信/硬件问题。", "推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),全天均正常上报数值,无任何 None 值出现,进一步说明厨房温度传感器的 None 是该设备特有的异常。", "推理步骤3: 入户门在16:15被手动开锁(LockOperationType=1),有人进入(玄关运动传感器触发),但此后直到17:44第二次开门,期间没有任何上锁记录。门锁在约1.5小时内处于未锁定状态,这与07:31和22:25离家/睡前的自动上锁行为形成对比,属于安全疏忽。", "推理步骤4: 厨房窗户传感器在06:52和18:53两次报告 StateValue=False(窗户打开),但日志中没有对应的关闭(StateValue=True)记录。如果窗户在夜间仍处于打开状态,结合家中无人在厨房活动,存在一定的安全隐患。", "推理步骤5: 其余行为模式均属正常——早晨06:23起床、07:31全家出门并自动锁门、16:15孩子放学回家、17:44大人回家开空调做饭、20:46孩子关灯睡觉、22:25大人就寝锁门,符合典型三口之家的作息规律。", "推理步骤6: 温度趋势合理:夜间约22.9°C,白天随气温升高至25.8°C峰值(约12:30),傍晚逐步回落,开空调后客厅温度从24.6°C降至23.5°C,均属正常范围。", "推理步骤7: 烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。阳台门19:11打开后无关闭记录,但结合主卧有人活动,可能是晚间通风,属于可接受行为。"], "key_evidence": ["厨房温度传感器在06:49、06:53、18:16、18:54四次报告 MeasuredValue = None,均与灶具使用时段重合", "16:15入户门手动开锁后至17:44期间无上锁记录,门锁处于未锁定状态约1.5小时", "厨房窗户在06:52和18:53两次打开,日志中无对应关闭记录", "阳台门19:11打开后无关闭记录,可能整夜处于开启状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程;如有必要更换传感器或调整安装位置", "为入户门锁配置自动上锁策略(如开锁后5分钟无操作自动锁定),避免长时间处于未锁定状态", "确认厨房窗户和阳台门当前状态,夜间无人时建议关闭以防入侵风险", "考虑为厨房温度传感器设置 None 值告警规则,及时发现传感器离线或故障情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.574204206466675, "api_error": null} {"episode_id": "SQ3_TP_C_0556", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0556.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261185, "scenario_id": "DF-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-19T23:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;儿童房运动传感器在深夜出现快速反复触发,可能为传感器故障或儿童睡眠异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:40、06:56、18:42、19:30 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。None 值意味着传感器未能返回有效读数,可能是高温干扰、通信中断或传感器本身故障。\",\n \"推理步骤2: 厨房温度传感器的故障会导致安全盲区——灶具使用期间恰恰是最需要温度监控的时段,如果此时传感器失效,火灾风险将无法被及时发现。\",\n \"推理步骤3: 23:09~23:10 期间,儿童房运动传感器在约 1 分钟内出现 5 次快速交替的占用/空闲状态切换(1→0→1→0→1),间隔仅 5~30 秒。此时儿童房灯已于 21:16 关闭、窗帘已关闭,正常情况下孩子应已入睡。这种快速抖动模式更像传感器误触发或灵敏度问题,也不排除孩子在床上辗转不安。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 06:28 起床、07:25 出门上锁、16:11 孩子放学回家、17:55 大人回家开空调、18:41 做饭、19:29 用餐、22:45 睡前锁门关灯,完全符合三口之家的典型作息。\",\n \"推理步骤5: 入户门的开锁/上锁均为 Manual 或 Auto 操作,无异常远程解锁或暴力开锁事件。门锁在出门和睡前均自动上锁,安防状态良好。\",\n \"推理步骤6: 全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,符合夏季自然温度变化曲线,无异常热源迹象。06:00 时各房间温度同步跳升约 1°C,属于日出后正常升温。\",\n \"推理步骤7: 次卫灯在 06:38 开启但日志中无对应的关闭记录,可能是忘记关灯或日志截断,属于低风险的能耗浪费问题。\",\n \"推理步骤8: 厨房窗户传感器在 06:55 和 19:29 报告 StateValue=False(窗户打开),均在灶具关闭后,属于做饭后开窗通风的正常行为,但日志中未见窗户关闭记录,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 4 次报告 None 值(06:40、06:56、18:42、19:30),恰好是最需要温度监控的时段\",\n \"儿童房运动传感器在 23:09~23:10 出现 5 次快速状态切换(间隔 5~30 秒),孩子已关灯就寝\",\n \"次卫灯 06:38 开启后无关闭记录\",\n \"厨房窗户两次打开(06:55、19:29)后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温或油烟干扰导致读数丢失,必要时更换或重新定位传感器\",\n \"检查儿童房运动传感器的灵敏度设置和安装角度,排除风扇、窗帘等物体造成的误触发;同时关注孩子的睡眠质量\",\n \"确认厨房窗户当前是否已关闭,夜间开窗存在安全隐患(尤其是无人在家时段)\",\n \"确认次卫灯是否仍在亮着,避免不必要的能耗浪费\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;儿童房运动传感器在深夜出现快速反复触发,可能为传感器故障或儿童睡眠异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:40、06:56、18:42、19:30 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,但其他时段该传感器正常上报数值。None 值意味着传感器未能返回有效读数,可能是高温干扰、通信中断或传感器本身故障。", "推理步骤2: 厨房温度传感器的故障会导致安全盲区——灶具使用期间恰恰是最需要温度监控的时段,如果此时传感器失效,火灾风险将无法被及时发现。", "推理步骤3: 23:09~23:10 期间,儿童房运动传感器在约 1 分钟内出现 5 次快速交替的占用/空闲状态切换(1→0→1→0→1),间隔仅 5~30 秒。此时儿童房灯已于 21:16 关闭、窗帘已关闭,正常情况下孩子应已入睡。这种快速抖动模式更像传感器误触发或灵敏度问题,也不排除孩子在床上辗转不安。", "推理步骤4: 其余行为模式均属正常——早晨 06:28 起床、07:25 出门上锁、16:11 孩子放学回家、17:55 大人回家开空调、18:41 做饭、19:29 用餐、22:45 睡前锁门关灯,完全符合三口之家的典型作息。", "推理步骤5: 入户门的开锁/上锁均为 Manual 或 Auto 操作,无异常远程解锁或暴力开锁事件。门锁在出门和睡前均自动上锁,安防状态良好。", "推理步骤6: 全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,符合夏季自然温度变化曲线,无异常热源迹象。06:00 时各房间温度同步跳升约 1°C,属于日出后正常升温。", "推理步骤7: 次卫灯在 06:38 开启但日志中无对应的关闭记录,可能是忘记关灯或日志截断,属于低风险的能耗浪费问题。", "推理步骤8: 厨房窗户传感器在 06:55 和 19:29 报告 StateValue=False(窗户打开),均在灶具关闭后,属于做饭后开窗通风的正常行为,但日志中未见窗户关闭记录,需确认窗户是否仍处于打开状态。"], "key_evidence": ["厨房温度传感器在灶具使用期间 4 次报告 None 值(06:40、06:56、18:42、19:30),恰好是最需要温度监控的时段", "儿童房运动传感器在 23:09~23:10 出现 5 次快速状态切换(间隔 5~30 秒),孩子已关灯就寝", "次卫灯 06:38 开启后无关闭记录", "厨房窗户两次打开(06:55、19:29)后无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温或油烟干扰导致读数丢失,必要时更换或重新定位传感器", "检查儿童房运动传感器的灵敏度设置和安装角度,排除风扇、窗帘等物体造成的误触发;同时关注孩子的睡眠质量", "确认厨房窗户当前是否已关闭,夜间开窗存在安全隐患(尤其是无人在家时段)", "确认次卫灯是否仍在亮着,避免不必要的能耗浪费"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.705039739608765, "api_error": null} {"episode_id": "SQ3_TP_C_0558", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_C_0558.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261187, "scenario_id": "INS-02", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-15T19:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:52 入户门锁在短时间内连续4次解锁失败并触发强制入侵报警(AlarmCode=3),疑似有人尝试暴力破解门锁。\",\n \"reasoning\": [\n \"推理步骤1: 19:52:00 至 19:52:40,入户门锁在不到1分钟内连续报告4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常对应远程/键盘输入方式,说明有人在反复尝试错误密码或凭证。\",\n \"推理步骤2: 19:52:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"即错误密码次数超限报警,这是门锁自身判定的入侵告警。\",\n \"推理步骤3: 此时家中有人(18:20 有人回家,客厅灯和空调开启,厨房在做饭),但门锁的解锁尝试并非来自屋内住户的正常操作——住户已在屋内,不需要从外部解锁。\",\n \"推理步骤4: 事件发生后门锁未被成功打开(日志中无后续成功的 LockOperation 解锁事件),入户门传感器也未报告开门,说明入侵尝试未成功。\",\n \"推理步骤5: 排查其他异常——厨房温度传感器在 06:39、07:01、18:33、19:17 多次报告 MeasuredValue=None,属于设备故障(传感器读数丢失),但不构成安全威胁;16:17 有人回家后入户门未及时上锁(日志中无自动锁定记录),直到 22:48 才确认门锁关闭,这段时间门锁状态存在隐患。\",\n \"推理步骤6: 厨房窗户在 07:00:30 被打开后,直到日志结束未见关闭记录(19:16:30 的事件 StateValue=False 表示再次打开或仍为打开状态),家中无人期间(07:27-16:17)厨房窗户持续敞开,存在一定的物理入侵风险,但未检测到实际入侵行为。\"\n ],\n \"key_evidence\": [\n \"19:52:00-19:52:40 入户门锁连续4次 LockOperationError(OperationError=1, OperationSource=3)\",\n \"19:52:50 触发 DoorLockAlarm(AlarmCode=3)——错误密码超限报警\",\n \"事件发生时住户已在家中(18:20 回家),外部解锁尝试非住户行为\",\n \"门锁未被成功打开,入侵未得逞\",\n \"厨房温度传感器多次报告 None 值,存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即确认家中人员安全,查看入户门外是否有可疑人员(如有摄像头请回看19:52前后录像)\",\n \"检查门锁操作日志中 OperationSource=3 对应的具体凭证类型(密码/PIN/远程),如为远程访问应立即更换所有远程访问凭证\",\n \"更换或更新入户门锁密码,禁用不再使用的旧密码和临时密码\",\n \"考虑启用门锁连续失败后的自动锁定延时(lockout)策略,增加暴力破解难度\",\n \"检修厨房温度传感器,多次报告 None 值说明传感器可能存在接触不良或供电问题\",\n \"设置离家模式自动化:出门后自动关闭厨房窗户并确认门锁上锁,避免无人时窗户长时间敞开\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:52 入户门锁在短时间内连续4次解锁失败并触发强制入侵报警(AlarmCode=3),疑似有人尝试暴力破解门锁。\",\n \"reasoning\": [\n \"推理步骤1: 19:52:00 至 19:52:40,入户门锁在不到1分钟内连续报告4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 通常对应远程/键盘输入方式,说明有人在反复尝试错误密码或凭证。\",\n \"推理步骤2: 19:52:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"即错误密码次数超限报警,这是门锁自身判定的入侵告警。\",\n \""], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 26.460362195968628, "api_error": null} {"episode_id": "SQ3_TP_D_0430", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0430.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261059, "scenario_id": "BA-03", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-18T17:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时 17:09 出现灯光快速反复开关的异常模式,需关注老人状况。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(06:07、11:01、16:58),且灶具关闭后也再次报告 None(06:40、11:39、17:36)。正常传感器在灶具使用时温度应上升而非丢失数据,而每30分钟的定时读数却能正常返回数值,说明传感器在受热/温变环境下存在间歇性故障。\",\n \"推理步骤2: 17:09 客厅灯在约10秒内被快速开关5次(True→False→True→False→True),紧接着卧室灯也被快速开关一次。这种短时间内反复切换灯光的模式不符合正常使用习惯。对于独居老人,这可能是求助信号(通过反复开关灯引起注意),也可能是设备控制系统异常或误操作。\",\n \"推理步骤3: 08:20 入户门被手动解锁、门被打开,但日志中没有对应的关门和上锁记录。直到 20:37 才出现门传感器显示关闭(StateValue=True)并自动上锁。这意味着入户门可能在 08:20 至 20:37 期间(约12小时)处于未锁定状态。对于独居老人,长时间门未锁存在入侵风险。\",\n \"推理步骤4: 老人的整体作息模式基本正常——05:31起床、06:06做早餐、06:52出门、08:20回家、12:21午休、14:04起床、16:57做晚餐、20:37就寝。三餐灶具使用时间合理(早餐约32分钟、午餐约38分钟、晚餐约38分钟),无烟雾报警触发,无漏水报警,温度整体在22-26°C范围内波动属正常夏季室温。\",\n \"推理步骤5: 综合来看,厨房温度传感器的间歇性 None 值是明确的设备异常;17:09 的灯光快速闪烁模式需要重点关注是否为老人求助行为;入户门长时间未锁是安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:07、06:40、11:01、11:39、16:58、17:36 共6次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"17:09:00-17:09:14 客厅灯在约10秒内被开关5次,卧室灯被开关2次,呈现异常快速闪烁模式\",\n \"08:20 入户门手动解锁开门后,直到 20:37 才记录到关门上锁,中间约12小时无门锁状态变化\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,该传感器在温度变化较大时频繁丢失读数,可能影响厨房安全监测(如无法及时发现异常高温)\",\n \"核实 17:09 灯光快速闪烁事件的原因——联系老人确认当时是否遇到困难或在求助;如非人为操作,排查智能灯控制模块是否存在故障\",\n \"为入户门锁设置未锁定超时提醒,建议门未锁超过10-15分钟即推送告警通知,避免长时间门户大开的安全隐患\",\n \"考虑为独居老人增设紧急求助按钮(SOS设备),避免老人只能通过反复开关灯等非常规方式求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时 17:09 出现灯光快速反复开关的异常模式,需关注老人状况。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(06:07、11:01、16:58),且灶具关闭后也再次报告 None(06:40、11:39、17:36)。正常传感器在灶具使用时温度应上升而非丢失数据,而每30分钟的定时读数却能正常返回数值,说明传感器在受热/温变环境下存在间歇性故障。", "推理步骤2: 17:09 客厅灯在约10秒内被快速开关5次(True→False→True→False→True),紧接着卧室灯也被快速开关一次。这种短时间内反复切换灯光的模式不符合正常使用习惯。对于独居老人,这可能是求助信号(通过反复开关灯引起注意),也可能是设备控制系统异常或误操作。", "推理步骤3: 08:20 入户门被手动解锁、门被打开,但日志中没有对应的关门和上锁记录。直到 20:37 才出现门传感器显示关闭(StateValue=True)并自动上锁。这意味着入户门可能在 08:20 至 20:37 期间(约12小时)处于未锁定状态。对于独居老人,长时间门未锁存在入侵风险。", "推理步骤4: 老人的整体作息模式基本正常——05:31起床、06:06做早餐、06:52出门、08:20回家、12:21午休、14:04起床、16:57做晚餐、20:37就寝。三餐灶具使用时间合理(早餐约32分钟、午餐约38分钟、晚餐约38分钟),无烟雾报警触发,无漏水报警,温度整体在22-26°C范围内波动属正常夏季室温。", "推理步骤5: 综合来看,厨房温度传感器的间歇性 None 值是明确的设备异常;17:09 的灯光快速闪烁模式需要重点关注是否为老人求助行为;入户门长时间未锁是安全隐患。"], "key_evidence": ["厨房温度传感器在 06:07、06:40、11:01、11:39、16:58、17:36 共6次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "17:09:00-17:09:14 客厅灯在约10秒内被开关5次,卧室灯被开关2次,呈现异常快速闪烁模式", "08:20 入户门手动解锁开门后,直到 20:37 才记录到关门上锁,中间约12小时无门锁状态变化"], "recommended_actions": ["检查或更换厨房温度传感器,该传感器在温度变化较大时频繁丢失读数,可能影响厨房安全监测(如无法及时发现异常高温)", "核实 17:09 灯光快速闪烁事件的原因——联系老人确认当时是否遇到困难或在求助;如非人为操作,排查智能灯控制模块是否存在故障", "为入户门锁设置未锁定超时提醒,建议门未锁超过10-15分钟即推送告警通知,避免长时间门户大开的安全隐患", "考虑为独居老人增设紧急求助按钮(SOS设备),避免老人只能通过反复开关灯等非常规方式求助"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.875068187713623, "api_error": null} {"episode_id": "SQ3_TP_D_0436", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0436.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261065, "scenario_id": "EL-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "EL-06", "scenario_name": "忘记锁门", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unlocked_door_unattended", "key_evidence": ["住户出门(所有 occupancy=0)", "门已关(contact=Closed)但锁未锁(LockState=Unlocked)", "超过合理时间(10分钟)仍未自动锁定,且 AutoRelockTime 可能未启用"], "expected_response": "通知老人远程锁门,或自动锁门", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-19T18:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且入户门在老人外出后长时间未上锁(18:32~18:42 间隔10分钟门锁才恢复锁定状态),存在设备故障与安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(05:57、10:59、16:53),灶具关闭后也再次报告 None(06:37、11:35、17:31)。一天内出现6次 None 值,说明传感器在高温环境下反复失效,这是明显的设备故障模式。\",\n \"推理步骤2: 厨房温度传感器是独居老人用火安全的关键监控设备。如果传感器在灶具工作期间无法正常读数,一旦发生灶具过热或火灾前兆,系统将无法及时检测和报警,形成严重的安全盲区。\",\n \"推理步骤3: 18:32 老人出门,门锁解锁(LockOperationType=1),门开后关闭(StateValue False→True),但直到 18:42 门锁才恢复锁定状态(LockState=2)。中间10分钟门处于关闭但未上锁状态,且没有记录到自动上锁事件,说明自动上锁机制可能存在延迟或故障。对独居老人而言,这是入侵风险窗口。\",\n \"推理步骤4: 对比早晨 07:10 出门的记录——门关闭后2秒内即自动上锁(LockOperationType=0, OperationSource=Auto),而 18:32 出门时缺少自动上锁事件,10分钟后才显示 LockState=2,且没有记录操作来源,行为不一致。\",\n \"推理步骤5: 其余活动模式正常——老人 05:32 起床、洗漱、做早餐、07:10 出门、08:36 回家、午休、三餐规律、20:43 就寝,生活节奏健康规律,无健康异常迹象。温度曲线随日照自然升降,烟雾报警器和漏水传感器均未触发,无火灾或漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:57:06、06:37:00、10:59:00、11:35:00、16:53:00、17:31:00),每次灶具开关前后均触发\",\n \"18:32 出门后门锁未立即自动上锁,直到 18:42(10分钟后)才显示 LockState=2,且缺少 LockOperation 事件记录,与 07:10 出门时2秒内自动上锁的行为不一致\",\n \"18:32 出门事件中 LockOperation 缺少 OperationSource 字段,门锁日志格式与其他时段不一致,可能存在通信异常\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器——该传感器在高温环境下反复失效,已无法在灶具使用期间提供有效的温度监控,是火灾预警的关键盲区\",\n \"检查入户门锁的自动上锁功能——排查 18:32 出门时自动上锁延迟10分钟的原因,可能是门锁电池电量不足、机械故障或 Matter 通信不稳定\",\n \"建议为厨房灶具增加使用时长自动关闭规则(如超过45分钟未手动关闭则自动断电),作为温度传感器失效期间的补偿安全措施\",\n \"建议设置门锁未上锁超时告警(如门关闭后60秒内未上锁则推送通知给紧急联系人)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且入户门在老人外出后长时间未上锁(18:32~18:42 间隔10分钟门锁才恢复锁定状态),存在设备故障与安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(05:57、10:59、16:53),灶具关闭后也再次报告 None(06:37、11:35、17:31)。一天内出现6次 None 值,说明传感器在高温环境下反复失效,这是明显的设备故障模式。", "推理步骤2: 厨房温度传感器是独居老人用火安全的关键监控设备。如果传感器在灶具工作期间无法正常读数,一旦发生灶具过热或火灾前兆,系统将无法及时检测和报警,形成严重的安全盲区。", "推理步骤3: 18:32 老人出门,门锁解锁(LockOperationType=1),门开后关闭(StateValue False→True),但直到 18:42 门锁才恢复锁定状态(LockState=2)。中间10分钟门处于关闭但未上锁状态,且没有记录到自动上锁事件,说明自动上锁机制可能存在延迟或故障。对独居老人而言,这是入侵风险窗口。", "推理步骤4: 对比早晨 07:10 出门的记录——门关闭后2秒内即自动上锁(LockOperationType=0, OperationSource=Auto),而 18:32 出门时缺少自动上锁事件,10分钟后才显示 LockState=2,且没有记录操作来源,行为不一致。", "推理步骤5: 其余活动模式正常——老人 05:32 起床、洗漱、做早餐、07:10 出门、08:36 回家、午休、三餐规律、20:43 就寝,生活节奏健康规律,无健康异常迹象。温度曲线随日照自然升降,烟雾报警器和漏水传感器均未触发,无火灾或漏水风险。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:57:06、06:37:00、10:59:00、11:35:00、16:53:00、17:31:00),每次灶具开关前后均触发", "18:32 出门后门锁未立即自动上锁,直到 18:42(10分钟后)才显示 LockState=2,且缺少 LockOperation 事件记录,与 07:10 出门时2秒内自动上锁的行为不一致", "18:32 出门事件中 LockOperation 缺少 OperationSource 字段,门锁日志格式与其他时段不一致,可能存在通信异常"], "recommended_actions": ["立即检修或更换厨房温度传感器——该传感器在高温环境下反复失效,已无法在灶具使用期间提供有效的温度监控,是火灾预警的关键盲区", "检查入户门锁的自动上锁功能——排查 18:32 出门时自动上锁延迟10分钟的原因,可能是门锁电池电量不足、机械故障或 Matter 通信不稳定", "建议为厨房灶具增加使用时长自动关闭规则(如超过45分钟未手动关闭则自动断电),作为温度传感器失效期间的补偿安全措施", "建议设置门锁未上锁超时告警(如门关闭后60秒内未上锁则推送通知给紧急联系人)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.898736476898193, "api_error": null} {"episode_id": "SQ3_TP_D_0443", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0443.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261072, "scenario_id": "EL-07", "total_events": 205, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "EL-07", "scenario_name": "长时间未归家", "category": "elderly_specific", "is_anomaly": true, "threat_type": "prolonged_absence", "key_evidence": ["出门时间已知(LockOperation 事件)", "预期回家时间已过但无 LockOperation 解锁事件", "偏离日常规律超过1小时"], "expected_response": "9:30开始尝试联系,10:00后联系紧急联系人", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-18T16:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:37起床,06:08做早餐,06:55出门(手动开锁、关门后自动上锁),08:27回家,12:30午休拉窗帘,13:56起床,16:59做晚餐,20:38洗漱后约20:46就寝,作息规律且符合独居老人模式。\",\n \"推理步骤2: 入户门安全状况正常——06:55手动开锁出门后自动上锁,07:00有一次开锁事件(可能是确认锁门或钥匙操作),08:27手动开锁回家,20:46自动上锁就寝。门锁操作均有合理解释,无异常入侵迹象。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None。具体出现在06:09(灶具06:08开)、06:34(灶具06:33关后1分钟)、10:51(灶具10:50开)、11:35(灶具11:34关后1分钟)、17:00(灶具16:59开)、17:32(灶具17:31关后1分钟)。每次灶具操作期间和关闭后都会出现一次 None 读数,说明传感器在高温环境下无法正常工作或存在通信故障。\",\n \"推理步骤4: 厨房温度传感器的 None 值在定时的半小时整点读数中又恢复正常数值(如06:30报2391、11:00报2553),说明传感器并非完全损坏,而是在灶具使用引起的温度变化时出现间歇性故障。\",\n \"推理步骤5: 这是一个安全隐患——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具过热或忘关灶具的情况,系统将无法通过温度异常及时发出警报。对于独居老人来说,这个风险需要重视。\",\n \"推理步骤6: 其余设备运行正常:烟雾报警器未触发、漏水传感器未报警、各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.9°C)、窗户传感器无异常开合,整体环境安全。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用周期中共出现6次 MeasuredValue = None(06:09、06:34、10:51、11:35、17:00、17:32),与灶具开关操作高度关联\",\n \"传感器在非烹饪时段的定时读数均正常,表明故障为间歇性、与高温/灶具使用相关\",\n \"烟雾报警器全天未触发任何事件,说明目前尚未发生实际火灾,但传感器故障削弱了预警能力\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或通信干扰\",\n \"对厨房温度传感器进行固件更新或更换,确保其在高温环境下能正常报告数值\",\n \"在传感器修复前,建议为灶具使用设置自动超时关闭规则(如灶具持续开启超过45分钟自动断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器工作正常并定期测试,作为温度传感器失效期间的主要安全防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:37起床,06:08做早餐,06:55出门(手动开锁、关门后自动上锁),08:27回家,12:30午休拉窗帘,13:56起床,16:59做晚餐,20:38洗漱后约20:46就寝,作息规律且符合独居老人模式。", "推理步骤2: 入户门安全状况正常——06:55手动开锁出门后自动上锁,07:00有一次开锁事件(可能是确认锁门或钥匙操作),08:27手动开锁回家,20:46自动上锁就寝。门锁操作均有合理解释,无异常入侵迹象。", "推理步骤3: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None。具体出现在06:09(灶具06:08开)、06:34(灶具06:33关后1分钟)、10:51(灶具10:50开)、11:35(灶具11:34关后1分钟)、17:00(灶具16:59开)、17:32(灶具17:31关后1分钟)。每次灶具操作期间和关闭后都会出现一次 None 读数,说明传感器在高温环境下无法正常工作或存在通信故障。", "推理步骤4: 厨房温度传感器的 None 值在定时的半小时整点读数中又恢复正常数值(如06:30报2391、11:00报2553),说明传感器并非完全损坏,而是在灶具使用引起的温度变化时出现间歇性故障。", "推理步骤5: 这是一个安全隐患——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具过热或忘关灶具的情况,系统将无法通过温度异常及时发出警报。对于独居老人来说,这个风险需要重视。", "推理步骤6: 其余设备运行正常:烟雾报警器未触发、漏水传感器未报警、各房间温度随昼夜自然波动(夜间约22°C,午间峰值约25.9°C)、窗户传感器无异常开合,整体环境安全。"], "key_evidence": ["厨房温度传感器在三次灶具使用周期中共出现6次 MeasuredValue = None(06:09、06:34、10:51、11:35、17:00、17:32),与灶具开关操作高度关联", "传感器在非烹饪时段的定时读数均正常,表明故障为间歇性、与高温/灶具使用相关", "烟雾报警器全天未触发任何事件,说明目前尚未发生实际火灾,但传感器故障削弱了预警能力"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或通信干扰", "对厨房温度传感器进行固件更新或更换,确保其在高温环境下能正常报告数值", "在传感器修复前,建议为灶具使用设置自动超时关闭规则(如灶具持续开启超过45分钟自动断电),作为补偿性安全措施", "确认厨房烟雾报警器工作正常并定期测试,作为温度传感器失效期间的主要安全防线"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.043087244033813, "api_error": null} {"episode_id": "SQ3_TP_D_0445", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0445.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261074, "scenario_id": "EL-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-01", "scenario_name": "卫生间疑似跌倒", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall", "key_evidence": ["老人进入卫生间(灯开+运动触发)", "运动传感器因PIR超时归零(人倒在地上不动),但灯仍开着", "随后30分钟+全屋完全无活动", "卫生间是老人跌倒高发区域(地滑)", "跟正常午睡的区别:午睡在卧室且会先关灯"], "expected_response": "中等紧急度警报,尝试通过语音/通知联系老人,如无回应建议联系紧急联系人", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-22T21:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在外出后长时间未锁(08:33 至 20:55),以及 21:09 卫生间出现异常短暂的占用事件(5秒),需关注独居老人安全。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器异常 — 灶具三次使用期间(05:55、10:51、17:09),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。这不是正常的温度读数,说明传感器在高温环境下可能存在故障或通信中断。对于独居老人家庭,厨房温度监控是火灾预警的关键环节,传感器失效会导致安全盲区。\",\n \"推理步骤2: 入户门长时间未锁 — 08:33 老人回家时解锁入户门(LockOperationType=1, LockState=2),门传感器显示门打开(StateValue=False),但之后日志中没有记录门关闭或重新上锁的事件,直到 20:55 才出现门关闭(StateValue=True)并自动上锁(LockState=1)。这意味着入户门可能处于未锁/未关状态长达约12小时。对独居老人而言,这是明显的入侵风险。\",\n \"推理步骤3: 21:09 卫生间异常短暂占用 — 卫生间运动传感器在 21:09:00 检测到占用,仅5秒后(21:09:05)就变为无人。此时老人应已在卧室就寝(20:55 已关灯拉窗帘)。如此短暂的触发可能是老人夜间起身但很快返回,也可能是传感器误触发。但考虑到独居老人场景,需要排除跌倒后短暂触发传感器的可能性。\",\n \"推理步骤4: 整体生活模式基本正常 — 老人 05:24 起床,05:47 使用卫生间,05:55 做早餐,06:57 出门(门锁手动解锁后自动上锁),08:33 回家,10:51 做午餐,12:37 午休(拉窗帘),14:09 起床,17:09 做晚餐,20:27 洗漱,20:55 就寝。作息规律,三餐正常,活动轨迹连贯合理。\",\n \"推理步骤5: 温度趋势正常 — 各房间温度随昼夜自然变化:夜间约22-23°C,午间峰值约25-26°C,符合6月夏季特征。客厅和厨房温度略高于卧室,符合朝向和使用习惯。无异常温升或骤降。\",\n \"推理步骤6: 综合评估 — 厨房温度传感器的反复 None 值是确定性的设备故障信号,需要维修或更换。入户门长时间未锁是中等安全风险。21:09 的短暂卫生间事件需持续关注。三者叠加,判定存在异常,但主要是设备故障和安全习惯问题,非紧急威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(05:56、06:26、10:52、11:29、17:10、17:36)共6次报告 MeasuredValue = None\",\n \"入户门 08:33 解锁开门后,直到 20:55 才记录到关门上锁事件,中间约12小时无门锁状态变化\",\n \"21:09 卫生间占用传感器触发仅持续5秒(21:09:00 占用 → 21:09:05 无人),且灯未关闭\",\n \"21:09 卫生间事件的日志格式异常(缺少 OccupancySensing 和 OnOff 的 Cluster 前缀),可能存在通信协议问题\"\n ],\n \"recommended_actions\": [\n \"尽快检查或更换厨房温度传感器(kitchen_temp_sensor),确保灶具使用期间温度监控不中断,这是独居老人厨房安全的关键防线\",\n \"检查入户门锁的自动上锁策略,建议配置门未关闭超过一定时间(如5分钟)后向紧急联系人发送提醒通知\",\n \"关注 21:09 卫生间短暂触发事件,建议设置规则:夜间卫生间传感器触发后若短时间内无后续活动,向紧急联系人发送确认提醒,排除跌倒风险\",\n \"检查 21:09 事件中卫生间灯(bathroom_light)是否仍处于开启状态未关闭,如是则可能需要人工确认老人状态\",\n \"建议对所有传感器进行一次通信质量检查,21:09 日志中 Cluster 前缀缺失可能暗示设备固件或网关存在间歇性问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时入户门在外出后长时间未锁(08:33 至 20:55),以及 21:09 卫生间出现异常短暂的占用事件(5秒),需关注独居老人安全。", "reasoning": ["推理步骤1: 厨房温度传感器异常 — 灶具三次使用期间(05:55、10:51、17:09),厨房温度传感器均在灶具开启后约30秒报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。这不是正常的温度读数,说明传感器在高温环境下可能存在故障或通信中断。对于独居老人家庭,厨房温度监控是火灾预警的关键环节,传感器失效会导致安全盲区。", "推理步骤2: 入户门长时间未锁 — 08:33 老人回家时解锁入户门(LockOperationType=1, LockState=2),门传感器显示门打开(StateValue=False),但之后日志中没有记录门关闭或重新上锁的事件,直到 20:55 才出现门关闭(StateValue=True)并自动上锁(LockState=1)。这意味着入户门可能处于未锁/未关状态长达约12小时。对独居老人而言,这是明显的入侵风险。", "推理步骤3: 21:09 卫生间异常短暂占用 — 卫生间运动传感器在 21:09:00 检测到占用,仅5秒后(21:09:05)就变为无人。此时老人应已在卧室就寝(20:55 已关灯拉窗帘)。如此短暂的触发可能是老人夜间起身但很快返回,也可能是传感器误触发。但考虑到独居老人场景,需要排除跌倒后短暂触发传感器的可能性。", "推理步骤4: 整体生活模式基本正常 — 老人 05:24 起床,05:47 使用卫生间,05:55 做早餐,06:57 出门(门锁手动解锁后自动上锁),08:33 回家,10:51 做午餐,12:37 午休(拉窗帘),14:09 起床,17:09 做晚餐,20:27 洗漱,20:55 就寝。作息规律,三餐正常,活动轨迹连贯合理。", "推理步骤5: 温度趋势正常 — 各房间温度随昼夜自然变化:夜间约22-23°C,午间峰值约25-26°C,符合6月夏季特征。客厅和厨房温度略高于卧室,符合朝向和使用习惯。无异常温升或骤降。", "推理步骤6: 综合评估 — 厨房温度传感器的反复 None 值是确定性的设备故障信号,需要维修或更换。入户门长时间未锁是中等安全风险。21:09 的短暂卫生间事件需持续关注。三者叠加,判定存在异常,但主要是设备故障和安全习惯问题,非紧急威胁。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(05:56、06:26、10:52、11:29、17:10、17:36)共6次报告 MeasuredValue = None", "入户门 08:33 解锁开门后,直到 20:55 才记录到关门上锁事件,中间约12小时无门锁状态变化", "21:09 卫生间占用传感器触发仅持续5秒(21:09:00 占用 → 21:09:05 无人),且灯未关闭", "21:09 卫生间事件的日志格式异常(缺少 OccupancySensing 和 OnOff 的 Cluster 前缀),可能存在通信协议问题"], "recommended_actions": ["尽快检查或更换厨房温度传感器(kitchen_temp_sensor),确保灶具使用期间温度监控不中断,这是独居老人厨房安全的关键防线", "检查入户门锁的自动上锁策略,建议配置门未关闭超过一定时间(如5分钟)后向紧急联系人发送提醒通知", "关注 21:09 卫生间短暂触发事件,建议设置规则:夜间卫生间传感器触发后若短时间内无后续活动,向紧急联系人发送确认提醒,排除跌倒风险", "检查 21:09 事件中卫生间灯(bathroom_light)是否仍处于开启状态未关闭,如是则可能需要人工确认老人状态", "建议对所有传感器进行一次通信质量检查,21:09 日志中 Cluster 前缀缺失可能暗示设备固件或网关存在间歇性问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 35.4499032497406, "api_error": null} {"episode_id": "SQ3_TP_D_0456", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0456.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20261085, "scenario_id": "EL-04", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-04", "scenario_name": "起床时间异常推迟", "category": "elderly_specific", "is_anomaly": true, "threat_type": "abnormal_inactivity", "key_evidence": ["与老人的日常作息规律(daily_routines 中的 elderly 画像)显著偏离", "不是周末睡懒觉(老人每天作息一样)", "全屋完全无活动信号"], "expected_response": "上午8点后联系老人确认状况", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-30T07:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在老人外出期间(08:28)未锁且长时间敞开需关注。\",\n \"reasoning\": [\n \"推理步骤1: 梳理住户一天的活动轨迹——05:20起床→05:43卫生间→05:57厨房做早餐→07:08出门→08:28回家→11:07做午餐→12:40午休→14:10起床→16:54做晚餐→19:25客厅休息→20:39就寝,整体作息规律,符合独居老人的典型生活节奏。\",\n \"推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:58、06:40、11:08、11:30、16:55、17:40),共出现6次。每次都与灶具使用时间高度相关,说明传感器在高温环境下出现读数丢失,属于设备故障或传感器耐温能力不足。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,将无法及时检测到异常高温,存在安全监控盲区。\",\n \"推理步骤4: 08:28老人回家时,门锁解锁(LockOperationType=1)、门打开(StateValue=False),但日志中没有记录该次进门后的关门和上锁事件。直到20:43才出现 front_door_contact=True 和 LockState=1(自动上锁)。这意味着入户门可能在08:28至20:43之间长达12小时处于未锁状态,对独居老人存在入侵风险。\",\n \"推理步骤5: 灶具使用时长合理(早餐约41分钟、午餐约22分钟、晚餐约45分钟),烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水灾风险。\",\n \"推理步骤6: 温度数据整体走势正常——夜间约22-23°C,午间峰值约25.5°C,符合6月底夏季气温变化规律,无异常温升。\",\n \"推理步骤7: 门锁在07:08出门时正常执行了手动解锁→开门→关门→自动上锁的完整流程,但08:28回家时缺少关门上锁记录,可能是老人忘记关门或门锁自动上锁功能偶发失效。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:58、06:40、11:08、11:30、16:55、17:40),每次均与 cook_surface 开启/关闭时间窗口吻合\",\n \"08:28 入户门解锁开门后,直到20:43才记录到关门上锁事件,中间约12小时无门锁闭合记录\",\n \"烟雾报警器、漏水传感器全天无告警,排除火灾和水灾\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:当前传感器在灶具使用时反复失效,导致高温监控出现盲区,对独居老人的厨房安全构成隐患\",\n \"检查入户门锁的自动上锁功能是否正常工作,确认08:28回家后门是否确实长时间未锁;如确认故障,应维修门锁或启用定时自动上锁策略\",\n \"建议为独居老人设置「入户门超过5分钟未锁」的自动提醒规则,防止忘记锁门\",\n \"考虑在厨房增加独立的高温报警装置作为温度传感器失效时的备份监控手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时入户门在老人外出期间(08:28)未锁且长时间敞开需关注。", "reasoning": ["推理步骤1: 梳理住户一天的活动轨迹——05:20起床→05:43卫生间→05:57厨房做早餐→07:08出门→08:28回家→11:07做午餐→12:40午休→14:10起床→16:54做晚餐→19:25客厅休息→20:39就寝,整体作息规律,符合独居老人的典型生活节奏。", "推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:58、06:40、11:08、11:30、16:55、17:40),共出现6次。每次都与灶具使用时间高度相关,说明传感器在高温环境下出现读数丢失,属于设备故障或传感器耐温能力不足。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,将无法及时检测到异常高温,存在安全监控盲区。", "推理步骤4: 08:28老人回家时,门锁解锁(LockOperationType=1)、门打开(StateValue=False),但日志中没有记录该次进门后的关门和上锁事件。直到20:43才出现 front_door_contact=True 和 LockState=1(自动上锁)。这意味着入户门可能在08:28至20:43之间长达12小时处于未锁状态,对独居老人存在入侵风险。", "推理步骤5: 灶具使用时长合理(早餐约41分钟、午餐约22分钟、晚餐约45分钟),烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水灾风险。", "推理步骤6: 温度数据整体走势正常——夜间约22-23°C,午间峰值约25.5°C,符合6月底夏季气温变化规律,无异常温升。", "推理步骤7: 门锁在07:08出门时正常执行了手动解锁→开门→关门→自动上锁的完整流程,但08:28回家时缺少关门上锁记录,可能是老人忘记关门或门锁自动上锁功能偶发失效。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:58、06:40、11:08、11:30、16:55、17:40),每次均与 cook_surface 开启/关闭时间窗口吻合", "08:28 入户门解锁开门后,直到20:43才记录到关门上锁事件,中间约12小时无门锁闭合记录", "烟雾报警器、漏水传感器全天无告警,排除火灾和水灾"], "recommended_actions": ["检修或更换厨房温度传感器:当前传感器在灶具使用时反复失效,导致高温监控出现盲区,对独居老人的厨房安全构成隐患", "检查入户门锁的自动上锁功能是否正常工作,确认08:28回家后门是否确实长时间未锁;如确认故障,应维修门锁或启用定时自动上锁策略", "建议为独居老人设置「入户门超过5分钟未锁」的自动提醒规则,防止忘记锁门", "考虑在厨房增加独立的高温报警装置作为温度传感器失效时的备份监控手段"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.424743175506592, "api_error": null} {"episode_id": "SQ3_TP_D_0459", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0459.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261088, "scenario_id": "EL-02", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-02", "scenario_name": "居家意外(任意位置跌倒/晕倒)", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall_or_medical_emergency", "key_evidence": ["最后一次运动在非卧室房间(如客厅、厨房)", "随后异常长时间无任何活动", "不在正常午睡时段(比如上午10点或下午4点)"], "expected_response": "紧急联系老人,如无应答联系紧急联系人或120", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-11T10:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志,老人的日常作息模式正常——17:04做晚饭、19:33在客厅看电视(调暗灯光至15%)、20:24洗漱、20:43回卧室就寝,符合独居老人的典型生活节奏。\",\n \"推理步骤2: 入户门在20:43确认关闭并自动上锁(LockState=1),全天无异常开锁事件,无陌生人入侵迹象。烟雾报警器和漏水传感器全天无触发,排除火灾和水患风险。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间(17:05和17:25)连续报告 MeasuredValue = None,回顾全天日志发现这一现象在早餐(06:05、06:22)和午餐(10:54、11:34)时段同样出现,共计6次。正常温度传感器即使在高温环境下也应返回数值而非 None。\",\n \"推理步骤4: 该传感器在灶具关闭后的下一个整点周期(如17:30)能恢复正常读数,说明传感器并非完全离线,而是在灶具工作产生的高温或蒸汽环境下无法正常测量,可能是传感器量程被超出、探头受污染或通信受干扰。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常升高来提前预警,存在安全监控盲区。\",\n \"推理步骤6: 其余行为均属正常——温度随昼夜自然升降、卧室窗帘按作息开合、08:31有一次外出归来(门锁手动开启后进入客厅),无健康异常或入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间(17:05、17:25)报告 MeasuredValue = None,全天共出现6次(06:05、06:22、10:54、11:34、17:05、17:25),均与灶具开关时间高度关联\",\n \"传感器在灶具关闭后的下一个整点采样周期恢复正常数值(如17:30报告2480),说明故障与灶具使用环境直接相关\",\n \"其余所有传感器(温度、运动、门窗、烟雾、漏水)全天工作正常,无异常触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或受油烟蒸汽影响,建议将传感器移至距灶具较远但仍能监测厨房整体温度的位置\",\n \"检查该传感器的固件版本,确认是否存在已知的 None 值上报 bug,必要时更新固件或更换传感器\",\n \"在传感器修复前,建议增加一条自动化规则:当灶具开启超过30分钟且温度传感器无有效读数时,触发提醒通知家属或看护人\",\n \"考虑为独居老人的厨房灶具增加超时自动关闭功能,作为额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 分析过去6小时(约17:30至23:30)的活动日志,老人的日常作息模式正常——17:04做晚饭、19:33在客厅看电视(调暗灯光至15%)、20:24洗漱、20:43回卧室就寝,符合独居老人的典型生活节奏。", "推理步骤2: 入户门在20:43确认关闭并自动上锁(LockState=1),全天无异常开锁事件,无陌生人入侵迹象。烟雾报警器和漏水传感器全天无触发,排除火灾和水患风险。", "推理步骤3: 厨房温度传感器在灶具开启期间(17:05和17:25)连续报告 MeasuredValue = None,回顾全天日志发现这一现象在早餐(06:05、06:22)和午餐(10:54、11:34)时段同样出现,共计6次。正常温度传感器即使在高温环境下也应返回数值而非 None。", "推理步骤4: 该传感器在灶具关闭后的下一个整点周期(如17:30)能恢复正常读数,说明传感器并非完全离线,而是在灶具工作产生的高温或蒸汽环境下无法正常测量,可能是传感器量程被超出、探头受污染或通信受干扰。", "推理步骤5: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常升高来提前预警,存在安全监控盲区。", "推理步骤6: 其余行为均属正常——温度随昼夜自然升降、卧室窗帘按作息开合、08:31有一次外出归来(门锁手动开启后进入客厅),无健康异常或入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间(17:05、17:25)报告 MeasuredValue = None,全天共出现6次(06:05、06:22、10:54、11:34、17:05、17:25),均与灶具开关时间高度关联", "传感器在灶具关闭后的下一个整点采样周期恢复正常数值(如17:30报告2480),说明故障与灶具使用环境直接相关", "其余所有传感器(温度、运动、门窗、烟雾、漏水)全天工作正常,无异常触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或受油烟蒸汽影响,建议将传感器移至距灶具较远但仍能监测厨房整体温度的位置", "检查该传感器的固件版本,确认是否存在已知的 None 值上报 bug,必要时更新固件或更换传感器", "在传感器修复前,建议增加一条自动化规则:当灶具开启超过30分钟且温度传感器无有效读数时,触发提醒通知家属或看护人", "考虑为独居老人的厨房灶具增加超时自动关闭功能,作为额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.28051781654358, "api_error": null} {"episode_id": "SQ3_TP_D_0461", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0461.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261090, "scenario_id": "EL-03", "total_events": 210, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "EL-03", "scenario_name": "忘记关火", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unattended_cooking_elderly", "key_evidence": ["灶具开着 + 厨房无人 + 老人在其他房间", "跟 FG-01 类似但在老人场景下更危险(认知衰退风险更高)"], "expected_response": "立即语音提醒老人关火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-28T01:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨1:42灶具在无人看管状态下持续运行,且厨房温度传感器多次报告异常值或故障(None),存在火灾隐患和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨1:42厨房灶具开启(kitchen_cook_surface OnOff=True),厨房运动传感器同时检测到有人(Occupancy=1)。但仅10分钟后(1:52),厨房运动传感器显示无人(Occupancy=0),人员移动到客厅(living_room_occupancy=1)。灶具在此后一直未关闭。\",\n \"推理步骤2: 到2:02,灶具仍然处于开启状态(再次报告OnOff=True),此时厨房温度传感器读数飙升至3046(即30.46°C),相比之前的23°C左右上升了约7°C,这是灶具无人看管持续加热的直接证据。\",\n \"推理步骤3: 整个日志中未出现灶具在凌晨1:42开启后的明确关闭事件。直到早上6:02老人再次进入厨房做早餐(6:02:36灶具再次OnOff=True),说明灶具可能持续运行了超过4小时无人看管,或者在某个未记录的时间点自行关闭。这对独居老人来说是严重的火灾风险。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(6:03、6:28、11:04、11:37、17:01、17:36),共出现6次。这表明传感器存在故障——恰恰在需要监测厨房温度的关键时刻无法提供数据,削弱了安全监控能力。\",\n \"推理步骤5: 凌晨1:42的灶具使用时间极为异常。独居老人在凌晨近2点使用灶具,可能反映睡眠紊乱、认知功能下降或夜间意识模糊等健康问题。\",\n \"推理步骤6: 入户门在8:33被手动开锁(LockOperationType=1),有人进入但此后门锁未记录到上锁事件,直到20:44才自动上锁。这意味着入户门可能在白天长时间处于未锁状态,对独居老人存在安全隐患。\",\n \"推理步骤7: 其余日常行为模式基本正常——早起(5:31)、三餐做饭、午休(12:23-13:50)、晚间就寝(20:44),符合独居老人的生活规律。温度变化也符合夏季昼夜温差规律。\"\n ],\n \"key_evidence\": [\n \"01:42 灶具开启,01:52 厨房已无人,但灶具未关闭,02:02 厨房温度飙升至30.46°C(3046)\",\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None,传感器存在间歇性故障\",\n \"凌晨1:42的异常用灶时间,独居老人深夜使用灶具后离开厨房未关火\",\n \"08:33入户门手动开锁后至20:44期间无上锁记录,门锁长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即检修厨房温度传感器(kitchen_temp_sensor),排查间歇性报告None的故障原因,确保在灶具使用时能正常监测温度\",\n \"为厨房灶具配置自动关闭规则:当厨房运动传感器持续无人超过10分钟时,自动关闭灶具并发送告警通知\",\n \"设置深夜时段(23:00-05:00)灶具使用告警,及时通知家属或护理人员关注老人的异常活动\",\n \"配置入户门锁长时间未锁定告警(如超过30分钟未上锁),提醒老人或远程自动上锁\",\n \"建议家属关注老人的夜间行为模式,凌晨近2点使用灶具可能提示睡眠障碍或认知功能变化,必要时就医评估\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨1:42灶具在无人看管状态下持续运行,且厨房温度传感器多次报告异常值或故障(None),存在火灾隐患和设备故障双重风险。", "reasoning": ["推理步骤1: 凌晨1:42厨房灶具开启(kitchen_cook_surface OnOff=True),厨房运动传感器同时检测到有人(Occupancy=1)。但仅10分钟后(1:52),厨房运动传感器显示无人(Occupancy=0),人员移动到客厅(living_room_occupancy=1)。灶具在此后一直未关闭。", "推理步骤2: 到2:02,灶具仍然处于开启状态(再次报告OnOff=True),此时厨房温度传感器读数飙升至3046(即30.46°C),相比之前的23°C左右上升了约7°C,这是灶具无人看管持续加热的直接证据。", "推理步骤3: 整个日志中未出现灶具在凌晨1:42开启后的明确关闭事件。直到早上6:02老人再次进入厨房做早餐(6:02:36灶具再次OnOff=True),说明灶具可能持续运行了超过4小时无人看管,或者在某个未记录的时间点自行关闭。这对独居老人来说是严重的火灾风险。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(6:03、6:28、11:04、11:37、17:01、17:36),共出现6次。这表明传感器存在故障——恰恰在需要监测厨房温度的关键时刻无法提供数据,削弱了安全监控能力。", "推理步骤5: 凌晨1:42的灶具使用时间极为异常。独居老人在凌晨近2点使用灶具,可能反映睡眠紊乱、认知功能下降或夜间意识模糊等健康问题。", "推理步骤6: 入户门在8:33被手动开锁(LockOperationType=1),有人进入但此后门锁未记录到上锁事件,直到20:44才自动上锁。这意味着入户门可能在白天长时间处于未锁状态,对独居老人存在安全隐患。", "推理步骤7: 其余日常行为模式基本正常——早起(5:31)、三餐做饭、午休(12:23-13:50)、晚间就寝(20:44),符合独居老人的生活规律。温度变化也符合夏季昼夜温差规律。"], "key_evidence": ["01:42 灶具开启,01:52 厨房已无人,但灶具未关闭,02:02 厨房温度飙升至30.46°C(3046)", "厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None,传感器存在间歇性故障", "凌晨1:42的异常用灶时间,独居老人深夜使用灶具后离开厨房未关火", "08:33入户门手动开锁后至20:44期间无上锁记录,门锁长时间处于未锁定状态"], "recommended_actions": ["立即检修厨房温度传感器(kitchen_temp_sensor),排查间歇性报告None的故障原因,确保在灶具使用时能正常监测温度", "为厨房灶具配置自动关闭规则:当厨房运动传感器持续无人超过10分钟时,自动关闭灶具并发送告警通知", "设置深夜时段(23:00-05:00)灶具使用告警,及时通知家属或护理人员关注老人的异常活动", "配置入户门锁长时间未锁定告警(如超过30分钟未上锁),提醒老人或远程自动上锁", "建议家属关注老人的夜间行为模式,凌晨近2点使用灶具可能提示睡眠障碍或认知功能变化,必要时就医评估"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.05834722518921, "api_error": null} {"episode_id": "SQ3_TP_D_0464", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0464.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261093, "scenario_id": "EL-07", "total_events": 205, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "EL-07", "scenario_name": "长时间未归家", "category": "elderly_specific", "is_anomaly": true, "threat_type": "prolonged_absence", "key_evidence": ["出门时间已知(LockOperation 事件)", "预期回家时间已过但无 LockOperation 解锁事件", "偏离日常规律超过1小时"], "expected_response": "9:30开始尝试联系,10:00后联系紧急联系人", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-03T15:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒~1分钟内,MeasuredValue 变为 None(06:01、11:01、17:00),且在灶具关闭后仍报告 None(06:32、11:28、17:23),随后在下一个整点周期恢复正常数值。\",\n \"推理步骤2: Matter 协议中 MeasuredValue = None 表示传感器无法提供有效读数,可能是传感器过热保护、通信中断或硬件故障。该现象在一天内重复出现3次,与灶具使用高度相关。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在高温烹饪时失效,恰恰是最需要监测的时刻无法提供数据,存在安全盲区。\",\n \"推理步骤4: 其余行为模式正常——老人约05:33起床、06:00做早餐、07:02出门、08:34回家、12:39午休、14:06起床、16:59做晚餐、20:35洗漱、20:55就寝,符合独居老人的典型作息规律。\",\n \"推理步骤5: 门锁操作均为正常手动/自动操作,无异常入侵迹象;无烟雾报警、无漏水报警触发;温度整体随日间升温夜间降温的自然规律变化。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在06:01、06:32、11:01、11:28、17:00、17:23共6次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"该传感器在非烹饪时段读数正常,说明故障与高温环境相关,可能是传感器耐热性不足或安装位置过近\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时读数异常\",\n \"考虑更换耐高温型温度传感器,或将传感器移至距灶具更远但仍能监测厨房整体温度的位置\",\n \"在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为烹饪期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒~1分钟内,MeasuredValue 变为 None(06:01、11:01、17:00),且在灶具关闭后仍报告 None(06:32、11:28、17:23),随后在下一个整点周期恢复正常数值。", "推理步骤2: Matter 协议中 MeasuredValue = None 表示传感器无法提供有效读数,可能是传感器过热保护、通信中断或硬件故障。该现象在一天内重复出现3次,与灶具使用高度相关。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在高温烹饪时失效,恰恰是最需要监测的时刻无法提供数据,存在安全盲区。", "推理步骤4: 其余行为模式正常——老人约05:33起床、06:00做早餐、07:02出门、08:34回家、12:39午休、14:06起床、16:59做晚餐、20:35洗漱、20:55就寝,符合独居老人的典型作息规律。", "推理步骤5: 门锁操作均为正常手动/自动操作,无异常入侵迹象;无烟雾报警、无漏水报警触发;温度整体随日间升温夜间降温的自然规律变化。"], "key_evidence": ["kitchen_temp_sensor 在06:01、06:32、11:01、11:28、17:00、17:23共6次报告 MeasuredValue = None,均与灶具使用时段重合", "该传感器在非烹饪时段读数正常,说明故障与高温环境相关,可能是传感器耐热性不足或安装位置过近"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时读数异常", "考虑更换耐高温型温度传感器,或将传感器移至距灶具更远但仍能监测厨房整体温度的位置", "在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为烹饪期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.775941848754883, "api_error": null} {"episode_id": "SQ3_TP_D_0462", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0462.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261091, "scenario_id": "EL-05", "total_events": 215, "anomaly_events_count": 11}, "ground_truth": {"scenario_id": "EL-05", "scenario_name": "夜间频繁起夜", "category": "elderly_specific", "is_anomaly": true, "threat_type": "health_concern", "key_evidence": ["一晚4次以上卧室→卫生间往返", "间隔越来越短", "可能的健康问题:泌尿系统感染、前列腺问题、糖尿病等"], "expected_response": "非紧急但需要记录,建议子女/看护者关注,如连续多天则建议就医", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-13T12:41:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障或通信异常;同时入户门在 08:25 被从外部手动开锁进入但老人当时应在外出状态,且门锁未在之后重新上锁。\",\n \"reasoning\": [\n \"推理步骤1: 老人 06:56 手动开锁出门,门关闭后自动上锁(LockState=1),这是正常外出行为。\",\n \"推理步骤2: 08:25 入户门再次被手动开锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关和客厅运动传感器同时触发,客厅灯打开——说明有人从外面进入了家中。但日志中没有对应的关门和上锁记录,直到 20:36 才出现门关闭和自动上锁事件,意味着入户门可能长时间处于未关闭或未上锁状态。\",\n \"推理步骤3: 对于独居老人场景,08:25 的进入可以解释为老人自己回家(比如晨练归来),行为模式(进门→客厅→午休→下午活动→做饭→晚间就寝)整体合理,因此入侵风险不高,但门锁长时间未闭合是安全隐患。\",\n \"推理步骤4: 厨房温度传感器在三次灶具使用期间(06:01、11:10、16:57)以及灶具关闭后(06:36、11:29、17:38)均报告 MeasuredValue = None。灶具开启时温度传感器读数丢失可能是高温干扰或传感器通信故障。正常传感器即使在灶具附近也应返回有效数值,连续 6 次 None 值属于异常。\",\n \"推理步骤5: 其余行为模式正常——老人 05:30 起床、三餐规律、12:29-14:00 午休、20:36 就寝,活动轨迹连贯,无长时间无活动的健康风险信号。温度曲线随昼夜自然变化,无火灾或异常升温迹象。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:01、06:36、11:10、11:29、16:57、17:38 共 6 次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"08:25 入户门手动开锁进入后,直到 20:36(约 12 小时后)才记录到门关闭和自动上锁,期间无门锁闭合记录\",\n \"08:25 开门时客厅运动传感器和玄关运动传感器同时触发,说明确实有人进入\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热保护或通信中断,必要时更换为耐高温型号或调整安装位置\",\n \"检查入户门磁传感器和门锁自动闭合功能是否正常工作,确认 08:25 至 20:36 期间门是否确实处于未关闭状态\",\n \"建议为入户门设置长时间未关闭/未上锁告警(如超过 5 分钟未闭合即推送提醒),对独居老人尤为重要\",\n \"考虑为厨房灶具增加无人看管自动关闭功能(如灶具开启超过 45 分钟且厨房无人活动时自动断气/断电)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障或通信异常;同时入户门在 08:25 被从外部手动开锁进入但老人当时应在外出状态,且门锁未在之后重新上锁。", "reasoning": ["推理步骤1: 老人 06:56 手动开锁出门,门关闭后自动上锁(LockState=1),这是正常外出行为。", "推理步骤2: 08:25 入户门再次被手动开锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关和客厅运动传感器同时触发,客厅灯打开——说明有人从外面进入了家中。但日志中没有对应的关门和上锁记录,直到 20:36 才出现门关闭和自动上锁事件,意味着入户门可能长时间处于未关闭或未上锁状态。", "推理步骤3: 对于独居老人场景,08:25 的进入可以解释为老人自己回家(比如晨练归来),行为模式(进门→客厅→午休→下午活动→做饭→晚间就寝)整体合理,因此入侵风险不高,但门锁长时间未闭合是安全隐患。", "推理步骤4: 厨房温度传感器在三次灶具使用期间(06:01、11:10、16:57)以及灶具关闭后(06:36、11:29、17:38)均报告 MeasuredValue = None。灶具开启时温度传感器读数丢失可能是高温干扰或传感器通信故障。正常传感器即使在灶具附近也应返回有效数值,连续 6 次 None 值属于异常。", "推理步骤5: 其余行为模式正常——老人 05:30 起床、三餐规律、12:29-14:00 午休、20:36 就寝,活动轨迹连贯,无长时间无活动的健康风险信号。温度曲线随昼夜自然变化,无火灾或异常升温迹象。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["厨房温度传感器在 06:01、06:36、11:10、11:29、16:57、17:38 共 6 次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "08:25 入户门手动开锁进入后,直到 20:36(约 12 小时后)才记录到门关闭和自动上锁,期间无门锁闭合记录", "08:25 开门时客厅运动传感器和玄关运动传感器同时触发,说明确实有人进入"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热保护或通信中断,必要时更换为耐高温型号或调整安装位置", "检查入户门磁传感器和门锁自动闭合功能是否正常工作,确认 08:25 至 20:36 期间门是否确实处于未关闭状态", "建议为入户门设置长时间未关闭/未上锁告警(如超过 5 分钟未闭合即推送提醒),对独居老人尤为重要", "考虑为厨房灶具增加无人看管自动关闭功能(如灶具开启超过 45 分钟且厨房无人活动时自动断气/断电)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.44406771659851, "api_error": null} {"episode_id": "SQ3_TP_D_0469", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0469.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-25T00:00:00", "seed": 20261098, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-25T00:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器发生硬件故障,且厨房温度传感器多次报告 None 值,两个安全关键设备同时异常,独居老人的厨房安全监测存在盲区。\",\n \"reasoning\": [\n \"推理步骤1: 在 00:09 厨房烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(对应 HardwareFault 状态),并触发了 HardwareFault 事件。这意味着该报警器已无法正常工作,无法检测烟雾或一氧化碳。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后反复报告 MeasuredValue=None(06:02、06:27、11:04、11:35、17:01、17:40),共出现6次。每次都与灶具使用时间高度吻合,说明该传感器在厨房温度升高时失效,可能存在硬件缺陷或安装位置不当导致过热保护触发。\",\n \"推理步骤3: 烟雾报警器故障 + 温度传感器间歇失效,意味着厨房在烹饪期间的两道安全防线同时缺失。老人当天使用灶具三次(06:01-06:26、11:03-11:34、17:00-17:39),每次烹饪时厨房都处于安全监测盲区。\",\n \"推理步骤4: 从整体生活模式来看,老人的作息正常——05:28起床、07:08外出、08:35回家、12:31午休、20:43就寝,门锁操作均为手动开锁+自动上锁,无入侵迹象。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.9°C)。漏水传感器和其他设备均无异常报告。\",\n \"推理步骤5: 08:35 老人回家后入户门一直未关闭(front_door_contact 的 StateValue 保持 False,直到 20:43 才变为 True 并自动上锁),这意味着入户门从上午 08:35 到晚上 20:43 处于开启状态长达约12小时。虽然老人在家中活动,但对独居老人而言,长时间门户大开存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"00:09 kitchen_smoke_alarm 报告 HardwareFaultAlert=True,ExpressedState=5,触发 HardwareFault 事件,且全天未恢复\",\n \"kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue=None(06:02、06:27、11:04、11:35、17:01、17:40),灶具关闭后恢复正常读数\",\n \"老人当天三次使用灶具烹饪,每次烹饪期间厨房烟雾报警和温度监测均处于失效状态\",\n \"入户门从 08:35 至 20:43 持续处于开启状态约12小时(front_door_contact StateValue=False)\"\n ],\n \"recommended_actions\": [\n \"立即安排维修或更换厨房烟雾报警器(kitchen_smoke_alarm),这是最高优先级——烟雾报警器是防火安全的最后一道防线\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置和硬件状态,排查灶具使用时反复报 None 的原因,必要时更换传感器\",\n \"在烟雾报警器修复前,建议老人减少使用灶具,或安排家人在烹饪时段远程关注\",\n \"考虑增加入户门长时间未关闭的自动提醒规则,避免独居老人门户大开带来的安全风险\",\n \"建议为关键安全设备(烟雾报警器、温度传感器)设置故障后的即时通知推送给紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器发生硬件故障,且厨房温度传感器多次报告 None 值,两个安全关键设备同时异常,独居老人的厨房安全监测存在盲区。", "reasoning": ["推理步骤1: 在 00:09 厨房烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(对应 HardwareFault 状态),并触发了 HardwareFault 事件。这意味着该报警器已无法正常工作,无法检测烟雾或一氧化碳。", "推理步骤2: 厨房温度传感器在灶具开启后反复报告 MeasuredValue=None(06:02、06:27、11:04、11:35、17:01、17:40),共出现6次。每次都与灶具使用时间高度吻合,说明该传感器在厨房温度升高时失效,可能存在硬件缺陷或安装位置不当导致过热保护触发。", "推理步骤3: 烟雾报警器故障 + 温度传感器间歇失效,意味着厨房在烹饪期间的两道安全防线同时缺失。老人当天使用灶具三次(06:01-06:26、11:03-11:34、17:00-17:39),每次烹饪时厨房都处于安全监测盲区。", "推理步骤4: 从整体生活模式来看,老人的作息正常——05:28起床、07:08外出、08:35回家、12:31午休、20:43就寝,门锁操作均为手动开锁+自动上锁,无入侵迹象。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.9°C)。漏水传感器和其他设备均无异常报告。", "推理步骤5: 08:35 老人回家后入户门一直未关闭(front_door_contact 的 StateValue 保持 False,直到 20:43 才变为 True 并自动上锁),这意味着入户门从上午 08:35 到晚上 20:43 处于开启状态长达约12小时。虽然老人在家中活动,但对独居老人而言,长时间门户大开存在一定安全隐患。"], "key_evidence": ["00:09 kitchen_smoke_alarm 报告 HardwareFaultAlert=True,ExpressedState=5,触发 HardwareFault 事件,且全天未恢复", "kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue=None(06:02、06:27、11:04、11:35、17:01、17:40),灶具关闭后恢复正常读数", "老人当天三次使用灶具烹饪,每次烹饪期间厨房烟雾报警和温度监测均处于失效状态", "入户门从 08:35 至 20:43 持续处于开启状态约12小时(front_door_contact StateValue=False)"], "recommended_actions": ["立即安排维修或更换厨房烟雾报警器(kitchen_smoke_alarm),这是最高优先级——烟雾报警器是防火安全的最后一道防线", "检查厨房温度传感器(kitchen_temp_sensor)的安装位置和硬件状态,排查灶具使用时反复报 None 的原因,必要时更换传感器", "在烟雾报警器修复前,建议老人减少使用灶具,或安排家人在烹饪时段远程关注", "考虑增加入户门长时间未关闭的自动提醒规则,避免独居老人门户大开带来的安全风险", "建议为关键安全设备(烟雾报警器、温度传感器)设置故障后的即时通知推送给紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.651777267456055, "api_error": null} {"episode_id": "SQ3_TP_D_0466", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0466.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-25T00:00:00", "seed": 20261095, "scenario_id": "EL-07", "total_events": 205, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "EL-07", "scenario_name": "长时间未归家", "category": "elderly_specific", "is_anomaly": true, "threat_type": "prolonged_absence", "key_evidence": ["出门时间已知(LockOperation 事件)", "预期回家时间已过但无 LockOperation 解锁事件", "偏离日常规律超过1小时"], "expected_response": "9:30开始尝试联系,10:00后联系紧急联系人", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-25T06:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出期间未上锁长达约1.5小时。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约05:30起床(卧室运动+开灯+开窗帘),05:47去卫生间,06:06进厨房做早餐,07:05出门(关厨房灯、手动开锁、开关门、自动上锁),08:40回家,12:31午休(关客厅灯、进卧室、关窗帘),14:10起床,17:08做晚餐,20:38洗漱,20:50就寝。这是一个非常规律的独居老人日常模式。\",\n \"推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:06-06:21、10:58-11:22、17:08-17:36),kitchen_temp_sensor 均在灶具开启约30秒后报告 MeasuredValue = None,且在灶具关闭约1分钟后再次报告 None。每次灶具使用都复现此问题,但在下一个整点/半点的定时采集中又恢复正常数值。这说明传感器在厨房温度快速变化时出现读数失败,可能是传感器量程溢出、通信超时或硬件故障。\",\n \"推理步骤3: 入户门锁状态分析——07:05:09老人手动开锁出门,07:05:13自动上锁,这是正常的。但08:40:00老人回家时再次手动开锁(LockOperationType=1, LockState=2),之后日志中直到20:50:14才出现自动上锁记录(LockState=1)。这意味着从08:40到20:50,入户门处于未上锁状态长达约12小时。虽然老人在家中,但对于独居老人而言,长时间不锁门存在一定安全隐患。\",\n \"推理步骤4: 安全设备检查——烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无告警,漏水传感器(bathroom_water_leak、kitchen_water_leak)全天无告警,窗户传感器无异常开启记录,排除火灾和水患风险。\",\n \"推理步骤5: 健康状况评估——老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,无长时间无活动的空白期(最长静止期为午休约1.5小时,属正常范围),卫生间使用时长合理(早晨约19分钟,晚间约12分钟),未发现跌倒或健康异常的迹象。\",\n \"推理步骤6: 温度趋势正常——室内温度随夏季日间升温、夜间降温的自然规律波动(卧室约22.0°C~24.8°C,客厅约22.9°C~25.7°C,厨房约22.9°C~25.8°C),未出现异常高温或低温,空调全天未开启但温度尚在可接受范围内。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:07:05、06:22:00、10:59:00、11:23:00、17:09:00、17:37:00),共6次异常读数\",\n \"08:40老人回家开锁后,门锁长时间处于未锁定状态(LockState=2),直到20:50:14才重新上锁\",\n \"传感器在非灶具使用时段的定时采集中均能正常报告数值,说明故障与灶具使用(高温/蒸汽环境)相关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰;考虑更换耐高温型号或调整安装位置\",\n \"为入户门锁配置自动上锁策略(如门关闭后N分钟自动上锁),避免老人忘记锁门带来的安全隐患\",\n \"建议设置门锁未上锁超时提醒(如超过10分钟未上锁则推送通知给家属或老人)\",\n \"持续监控厨房温度传感器,若问题持续出现建议更换设备,确保灶具使用期间的温度监控不中断(这对独居老人的用火安全至关重要)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出期间未上锁长达约1.5小时。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约05:30起床(卧室运动+开灯+开窗帘),05:47去卫生间,06:06进厨房做早餐,07:05出门(关厨房灯、手动开锁、开关门、自动上锁),08:40回家,12:31午休(关客厅灯、进卧室、关窗帘),14:10起床,17:08做晚餐,20:38洗漱,20:50就寝。这是一个非常规律的独居老人日常模式。", "推理步骤2: 厨房温度传感器异常——灶具三次使用期间(06:06-06:21、10:58-11:22、17:08-17:36),kitchen_temp_sensor 均在灶具开启约30秒后报告 MeasuredValue = None,且在灶具关闭约1分钟后再次报告 None。每次灶具使用都复现此问题,但在下一个整点/半点的定时采集中又恢复正常数值。这说明传感器在厨房温度快速变化时出现读数失败,可能是传感器量程溢出、通信超时或硬件故障。", "推理步骤3: 入户门锁状态分析——07:05:09老人手动开锁出门,07:05:13自动上锁,这是正常的。但08:40:00老人回家时再次手动开锁(LockOperationType=1, LockState=2),之后日志中直到20:50:14才出现自动上锁记录(LockState=1)。这意味着从08:40到20:50,入户门处于未上锁状态长达约12小时。虽然老人在家中,但对于独居老人而言,长时间不锁门存在一定安全隐患。", "推理步骤4: 安全设备检查——烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无告警,漏水传感器(bathroom_water_leak、kitchen_water_leak)全天无告警,窗户传感器无异常开启记录,排除火灾和水患风险。", "推理步骤5: 健康状况评估——老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,无长时间无活动的空白期(最长静止期为午休约1.5小时,属正常范围),卫生间使用时长合理(早晨约19分钟,晚间约12分钟),未发现跌倒或健康异常的迹象。", "推理步骤6: 温度趋势正常——室内温度随夏季日间升温、夜间降温的自然规律波动(卧室约22.0°C~24.8°C,客厅约22.9°C~25.7°C,厨房约22.9°C~25.8°C),未出现异常高温或低温,空调全天未开启但温度尚在可接受范围内。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:07:05、06:22:00、10:59:00、11:23:00、17:09:00、17:37:00),共6次异常读数", "08:40老人回家开锁后,门锁长时间处于未锁定状态(LockState=2),直到20:50:14才重新上锁", "传感器在非灶具使用时段的定时采集中均能正常报告数值,说明故障与灶具使用(高温/蒸汽环境)相关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰;考虑更换耐高温型号或调整安装位置", "为入户门锁配置自动上锁策略(如门关闭后N分钟自动上锁),避免老人忘记锁门带来的安全隐患", "建议设置门锁未上锁超时提醒(如超过10分钟未上锁则推送通知给家属或老人)", "持续监控厨房温度传感器,若问题持续出现建议更换设备,确保灶具使用期间的温度监控不中断(这对独居老人的用火安全至关重要)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.125489234924316, "api_error": null} {"episode_id": "SQ3_TP_D_0470", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0470.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20261099, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-20T23:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在深夜持续报警,老人已入睡无人处理,存在水损和安全风险。\",\n \"reasoning\": [\n \"推理步骤1: 过去6小时的时间窗口为 2026-06-20 17:35 至 23:35。在此期间,老人的活动轨迹为:17:07 厨房做饭 → 19:32 客厅休息 → 20:29 卫生间 → 20:43 回卧室关灯就寝,生活节奏正常。\",\n \"推理步骤2: 23:05 厨房漏水传感器首次触发 StateValue=True,随后 23:15 和 23:35 持续报告 True,说明漏水状态在至少 30 分钟内未解除,水源仍在持续泄漏。\",\n \"推理步骤3: 老人约 20:43 已进入卧室关灯就寝,卧室窗帘关闭(100%),此后无任何房间的运动传感器或灯光触发记录,表明老人已熟睡,完全没有察觉到厨房漏水。\",\n \"推理步骤4: 厨房温度传感器在此期间曾多次报告 None 值(做饭时的干扰),但 23:00 和 23:30 恢复正常读数(约 23.3°C),排除火灾或燃气泄漏的可能,问题聚焦于漏水。\",\n \"推理步骤5: 独居老人场景下,深夜无人响应的持续漏水尤其危险——可能导致地面湿滑(跌倒风险)、电器浸水(触电风险)以及财产损失,需要立即外部干预。\"\n ],\n \"key_evidence\": [\n \"23:05 kitchen_water_leak StateValue=True,首次触发漏水报警\",\n \"23:15 kitchen_water_leak StateValue=True,10分钟后仍在漏水\",\n \"23:35 kitchen_water_leak StateValue=True,30分钟后漏水持续未解除\",\n \"20:43 老人已回卧室关灯就寝,此后全屋无任何活动记录,无人响应漏水\",\n \"厨房温度传感器读数正常(~23.3°C),排除火灾等其他威胁\"\n ],\n \"recommended_actions\": [\n \"立即通过紧急联系人(子女/社区)电话或短信通知,告知厨房漏水情况\",\n \"如果智能家居系统接入了电磁水阀,应立即远程关闭厨房供水总阀\",\n \"触发室内声光报警(如智能音箱语音播报)尝试唤醒老人\",\n \"漏水解除后检查厨房地面积水情况,防止老人起夜时滑倒\",\n \"排查漏水原因:重点检查厨房水龙头、洗碗机接口、水管接头等,必要时联系维修\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在深夜持续报警,老人已入睡无人处理,存在水损和安全风险。", "reasoning": ["推理步骤1: 过去6小时的时间窗口为 2026-06-20 17:35 至 23:35。在此期间,老人的活动轨迹为:17:07 厨房做饭 → 19:32 客厅休息 → 20:29 卫生间 → 20:43 回卧室关灯就寝,生活节奏正常。", "推理步骤2: 23:05 厨房漏水传感器首次触发 StateValue=True,随后 23:15 和 23:35 持续报告 True,说明漏水状态在至少 30 分钟内未解除,水源仍在持续泄漏。", "推理步骤3: 老人约 20:43 已进入卧室关灯就寝,卧室窗帘关闭(100%),此后无任何房间的运动传感器或灯光触发记录,表明老人已熟睡,完全没有察觉到厨房漏水。", "推理步骤4: 厨房温度传感器在此期间曾多次报告 None 值(做饭时的干扰),但 23:00 和 23:30 恢复正常读数(约 23.3°C),排除火灾或燃气泄漏的可能,问题聚焦于漏水。", "推理步骤5: 独居老人场景下,深夜无人响应的持续漏水尤其危险——可能导致地面湿滑(跌倒风险)、电器浸水(触电风险)以及财产损失,需要立即外部干预。"], "key_evidence": ["23:05 kitchen_water_leak StateValue=True,首次触发漏水报警", "23:15 kitchen_water_leak StateValue=True,10分钟后仍在漏水", "23:35 kitchen_water_leak StateValue=True,30分钟后漏水持续未解除", "20:43 老人已回卧室关灯就寝,此后全屋无任何活动记录,无人响应漏水", "厨房温度传感器读数正常(~23.3°C),排除火灾等其他威胁"], "recommended_actions": ["立即通过紧急联系人(子女/社区)电话或短信通知,告知厨房漏水情况", "如果智能家居系统接入了电磁水阀,应立即远程关闭厨房供水总阀", "触发室内声光报警(如智能音箱语音播报)尝试唤醒老人", "漏水解除后检查厨房地面积水情况,防止老人起夜时滑倒", "排查漏水原因:重点检查厨房水龙头、洗碗机接口、水管接头等,必要时联系维修"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.206742763519287, "api_error": null} {"episode_id": "SQ3_TP_D_0472", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0472.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261101, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-13T03:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器在凌晨3:25发生硬件故障,且厨房温度传感器多次报告null值,两个设备均存在功能失效风险,对独居老人的安全保障构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 在03:25,客厅烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(对应Matter协议中的HardwareFault状态),并触发了HardwareFault事件。这意味着该报警器自身检测到硬件级别的故障,可能无法正常检测烟雾或CO。\",\n \"推理步骤2: 检查同时段温度数据,客厅、卧室、厨房温度均在22-23°C范围内正常波动,无异常升温,排除了真实火灾触发的可能性。这进一步确认是设备自身硬件故障,而非环境异常。\",\n \"推理步骤3: 厨房温度传感器在三次做饭期间(06:11、11:06、16:56)及灶具关闭后均报告MeasuredValue=None,共出现6次null读数。虽然可能与灶具高温导致传感器暂时超量程有关,但灶具关闭后(如06:25、11:24、17:34)仍然报告null值,直到下一个整点才恢复正常读数,说明传感器存在恢复延迟或间歇性故障。\",\n \"推理步骤4: 对于独居老人家庭,烟雾报警器是最关键的安全设备之一。硬件故障意味着如果发生真实火灾或CO泄漏,该报警器可能无法发出警报。厨房温度传感器的异常也削弱了通过温度异常检测厨房火灾风险的能力。\",\n \"推理步骤5: 其余行为模式均属正常——老人05:22起床、05:31如厕、06:10做早餐、07:04出门(门锁手动开锁后自动上锁)、08:24回家、12:20午休(关窗帘)、13:57起床、16:55做晚餐、20:36洗漱、20:49就寝(关窗帘、关灯)。入户门在老人外出和就寝时均处于上锁状态,无入侵迹象。漏水传感器无报警。生活节奏规律,无健康异常信号。\"\n ],\n \"key_evidence\": [\n \"03:25 客厅烟雾报警器触发 HardwareFaultAlert=True,ExpressedState=5(HardwareFault),并产生 HardwareFault 事件\",\n \"厨房温度传感器在做饭期间及灶具关闭后共6次报告 MeasuredValue=None(06:11、06:25、11:06、11:24、16:56、17:34),存在间歇性故障嫌疑\",\n \"故障发生时各房间温度正常(22-23°C),排除真实火灾场景\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换客厅烟雾报警器(living_room_smoke_alarm),在修复前确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为备用保护\",\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温影响,或传感器本身存在硬件问题,必要时更换或重新定位\",\n \"考虑为独居老人增加冗余烟雾报警器,避免单点故障导致安全盲区\",\n \"在烟雾报警器修复前,建议通知老人的紧急联系人关注该情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器在凌晨3:25发生硬件故障,且厨房温度传感器多次报告null值,两个设备均存在功能失效风险,对独居老人的安全保障构成隐患。", "reasoning": ["推理步骤1: 在03:25,客厅烟雾报警器报告 HardwareFaultAlert=True,ExpressedState=5(对应Matter协议中的HardwareFault状态),并触发了HardwareFault事件。这意味着该报警器自身检测到硬件级别的故障,可能无法正常检测烟雾或CO。", "推理步骤2: 检查同时段温度数据,客厅、卧室、厨房温度均在22-23°C范围内正常波动,无异常升温,排除了真实火灾触发的可能性。这进一步确认是设备自身硬件故障,而非环境异常。", "推理步骤3: 厨房温度传感器在三次做饭期间(06:11、11:06、16:56)及灶具关闭后均报告MeasuredValue=None,共出现6次null读数。虽然可能与灶具高温导致传感器暂时超量程有关,但灶具关闭后(如06:25、11:24、17:34)仍然报告null值,直到下一个整点才恢复正常读数,说明传感器存在恢复延迟或间歇性故障。", "推理步骤4: 对于独居老人家庭,烟雾报警器是最关键的安全设备之一。硬件故障意味着如果发生真实火灾或CO泄漏,该报警器可能无法发出警报。厨房温度传感器的异常也削弱了通过温度异常检测厨房火灾风险的能力。", "推理步骤5: 其余行为模式均属正常——老人05:22起床、05:31如厕、06:10做早餐、07:04出门(门锁手动开锁后自动上锁)、08:24回家、12:20午休(关窗帘)、13:57起床、16:55做晚餐、20:36洗漱、20:49就寝(关窗帘、关灯)。入户门在老人外出和就寝时均处于上锁状态,无入侵迹象。漏水传感器无报警。生活节奏规律,无健康异常信号。"], "key_evidence": ["03:25 客厅烟雾报警器触发 HardwareFaultAlert=True,ExpressedState=5(HardwareFault),并产生 HardwareFault 事件", "厨房温度传感器在做饭期间及灶具关闭后共6次报告 MeasuredValue=None(06:11、06:25、11:06、11:24、16:56、17:34),存在间歇性故障嫌疑", "故障发生时各房间温度正常(22-23°C),排除真实火灾场景"], "recommended_actions": ["立即检查或更换客厅烟雾报警器(living_room_smoke_alarm),在修复前确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为备用保护", "检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温影响,或传感器本身存在硬件问题,必要时更换或重新定位", "考虑为独居老人增加冗余烟雾报警器,避免单点故障导致安全盲区", "在烟雾报警器修复前,建议通知老人的紧急联系人关注该情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.3252911567688, "api_error": null} {"episode_id": "SQ3_TP_D_0484", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0484.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261113, "scenario_id": "EL-02", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-02", "scenario_name": "居家意外(任意位置跌倒/晕倒)", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall_or_medical_emergency", "key_evidence": ["最后一次运动在非卧室房间(如客厅、厨房)", "随后异常长时间无任何活动", "不在正常午睡时段(比如上午10点或下午4点)"], "expected_response": "紧急联系老人,如无应答联系紧急联系人或120", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-07T00:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出后长时间未锁(08:39 开锁后至 20:49 才自动上锁)。\",\n \"reasoning\": [\n \"推理步骤1: 梳理老人全天作息——00:53 卧室短暂活动(可能起夜翻身),05:25 起床开灯开窗帘,05:50 进卫生间,06:04 进厨房做早餐,07:02 手动开锁出门(门自动上锁),08:39 回家开锁进门,之后在客厅/卧室活动,11:05 做午餐,12:36 午休拉窗帘,14:05 起床,16:55 做晚餐,19:32 客厅看电视(灯调暗至35),20:36 洗漱,20:49 回卧室就寝。整体作息规律,符合独居老人的典型生活模式。\",\n \"推理步骤2: 厨房温度传感器在三次灶具使用期间(06:05、11:06、16:56)以及灶具关闭后(06:24、11:41、17:32)均报告 MeasuredValue = None。而同一时段客厅和卧室温度传感器正常上报数值。这说明厨房温度传感器在灶具工作时反复出现读数丢失,可能是传感器受高温影响导致读数超量程返回 None,或传感器本身存在间歇性故障。\",\n \"推理步骤3: 08:39 老人回家时手动开锁(LockOperationType=1),入户门传感器显示门打开(StateValue=False),但此后直到 20:49 才出现门关闭(StateValue=True)和自动上锁记录。这意味着入户门可能在长达约12小时内处于未关闭/未上锁状态。对于独居老人而言,这是一个安全隐患——门未关可能导致入侵风险,也可能是门磁传感器漏报了关门事件。\",\n \"推理步骤4: 其余设备行为均正常——烟雾报警器未触发、漏水传感器未报警、各房间运动传感器与灯光/窗帘联动合理、温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.8°C)。无入侵、火灾或漏水迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:05、06:24、11:06、11:41、16:56、17:32共6次报告 MeasuredValue = None,均与灶具开关时间高度关联,而其他传感器同期正常\",\n \"08:39 入户门开锁并打开(StateValue=False),直到20:49才记录到关门(StateValue=True)和自动上锁,中间约12小时无门状态变化记录\",\n \"07:02 出门时门在10秒内正常关闭并自动上锁,但08:39回家后未见对应的关门事件,行为不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程;如传感器本身故障,建议更换或重新校准\",\n \"检查入户门磁传感器是否工作正常,确认08:39后门是否确实未关闭;如传感器漏报,需维修或更换门磁\",\n \"建议为入户门设置「开门超时未关」告警规则(如超过5分钟未关门则推送提醒),保障独居老人的居家安全\",\n \"考虑为厨房灶具增加「无人看管超时自动关闭」的安全联动规则,防止老人忘记关火\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出后长时间未锁(08:39 开锁后至 20:49 才自动上锁)。", "reasoning": ["推理步骤1: 梳理老人全天作息——00:53 卧室短暂活动(可能起夜翻身),05:25 起床开灯开窗帘,05:50 进卫生间,06:04 进厨房做早餐,07:02 手动开锁出门(门自动上锁),08:39 回家开锁进门,之后在客厅/卧室活动,11:05 做午餐,12:36 午休拉窗帘,14:05 起床,16:55 做晚餐,19:32 客厅看电视(灯调暗至35),20:36 洗漱,20:49 回卧室就寝。整体作息规律,符合独居老人的典型生活模式。", "推理步骤2: 厨房温度传感器在三次灶具使用期间(06:05、11:06、16:56)以及灶具关闭后(06:24、11:41、17:32)均报告 MeasuredValue = None。而同一时段客厅和卧室温度传感器正常上报数值。这说明厨房温度传感器在灶具工作时反复出现读数丢失,可能是传感器受高温影响导致读数超量程返回 None,或传感器本身存在间歇性故障。", "推理步骤3: 08:39 老人回家时手动开锁(LockOperationType=1),入户门传感器显示门打开(StateValue=False),但此后直到 20:49 才出现门关闭(StateValue=True)和自动上锁记录。这意味着入户门可能在长达约12小时内处于未关闭/未上锁状态。对于独居老人而言,这是一个安全隐患——门未关可能导致入侵风险,也可能是门磁传感器漏报了关门事件。", "推理步骤4: 其余设备行为均正常——烟雾报警器未触发、漏水传感器未报警、各房间运动传感器与灯光/窗帘联动合理、温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.8°C)。无入侵、火灾或漏水迹象。"], "key_evidence": ["厨房温度传感器在06:05、06:24、11:06、11:41、16:56、17:32共6次报告 MeasuredValue = None,均与灶具开关时间高度关联,而其他传感器同期正常", "08:39 入户门开锁并打开(StateValue=False),直到20:49才记录到关门(StateValue=True)和自动上锁,中间约12小时无门状态变化记录", "07:02 出门时门在10秒内正常关闭并自动上锁,但08:39回家后未见对应的关门事件,行为不一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温超量程;如传感器本身故障,建议更换或重新校准", "检查入户门磁传感器是否工作正常,确认08:39后门是否确实未关闭;如传感器漏报,需维修或更换门磁", "建议为入户门设置「开门超时未关」告警规则(如超过5分钟未关门则推送提醒),保障独居老人的居家安全", "考虑为厨房灶具增加「无人看管超时自动关闭」的安全联动规则,防止老人忘记关火"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.87295699119568, "api_error": null} {"episode_id": "SQ3_TP_D_0485", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0485.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261114, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T07:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器发生硬件故障,丧失火灾监测能力;厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 07:35 客厅烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件。ExpressedState=5 对应 'HardwareFault' 状态,说明该报警器已无法正常工作。此时老人已于 06:50 出门,家中无人,报警器故障无人知晓。\",\n \"推理步骤2: 08:32 有人通过手动开锁进入家中(入户门解锁→门打开→玄关/客厅检测到人→客厅灯亮),但入户门在 06:50 出门时已自动上锁,此次进入后门未再关闭上锁(直到 20:40 才出现门锁关闭记录)。结合独居老人场景,08:32 的进入者身份需要确认,但行为模式(手动开锁、开灯、正常活动)更像是老人自己回家,属于低风险。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(06:06、06:34、11:05、11:41、17:09、17:26),共出现 6 次。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能在高温时出现故障或超量程,无法提供有效读数。对于独居老人家庭,厨房温度监测失效意味着灶具忘关等危险场景无法被及时发现。\",\n \"推理步骤4: 老人日常作息模式本身正常——05:22 起床、05:46 如厕、06:05 做早餐、06:50 出门、08:32 回家、11:04 做午餐、12:38 午休(关窗帘)、14:02 起床、17:08 做晚餐、19:40 看电视(客厅灯调暗)、20:39 洗漱就寝。活动节奏合理,无健康异常迹象。\",\n \"推理步骤5: 温度趋势正常:夜间约 22-23°C,午间峰值约 25.8°C,符合夏季自然温度变化曲线,无异常热源或火灾迹象。门窗传感器、漏水传感器均无异常报告。\"\n ],\n \"key_evidence\": [\n \"07:35 living_room_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5 及 HardwareFault 事件,表明客厅烟雾报警器硬件故障\",\n \"厨房温度传感器在灶具使用期间共 6 次报告 MeasuredValue=None(06:06、06:34、11:05、11:41、17:09、17:26),传感器工作异常\",\n \"烟雾报警器故障发生时家中无人(老人 06:50 已出门),故障未被及时察觉\"\n ],\n \"recommended_actions\": [\n \"立即通知老人或其紧急联系人:客厅烟雾报警器已故障,需尽快更换或维修,在此期间家中缺少火灾预警能力\",\n \"检查并更换厨房温度传感器,当前传感器在灶具使用时无法提供有效温度读数,存在安全监测盲区\",\n \"在烟雾报警器修复前,考虑启用厨房烟雾报警器作为全屋备用告警,并适当降低其告警阈值\",\n \"建议为独居老人家庭增加远程告警通知机制,确保设备故障信息能第一时间推送给家属或社区服务人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器发生硬件故障,丧失火灾监测能力;厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障嫌疑。", "reasoning": ["推理步骤1: 07:35 客厅烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件。ExpressedState=5 对应 'HardwareFault' 状态,说明该报警器已无法正常工作。此时老人已于 06:50 出门,家中无人,报警器故障无人知晓。", "推理步骤2: 08:32 有人通过手动开锁进入家中(入户门解锁→门打开→玄关/客厅检测到人→客厅灯亮),但入户门在 06:50 出门时已自动上锁,此次进入后门未再关闭上锁(直到 20:40 才出现门锁关闭记录)。结合独居老人场景,08:32 的进入者身份需要确认,但行为模式(手动开锁、开灯、正常活动)更像是老人自己回家,属于低风险。", "推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(06:06、06:34、11:05、11:41、17:09、17:26),共出现 6 次。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能在高温时出现故障或超量程,无法提供有效读数。对于独居老人家庭,厨房温度监测失效意味着灶具忘关等危险场景无法被及时发现。", "推理步骤4: 老人日常作息模式本身正常——05:22 起床、05:46 如厕、06:05 做早餐、06:50 出门、08:32 回家、11:04 做午餐、12:38 午休(关窗帘)、14:02 起床、17:08 做晚餐、19:40 看电视(客厅灯调暗)、20:39 洗漱就寝。活动节奏合理,无健康异常迹象。", "推理步骤5: 温度趋势正常:夜间约 22-23°C,午间峰值约 25.8°C,符合夏季自然温度变化曲线,无异常热源或火灾迹象。门窗传感器、漏水传感器均无异常报告。"], "key_evidence": ["07:35 living_room_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5 及 HardwareFault 事件,表明客厅烟雾报警器硬件故障", "厨房温度传感器在灶具使用期间共 6 次报告 MeasuredValue=None(06:06、06:34、11:05、11:41、17:09、17:26),传感器工作异常", "烟雾报警器故障发生时家中无人(老人 06:50 已出门),故障未被及时察觉"], "recommended_actions": ["立即通知老人或其紧急联系人:客厅烟雾报警器已故障,需尽快更换或维修,在此期间家中缺少火灾预警能力", "检查并更换厨房温度传感器,当前传感器在灶具使用时无法提供有效温度读数,存在安全监测盲区", "在烟雾报警器修复前,考虑启用厨房烟雾报警器作为全屋备用告警,并适当降低其告警阈值", "建议为独居老人家庭增加远程告警通知机制,确保设备故障信息能第一时间推送给家属或社区服务人员"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.678407907485962, "api_error": null} {"episode_id": "SQ3_TP_D_0490", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0490.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261119, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-13T22:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在老人已入睡后触发报警,且持续至日志结束未解除,存在水损和安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人的作息规律清晰——05:35起床,06:50出门晨练/买菜,08:29回家,12:35午休,14:02起床,20:36洗漱,20:54上床关灯入睡。整体生活节奏正常,无健康异常迹象。\",\n \"推理步骤2: 22:33 卫生间漏水传感器触发 (bathroom_water_leak StateValue=True),此时老人已于 20:54 入睡近两小时,卫生间自 20:54:58 起无人活动(occupancy=0),说明漏水并非老人正在用水导致。\",\n \"推理步骤3: 从 22:33 到日志结束 23:30,漏水状态未恢复为 False,持续近 1 小时无人处理。老人处于睡眠状态,很可能未察觉漏水。\",\n \"推理步骤4: 卫生间无人且无用水操作的情况下出现漏水,最可能的原因是水管接头松动、马桶/水龙头阀门故障或管道渗漏。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于设备小异常(可能是高温导致的读数溢出或传感器暂时失灵),但灶具关闭后温度恢复正常读数,烟雾报警器未触发,不构成安全威胁。\",\n \"推理步骤6: 入户门在 08:29 回家后未上锁(直到 20:54 才记录到自动上锁),白天独居老人在家期间门锁状态为未锁,存在一定安全隐患但属于生活习惯范畴,不是紧急威胁。\",\n \"推理步骤7: 综合判断,最紧急的问题是卫生间漏水——独居老人在睡眠中无法自行发现和处理,长时间漏水可能造成地面积水(滑倒风险)、财产损失及楼下渗水。\"\n ],\n \"key_evidence\": [\n \"22:33 bathroom_water_leak StateValue=True 且触发 StateChange 事件,卫生间漏水报警\",\n \"漏水发生时卫生间无人(bathroom_occupancy 自 20:54:58 起为 0),排除正常用水\",\n \"从 22:33 至日志结束 23:30,漏水状态持续未解除(未见 StateValue=False)\",\n \"老人 20:54 已关灯入睡,大概率未察觉漏水情况\"\n ],\n \"recommended_actions\": [\n \"立即通过紧急联系人(子女/社区)电话通知老人或代为处理,提醒关闭卫生间水阀\",\n \"如系统支持远程控制,自动关闭卫生间总水阀以止损\",\n \"安排水管工尽快上门检查漏水原因(管道、阀门、马桶等)\",\n \"关注厨房温度传感器在灶具使用时报告 None 的问题,建议检查传感器是否安装位置过近灶具或需要更换\",\n \"建议为老人设置漏水报警时的声光提醒或床头通知设备,避免睡眠中错过重要警报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在老人已入睡后触发报警,且持续至日志结束未解除,存在水损和安全隐患。", "reasoning": ["推理步骤1: 老人的作息规律清晰——05:35起床,06:50出门晨练/买菜,08:29回家,12:35午休,14:02起床,20:36洗漱,20:54上床关灯入睡。整体生活节奏正常,无健康异常迹象。", "推理步骤2: 22:33 卫生间漏水传感器触发 (bathroom_water_leak StateValue=True),此时老人已于 20:54 入睡近两小时,卫生间自 20:54:58 起无人活动(occupancy=0),说明漏水并非老人正在用水导致。", "推理步骤3: 从 22:33 到日志结束 23:30,漏水状态未恢复为 False,持续近 1 小时无人处理。老人处于睡眠状态,很可能未察觉漏水。", "推理步骤4: 卫生间无人且无用水操作的情况下出现漏水,最可能的原因是水管接头松动、马桶/水龙头阀门故障或管道渗漏。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于设备小异常(可能是高温导致的读数溢出或传感器暂时失灵),但灶具关闭后温度恢复正常读数,烟雾报警器未触发,不构成安全威胁。", "推理步骤6: 入户门在 08:29 回家后未上锁(直到 20:54 才记录到自动上锁),白天独居老人在家期间门锁状态为未锁,存在一定安全隐患但属于生活习惯范畴,不是紧急威胁。", "推理步骤7: 综合判断,最紧急的问题是卫生间漏水——独居老人在睡眠中无法自行发现和处理,长时间漏水可能造成地面积水(滑倒风险)、财产损失及楼下渗水。"], "key_evidence": ["22:33 bathroom_water_leak StateValue=True 且触发 StateChange 事件,卫生间漏水报警", "漏水发生时卫生间无人(bathroom_occupancy 自 20:54:58 起为 0),排除正常用水", "从 22:33 至日志结束 23:30,漏水状态持续未解除(未见 StateValue=False)", "老人 20:54 已关灯入睡,大概率未察觉漏水情况"], "recommended_actions": ["立即通过紧急联系人(子女/社区)电话通知老人或代为处理,提醒关闭卫生间水阀", "如系统支持远程控制,自动关闭卫生间总水阀以止损", "安排水管工尽快上门检查漏水原因(管道、阀门、马桶等)", "关注厨房温度传感器在灶具使用时报告 None 的问题,建议检查传感器是否安装位置过近灶具或需要更换", "建议为老人设置漏水报警时的声光提醒或床头通知设备,避免睡眠中错过重要警报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.961471557617188, "api_error": null} {"episode_id": "SQ3_TP_D_0496", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0496.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20261125, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T10:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器疑似故障:6月1日后出现非标准属性上报,且读数固定不变,丧失正常测量能力;厨房温度传感器在灶具使用期间持续报告 None 值,也存在异常。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器在6月1日当天同时上报了两种格式的数据——标准的 TemperatureMeasurement.MeasuredValue 和非标准的 MeasuredValue(缺少 Cluster 前缀)。例如 08:00 标准值为 2450 但同时出现 MeasuredValue=2350,12:00 标准值为 2578 但同时出现 MeasuredValue=2510,18:00 标准值为 2451 但同时出现 MeasuredValue=2400。两组数值不一致,说明传感器上报链路存在异常。\",\n \"推理步骤2: 从6月2日开始,客厅温度传感器完全停止上报标准 TemperatureMeasurement.MeasuredValue,仅剩非标准的 MeasuredValue,且读数锁定在 2350(23.50°C)不再变化。6月2日 08:00/12:00/18:00/22:00 以及6月3日 08:00/12:00 全部为 2350,跨越多天、昼夜温差完全消失,这在物理上不可能。\",\n \"推理步骤3: 同期卧室和厨房温度传感器在6月2日和6月3日完全没有任何数据上报,结合客厅传感器的异常,可能存在网关或系统级通信故障,也可能是这些传感器已离线。\",\n \"推理步骤4: 厨房温度传感器在6月1日三次灶具使用期间(06:07、11:11、16:51)均上报 MeasuredValue=None,且灶具关闭后仍有一次 None(06:24、11:40、17:41)。虽然可能是灶具高温导致传感器超量程,但连续出现 None 值也可能表明传感器本身存在故障或需要校准。\",\n \"推理步骤5: 对于独居老人场景,温度传感器是环境安全监测的关键设备。如果传感器失效,将无法及时发现室内过热、火灾前兆或空调故障等危险情况,安全风险显著升高。\",\n \"推理步骤6: 其余行为模式正常——老人 05:20 起床、05:37 如厕、06:06 做早餐、07:09 出门、08:40 回家、12:27 午休、13:57 起床、16:50 做晚餐、20:24 洗漱、20:49 就寝,作息规律合理,门锁出入正常,无入侵或健康异常迹象。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器从6月2日起仅上报非标准 MeasuredValue(无 Cluster 前缀),且读数锁定为 2350 不变,持续超过24小时\",\n \"6月1日客厅传感器同一时刻出现两种格式的温度值且数值不一致(如 08:00 标准值2450 vs 非标准值2350)\",\n \"卧室和厨房温度传感器在6月2日和6月3日完全无数据上报\",\n \"厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器的固件版本和通信状态,可能需要重启或重新配对设备\",\n \"检查智能家居网关/Hub的运行状态和日志,排查6月2日起是否存在系统级通信故障导致多个传感器离线\",\n \"检查卧室和厨房温度传感器是否仍在线,必要时更换电池或重新配网\",\n \"对厨房温度传感器进行校准或调整安装位置,避免灶具高温直接影响导致 None 值\",\n \"在传感器修复前,安排人工或电话方式定期确认老人居住环境安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器疑似故障:6月1日后出现非标准属性上报,且读数固定不变,丧失正常测量能力;厨房温度传感器在灶具使用期间持续报告 None 值,也存在异常。", "reasoning": ["推理步骤1: 客厅温度传感器在6月1日当天同时上报了两种格式的数据——标准的 TemperatureMeasurement.MeasuredValue 和非标准的 MeasuredValue(缺少 Cluster 前缀)。例如 08:00 标准值为 2450 但同时出现 MeasuredValue=2350,12:00 标准值为 2578 但同时出现 MeasuredValue=2510,18:00 标准值为 2451 但同时出现 MeasuredValue=2400。两组数值不一致,说明传感器上报链路存在异常。", "推理步骤2: 从6月2日开始,客厅温度传感器完全停止上报标准 TemperatureMeasurement.MeasuredValue,仅剩非标准的 MeasuredValue,且读数锁定在 2350(23.50°C)不再变化。6月2日 08:00/12:00/18:00/22:00 以及6月3日 08:00/12:00 全部为 2350,跨越多天、昼夜温差完全消失,这在物理上不可能。", "推理步骤3: 同期卧室和厨房温度传感器在6月2日和6月3日完全没有任何数据上报,结合客厅传感器的异常,可能存在网关或系统级通信故障,也可能是这些传感器已离线。", "推理步骤4: 厨房温度传感器在6月1日三次灶具使用期间(06:07、11:11、16:51)均上报 MeasuredValue=None,且灶具关闭后仍有一次 None(06:24、11:40、17:41)。虽然可能是灶具高温导致传感器超量程,但连续出现 None 值也可能表明传感器本身存在故障或需要校准。", "推理步骤5: 对于独居老人场景,温度传感器是环境安全监测的关键设备。如果传感器失效,将无法及时发现室内过热、火灾前兆或空调故障等危险情况,安全风险显著升高。", "推理步骤6: 其余行为模式正常——老人 05:20 起床、05:37 如厕、06:06 做早餐、07:09 出门、08:40 回家、12:27 午休、13:57 起床、16:50 做晚餐、20:24 洗漱、20:49 就寝,作息规律合理,门锁出入正常,无入侵或健康异常迹象。"], "key_evidence": ["客厅温度传感器从6月2日起仅上报非标准 MeasuredValue(无 Cluster 前缀),且读数锁定为 2350 不变,持续超过24小时", "6月1日客厅传感器同一时刻出现两种格式的温度值且数值不一致(如 08:00 标准值2450 vs 非标准值2350)", "卧室和厨房温度传感器在6月2日和6月3日完全无数据上报", "厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None"], "recommended_actions": ["立即检查客厅温度传感器的固件版本和通信状态,可能需要重启或重新配对设备", "检查智能家居网关/Hub的运行状态和日志,排查6月2日起是否存在系统级通信故障导致多个传感器离线", "检查卧室和厨房温度传感器是否仍在线,必要时更换电池或重新配网", "对厨房温度传感器进行校准或调整安装位置,避免灶具高温直接影响导致 None 值", "在传感器修复前,安排人工或电话方式定期确认老人居住环境安全"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.1127712726593, "api_error": null} {"episode_id": "SQ3_TP_D_0497", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0497.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261126, "scenario_id": "DF-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-19T14:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障隐患;同时入户门在老人外出期间(08:40)未关闭/未上锁长达约12小时,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内反复报告 MeasuredValue = None(06:11、06:34、11:02、11:36、16:59、17:34),共出现6次。虽然灶具工作时高温可能导致传感器暂时超量程,但每次灶具关闭后仍报告 None(如06:33关灶→06:34仍为None),直到下一个30分钟整点才恢复正常值,说明传感器恢复存在延迟或间歇性故障。\",\n \"推理步骤2: 对于独居老人家庭,厨房温度传感器是火灾预警的关键设备。如果传感器在灶具使用期间持续无法提供有效读数,一旦发生干烧或火灾,系统将无法通过温度异常及时报警,这是一个重要的安全盲区。\",\n \"推理步骤3: 08:40老人回家时,入户门解锁(LockState=2)、门打开(StateValue=False),但此后日志中直到20:41才出现门关闭(StateValue=True)和自动上锁(LockState=1)。这意味着入户门在约12小时内处于未关闭或未上锁状态。对于独居老人,这是明显的入侵风险。\",\n \"推理步骤4: 14:02-14:03期间,卫生间运动传感器在约1分钟内出现3次快速的占用/清空交替(1→0→1→0→1),间隔仅约30秒。这种模式可能表示老人在卫生间内摔倒后挣扎移动,也可能是传感器边缘区域的正常进出。考虑到独居老人的健康风险,这一模式值得关注但证据不够充分,标记为低置信度关注点。\",\n \"推理步骤5: 其余行为模式基本正常:老人05:35起床→洗漱→做早餐→06:57出门→08:40回家→午间休息→下午活动→晚餐→20:41就寝,符合独居老人的典型日常作息。温度曲线随日照自然升降,灶具使用时长合理(约22-35分钟),门锁在出门时自动上锁,均无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间及关闭后共6次报告 MeasuredValue = None(06:11、06:34、11:02、11:36、16:59、17:34),表明传感器在高温环境下工作不稳定\",\n \"08:40入户门解锁并打开后,直到20:41才记录到门关闭和上锁,期间约12小时门可能处于未锁状态\",\n \"14:02-14:03卫生间运动传感器在约1分钟内出现3次快速占用状态切换(30秒间隔)\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确保其在灶具工作温度范围内能正常报告数值,消除火灾监测盲区\",\n \"检查入户门传感器是否存在漏报问题,确认08:40-20:41期间门的真实状态;如确实未关门,建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)\",\n \"针对卫生间运动传感器的快速交替模式,建议增加跌倒检测逻辑:若短时间内出现多次快速占用切换且无后续正常活动轨迹,触发健康关注提醒\",\n \"建议为独居老人启用长时间无活动告警机制,如任何房间超过一定时间无运动检测则发送通知给紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障隐患;同时入户门在老人外出期间(08:40)未关闭/未上锁长达约12小时,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内反复报告 MeasuredValue = None(06:11、06:34、11:02、11:36、16:59、17:34),共出现6次。虽然灶具工作时高温可能导致传感器暂时超量程,但每次灶具关闭后仍报告 None(如06:33关灶→06:34仍为None),直到下一个30分钟整点才恢复正常值,说明传感器恢复存在延迟或间歇性故障。", "推理步骤2: 对于独居老人家庭,厨房温度传感器是火灾预警的关键设备。如果传感器在灶具使用期间持续无法提供有效读数,一旦发生干烧或火灾,系统将无法通过温度异常及时报警,这是一个重要的安全盲区。", "推理步骤3: 08:40老人回家时,入户门解锁(LockState=2)、门打开(StateValue=False),但此后日志中直到20:41才出现门关闭(StateValue=True)和自动上锁(LockState=1)。这意味着入户门在约12小时内处于未关闭或未上锁状态。对于独居老人,这是明显的入侵风险。", "推理步骤4: 14:02-14:03期间,卫生间运动传感器在约1分钟内出现3次快速的占用/清空交替(1→0→1→0→1),间隔仅约30秒。这种模式可能表示老人在卫生间内摔倒后挣扎移动,也可能是传感器边缘区域的正常进出。考虑到独居老人的健康风险,这一模式值得关注但证据不够充分,标记为低置信度关注点。", "推理步骤5: 其余行为模式基本正常:老人05:35起床→洗漱→做早餐→06:57出门→08:40回家→午间休息→下午活动→晚餐→20:41就寝,符合独居老人的典型日常作息。温度曲线随日照自然升降,灶具使用时长合理(约22-35分钟),门锁在出门时自动上锁,均无异常。"], "key_evidence": ["厨房温度传感器在灶具使用期间及关闭后共6次报告 MeasuredValue = None(06:11、06:34、11:02、11:36、16:59、17:34),表明传感器在高温环境下工作不稳定", "08:40入户门解锁并打开后,直到20:41才记录到门关闭和上锁,期间约12小时门可能处于未锁状态", "14:02-14:03卫生间运动传感器在约1分钟内出现3次快速占用状态切换(30秒间隔)"], "recommended_actions": ["检查或更换厨房温度传感器,确保其在灶具工作温度范围内能正常报告数值,消除火灾监测盲区", "检查入户门传感器是否存在漏报问题,确认08:40-20:41期间门的真实状态;如确实未关门,建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)", "针对卫生间运动传感器的快速交替模式,建议增加跌倒检测逻辑:若短时间内出现多次快速占用切换且无后续正常活动轨迹,触发健康关注提醒", "建议为独居老人启用长时间无活动告警机制,如任何房间超过一定时间无运动检测则发送通知给紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.514820098876953, "api_error": null} {"episode_id": "SQ3_TP_D_0498", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0498.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20261127, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-26T18:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时客厅窗帘在关闭过程中疑似卡住未完成动作。\",\n \"reasoning\": [\n \"推理步骤1: 梳理住户一天的活动轨迹——05:21起床→卫生间→厨房做早餐→07:04出门→08:21回家→客厅活动→12:28午休→13:51起床→17:02做晚餐→20:40洗漱→20:51就寝。整体作息规律,符合独居老人的正常生活节奏。\",\n \"推理步骤2: 入户门锁操作均为 Manual 解锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,无入侵迹象。08:21回家时门未重新上锁记录,但20:51就寝前系统确认门已锁定(LockState=1),安全闭环完整。\",\n \"推理步骤3: 厨房灶具三次使用(05:59-06:22、10:51-11:36、17:02-17:24),每次使用时长分别约23分钟、45分钟、22分钟,均在合理范围内,且均正常关闭,无遗忘关火风险。烟雾报警器全天无触发。\",\n \"推理步骤4: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:00:05、06:23:00、10:52:00、11:37:00、17:03:00、17:25:00),共6次。虽然可能与灶具高温导致传感器量程溢出有关,但正常传感器应报告最大量程值而非 None。这表明传感器可能存在固件缺陷或硬件故障,在高温环境下无法正常工作。\",\n \"推理步骤5: 客厅窗帘在18:16发出 DownOrClose 命令后,OperationalStatus 持续为 0b000010(正在关闭),到18:17仍在运动中,且 CurrentPositionLiftPercent100ths 在18:16:30时仅到达5000(50%位置)。此后无最终到达目标位置(10000=全关)的日志,也无 OperationalStatus 归零的记录,提示窗帘可能卡在半开位置未完成关闭动作。\",\n \"推理步骤6: 温度数据整体合理——夜间约22-23°C,午间峰值约25.8°C,符合夏季室内温度曲线。卧室始终比客厅低约1°C,与窗帘遮光和朝向差异一致。无异常温升提示火灾风险。\",\n \"推理步骤7: 漏水传感器(卫生间、厨房)全天无触发,烟雾/CO报警器无触发,窗户接触传感器无异常开启,整体安防状态良好。\",\n \"推理步骤8: 综合来看,无入侵、火灾、漏水或健康方面的威胁,但厨房温度传感器的反复 None 值属于设备异常,客厅窗帘可能存在机械故障,两者均需关注。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:00:05、06:23:00、10:52:00、11:37:00、17:03:00、17:25:00),正常传感器不应返回空值\",\n \"客厅窗帘18:16执行关闭命令后,18:16:30仅到达50%位置,18:17:00仍显示运动中(OperationalStatus=0b000010),之后无完成关闭的日志记录\",\n \"灶具三次使用均正常关闭,时长合理(23/45/22分钟),无遗忘关火\",\n \"入户门全天仅两次正常手动开锁,就寝前确认已锁定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认其量程是否覆盖灶具工作时的环境温度,考虑固件升级或更换耐高温型号的传感器\",\n \"检查客厅窗帘电机及导轨:确认是否存在机械卡阻,手动测试全行程是否能正常完成,必要时清洁导轨或更换电机\",\n \"为厨房温度传感器设置 None 值告警规则,当连续报告空值时及时通知维护人员\",\n \"建议为独居老人增加定时健康确认机制——如长时间(如超过12小时)无任何运动传感器触发,自动通知紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时客厅窗帘在关闭过程中疑似卡住未完成动作。", "reasoning": ["推理步骤1: 梳理住户一天的活动轨迹——05:21起床→卫生间→厨房做早餐→07:04出门→08:21回家→客厅活动→12:28午休→13:51起床→17:02做晚餐→20:40洗漱→20:51就寝。整体作息规律,符合独居老人的正常生活节奏。", "推理步骤2: 入户门锁操作均为 Manual 解锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,无入侵迹象。08:21回家时门未重新上锁记录,但20:51就寝前系统确认门已锁定(LockState=1),安全闭环完整。", "推理步骤3: 厨房灶具三次使用(05:59-06:22、10:51-11:36、17:02-17:24),每次使用时长分别约23分钟、45分钟、22分钟,均在合理范围内,且均正常关闭,无遗忘关火风险。烟雾报警器全天无触发。", "推理步骤4: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:00:05、06:23:00、10:52:00、11:37:00、17:03:00、17:25:00),共6次。虽然可能与灶具高温导致传感器量程溢出有关,但正常传感器应报告最大量程值而非 None。这表明传感器可能存在固件缺陷或硬件故障,在高温环境下无法正常工作。", "推理步骤5: 客厅窗帘在18:16发出 DownOrClose 命令后,OperationalStatus 持续为 0b000010(正在关闭),到18:17仍在运动中,且 CurrentPositionLiftPercent100ths 在18:16:30时仅到达5000(50%位置)。此后无最终到达目标位置(10000=全关)的日志,也无 OperationalStatus 归零的记录,提示窗帘可能卡在半开位置未完成关闭动作。", "推理步骤6: 温度数据整体合理——夜间约22-23°C,午间峰值约25.8°C,符合夏季室内温度曲线。卧室始终比客厅低约1°C,与窗帘遮光和朝向差异一致。无异常温升提示火灾风险。", "推理步骤7: 漏水传感器(卫生间、厨房)全天无触发,烟雾/CO报警器无触发,窗户接触传感器无异常开启,整体安防状态良好。", "推理步骤8: 综合来看,无入侵、火灾、漏水或健康方面的威胁,但厨房温度传感器的反复 None 值属于设备异常,客厅窗帘可能存在机械故障,两者均需关注。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:00:05、06:23:00、10:52:00、11:37:00、17:03:00、17:25:00),正常传感器不应返回空值", "客厅窗帘18:16执行关闭命令后,18:16:30仅到达50%位置,18:17:00仍显示运动中(OperationalStatus=0b000010),之后无完成关闭的日志记录", "灶具三次使用均正常关闭,时长合理(23/45/22分钟),无遗忘关火", "入户门全天仅两次正常手动开锁,就寝前确认已锁定"], "recommended_actions": ["检查厨房温度传感器:确认其量程是否覆盖灶具工作时的环境温度,考虑固件升级或更换耐高温型号的传感器", "检查客厅窗帘电机及导轨:确认是否存在机械卡阻,手动测试全行程是否能正常完成,必要时清洁导轨或更换电机", "为厨房温度传感器设置 None 值告警规则,当连续报告空值时及时通知维护人员", "建议为独居老人增加定时健康确认机制——如长时间(如超过12小时)无任何运动传感器触发,自动通知紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.73944902420044, "api_error": null} {"episode_id": "SQ3_TP_D_0499", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0499.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20261128, "scenario_id": "EL-03", "total_events": 210, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "EL-03", "scenario_name": "忘记关火", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unattended_cooking_elderly", "key_evidence": ["灶具开着 + 厨房无人 + 老人在其他房间", "跟 FG-01 类似但在老人场景下更危险(认知衰退风险更高)"], "expected_response": "立即语音提醒老人关火", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-01T03:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨3:46灶具在无人看管状态下持续运行,且厨房温度传感器多次报告None值,存在火灾隐患和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨03:46厨房灶具开启,03:56厨房运动传感器显示无人(Occupancy=0),同时客厅检测到有人(03:56:10)。说明老人离开厨房去了客厅,但灶具仍在运行。\",\n \"推理步骤2: 04:06灶具仍处于开启状态(OnOff=True再次上报),此时厨房温度从约23°C飙升至28.07°C(MeasuredValue=2807),短时间内升高约5°C,这是灶具无人看管持续加热的明确信号。\",\n \"推理步骤3: 从03:46到04:30之间没有灶具关闭的记录,也没有厨房再次检测到人的记录。灶具无人看管时间至少超过34分钟(03:56人离开到04:30仍无关闭记录),对独居老人而言这是严重的火灾风险。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:03、06:28、10:54、11:41、16:51、17:26),共出现6次。正常传感器不应返回None,这表明传感器可能因高温或硬件故障导致读数异常,无法正常监测厨房温度,削弱了安全监控能力。\",\n \"推理步骤5: 凌晨3:46开灶做饭对独居老人来说是非常异常的时间点,可能反映睡眠障碍、认知功能下降或其他健康问题,需要关注。\",\n \"推理步骤6: 其余日常活动模式基本合理——05:34起床、06:02早餐烹饪、06:53出门、08:28回家、12:33午休、16:50晚餐准备、20:43就寝——但凌晨的异常活动和传感器故障是需要重点关注的安全隐患。\"\n ],\n \"key_evidence\": [\n \"03:46灶具开启 → 03:56厨房无人 → 04:06厨房温度飙升至28.07°C(2807),灶具无人看管超过34分钟\",\n \"厨房温度传感器在一天内6次报告MeasuredValue=None(06:03、06:28、10:54、11:41、16:51、17:26),表明设备故障\",\n \"凌晨03:46的异常烹饪活动时间,不符合正常独居老人作息\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器,确保其能正常监测温度,消除监控盲区\",\n \"为厨房灶具设置自动关闭规则:当厨房运动传感器超过10分钟无人时,自动关闭灶具并发送告警通知\",\n \"设置灶具使用时长上限(如30分钟),超时未手动确认则自动断电\",\n \"关注老人凌晨异常活动模式,建议家属或护理人员了解老人近期睡眠和认知状况,排查健康隐患\",\n \"考虑在厨房增加燃气泄漏检测器,与烟雾报警器形成多重安全防护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨3:46灶具在无人看管状态下持续运行,且厨房温度传感器多次报告None值,存在火灾隐患和设备故障双重风险。", "reasoning": ["推理步骤1: 凌晨03:46厨房灶具开启,03:56厨房运动传感器显示无人(Occupancy=0),同时客厅检测到有人(03:56:10)。说明老人离开厨房去了客厅,但灶具仍在运行。", "推理步骤2: 04:06灶具仍处于开启状态(OnOff=True再次上报),此时厨房温度从约23°C飙升至28.07°C(MeasuredValue=2807),短时间内升高约5°C,这是灶具无人看管持续加热的明确信号。", "推理步骤3: 从03:46到04:30之间没有灶具关闭的记录,也没有厨房再次检测到人的记录。灶具无人看管时间至少超过34分钟(03:56人离开到04:30仍无关闭记录),对独居老人而言这是严重的火灾风险。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:03、06:28、10:54、11:41、16:51、17:26),共出现6次。正常传感器不应返回None,这表明传感器可能因高温或硬件故障导致读数异常,无法正常监测厨房温度,削弱了安全监控能力。", "推理步骤5: 凌晨3:46开灶做饭对独居老人来说是非常异常的时间点,可能反映睡眠障碍、认知功能下降或其他健康问题,需要关注。", "推理步骤6: 其余日常活动模式基本合理——05:34起床、06:02早餐烹饪、06:53出门、08:28回家、12:33午休、16:50晚餐准备、20:43就寝——但凌晨的异常活动和传感器故障是需要重点关注的安全隐患。"], "key_evidence": ["03:46灶具开启 → 03:56厨房无人 → 04:06厨房温度飙升至28.07°C(2807),灶具无人看管超过34分钟", "厨房温度传感器在一天内6次报告MeasuredValue=None(06:03、06:28、10:54、11:41、16:51、17:26),表明设备故障", "凌晨03:46的异常烹饪活动时间,不符合正常独居老人作息"], "recommended_actions": ["立即检修或更换厨房温度传感器,确保其能正常监测温度,消除监控盲区", "为厨房灶具设置自动关闭规则:当厨房运动传感器超过10分钟无人时,自动关闭灶具并发送告警通知", "设置灶具使用时长上限(如30分钟),超时未手动确认则自动断电", "关注老人凌晨异常活动模式,建议家属或护理人员了解老人近期睡眠和认知状况,排查健康隐患", "考虑在厨房增加燃气泄漏检测器,与烟雾报警器形成多重安全防护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.395596981048584, "api_error": null} {"episode_id": "SQ3_TP_D_0501", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0501.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261130, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T18:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:03 入户门锁在短时间内连续出现4次远程/键盘解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 18:03:00 至 18:03:40 期间,front_door_lock 连续报告了 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应键盘/密码输入方式,OperationError=1 表示凭证无效,说明有人在反复尝试错误密码开锁。\",\n \"推理步骤2: 4 次失败尝试发生在不到 40 秒内(18:03:00、18:03:15、18:03:25、18:03:40),频率极高,符合暴力破解或试探性攻击的模式,而非老人偶尔输错密码的行为。\",\n \"推理步骤3: 18:03:50 门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"报警,即错误输入次数达到上限后的安全锁定告警,进一步确认这是一次密码暴力尝试。\",\n \"推理步骤4: 此时老人在家中(08:28 回家后一直有室内活动记录,未再出门),老人本人不需要从外部用密码开锁。结合 OperationSource=3(非手动钥匙、非内部操作),说明尝试者是外部人员。\",\n \"推理步骤5: 事件发生后门锁未被成功打开(无后续 LockState=2 解锁记录),入侵尝试未成功,但威胁真实存在。\",\n \"推理步骤6: 附带发现——厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:11、06:21、10:53、11:33、16:59、17:23),可能是传感器受高温干扰或存在设备故障,属于次要问题但值得关注。\"\n ],\n \"key_evidence\": [\n \"18:03:00-18:03:40 入户门锁连续 4 次 LockOperationError(OperationError=1, OperationSource=3),间隔仅 10-15 秒\",\n \"18:03:50 触发 DoorLockAlarm(AlarmCode=3),即错误密码次数超限报警\",\n \"老人 08:28 回家后未出门(无出门开锁/开门记录),排除本人在外操作的可能\",\n \"入侵未成功——事件后无 LockState=2(解锁)记录\"\n ],\n \"recommended_actions\": [\n \"立即通知老人及其紧急联系人(子女/社区),确认老人安全状况\",\n \"检查门外监控或可视门铃录像,确认 18:03 前后是否有可疑人员\",\n \"考虑临时启用门锁更高安全策略:缩短错误锁定时间窗口、降低允许错误次数、启用入侵告警推送\",\n \"如有条件,联系物业或社区安保巡查\",\n \"排查厨房温度传感器多次报告 None 值的问题,可能需要检修或更换传感器,避免在真正发生厨房高温危险时无法正常报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:03 入户门锁在短时间内连续出现4次远程/键盘解锁失败并触发防篡改报警,疑似有人尝试非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 18:03:00 至 18:03:40 期间,front_door_lock 连续报告了 4 次 LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3 通常对应键盘/密码输入方式,OperationError=1 表示凭证无效,说明有人在反复尝试错误密码开锁。\",\n \"推理步骤2: 4 次失败尝试发生在不到 40 秒内(18:03:00、18:03:15、18:03:25、18:03:40),频率极高,符合暴力破解或试探性攻击的模式,而非老人偶尔输错密码的行为。\",\n \"推理步骤3: 18:03:50 "], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 27.10650324821472, "api_error": null} {"episode_id": "SQ3_TP_D_0502", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0502.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261131, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-13T18:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器于18:31触发报警,且至日志结束未恢复,同时厨房温度传感器多次报告None值存在设备故障嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 18:31卫生间漏水传感器(bathroom_water_leak)报告StateValue=True并触发StateChange事件,表明检测到漏水。在此后直到23:30日志结束,未见该传感器恢复为False,说明漏水状态持续存在。\",\n \"推理步骤2: 漏水发生时(18:31),卫生间无人占用(上一次卫生间占用在06:07结束,下一次在20:23才出现),说明漏水并非由住户正常用水引起,更可能是管道渗漏或设备故障。\",\n \"推理步骤3: 住户在20:23进入卫生间,20:36离开,停留约13分钟,但漏水传感器仍未恢复正常,说明住户可能未注意到漏水问题,或漏水源头未被处理。对于独居老人,这存在滑倒风险和财产损失风险。\",\n \"推理步骤4: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(06:08、06:35、11:06、11:27、16:57、17:25),共出现6次。虽然灶具工作时可能因高温超出量程导致读数异常,但传感器应报告上限值而非None,这提示传感器可能存在故障或通信问题。\",\n \"推理步骤5: 其余行为模式正常——老人05:33起床、06:53出门晨练/买菜、08:27回家、12:23午休、13:55起床、16:56做晚饭、20:36就寝,符合独居老人的典型日常作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。08:27回家时门未上锁(仅开锁无对应之前的上锁记录),但老人出门时06:53有正常上锁,回来时手动开锁合理。\",\n \"推理步骤6: 温度趋势正常,呈现夏季典型的日间升温(最高约25.8°C)、夜间降温(最低约21.9°C)的规律,无异常温升,排除火灾风险。烟雾报警器全天无触发。\"\n ],\n \"key_evidence\": [\n \"18:31 bathroom_water_leak StateValue=True 触发漏水报警,直至23:30日志结束未恢复\",\n \"漏水触发时卫生间无人(上次占用06:07结束),非正常用水行为\",\n \"住户20:23-20:36进入卫生间但漏水仍未解除,老人可能未察觉\",\n \"厨房温度传感器在灶具使用期间6次报告None值,疑似设备故障\"\n ],\n \"recommended_actions\": [\n \"立即通知住户或其紧急联系人检查卫生间漏水情况,必要时关闭卫生间水阀\",\n \"安排人员检查卫生间地面积水情况,防止独居老人滑倒\",\n \"检查厨房温度传感器是否工作正常,确认是否需要更换或重新校准,确保其在灶具使用时能正常监测温度以防火灾\",\n \"考虑为卫生间加装自动关水阀,与漏水传感器联动,实现漏水自动止水\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器于18:31触发报警,且至日志结束未恢复,同时厨房温度传感器多次报告None值存在设备故障嫌疑。", "reasoning": ["推理步骤1: 18:31卫生间漏水传感器(bathroom_water_leak)报告StateValue=True并触发StateChange事件,表明检测到漏水。在此后直到23:30日志结束,未见该传感器恢复为False,说明漏水状态持续存在。", "推理步骤2: 漏水发生时(18:31),卫生间无人占用(上一次卫生间占用在06:07结束,下一次在20:23才出现),说明漏水并非由住户正常用水引起,更可能是管道渗漏或设备故障。", "推理步骤3: 住户在20:23进入卫生间,20:36离开,停留约13分钟,但漏水传感器仍未恢复正常,说明住户可能未注意到漏水问题,或漏水源头未被处理。对于独居老人,这存在滑倒风险和财产损失风险。", "推理步骤4: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(06:08、06:35、11:06、11:27、16:57、17:25),共出现6次。虽然灶具工作时可能因高温超出量程导致读数异常,但传感器应报告上限值而非None,这提示传感器可能存在故障或通信问题。", "推理步骤5: 其余行为模式正常——老人05:33起床、06:53出门晨练/买菜、08:27回家、12:23午休、13:55起床、16:56做晚饭、20:36就寝,符合独居老人的典型日常作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。08:27回家时门未上锁(仅开锁无对应之前的上锁记录),但老人出门时06:53有正常上锁,回来时手动开锁合理。", "推理步骤6: 温度趋势正常,呈现夏季典型的日间升温(最高约25.8°C)、夜间降温(最低约21.9°C)的规律,无异常温升,排除火灾风险。烟雾报警器全天无触发。"], "key_evidence": ["18:31 bathroom_water_leak StateValue=True 触发漏水报警,直至23:30日志结束未恢复", "漏水触发时卫生间无人(上次占用06:07结束),非正常用水行为", "住户20:23-20:36进入卫生间但漏水仍未解除,老人可能未察觉", "厨房温度传感器在灶具使用期间6次报告None值,疑似设备故障"], "recommended_actions": ["立即通知住户或其紧急联系人检查卫生间漏水情况,必要时关闭卫生间水阀", "安排人员检查卫生间地面积水情况,防止独居老人滑倒", "检查厨房温度传感器是否工作正常,确认是否需要更换或重新校准,确保其在灶具使用时能正常监测温度以防火灾", "考虑为卫生间加装自动关水阀,与漏水传感器联动,实现漏水自动止水"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.351418018341064, "api_error": null} {"episode_id": "SQ3_TP_D_0503", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0503.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261132, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-19T23:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且卧室窗帘在 23:02 发出关闭指令后持续处于运行状态未到达终点,疑似设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:51、06:24、10:55、11:40、17:06、17:27),共出现 6 次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在故障、过热保护触发或通信异常。\",\n \"推理步骤2: 卧室窗帘在 23:02:00 收到 DownOrClose 指令,OperationalStatus 持续为 0b000010(正在关闭),在 23:02:30 位置到达 5000(50%),但 23:03:00 仍报告 OperationalStatus = 0b000010,说明窗帘仍在运动中却未在合理时间内到达终点(0% 或 10000)。日志在此之后无窗帘到达终点的记录,可能存在机械卡阻或电机故障。\",\n \"推理步骤3: 老人的日常作息模式本身正常——05:30 起床、06:58 出门、08:28 回家、12:37 午休、14:03 起床、17:05 做晚饭、20:34 洗漱就寝,活动轨迹连贯合理,排除入侵和健康异常。\",\n \"推理步骤4: 入户门在 08:28 开锁进入后,直到 20:38 才有门锁自动上锁记录(LockState=1),期间门锁状态为未锁(LockState=2)。虽然老人在家期间不锁门可以理解,但对独居老人而言,长时间未锁门存在一定安全隐患。不过 20:38:17 门传感器报告 StateValue=True(门关闭)且自动上锁,说明就寝前门已锁好。\",\n \"推理步骤5: 温度趋势正常,符合夏季白天升温夜间降温的规律(客厅从 22.9°C 升至 25.8°C 再降回 23.4°C),烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(05:51、06:24、10:55、11:40、17:06、17:27),正常传感器不应返回空值\",\n \"卧室窗帘 23:02 收到关闭指令后,23:03 仍处于运动状态(OperationalStatus=0b000010),位置停留在 50%,后续无到达终点的记录,疑似卡阻\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致过热保护频繁触发;如持续出现 None 值建议更换传感器\",\n \"检查卧室窗帘电机及导轨:确认窗帘是否存在机械卡阻,清理导轨异物,必要时重新校准窗帘行程\",\n \"建议为厨房温度传感器设置 None 值告警规则,连续出现时自动通知家属或护理人员\",\n \"考虑为入户门锁设置在家模式的定时自动上锁策略,提升独居老人的居家安全性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且卧室窗帘在 23:02 发出关闭指令后持续处于运行状态未到达终点,疑似设备故障。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:51、06:24、10:55、11:40、17:06、17:27),共出现 6 次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在故障、过热保护触发或通信异常。", "推理步骤2: 卧室窗帘在 23:02:00 收到 DownOrClose 指令,OperationalStatus 持续为 0b000010(正在关闭),在 23:02:30 位置到达 5000(50%),但 23:03:00 仍报告 OperationalStatus = 0b000010,说明窗帘仍在运动中却未在合理时间内到达终点(0% 或 10000)。日志在此之后无窗帘到达终点的记录,可能存在机械卡阻或电机故障。", "推理步骤3: 老人的日常作息模式本身正常——05:30 起床、06:58 出门、08:28 回家、12:37 午休、14:03 起床、17:05 做晚饭、20:34 洗漱就寝,活动轨迹连贯合理,排除入侵和健康异常。", "推理步骤4: 入户门在 08:28 开锁进入后,直到 20:38 才有门锁自动上锁记录(LockState=1),期间门锁状态为未锁(LockState=2)。虽然老人在家期间不锁门可以理解,但对独居老人而言,长时间未锁门存在一定安全隐患。不过 20:38:17 门传感器报告 StateValue=True(门关闭)且自动上锁,说明就寝前门已锁好。", "推理步骤5: 温度趋势正常,符合夏季白天升温夜间降温的规律(客厅从 22.9°C 升至 25.8°C 再降回 23.4°C),烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。"], "key_evidence": ["厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(05:51、06:24、10:55、11:40、17:06、17:27),正常传感器不应返回空值", "卧室窗帘 23:02 收到关闭指令后,23:03 仍处于运动状态(OperationalStatus=0b000010),位置停留在 50%,后续无到达终点的记录,疑似卡阻"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致过热保护频繁触发;如持续出现 None 值建议更换传感器", "检查卧室窗帘电机及导轨:确认窗帘是否存在机械卡阻,清理导轨异物,必要时重新校准窗帘行程", "建议为厨房温度传感器设置 None 值告警规则,连续出现时自动通知家属或护理人员", "考虑为入户门锁设置在家模式的定时自动上锁策略,提升独居老人的居家安全性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.350647449493408, "api_error": null} {"episode_id": "SQ3_TP_D_0509", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0509.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261138, "scenario_id": "EL-03", "total_events": 210, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "EL-03", "scenario_name": "忘记关火", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unattended_cooking_elderly", "key_evidence": ["灶具开着 + 厨房无人 + 老人在其他房间", "跟 FG-01 类似但在老人场景下更危险(认知衰退风险更高)"], "expected_response": "立即语音提醒老人关火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-14T19:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人看管的情况下持续运行,且厨房温度出现异常飙升(31.14°C),存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:10 厨房灶具开启(OnOff=True),此时厨房有人(Occupancy=1)。但仅10分钟后(19:20),厨房运动传感器显示无人(Occupancy=0),老人移动到了客厅(19:20:10 living_room Occupancy=1)。\",\n \"推理步骤2: 灶具在19:10开启后,日志中直到当天结束都没有记录灶具关闭事件(OnOff=False)。对比当天早餐(06:09开→06:29关,约20分钟)、午餐(11:06开→11:31关,约25分钟)、晚餐(17:04开→17:24关,约20分钟)的正常使用模式,灶具均在30分钟内关闭。而19:10开启的这次至少持续到23:30仍未关闭,严重偏离正常模式。\",\n \"推理步骤3: 19:30 厨房温度传感器报告 MeasuredValue=3114(即31.14°C),而同一时刻客厅为24.44°C、卧室为23.41°C。厨房温度比其他房间高出约7°C,且此前厨房与客厅温差通常不超过1°C,说明灶具持续加热导致厨房温度异常升高。\",\n \"推理步骤4: 20:00之后厨房温度回落至24.00°C附近,但这可能是因为温度传感器的定时采样恢复了正常读数周期,并不代表灶具已关闭——日志中始终没有灶具关闭事件。\",\n \"推理步骤5: 老人约20:39进入卧室关灯就寝,说明其已完全忘记厨房灶具仍在运行。独居老人夜间熟睡时灶具无人看管,火灾风险极高。\",\n \"推理步骤6: 额外发现——厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:10、06:30、11:07、11:32、17:05、17:25),表明该传感器在高温环境下存在间歇性读数故障,降低了火灾预警的可靠性。\",\n \"推理步骤7: 08:26 老人回家后入户门一直未上锁(日志中无后续 LockOperationType=0 的上锁事件),直到20:39才自动上锁。白天长时间门锁未锁定虽非紧急威胁,但对独居老人存在安全隐患。不过当前最紧急的问题仍是灶具无人看管。\"\n ],\n \"key_evidence\": [\n \"19:10 灶具开启后至日志结束(23:30)无关闭记录,持续超过4小时\",\n \"19:20 厨房已无人(Occupancy=0),老人转移至客厅,灶具处于无人看管状态\",\n \"19:30 厨房温度飙升至31.14°C(3114),远超同时段客厅24.44°C和卧室23.41°C\",\n \"20:39 老人进入卧室就寝,完全未返回厨房关闭灶具\",\n \"厨房温度传感器多次报告None值,存在设备故障,削弱了火灾监测能力\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除火灾隐患\",\n \"通过紧急联系人或语音设备提醒老人灶具未关,确认老人安全状态\",\n \"设置自动化规则:当灶具开启且厨房无人超过5分钟时,自动发出警报并尝试关闭灶具\",\n \"检修厨房温度传感器,排查多次报告None值的故障原因,确保火灾预警链路可靠\",\n \"考虑为灶具设置最长运行时间限制(如30分钟自动断电),防止类似遗忘情况再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人看管的情况下持续运行,且厨房温度出现异常飙升(31.14°C),存在火灾风险。", "reasoning": ["推理步骤1: 19:10 厨房灶具开启(OnOff=True),此时厨房有人(Occupancy=1)。但仅10分钟后(19:20),厨房运动传感器显示无人(Occupancy=0),老人移动到了客厅(19:20:10 living_room Occupancy=1)。", "推理步骤2: 灶具在19:10开启后,日志中直到当天结束都没有记录灶具关闭事件(OnOff=False)。对比当天早餐(06:09开→06:29关,约20分钟)、午餐(11:06开→11:31关,约25分钟)、晚餐(17:04开→17:24关,约20分钟)的正常使用模式,灶具均在30分钟内关闭。而19:10开启的这次至少持续到23:30仍未关闭,严重偏离正常模式。", "推理步骤3: 19:30 厨房温度传感器报告 MeasuredValue=3114(即31.14°C),而同一时刻客厅为24.44°C、卧室为23.41°C。厨房温度比其他房间高出约7°C,且此前厨房与客厅温差通常不超过1°C,说明灶具持续加热导致厨房温度异常升高。", "推理步骤4: 20:00之后厨房温度回落至24.00°C附近,但这可能是因为温度传感器的定时采样恢复了正常读数周期,并不代表灶具已关闭——日志中始终没有灶具关闭事件。", "推理步骤5: 老人约20:39进入卧室关灯就寝,说明其已完全忘记厨房灶具仍在运行。独居老人夜间熟睡时灶具无人看管,火灾风险极高。", "推理步骤6: 额外发现——厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:10、06:30、11:07、11:32、17:05、17:25),表明该传感器在高温环境下存在间歇性读数故障,降低了火灾预警的可靠性。", "推理步骤7: 08:26 老人回家后入户门一直未上锁(日志中无后续 LockOperationType=0 的上锁事件),直到20:39才自动上锁。白天长时间门锁未锁定虽非紧急威胁,但对独居老人存在安全隐患。不过当前最紧急的问题仍是灶具无人看管。"], "key_evidence": ["19:10 灶具开启后至日志结束(23:30)无关闭记录,持续超过4小时", "19:20 厨房已无人(Occupancy=0),老人转移至客厅,灶具处于无人看管状态", "19:30 厨房温度飙升至31.14°C(3114),远超同时段客厅24.44°C和卧室23.41°C", "20:39 老人进入卧室就寝,完全未返回厨房关闭灶具", "厨房温度传感器多次报告None值,存在设备故障,削弱了火灾监测能力"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除火灾隐患", "通过紧急联系人或语音设备提醒老人灶具未关,确认老人安全状态", "设置自动化规则:当灶具开启且厨房无人超过5分钟时,自动发出警报并尝试关闭灶具", "检修厨房温度传感器,排查多次报告None值的故障原因,确保火灾预警链路可靠", "考虑为灶具设置最长运行时间限制(如30分钟自动断电),防止类似遗忘情况再次发生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.516346216201782, "api_error": null} {"episode_id": "SQ3_TP_D_0511", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0511.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261140, "scenario_id": "EL-02", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-02", "scenario_name": "居家意外(任意位置跌倒/晕倒)", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall_or_medical_emergency", "key_evidence": ["最后一次运动在非卧室房间(如客厅、厨房)", "随后异常长时间无任何活动", "不在正常午睡时段(比如上午10点或下午4点)"], "expected_response": "紧急联系老人,如无应答联系紧急联系人或120", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-07T02:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障;同时入户门在老人外出期间(08:39)未上锁长达约12小时,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:02、06:29、11:01、11:35、17:11、17:21),共出现6次。虽然灶具工作时局部高温可能导致传感器读数异常,但正常传感器应报告一个数值而非 None。这表明传感器可能在高温环境下出现故障或通信中断。对于独居老人家庭,厨房温度监控失效意味着无法及时检测火灾或过热风险。\",\n \"推理步骤2: 老人于 07:02 手动开锁出门(LockOperationType=1 为 Unlock),门关闭后自动上锁(07:02:14 Auto Lock)。但 08:39 老人回家时再次手动开锁进门,之后日志中未出现任何上锁事件。直到 20:41:15 才出现自动上锁记录。这意味着从 08:39 到 20:41 长达约12小时,入户门处于未锁定状态。对独居老人而言,这是一个安全隐患。\",\n \"推理步骤3: 凌晨 02:32 客厅运动传感器短暂触发(5秒内从1变为0),此时老人应在卧室睡觉。这可能是宠物、传感器误触发或窗帘晃动等原因,单独来看不构成入侵威胁,因为没有伴随门锁、门磁或其他区域的联动事件。但结合独居老人场景,值得关注。\",\n \"推理步骤4: 老人的整体作息模式基本正常——05:37 起床、06:01 做早餐、07:02 出门、08:39 回家、12:22 午休、13:58 起来活动、17:10 做晚餐、20:33 洗漱、20:41 就寝。活动节奏合理,各房间运动传感器的触发顺序符合正常生活动线。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约22°C,午间峰值约25°C),各房间温度走势一致,未见异常高温或骤变,排除火灾风险。所有烟雾报警器和漏水传感器均未触发,无火灾或水患迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:02、06:29、11:01、11:35、17:11、17:21 共6次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"08:39 入户门手动解锁后,直到 20:41:15 才出现自动上锁记录,期间约12小时门锁状态为未锁定\",\n \"凌晨 02:32 客厅运动传感器短暂触发5秒,此时老人应在卧室休息\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器(kitchen_temp_sensor),该设备在灶具工作时反复报告空值,可能已损坏或安装位置不当,无法在关键时刻提供温度监控\",\n \"为入户门锁配置自动上锁策略(如开锁后5分钟无操作自动锁定),避免长时间处于未锁定状态\",\n \"建议设置门锁未锁定超时告警,当门锁解锁超过一定时间后主动提醒老人或家属\",\n \"关注凌晨客厅的短暂运动触发事件,如反复出现建议检查传感器灵敏度或排查是否有外部因素干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障;同时入户门在老人外出期间(08:39)未上锁长达约12小时,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:02、06:29、11:01、11:35、17:11、17:21),共出现6次。虽然灶具工作时局部高温可能导致传感器读数异常,但正常传感器应报告一个数值而非 None。这表明传感器可能在高温环境下出现故障或通信中断。对于独居老人家庭,厨房温度监控失效意味着无法及时检测火灾或过热风险。", "推理步骤2: 老人于 07:02 手动开锁出门(LockOperationType=1 为 Unlock),门关闭后自动上锁(07:02:14 Auto Lock)。但 08:39 老人回家时再次手动开锁进门,之后日志中未出现任何上锁事件。直到 20:41:15 才出现自动上锁记录。这意味着从 08:39 到 20:41 长达约12小时,入户门处于未锁定状态。对独居老人而言,这是一个安全隐患。", "推理步骤3: 凌晨 02:32 客厅运动传感器短暂触发(5秒内从1变为0),此时老人应在卧室睡觉。这可能是宠物、传感器误触发或窗帘晃动等原因,单独来看不构成入侵威胁,因为没有伴随门锁、门磁或其他区域的联动事件。但结合独居老人场景,值得关注。", "推理步骤4: 老人的整体作息模式基本正常——05:37 起床、06:01 做早餐、07:02 出门、08:39 回家、12:22 午休、13:58 起来活动、17:10 做晚餐、20:33 洗漱、20:41 就寝。活动节奏合理,各房间运动传感器的触发顺序符合正常生活动线。", "推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约22°C,午间峰值约25°C),各房间温度走势一致,未见异常高温或骤变,排除火灾风险。所有烟雾报警器和漏水传感器均未触发,无火灾或水患迹象。"], "key_evidence": ["厨房温度传感器在 06:02、06:29、11:01、11:35、17:11、17:21 共6次报告 MeasuredValue = None,均发生在灶具使用前后", "08:39 入户门手动解锁后,直到 20:41:15 才出现自动上锁记录,期间约12小时门锁状态为未锁定", "凌晨 02:32 客厅运动传感器短暂触发5秒,此时老人应在卧室休息"], "recommended_actions": ["检查或更换厨房温度传感器(kitchen_temp_sensor),该设备在灶具工作时反复报告空值,可能已损坏或安装位置不当,无法在关键时刻提供温度监控", "为入户门锁配置自动上锁策略(如开锁后5分钟无操作自动锁定),避免长时间处于未锁定状态", "建议设置门锁未锁定超时告警,当门锁解锁超过一定时间后主动提醒老人或家属", "关注凌晨客厅的短暂运动触发事件,如反复出现建议检查传感器灵敏度或排查是否有外部因素干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.660560607910156, "api_error": null} {"episode_id": "SQ3_TP_D_0515", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0515.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261144, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-24T13:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"13:44 时段入户门锁遭受连续4次错误密码/凭证尝试并触发防篡改报警,疑似有人试图非法入侵,且老人当时独自在卧室午休。\",\n \"reasoning\": [\n \"推理步骤1: 在 13:44:00 至 13:44:40 的40秒内,front_door_lock 连续产生4次 LockOperationError(OperationError=1, OperationSource=3)。OperationError=1 表示凭证/密码错误,OperationSource=3 表示来自远程或键盘输入源。短时间内连续4次失败是典型的暴力破解或试探模式。\",\n \"推理步骤2: 紧接着在 13:44:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wrong Code Entry Limit\"报警,即错误输入次数超限触发的安全警报,进一步确认了恶意尝试。\",\n \"推理步骤3: 事件发生时老人正在卧室午休(12:36 卧室检测到占用且窗帘关闭至100%遮光),家中无其他住户(独居老人),且当天早晨 07:02 老人已外出、08:25 回家,说明老人此时在家。这排除了'老人自己忘带钥匙在门外尝试'的可能。\",\n \"推理步骤4: 入侵尝试未成功——13:44 之后没有 front_door_contact 的开门事件,也没有 entrance_occupancy 的触发,说明入侵者未能进入。老人在 13:59 起床活动(卧室占用→窗帘打开→客厅活动),生活节奏未被直接打断。\",\n \"推理步骤5: 附带发现——厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:05、06:38、11:07、11:31、16:54、17:24),共出现6次。这可能是传感器在高温环境下超量程或通信故障,属于设备异常,需要关注但不构成即时安全威胁。\"\n ],\n \"key_evidence\": [\n \"13:44:00-13:44:40:40秒内连续4次 LockOperationError(OperationError=1, OperationSource=3),密码/凭证错误\",\n \"13:44:50:触发 DoorLockAlarm(AlarmCode=3),错误输入次数超限报警\",\n \"事发时老人在卧室午休(12:36 卧室占用、窗帘全关),排除老人自身操作的可能\",\n \"入侵未成功:之后无门开启事件、无玄关运动检测\",\n \"厨房温度传感器在灶具使用期间多次返回 None,存在设备故障嫌疑\"\n ],\n \"recommended_actions\": [\n \"立即通知老人及其紧急联系人(子女/社区),告知门锁遭到非法尝试开启\",\n \"检查门锁操作日志中 OperationSource=3 的详细来源(是门锁键盘还是远程接口),确认攻击途径\",\n \"考虑临时加强安防:启用入户门摄像头(如有)、增加门锁错误尝试后的锁定时间、启用入侵检测联动报警\",\n \"建议更换门锁密码,并检查是否有远程访问凭证泄露\",\n \"安排检修厨房温度传感器,排查其在灶具使用时频繁报告 None 的原因,确保火灾预警功能正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"13:44 时段入户门锁遭受连续4次错误密码/凭证尝试并触发防篡改报警,疑似有人试图非法入侵,且老人当时独自在卧室午休。\",\n \"reasoning\": [\n \"推理步骤1: 在 13:44:00 至 13:44:40 的40秒内,front_door_lock 连续产生4次 LockOperationError(OperationError=1, OperationSource=3)。OperationError=1 表示凭证/密码错误,OperationSource=3 表示来自远程或键盘输入源。短时间内连续4次失败是典型的暴力破解或试探模式。\",\n \"推理步骤2: 紧接着在 13:44:50,门锁触发了 DoorLockAlarm(AlarmCode=3)。AlarmCode=3 在 Matter DoorLock Cluster 中对应\"Wron"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 27.142482042312622, "api_error": null} {"episode_id": "SQ3_TP_D_0518", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0518.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261147, "scenario_id": "DF-04", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-06T21:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时入户门锁在已锁定状态下被重复发送锁门指令并触发告警,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:51、06:35、11:11、11:41、17:10、17:31),共计6次。正常传感器即使受灶具热量影响也应报告数值(哪怕超量程),而非 None。这表明传感器可能存在通信故障或硬件异常。\",\n \"推理步骤2: 在 21:35,入户门锁在5秒内连续收到两次 LockDoor 命令,且门锁已处于锁定状态(LockState=2)。第二次锁门后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败或死锁告警。此时老人已在卧室就寝(20:35 卧室有活动),重复锁门指令来源不明,可能是自动化规则异常或远程误操作。\",\n \"推理步骤3: 08:32 老人回家后,入户门未被锁上(无 LockDoor 事件),直到 20:35 才自动上锁。这意味着白天约12小时入户门处于未锁状态,对独居老人存在一定安全隐患,但考虑到老人白天在家活动,风险可控。\",\n \"推理步骤4: 老人的日常作息模式基本正常——05:29起床、05:49洗漱、05:50做早餐、06:59出门、08:32回家、12:20午休、14:10起床、17:09做晚餐、20:23洗漱、20:35就寝。活动节奏合理,未发现长时间无活动的健康异常信号。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温-夜间降温曲线(卧室约21.9°C~24.8°C,客厅约22.9°C~25.9°C,厨房约22.9°C~25.8°C),未出现异常高温,烟雾报警器和漏水传感器均未触发,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:51、06:35、11:11、11:41、17:10、17:31 共6次报告 MeasuredValue = None,与灶具开关操作时间高度关联,疑似受热或通信干扰导致故障\",\n \"21:35:00 和 21:35:10 入户门锁在10秒内收到两次 LockDoor 命令,第二次触发 DoorLockAlarm(AlarmCode=0) 告警\",\n \"08:32 至 20:35 期间入户门未上锁约12小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器\",\n \"排查 21:35 重复锁门指令的来源(自动化规则或远程控制),修复导致重复触发的逻辑,并确认 AlarmCode=0 的具体含义以排除机械故障\",\n \"建议设置自动化规则:老人在家时入户门自动上锁,避免长时间未锁门的安全隐患\",\n \"考虑为独居老人增加定时活动检测规则:若超过一定时间(如2小时)全屋无任何运动传感器触发,自动向紧急联系人发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时入户门锁在已锁定状态下被重复发送锁门指令并触发告警,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:51、06:35、11:11、11:41、17:10、17:31),共计6次。正常传感器即使受灶具热量影响也应报告数值(哪怕超量程),而非 None。这表明传感器可能存在通信故障或硬件异常。", "推理步骤2: 在 21:35,入户门锁在5秒内连续收到两次 LockDoor 命令,且门锁已处于锁定状态(LockState=2)。第二次锁门后触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 通常表示锁定失败或死锁告警。此时老人已在卧室就寝(20:35 卧室有活动),重复锁门指令来源不明,可能是自动化规则异常或远程误操作。", "推理步骤3: 08:32 老人回家后,入户门未被锁上(无 LockDoor 事件),直到 20:35 才自动上锁。这意味着白天约12小时入户门处于未锁状态,对独居老人存在一定安全隐患,但考虑到老人白天在家活动,风险可控。", "推理步骤4: 老人的日常作息模式基本正常——05:29起床、05:49洗漱、05:50做早餐、06:59出门、08:32回家、12:20午休、14:10起床、17:09做晚餐、20:23洗漱、20:35就寝。活动节奏合理,未发现长时间无活动的健康异常信号。", "推理步骤5: 温度数据整体呈现正常的日间升温-夜间降温曲线(卧室约21.9°C~24.8°C,客厅约22.9°C~25.9°C,厨房约22.9°C~25.8°C),未出现异常高温,烟雾报警器和漏水传感器均未触发,排除火灾和漏水风险。"], "key_evidence": ["厨房温度传感器在 05:51、06:35、11:11、11:41、17:10、17:31 共6次报告 MeasuredValue = None,与灶具开关操作时间高度关联,疑似受热或通信干扰导致故障", "21:35:00 和 21:35:10 入户门锁在10秒内收到两次 LockDoor 命令,第二次触发 DoorLockAlarm(AlarmCode=0) 告警", "08:32 至 20:35 期间入户门未上锁约12小时"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器", "排查 21:35 重复锁门指令的来源(自动化规则或远程控制),修复导致重复触发的逻辑,并确认 AlarmCode=0 的具体含义以排除机械故障", "建议设置自动化规则:老人在家时入户门自动上锁,避免长时间未锁门的安全隐患", "考虑为独居老人增加定时活动检测规则:若超过一定时间(如2小时)全屋无任何运动传感器触发,自动向紧急联系人发送提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.958263397216797, "api_error": null} {"episode_id": "SQ3_TP_D_0521", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0521.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261150, "scenario_id": "DF-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-27T17:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器发生硬件故障,丧失烟雾/CO检测能力,对独居老人构成严重安全隐患;同时厨房温度传感器多次报告 null 值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 17:04 客厅烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5(硬件故障状态)并触发 HardwareFault 事件,表明该设备已无法正常工作。对于独居老人家庭,烟雾/CO报警器是关键安全设备,故障意味着火灾或一氧化碳泄漏时无法预警。\",\n \"推理步骤2: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(05:54、06:29、11:05、11:21、16:52、17:22),共出现6次。虽然部分 null 值可能与灶具高温干扰有关,但在灶具关闭后(06:29、11:21、17:22)仍立即报告 None,说明传感器本身可能存在间歇性故障。厨房温度传感器是辅助检测灶具异常升温的重要手段,故障会削弱厨房安全监控能力。\",\n \"推理步骤3: 老人的日常活动模式本身正常——05:23起床、05:30如厕、05:53做早餐、07:07外出、08:27回家、12:31午休、16:51做晚餐、20:37就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤4: 全天温度变化呈现正常的日间升温-夜间降温曲线(卧室约22°C~25°C,客厅约23°C~26°C),无异常温升,排除火灾风险。漏水传感器全天无报警,水管安全。\",\n \"推理步骤5: 综合来看,住户行为正常、无入侵或火灾迹象,但两个关键安全设备存在故障:客厅烟雾报警器已确认硬件故障,厨房温度传感器间歇性失效。在独居老人场景下,这些设备故障会显著降低家庭安全防护等级,需要优先处理。\"\n ],\n \"key_evidence\": [\n \"17:04 living_room_smoke_alarm 上报 HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault(),确认硬件故障\",\n \"厨房温度传感器在 05:54、06:29、11:05、11:21、16:52、17:22 共6次报告 MeasuredValue=None,包括灶具关闭后仍报 None 的情况\",\n \"客厅烟雾报警器故障后至日志结束(17:04~23:30)未见恢复事件,说明故障持续存在\",\n \"该家庭为独居老人,烟雾报警器和温度传感器是防火防灾的关键设备\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换客厅烟雾报警器(living_room_smoke_alarm),在修复前确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为临时替代监控\",\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温干扰,或传感器本身存在硬件问题,必要时更换\",\n \"考虑为独居老人增设备用烟雾报警器,避免单点故障导致安全盲区\",\n \"通知老人的家属或紧急联系人,告知当前烟雾报警器处于故障状态,提醒用火安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器发生硬件故障,丧失烟雾/CO检测能力,对独居老人构成严重安全隐患;同时厨房温度传感器多次报告 null 值,存在传感器故障风险。", "reasoning": ["推理步骤1: 17:04 客厅烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5(硬件故障状态)并触发 HardwareFault 事件,表明该设备已无法正常工作。对于独居老人家庭,烟雾/CO报警器是关键安全设备,故障意味着火灾或一氧化碳泄漏时无法预警。", "推理步骤2: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(05:54、06:29、11:05、11:21、16:52、17:22),共出现6次。虽然部分 null 值可能与灶具高温干扰有关,但在灶具关闭后(06:29、11:21、17:22)仍立即报告 None,说明传感器本身可能存在间歇性故障。厨房温度传感器是辅助检测灶具异常升温的重要手段,故障会削弱厨房安全监控能力。", "推理步骤3: 老人的日常活动模式本身正常——05:23起床、05:30如厕、05:53做早餐、07:07外出、08:27回家、12:31午休、16:51做晚餐、20:37就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤4: 全天温度变化呈现正常的日间升温-夜间降温曲线(卧室约22°C~25°C,客厅约23°C~26°C),无异常温升,排除火灾风险。漏水传感器全天无报警,水管安全。", "推理步骤5: 综合来看,住户行为正常、无入侵或火灾迹象,但两个关键安全设备存在故障:客厅烟雾报警器已确认硬件故障,厨房温度传感器间歇性失效。在独居老人场景下,这些设备故障会显著降低家庭安全防护等级,需要优先处理。"], "key_evidence": ["17:04 living_room_smoke_alarm 上报 HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault(),确认硬件故障", "厨房温度传感器在 05:54、06:29、11:05、11:21、16:52、17:22 共6次报告 MeasuredValue=None,包括灶具关闭后仍报 None 的情况", "客厅烟雾报警器故障后至日志结束(17:04~23:30)未见恢复事件,说明故障持续存在", "该家庭为独居老人,烟雾报警器和温度传感器是防火防灾的关键设备"], "recommended_actions": ["立即检查或更换客厅烟雾报警器(living_room_smoke_alarm),在修复前确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为临时替代监控", "检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温干扰,或传感器本身存在硬件问题,必要时更换", "考虑为独居老人增设备用烟雾报警器,避免单点故障导致安全盲区", "通知老人的家属或紧急联系人,告知当前烟雾报警器处于故障状态,提醒用火安全"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.43077540397644, "api_error": null} {"episode_id": "SQ3_TP_D_0522", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0522.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261151, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-21T07:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时客厅窗帘在关闭指令后持续处于运动状态未到达目标位置,疑似机械卡住。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:20 起床、05:49 如厕、06:10 做早餐、06:58 出门、08:34 回家、12:20 午休、13:55 起床、17:07 做晚餐、20:25 洗漱、20:39 就寝。这是一个非常规律且合理的独居老人日常作息,未发现入侵或健康异常迹象。\",\n \"推理步骤2: 入户门安全分析——全天仅有两次开门记录(06:58 出门、08:34 回家),均为 Manual 操作且门锁在关门后自动上锁(LockState=1)。20:39 有一次门锁确认上锁事件,说明睡前门处于锁定状态。无异常开锁或未授权访问。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:10-06:36、10:57-11:29、17:07-17:37),厨房温度传感器均在灶具开启后约1分钟报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。正常传感器应报告升高的温度数值而非空值。这表明传感器可能在高温环境下出现通信中断或硬件故障。这对独居老人尤其危险——如果灶具忘关导致温度异常升高,传感器无法提供有效报警数据。\",\n \"推理步骤4: 客厅窗帘异常——07:19 收到 DownOrClose 指令后,窗帘 OperationalStatus 持续为 0b000010(表示正在向下运动),在 07:19:30 时位置仅到 50%(5000/10000),07:20:00 仍显示运动中状态,之后再无该设备的状态更新。正常情况下窗帘应在合理时间内到达目标位置并报告 OperationalStatus=0(停止)。缺少最终停止状态,可能是窗帘电机卡住或轨道阻塞。\",\n \"推理步骤5: 温度趋势分析——全天温度从夜间约 22-23°C 升至午间约 25-26°C,傍晚逐步回落,符合夏季(6月)自然温度变化规律。各房间温差合理(卧室略低于客厅和厨房)。未发现异常高温或火灾迹象。\",\n \"推理步骤6: 烟雾报警器和漏水传感器全天无触发记录,无火灾或漏水风险。\",\n \"推理步骤7: 综合评估——无入侵、无火灾、无漏水、无健康异常(老人活动规律正常),但存在两个设备级故障:厨房温度传感器在高温时失效(安全隐患较大)和客厅窗帘可能卡住(安全隐患较小)。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:11、06:37、10:58、11:30、17:08、17:38)共6次报告 MeasuredValue = None,而非正常温度数值\",\n \"客厅窗帘 07:19 执行 DownOrClose 后,07:20:00 仍处于运动状态(OperationalStatus=0b000010),位置停留在 50%,之后无到达终点或停止的状态更新\"\n ],\n \"recommended_actions\": [\n \"优先检修或更换厨房温度传感器——该传感器在灶具使用时失效,意味着如果发生灶具忘关等危险情况,系统无法通过温度数据及时报警,对独居老人构成安全盲区\",\n \"检查客厅窗帘轨道和电机,清理可能的异物阻塞,确认窗帘能正常运行到目标位置并报告停止状态\",\n \"考虑为厨房灶具增加自动关闭规则(如灶具开启超过45分钟且无人活动时自动关闭),作为温度传感器失效期间的补充安全措施\",\n \"建议设置设备健康监测告警,当传感器连续报告 None 值时主动通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时客厅窗帘在关闭指令后持续处于运动状态未到达目标位置,疑似机械卡住。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:20 起床、05:49 如厕、06:10 做早餐、06:58 出门、08:34 回家、12:20 午休、13:55 起床、17:07 做晚餐、20:25 洗漱、20:39 就寝。这是一个非常规律且合理的独居老人日常作息,未发现入侵或健康异常迹象。", "推理步骤2: 入户门安全分析——全天仅有两次开门记录(06:58 出门、08:34 回家),均为 Manual 操作且门锁在关门后自动上锁(LockState=1)。20:39 有一次门锁确认上锁事件,说明睡前门处于锁定状态。无异常开锁或未授权访问。", "推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:10-06:36、10:57-11:29、17:07-17:37),厨房温度传感器均在灶具开启后约1分钟报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None。正常传感器应报告升高的温度数值而非空值。这表明传感器可能在高温环境下出现通信中断或硬件故障。这对独居老人尤其危险——如果灶具忘关导致温度异常升高,传感器无法提供有效报警数据。", "推理步骤4: 客厅窗帘异常——07:19 收到 DownOrClose 指令后,窗帘 OperationalStatus 持续为 0b000010(表示正在向下运动),在 07:19:30 时位置仅到 50%(5000/10000),07:20:00 仍显示运动中状态,之后再无该设备的状态更新。正常情况下窗帘应在合理时间内到达目标位置并报告 OperationalStatus=0(停止)。缺少最终停止状态,可能是窗帘电机卡住或轨道阻塞。", "推理步骤5: 温度趋势分析——全天温度从夜间约 22-23°C 升至午间约 25-26°C,傍晚逐步回落,符合夏季(6月)自然温度变化规律。各房间温差合理(卧室略低于客厅和厨房)。未发现异常高温或火灾迹象。", "推理步骤6: 烟雾报警器和漏水传感器全天无触发记录,无火灾或漏水风险。", "推理步骤7: 综合评估——无入侵、无火灾、无漏水、无健康异常(老人活动规律正常),但存在两个设备级故障:厨房温度传感器在高温时失效(安全隐患较大)和客厅窗帘可能卡住(安全隐患较小)。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:11、06:37、10:58、11:30、17:08、17:38)共6次报告 MeasuredValue = None,而非正常温度数值", "客厅窗帘 07:19 执行 DownOrClose 后,07:20:00 仍处于运动状态(OperationalStatus=0b000010),位置停留在 50%,之后无到达终点或停止的状态更新"], "recommended_actions": ["优先检修或更换厨房温度传感器——该传感器在灶具使用时失效,意味着如果发生灶具忘关等危险情况,系统无法通过温度数据及时报警,对独居老人构成安全盲区", "检查客厅窗帘轨道和电机,清理可能的异物阻塞,确认窗帘能正常运行到目标位置并报告停止状态", "考虑为厨房灶具增加自动关闭规则(如灶具开启超过45分钟且无人活动时自动关闭),作为温度传感器失效期间的补充安全措施", "建议设置设备健康监测告警,当传感器连续报告 None 值时主动通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.779059410095215, "api_error": null} {"episode_id": "SQ3_TP_D_0533", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0533.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20261162, "scenario_id": "EL-04", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-04", "scenario_name": "起床时间异常推迟", "category": "elderly_specific", "is_anomaly": true, "threat_type": "abnormal_inactivity", "key_evidence": ["与老人的日常作息规律(daily_routines 中的 elderly 画像)显著偏离", "不是周末睡懒觉(老人每天作息一样)", "全屋完全无活动信号"], "expected_response": "上午8点后联系老人确认状况", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-23T08:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天活动时间线——老人约05:30起床如厕,06:06进厨房做早餐(灶具06:06~06:23),07:02出门(手动开锁、门开关、自动上锁),08:26回家,11:07做午餐(灶具11:07~11:39),12:24午休(卧室窗帘关闭),14:07起床,16:54做晚餐(灶具16:54~17:24),19:29在客厅调暗灯光看电视,20:37洗漱后20:48回卧室就寝。整体作息规律,符合独居老人的典型生活模式。\",\n \"推理步骤2: 入侵分析——08:26的入户门开启事件发生在老人外出后约1.5小时,操作方式为Manual手动开锁,随后客厅运动传感器触发、客厅灯打开,之后生活轨迹连续(做饭、午休、晚餐、就寝),高度吻合老人本人回家。07:02出门时门自动上锁,20:48就寝前门状态确认为关闭并自动上锁。全天无异常时段的门锁/门磁事件,无入侵迹象。\",\n \"推理步骤3: 火灾风险分析——灶具三次使用时长分别为约17分钟、32分钟、30分钟,均在合理范围内,且每次都有人在厨房(kitchen_occupancy=1)。烟雾报警器全天未触发。灶具使用后均正常关闭,无遗忘关火的情况。\",\n \"推理步骤4: 漏水分析——卫生间和厨房的漏水传感器全天无任何报告,无漏水风险。\",\n \"推理步骤5: 设备故障分析——厨房温度传感器在灶具开启期间出现了多次 MeasuredValue = None 的异常读数:06:07(灶具开启后1分钟)、06:24(灶具关闭后1分钟)、11:08(灶具开启后30秒)、11:40(灶具关闭后1分钟)、16:55(灶具开启后30秒)、17:25(灶具关闭后1分钟)。共6次 None 值,全部集中在灶具操作前后。而在非烹饪时段,该传感器读数正常。这说明传感器可能因灶具产生的高温或蒸汽干扰而暂时失效,或者传感器本身存在间歇性故障。\",\n \"推理步骤6: 健康关注分析——老人全天活动轨迹连贯,起床、如厕、做饭、出门、回家、午休、晚餐、就寝各环节之间的时间间隔和运动传感器触发序列合理,未出现长时间无活动或异常滞留某区域的情况。卫生间使用时间(05:30~06:06约36分钟早晨,20:37~20:48约11分钟晚间)在正常范围内。\",\n \"推理步骤7: 综合判断——虽然整体生活模式正常、无入侵或火灾风险,但厨房温度传感器的反复 None 值是一个需要关注的设备问题。对于独居老人家庭,厨房温度监控是火灾预警的重要环节,传感器在灶具使用时恰好失效会形成监控盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共出现6次 MeasuredValue = None(06:07、06:24、11:08、11:40、16:55、17:25),而非烹饪时段读数正常\",\n \"None 值与灶具开关操作高度相关——每次灶具 OnOff 状态变化后约30秒~1分钟即出现 None 读数\",\n \"其他两个温度传感器(客厅、卧室)全天读数正常,排除系统性问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰,必要时调整安装位置\",\n \"对厨房温度传感器进行硬件检测或固件更新,排除间歇性故障\",\n \"在传感器修复前,考虑增加厨房烟雾报警器的灵敏度或增设额外的温度监测手段,确保灶具使用期间的安全监控不中断\",\n \"建议为独居老人设置灶具使用超时自动提醒(如超过45分钟未关闭则告警),作为额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的安全监控构成隐患。", "reasoning": ["推理步骤1: 梳理全天活动时间线——老人约05:30起床如厕,06:06进厨房做早餐(灶具06:06~06:23),07:02出门(手动开锁、门开关、自动上锁),08:26回家,11:07做午餐(灶具11:07~11:39),12:24午休(卧室窗帘关闭),14:07起床,16:54做晚餐(灶具16:54~17:24),19:29在客厅调暗灯光看电视,20:37洗漱后20:48回卧室就寝。整体作息规律,符合独居老人的典型生活模式。", "推理步骤2: 入侵分析——08:26的入户门开启事件发生在老人外出后约1.5小时,操作方式为Manual手动开锁,随后客厅运动传感器触发、客厅灯打开,之后生活轨迹连续(做饭、午休、晚餐、就寝),高度吻合老人本人回家。07:02出门时门自动上锁,20:48就寝前门状态确认为关闭并自动上锁。全天无异常时段的门锁/门磁事件,无入侵迹象。", "推理步骤3: 火灾风险分析——灶具三次使用时长分别为约17分钟、32分钟、30分钟,均在合理范围内,且每次都有人在厨房(kitchen_occupancy=1)。烟雾报警器全天未触发。灶具使用后均正常关闭,无遗忘关火的情况。", "推理步骤4: 漏水分析——卫生间和厨房的漏水传感器全天无任何报告,无漏水风险。", "推理步骤5: 设备故障分析——厨房温度传感器在灶具开启期间出现了多次 MeasuredValue = None 的异常读数:06:07(灶具开启后1分钟)、06:24(灶具关闭后1分钟)、11:08(灶具开启后30秒)、11:40(灶具关闭后1分钟)、16:55(灶具开启后30秒)、17:25(灶具关闭后1分钟)。共6次 None 值,全部集中在灶具操作前后。而在非烹饪时段,该传感器读数正常。这说明传感器可能因灶具产生的高温或蒸汽干扰而暂时失效,或者传感器本身存在间歇性故障。", "推理步骤6: 健康关注分析——老人全天活动轨迹连贯,起床、如厕、做饭、出门、回家、午休、晚餐、就寝各环节之间的时间间隔和运动传感器触发序列合理,未出现长时间无活动或异常滞留某区域的情况。卫生间使用时间(05:30~06:06约36分钟早晨,20:37~20:48约11分钟晚间)在正常范围内。", "推理步骤7: 综合判断——虽然整体生活模式正常、无入侵或火灾风险,但厨房温度传感器的反复 None 值是一个需要关注的设备问题。对于独居老人家庭,厨房温度监控是火灾预警的重要环节,传感器在灶具使用时恰好失效会形成监控盲区。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共出现6次 MeasuredValue = None(06:07、06:24、11:08、11:40、16:55、17:25),而非烹饪时段读数正常", "None 值与灶具开关操作高度相关——每次灶具 OnOff 状态变化后约30秒~1分钟即出现 None 读数", "其他两个温度传感器(客厅、卧室)全天读数正常,排除系统性问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰,必要时调整安装位置", "对厨房温度传感器进行硬件检测或固件更新,排除间歇性故障", "在传感器修复前,考虑增加厨房烟雾报警器的灵敏度或增设额外的温度监测手段,确保灶具使用期间的安全监控不中断", "建议为独居老人设置灶具使用超时自动提醒(如超过45分钟未关闭则告警),作为额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.02439069747925, "api_error": null} {"episode_id": "SQ3_TP_D_0534", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0534.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261163, "scenario_id": "EL-05", "total_events": 215, "anomaly_events_count": 11}, "ground_truth": {"scenario_id": "EL-05", "scenario_name": "夜间频繁起夜", "category": "elderly_specific", "is_anomaly": true, "threat_type": "health_concern", "key_evidence": ["一晚4次以上卧室→卫生间往返", "间隔越来越短", "可能的健康问题:泌尿系统感染、前列腺问题、糖尿病等"], "expected_response": "非紧急但需要记录,建议子女/看护者关注,如连续多天则建议就医", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T11:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:36 起床、05:40 如厕、05:50 做早餐、07:02 出门、08:25 回家、12:23 午休、14:05 起床、16:58 做晚餐、20:35 洗漱、20:54 就寝。这是一个非常规律且合理的独居老人日常作息,无异常行为模式。\",\n \"推理步骤2: 入侵风险排查——全天仅有两次开门事件(07:02 出门、08:25 回家),均为手动解锁后自动上锁,门锁状态转换完整(Unlock→门开→门关→Auto Lock)。20:54 还有一次确认门已关闭并自动上锁的事件。无未授权开锁或异常时段的门窗事件。\",\n \"推理步骤3: 火灾风险排查——灶具三次使用时长分别约为 50 分钟(05:50-06:40)、35 分钟(10:52-11:27)、23 分钟(16:58-17:21),均在合理烹饪时长范围内,且每次使用时厨房运动传感器均检测到有人。烟雾报警器全天未触发。无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——每次灶具开启后约 30 秒至 1 分钟,kitchen_temp_sensor 就报告 MeasuredValue = None(05:51、10:53、16:59),灶具关闭后约 1 分钟再次报告 None(06:41、11:28、17:22)。这种与灶具使用完全同步的 None 值模式高度可疑,说明传感器在灶具工作时无法正常测量温度,可能是热源干扰导致超量程,或传感器本身存在硬件故障。\",\n \"推理步骤5: 温度趋势分析——全屋温度呈现正常的日间升温、夜间降温曲线(卧室夜间约 22°C,午间峰值约 25.5°C),各房间温差合理,空调全天未开启(夏季温度尚可接受)。无异常温升。\",\n \"推理步骤6: 漏水与健康风险排查——漏水传感器全天无报警。老人活动轨迹连贯,无长时间滞留卫生间或跌倒迹象(卫生间两次使用分别约 10 分钟和 19 分钟,均正常)。\",\n \"推理步骤7: 安全隐患评估——虽然厨房温度传感器故障本身不构成即时危险,但对于独居老人而言,该传感器是灶具使用安全的重要监测手段。如果传感器在灶具使用时失效,将无法及时检测到厨房异常高温,降低了火灾预警能力。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:51:04、10:53:00、16:59:00),灶具关闭后也各出现一次 None(06:41:00、11:28:00、17:22:00),共 6 次异常读数\",\n \"None 值出现时间与灶具 OnOff 状态变化高度相关(开启后约 30-60 秒、关闭后约 1 分钟),非灶具使用时段传感器读数正常\",\n \"入户门锁全天操作记录完整,08:25 回家后门未再开启直至次日,20:54 确认门已锁定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热源干扰或超出测量量程\",\n \"对厨房温度传感器进行硬件检测或固件更新,排除传感器本身故障\",\n \"在传感器修复前,考虑为灶具设置自动关闭定时器(如超过 60 分钟未手动操作则自动断气/断电),作为补偿性安全措施\",\n \"建议增加厨房燃气泄漏传感器作为额外安全冗余\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:36 起床、05:40 如厕、05:50 做早餐、07:02 出门、08:25 回家、12:23 午休、14:05 起床、16:58 做晚餐、20:35 洗漱、20:54 就寝。这是一个非常规律且合理的独居老人日常作息,无异常行为模式。", "推理步骤2: 入侵风险排查——全天仅有两次开门事件(07:02 出门、08:25 回家),均为手动解锁后自动上锁,门锁状态转换完整(Unlock→门开→门关→Auto Lock)。20:54 还有一次确认门已关闭并自动上锁的事件。无未授权开锁或异常时段的门窗事件。", "推理步骤3: 火灾风险排查——灶具三次使用时长分别约为 50 分钟(05:50-06:40)、35 分钟(10:52-11:27)、23 分钟(16:58-17:21),均在合理烹饪时长范围内,且每次使用时厨房运动传感器均检测到有人。烟雾报警器全天未触发。无火灾风险。", "推理步骤4: 厨房温度传感器异常——每次灶具开启后约 30 秒至 1 分钟,kitchen_temp_sensor 就报告 MeasuredValue = None(05:51、10:53、16:59),灶具关闭后约 1 分钟再次报告 None(06:41、11:28、17:22)。这种与灶具使用完全同步的 None 值模式高度可疑,说明传感器在灶具工作时无法正常测量温度,可能是热源干扰导致超量程,或传感器本身存在硬件故障。", "推理步骤5: 温度趋势分析——全屋温度呈现正常的日间升温、夜间降温曲线(卧室夜间约 22°C,午间峰值约 25.5°C),各房间温差合理,空调全天未开启(夏季温度尚可接受)。无异常温升。", "推理步骤6: 漏水与健康风险排查——漏水传感器全天无报警。老人活动轨迹连贯,无长时间滞留卫生间或跌倒迹象(卫生间两次使用分别约 10 分钟和 19 分钟,均正常)。", "推理步骤7: 安全隐患评估——虽然厨房温度传感器故障本身不构成即时危险,但对于独居老人而言,该传感器是灶具使用安全的重要监测手段。如果传感器在灶具使用时失效,将无法及时检测到厨房异常高温,降低了火灾预警能力。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:51:04、10:53:00、16:59:00),灶具关闭后也各出现一次 None(06:41:00、11:28:00、17:22:00),共 6 次异常读数", "None 值出现时间与灶具 OnOff 状态变化高度相关(开启后约 30-60 秒、关闭后约 1 分钟),非灶具使用时段传感器读数正常", "入户门锁全天操作记录完整,08:25 回家后门未再开启直至次日,20:54 确认门已锁定"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热源干扰或超出测量量程", "对厨房温度传感器进行硬件检测或固件更新,排除传感器本身故障", "在传感器修复前,考虑为灶具设置自动关闭定时器(如超过 60 分钟未手动操作则自动断气/断电),作为补偿性安全措施", "建议增加厨房燃气泄漏传感器作为额外安全冗余"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.196592092514038, "api_error": null} {"episode_id": "SQ3_TP_D_0536", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0536.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20261165, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-20T05:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨5:17触发报警,且整日未见复位,存在持续漏水风险;同时入户门在08:30后长时间未关闭/未锁定,需要关注。\",\n \"reasoning\": [\n \"推理步骤1: 05:17卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。此时为凌晨,老人尚在睡眠中(卧室运动传感器直到05:40才检测到活动)。\",\n \"推理步骤2: 在整个24小时日志中,未见 bathroom_water_leak 恢复为 StateValue=False 的记录,说明漏水状态可能持续了一整天未被处理。\",\n \"推理步骤3: 老人05:46进入卫生间使用约9分钟后离开,但日志中没有任何针对漏水的处理动作(如关闭水阀),老人可能未注意到漏水报警。\",\n \"推理步骤4: 08:30入户门被手动解锁(LockOperationType=1)、门被打开(StateValue=False),之后有人进入客厅(entrance_occupancy和living_room_occupancy触发),但日志中始终未见该次开门后的关门记录(front_door_contact 未恢复为 True)和重新上锁记录,直到20:55才出现门关闭并自动上锁。这意味着入户门可能敞开了约12.5小时,对独居老人存在安全隐患。\",\n \"推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:56、06:37、11:00、11:29、16:56、17:38),这可能是传感器在高温环境下暂时失效或被干扰,属于轻微设备异常,但灶具使用时长均在合理范围内(约30-40分钟),且烟雾报警器未触发,火灾风险较低。\",\n \"推理步骤6: 老人的日常作息模式基本正常——早起(05:40)、做早餐、出门(06:52)、回家(08:30)、午休(12:22-13:54)、做晚餐、晚间活动、就寝(20:55),活动节奏合理,未见长时间无活动的健康异常信号。\"\n ],\n \"key_evidence\": [\n \"05:17 bathroom_water_leak StateValue=True 触发漏水报警,全天未见复位为 False\",\n \"08:30 入户门解锁并打开后,直到20:55才记录到关门上锁,期间约12.5小时门可能处于未关闭状态\",\n \"厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,存在传感器异常\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况,确认漏水源头并关闭相关水阀,防止水损扩大\",\n \"确认入户门当前状态,排查08:30至20:55期间门是否确实长时间未关闭;如属实,建议设置门未关闭超时提醒(如超过10分钟未关门则推送告警)\",\n \"检查厨房温度传感器是否工作正常,清洁或更换传感器,确保灶具使用期间温度监控不中断\",\n \"考虑为独居老人配置漏水报警联动自动关水阀的功能,以及关键告警的远程通知(推送给家属或护理人员)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨5:17触发报警,且整日未见复位,存在持续漏水风险;同时入户门在08:30后长时间未关闭/未锁定,需要关注。", "reasoning": ["推理步骤1: 05:17卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。此时为凌晨,老人尚在睡眠中(卧室运动传感器直到05:40才检测到活动)。", "推理步骤2: 在整个24小时日志中,未见 bathroom_water_leak 恢复为 StateValue=False 的记录,说明漏水状态可能持续了一整天未被处理。", "推理步骤3: 老人05:46进入卫生间使用约9分钟后离开,但日志中没有任何针对漏水的处理动作(如关闭水阀),老人可能未注意到漏水报警。", "推理步骤4: 08:30入户门被手动解锁(LockOperationType=1)、门被打开(StateValue=False),之后有人进入客厅(entrance_occupancy和living_room_occupancy触发),但日志中始终未见该次开门后的关门记录(front_door_contact 未恢复为 True)和重新上锁记录,直到20:55才出现门关闭并自动上锁。这意味着入户门可能敞开了约12.5小时,对独居老人存在安全隐患。", "推理步骤5: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(05:56、06:37、11:00、11:29、16:56、17:38),这可能是传感器在高温环境下暂时失效或被干扰,属于轻微设备异常,但灶具使用时长均在合理范围内(约30-40分钟),且烟雾报警器未触发,火灾风险较低。", "推理步骤6: 老人的日常作息模式基本正常——早起(05:40)、做早餐、出门(06:52)、回家(08:30)、午休(12:22-13:54)、做晚餐、晚间活动、就寝(20:55),活动节奏合理,未见长时间无活动的健康异常信号。"], "key_evidence": ["05:17 bathroom_water_leak StateValue=True 触发漏水报警,全天未见复位为 False", "08:30 入户门解锁并打开后,直到20:55才记录到关门上锁,期间约12.5小时门可能处于未关闭状态", "厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,存在传感器异常"], "recommended_actions": ["立即检查卫生间漏水情况,确认漏水源头并关闭相关水阀,防止水损扩大", "确认入户门当前状态,排查08:30至20:55期间门是否确实长时间未关闭;如属实,建议设置门未关闭超时提醒(如超过10分钟未关门则推送告警)", "检查厨房温度传感器是否工作正常,清洁或更换传感器,确保灶具使用期间温度监控不中断", "考虑为独居老人配置漏水报警联动自动关水阀的功能,以及关键告警的远程通知(推送给家属或护理人员)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.563364028930664, "api_error": null} {"episode_id": "SQ3_TP_D_0540", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0540.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-02T00:00:00", "seed": 20261169, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-02T19:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器触发一氧化碳(CO)警报,但老人未做出任何应急响应,同时厨房温度传感器多次报告 None 值存在设备故障嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 19:49 客厅烟雾报警器触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。一氧化碳无色无味,对独居老人威胁极大。\",\n \"推理步骤2: CO 警报触发后,老人的行为轨迹未显示任何应急反应——没有开窗通风(客厅窗户传感器无变化、窗帘未动)、没有开门离开(入户门直到 20:42 才有自动上锁记录,且无开门外出动作)。老人在 20:29 仍正常去卫生间、20:42 回卧室就寝,说明老人可能未察觉警报或忽视了警报。\",\n \"推理步骤3: 排查 CO 来源——17:04-17:27 厨房灶具使用了约 23 分钟,之后关闭。19:49 距灶具关闭已过 2 小时多,若燃气灶存在不完全燃烧或微量泄漏,CO 可能在密闭空间中缓慢积累到触发阈值。但也不排除报警器本身误报的可能。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:04、06:26、11:08、11:25、17:05、17:28),共出现 6 次。每次都与灶具开启/关闭时间高度吻合,说明灶具工作时产生的高温可能导致传感器读数溢出或通信异常,存在设备故障或安装位置不当的问题。\",\n \"推理步骤5: 08:38 老人回家后入户门未关闭上锁(front_door_contact 未报告关门,front_door_lock 未上锁),直到 20:42 才出现自动上锁记录。这意味着入户门可能长时间处于未锁状态(约 12 小时),对独居老人存在安全隐患。不过这也可能是传感器未上报中间状态。\",\n \"推理步骤6: 综合来看,CO 警报是最高优先级的安全事件。无论是真实 CO 泄漏还是设备误报,都需要立即确认和处置,尤其是独居老人场景下。\"\n ],\n \"key_evidence\": [\n \"19:49 客厅烟雾报警器触发 CO 警报:COState=1, ExpressedState=2, Event: COAlarm()\",\n \"CO 警报触发后老人无任何应急行为(未开窗、未开门、未离开),40 分钟后正常回卧室就寝\",\n \"厨房温度传感器在灶具使用期间 6 次报告 None 值,传感器工作异常\",\n \"08:38 入户门解锁开门后长时间未见重新上锁记录,直到 20:42 才自动上锁\"\n ],\n \"recommended_actions\": [\n \"立即联系老人或紧急联系人确认安全状况——CO 中毒可能导致意识模糊甚至昏迷,老人可能已无法自行求助\",\n \"远程或通知物业/家属开窗通风,排除室内 CO 积聚风险\",\n \"安排专业人员检查燃气灶具是否存在不完全燃烧或燃气微泄漏问题\",\n \"检修或更换厨房温度传感器,确认其安装位置是否受灶具高温直接影响导致读数异常\",\n \"检查客厅 CO 报警器是否需要校准或更换,确认本次警报是真实检测还是误报\",\n \"考虑为入户门锁设置未锁定超时提醒,避免长时间门户未锁的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器触发一氧化碳(CO)警报,但老人未做出任何应急响应,同时厨房温度传感器多次报告 None 值存在设备故障嫌疑。", "reasoning": ["推理步骤1: 19:49 客厅烟雾报警器触发 CO 警报(COState=1, ExpressedState=2, Event: COAlarm),这是一个严重的安全事件。一氧化碳无色无味,对独居老人威胁极大。", "推理步骤2: CO 警报触发后,老人的行为轨迹未显示任何应急反应——没有开窗通风(客厅窗户传感器无变化、窗帘未动)、没有开门离开(入户门直到 20:42 才有自动上锁记录,且无开门外出动作)。老人在 20:29 仍正常去卫生间、20:42 回卧室就寝,说明老人可能未察觉警报或忽视了警报。", "推理步骤3: 排查 CO 来源——17:04-17:27 厨房灶具使用了约 23 分钟,之后关闭。19:49 距灶具关闭已过 2 小时多,若燃气灶存在不完全燃烧或微量泄漏,CO 可能在密闭空间中缓慢积累到触发阈值。但也不排除报警器本身误报的可能。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:04、06:26、11:08、11:25、17:05、17:28),共出现 6 次。每次都与灶具开启/关闭时间高度吻合,说明灶具工作时产生的高温可能导致传感器读数溢出或通信异常,存在设备故障或安装位置不当的问题。", "推理步骤5: 08:38 老人回家后入户门未关闭上锁(front_door_contact 未报告关门,front_door_lock 未上锁),直到 20:42 才出现自动上锁记录。这意味着入户门可能长时间处于未锁状态(约 12 小时),对独居老人存在安全隐患。不过这也可能是传感器未上报中间状态。", "推理步骤6: 综合来看,CO 警报是最高优先级的安全事件。无论是真实 CO 泄漏还是设备误报,都需要立即确认和处置,尤其是独居老人场景下。"], "key_evidence": ["19:49 客厅烟雾报警器触发 CO 警报:COState=1, ExpressedState=2, Event: COAlarm()", "CO 警报触发后老人无任何应急行为(未开窗、未开门、未离开),40 分钟后正常回卧室就寝", "厨房温度传感器在灶具使用期间 6 次报告 None 值,传感器工作异常", "08:38 入户门解锁开门后长时间未见重新上锁记录,直到 20:42 才自动上锁"], "recommended_actions": ["立即联系老人或紧急联系人确认安全状况——CO 中毒可能导致意识模糊甚至昏迷,老人可能已无法自行求助", "远程或通知物业/家属开窗通风,排除室内 CO 积聚风险", "安排专业人员检查燃气灶具是否存在不完全燃烧或燃气微泄漏问题", "检修或更换厨房温度传感器,确认其安装位置是否受灶具高温直接影响导致读数异常", "检查客厅 CO 报警器是否需要校准或更换,确认本次警报是真实检测还是误报", "考虑为入户门锁设置未锁定超时提醒,避免长时间门户未锁的安全风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.443251848220825, "api_error": null} {"episode_id": "SQ3_TP_D_0544", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0544.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261173, "scenario_id": "BA-03", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-14T11:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时客厅灯在 11:04 出现快速闪烁,可能为设备故障或老人求助信号。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:03、06:40、10:56、11:26、17:11、17:39),共出现6次。虽然部分 None 值与灶具运行时间重合,可能是高温超量程导致,但灶具关闭后(如 06:39 关灶、06:40 仍为 None;17:38 关灶、17:39 仍为 None)仍然报告 None,说明传感器未能及时恢复正常读数,存在设备异常或响应延迟的可能。\",\n \"推理步骤2: 11:04:00 至 11:04:14 期间,客厅灯在约10秒内被快速开关5次(开-关-开-关-开),紧接着卧室灯也被快速开关1次。这种模式不符合正常照明使用习惯。对于独居老人场景,这可能是:(a) 老人通过反复开关灯发出求助信号;(b) 智能灯设备或控制器故障导致的状态抖动。两种情况都值得关注。\",\n \"推理步骤3: 08:27 入户门被手动解锁、门被打开,但之后门未关闭(front_door_contact 未恢复为 True),直到 20:50:19 才记录到门关闭并自动上锁。这意味着入户门可能处于未关闭状态长达约12小时。对于独居老人,长时间大门未关存在安全隐患。不过也可能是老人在家时习惯不关门,或传感器在中间状态变化时未被记录。\",\n \"推理步骤4: 其余行为模式基本正常——老人 05:39 起床、06:02 做早餐、06:57 出门(门锁手动开锁后自动上锁)、08:27 回家、10:55 做午餐、12:37 午休拉窗帘、14:10 起床、17:10 做晚餐、19:35 客厅看电视(灯光调暗至22/254)、20:24 洗漱、20:50 就寝——符合独居老人的典型日常作息。\",\n \"推理步骤5: 温度数据整体呈现合理的日间升温、夜间降温趋势(卧室夜间约22°C,午间峰值约25.7°C),各房间温差合理,无火灾或异常热源迹象。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 None 值(06:03、06:40、10:56、11:26、17:11、17:39),包括灶具关闭后仍为 None\",\n \"11:04:00-11:04:14 客厅灯在10秒内被快速开关5次,卧室灯随后也被快速开关1次\",\n \"入户门 08:27:02 打开后,直到 20:50:19 才记录到关闭,中间约12.5小时无门状态变化记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否工作正常,清洁或更换传感器,确保其在灶具使用时仍能提供有效读数\",\n \"核实 11:04 客厅灯快速闪烁事件的原因——联系老人确认是否为求助行为;如非人为操作,检查灯具和控制器是否存在硬件故障\",\n \"检查入户门传感器(front_door_contact)是否安装牢固、工作正常,确认是否存在漏报;考虑设置大门长时间未关闭的自动提醒\",\n \"建议为独居老人配置紧急求助按钮或跌倒检测设备,避免依赖灯光闪烁等非标准方式求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时客厅灯在 11:04 出现快速闪烁,可能为设备故障或老人求助信号。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:03、06:40、10:56、11:26、17:11、17:39),共出现6次。虽然部分 None 值与灶具运行时间重合,可能是高温超量程导致,但灶具关闭后(如 06:39 关灶、06:40 仍为 None;17:38 关灶、17:39 仍为 None)仍然报告 None,说明传感器未能及时恢复正常读数,存在设备异常或响应延迟的可能。", "推理步骤2: 11:04:00 至 11:04:14 期间,客厅灯在约10秒内被快速开关5次(开-关-开-关-开),紧接着卧室灯也被快速开关1次。这种模式不符合正常照明使用习惯。对于独居老人场景,这可能是:(a) 老人通过反复开关灯发出求助信号;(b) 智能灯设备或控制器故障导致的状态抖动。两种情况都值得关注。", "推理步骤3: 08:27 入户门被手动解锁、门被打开,但之后门未关闭(front_door_contact 未恢复为 True),直到 20:50:19 才记录到门关闭并自动上锁。这意味着入户门可能处于未关闭状态长达约12小时。对于独居老人,长时间大门未关存在安全隐患。不过也可能是老人在家时习惯不关门,或传感器在中间状态变化时未被记录。", "推理步骤4: 其余行为模式基本正常——老人 05:39 起床、06:02 做早餐、06:57 出门(门锁手动开锁后自动上锁)、08:27 回家、10:55 做午餐、12:37 午休拉窗帘、14:10 起床、17:10 做晚餐、19:35 客厅看电视(灯光调暗至22/254)、20:24 洗漱、20:50 就寝——符合独居老人的典型日常作息。", "推理步骤5: 温度数据整体呈现合理的日间升温、夜间降温趋势(卧室夜间约22°C,午间峰值约25.7°C),各房间温差合理,无火灾或异常热源迹象。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["厨房温度传感器6次报告 None 值(06:03、06:40、10:56、11:26、17:11、17:39),包括灶具关闭后仍为 None", "11:04:00-11:04:14 客厅灯在10秒内被快速开关5次,卧室灯随后也被快速开关1次", "入户门 08:27:02 打开后,直到 20:50:19 才记录到关闭,中间约12.5小时无门状态变化记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否工作正常,清洁或更换传感器,确保其在灶具使用时仍能提供有效读数", "核实 11:04 客厅灯快速闪烁事件的原因——联系老人确认是否为求助行为;如非人为操作,检查灯具和控制器是否存在硬件故障", "检查入户门传感器(front_door_contact)是否安装牢固、工作正常,确认是否存在漏报;考虑设置大门长时间未关闭的自动提醒", "建议为独居老人配置紧急求助按钮或跌倒检测设备,避免依赖灯光闪烁等非标准方式求助"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.368571043014526, "api_error": null} {"episode_id": "SQ3_TP_D_0554", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0554.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261183, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-27T21:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器从21:59起持续报警超过30分钟,老人已就寝未响应,存在水损和安全风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房漏水传感器在21:59首次报告 StateValue=True,随后在22:09和22:29再次报告True,说明漏水状态持续至少30分钟且未被解除。\",\n \"推理步骤2: 老人在20:37已进入卧室、关灯并拉上窗帘就寝,此后全屋无任何运动传感器触发,说明老人很可能已入睡,未察觉厨房漏水。\",\n \"推理步骤3: 厨房灶具在17:37已关闭,厨房灯也早已熄灭,厨房无人活动。漏水可能来自水龙头未关紧、管道渗漏或洗碗机/水管接头故障。\",\n \"推理步骤4: 持续漏水若不及时处理,可能造成地板损坏、电器短路甚至滑倒风险,对独居老人尤其危险。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于设备小异常(可能受灶具热辐射干扰),但灶具关闭后温度恢复正常读数,不构成独立威胁。\"\n ],\n \"key_evidence\": [\n \"21:59 kitchen_water_leak StateValue=True,22:09再次True,22:29第三次True——漏水持续至少30分钟未消除\",\n \"老人20:37进入卧室关灯就寝后,全屋无任何运动传感器触发,无人前往厨房处理漏水\",\n \"厨房自17:37灶具关闭、厨房灯熄灭后无人活动,漏水发生时厨房无人在场\"\n ],\n \"recommended_actions\": [\n \"立即向老人或紧急联系人发送漏水警报通知,必要时触发卧室床头灯闪烁或语音提醒唤醒老人\",\n \"如果家中配有电动水阀(主水管阀门),建议自动关闭厨房供水以止损\",\n \"联系物业或家人尽快到场检查厨房漏水源头并进行维修\",\n \"关注厨房温度传感器在灶具使用时多次返回None的问题,建议检查传感器安装位置是否离灶具过近,或排查传感器固件是否需要更新\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器从21:59起持续报警超过30分钟,老人已就寝未响应,存在水损和安全风险。", "reasoning": ["推理步骤1: 厨房漏水传感器在21:59首次报告 StateValue=True,随后在22:09和22:29再次报告True,说明漏水状态持续至少30分钟且未被解除。", "推理步骤2: 老人在20:37已进入卧室、关灯并拉上窗帘就寝,此后全屋无任何运动传感器触发,说明老人很可能已入睡,未察觉厨房漏水。", "推理步骤3: 厨房灶具在17:37已关闭,厨房灯也早已熄灭,厨房无人活动。漏水可能来自水龙头未关紧、管道渗漏或洗碗机/水管接头故障。", "推理步骤4: 持续漏水若不及时处理,可能造成地板损坏、电器短路甚至滑倒风险,对独居老人尤其危险。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于设备小异常(可能受灶具热辐射干扰),但灶具关闭后温度恢复正常读数,不构成独立威胁。"], "key_evidence": ["21:59 kitchen_water_leak StateValue=True,22:09再次True,22:29第三次True——漏水持续至少30分钟未消除", "老人20:37进入卧室关灯就寝后,全屋无任何运动传感器触发,无人前往厨房处理漏水", "厨房自17:37灶具关闭、厨房灯熄灭后无人活动,漏水发生时厨房无人在场"], "recommended_actions": ["立即向老人或紧急联系人发送漏水警报通知,必要时触发卧室床头灯闪烁或语音提醒唤醒老人", "如果家中配有电动水阀(主水管阀门),建议自动关闭厨房供水以止损", "联系物业或家人尽快到场检查厨房漏水源头并进行维修", "关注厨房温度传感器在灶具使用时多次返回None的问题,建议检查传感器安装位置是否离灶具过近,或排查传感器固件是否需要更新"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.10784363746643, "api_error": null} {"episode_id": "SQ3_TP_D_0553", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq3\\SQ3_TP_D_0553.json", "metadata": {"sq_type": "SQ3", "sq_name": "行为序列分析", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261182, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T03:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器疑似故障:6月3日晚间后仅上报非标准格式的固定值2350,丧失真实测量能力;厨房温度传感器在灶具使用期间多次上报 None 值,存在间歇性故障。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器在6月3日全天通过标准 TemperatureMeasurement.MeasuredValue 属性正常上报温度,数值随昼夜自然波动(夜间约2290→午间峰值约2579→夜间回落至2339),符合物理规律。\",\n \"推理步骤2: 但从6月3日08:00起,客厅温度传感器开始额外出现一种非标准格式的上报——仅写 'MeasuredValue = 2350',缺少 'TemperatureMeasurement.' 前缀。这在08:00、12:00、18:00、22:00各出现一次,且值始终为2350,与同时刻标准上报的真实值(2452、2575、2460、2361)明显不同。\",\n \"推理步骤3: 进入6月4日和6月5日后,该传感器完全停止了标准格式的上报,仅剩非标准格式的固定值2350,每隔约4-6小时上报一次(6月4日 08:00/12:00/18:00/22:00,6月5日 08:00/12:00)。这意味着传感器已不再进行真实温度测量,只是以固定间隔回传一个静态值。\",\n \"推理步骤4: 对比卧室和厨房传感器在6月3日的正常波动曲线,客厅传感器在6月4-5日输出完全恒定的2350(约23.5°C),不随昼夜变化,极不合理。这高度指向传感器硬件故障或固件异常,进入了某种降级/回退模式。\",\n \"推理步骤5: 厨房温度传感器在灶具开启后短时间内多次上报 MeasuredValue = None(05:52、06:25、10:51、11:34、17:01、17:21),共6次。虽然灶具工作时局部高温可能导致传感器暂时超量程,但关灶后仍出现 None(如06:25、11:34、17:21),说明传感器恢复较慢,可能存在间歇性故障或安装位置不当导致的热损伤风险。\",\n \"推理步骤6: 对于独居老人家庭,温度传感器是火灾预警和环境监测的关键设备。客厅传感器完全失效意味着无法检测客厅异常升温(如电器过热、火灾初期),构成严重的安全监测盲区。\",\n \"推理步骤7: 其余行为模式均属正常——老人05:24起床、05:30如厕、05:51做早餐、07:04出门(门锁手动开锁后自动上锁)、08:35回家、12:22午休拉窗帘、14:06起床、17:00做晚餐、20:22洗漱、20:40就寝关灯拉窗帘,作息规律合理。入户门在老人外出和就寝时均处于上锁状态,安防正常。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器从6月4日起完全停止标准 TemperatureMeasurement.MeasuredValue 上报,仅以非标准格式输出固定值2350,持续超过24小时(6月4日08:00至6月5日12:00共6次,值恒定不变)\",\n \"6月3日当天,标准上报与非标准上报并存,同一时刻两者数值不一致(如08:00标准值2452 vs 非标准值2350,12:00标准值2575 vs 非标准值2510),说明非标准上报并非正常数据\",\n \"厨房温度传感器在灶具使用前后共6次上报 None 值,表明存在间歇性测量失败\",\n \"入户门在08:35老人回家后未见再次开锁记录,直到20:40确认门锁上锁状态,排除入侵可能\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器(living_room_temp_sensor)的硬件状态和固件版本,尝试重启或恢复出厂设置;若无法恢复正常上报,应尽快更换\",\n \"在客厅温度传感器修复前,考虑临时启用客厅烟雾报警器的增强监测模式,弥补温度监测盲区\",\n \"检查厨房温度传感器的安装位置,确认其与灶具的距离是否合理,避免因高温导致传感器反复进入保护状态\",\n \"排查系统中是否存在导致非标准属性上报格式(缺少 Cluster 前缀)的通信或网关问题,可能是 Matter 桥接设备的固件缺陷\",\n \"建议为独居老人家庭的关键传感器设置离线/异常值告警规则,当传感器长时间输出固定值或 None 时自动通知家属或护理人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器疑似故障:6月3日晚间后仅上报非标准格式的固定值2350,丧失真实测量能力;厨房温度传感器在灶具使用期间多次上报 None 值,存在间歇性故障。", "reasoning": ["推理步骤1: 客厅温度传感器在6月3日全天通过标准 TemperatureMeasurement.MeasuredValue 属性正常上报温度,数值随昼夜自然波动(夜间约2290→午间峰值约2579→夜间回落至2339),符合物理规律。", "推理步骤2: 但从6月3日08:00起,客厅温度传感器开始额外出现一种非标准格式的上报——仅写 'MeasuredValue = 2350',缺少 'TemperatureMeasurement.' 前缀。这在08:00、12:00、18:00、22:00各出现一次,且值始终为2350,与同时刻标准上报的真实值(2452、2575、2460、2361)明显不同。", "推理步骤3: 进入6月4日和6月5日后,该传感器完全停止了标准格式的上报,仅剩非标准格式的固定值2350,每隔约4-6小时上报一次(6月4日 08:00/12:00/18:00/22:00,6月5日 08:00/12:00)。这意味着传感器已不再进行真实温度测量,只是以固定间隔回传一个静态值。", "推理步骤4: 对比卧室和厨房传感器在6月3日的正常波动曲线,客厅传感器在6月4-5日输出完全恒定的2350(约23.5°C),不随昼夜变化,极不合理。这高度指向传感器硬件故障或固件异常,进入了某种降级/回退模式。", "推理步骤5: 厨房温度传感器在灶具开启后短时间内多次上报 MeasuredValue = None(05:52、06:25、10:51、11:34、17:01、17:21),共6次。虽然灶具工作时局部高温可能导致传感器暂时超量程,但关灶后仍出现 None(如06:25、11:34、17:21),说明传感器恢复较慢,可能存在间歇性故障或安装位置不当导致的热损伤风险。", "推理步骤6: 对于独居老人家庭,温度传感器是火灾预警和环境监测的关键设备。客厅传感器完全失效意味着无法检测客厅异常升温(如电器过热、火灾初期),构成严重的安全监测盲区。", "推理步骤7: 其余行为模式均属正常——老人05:24起床、05:30如厕、05:51做早餐、07:04出门(门锁手动开锁后自动上锁)、08:35回家、12:22午休拉窗帘、14:06起床、17:00做晚餐、20:22洗漱、20:40就寝关灯拉窗帘,作息规律合理。入户门在老人外出和就寝时均处于上锁状态,安防正常。"], "key_evidence": ["客厅温度传感器从6月4日起完全停止标准 TemperatureMeasurement.MeasuredValue 上报,仅以非标准格式输出固定值2350,持续超过24小时(6月4日08:00至6月5日12:00共6次,值恒定不变)", "6月3日当天,标准上报与非标准上报并存,同一时刻两者数值不一致(如08:00标准值2452 vs 非标准值2350,12:00标准值2575 vs 非标准值2510),说明非标准上报并非正常数据", "厨房温度传感器在灶具使用前后共6次上报 None 值,表明存在间歇性测量失败", "入户门在08:35老人回家后未见再次开锁记录,直到20:40确认门锁上锁状态,排除入侵可能"], "recommended_actions": ["立即检查客厅温度传感器(living_room_temp_sensor)的硬件状态和固件版本,尝试重启或恢复出厂设置;若无法恢复正常上报,应尽快更换", "在客厅温度传感器修复前,考虑临时启用客厅烟雾报警器的增强监测模式,弥补温度监测盲区", "检查厨房温度传感器的安装位置,确认其与灶具的距离是否合理,避免因高温导致传感器反复进入保护状态", "排查系统中是否存在导致非标准属性上报格式(缺少 Cluster 前缀)的通信或网关问题,可能是 Matter 桥接设备的固件缺陷", "建议为独居老人家庭的关键传感器设置离线/异常值告警规则,当传感器长时间输出固定值或 None 时自动通知家属或护理人员"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 35.70140790939331, "api_error": null} {"episode_id": "SQ4_FP_A_0857", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0857.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261486, "scenario_id": "BA-03", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "living_room", "injection_time": "2026-06-29T06:45:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,客厅主灯设备疑似故障(错误上报占用传感器事件并快速闪烁),入户门在住户回家后长时间未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——住户约 06:15 起床、06:34 进卫生间、07:27 出门上班(关灯、手动开锁、开关门、自动上锁),18:00 回家(开锁、开灯、开空调),21:55 就寝准备,22:39 入睡。这是典型的单人一室一厅作息,无入侵迹象。\",\n \"推理步骤2: 厨房温度传感器在 19:00 突然从约 2450 跳至 2837(28.37°C),而同一时刻客厅和卧室温度仍在正常下降趋势中。虽然 19:15 灶具开启可以解释厨房升温,但异常读数出现在灶具开启之前(19:00),且幅度过大(约 3.7°C 瞬间跳升)。更关键的是,19:16 和 19:44 传感器两次报告 MeasuredValue = None,说明传感器可能存在故障或通信异常。\",\n \"推理步骤3: 客厅主灯 living_room_light_1 在 06:45 上报了 OccupancySensing.Occupancy = 1 事件,但该设备类型是 dimmable_light,不应具备占用感应功能。随后灯在 2 秒间隔内反复开关四次(True→False→True→False),表现为快速闪烁,这不是正常的用户操作模式,疑似设备固件异常或通信干扰。\",\n \"推理步骤4: 住户 18:00 回家时,入户门传感器 front_door_contact 报告 StateValue = False(门打开),但直到 21:55:36 才报告 StateValue = True(门关闭),中间近 4 小时门处于开启状态。虽然可能是传感器漏报了关门事件,但如果门确实未关,这是一个安全隐患。\",\n \"推理步骤5: 烟雾报警器全天无告警,漏水传感器无告警,门锁操作均为合法方式(手动/自动),卧室窗户传感器无异常,整体无入侵或火灾/漏水风险。主要问题集中在设备可靠性层面。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~2450 骤升至 2837,灶具尚未开启(19:15 才开),跳变异常\",\n \"19:16 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失\",\n \"06:45 客厅主灯(dimmable_light 类型)错误上报 OccupancySensing.Occupancy 事件,并在 6 秒内闪烁 4 次\",\n \"入户门 18:00:02 打开后直到 21:55:36 才记录关闭,长达近 4 小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和电量,清理传感器探头,必要时更换设备以消除 null 读数和异常跳变\",\n \"检查客厅主灯 living_room_light_1 的固件版本,考虑重置或升级固件,排查其错误上报占用传感器事件的原因\",\n \"检查入户门磁传感器的安装位置和灵敏度,确认是否存在漏报关门事件的情况;如果门确实长时间未关,建议设置门未关超时告警\",\n \"考虑为厨房增加通风联动规则:当灶具开启且厨房温度超过阈值时,自动提醒开窗或启动排风\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,客厅主灯设备疑似故障(错误上报占用传感器事件并快速闪烁),入户门在住户回家后长时间未关闭。", "reasoning": ["推理步骤1: 整体生活节奏正常——住户约 06:15 起床、06:34 进卫生间、07:27 出门上班(关灯、手动开锁、开关门、自动上锁),18:00 回家(开锁、开灯、开空调),21:55 就寝准备,22:39 入睡。这是典型的单人一室一厅作息,无入侵迹象。", "推理步骤2: 厨房温度传感器在 19:00 突然从约 2450 跳至 2837(28.37°C),而同一时刻客厅和卧室温度仍在正常下降趋势中。虽然 19:15 灶具开启可以解释厨房升温,但异常读数出现在灶具开启之前(19:00),且幅度过大(约 3.7°C 瞬间跳升)。更关键的是,19:16 和 19:44 传感器两次报告 MeasuredValue = None,说明传感器可能存在故障或通信异常。", "推理步骤3: 客厅主灯 living_room_light_1 在 06:45 上报了 OccupancySensing.Occupancy = 1 事件,但该设备类型是 dimmable_light,不应具备占用感应功能。随后灯在 2 秒间隔内反复开关四次(True→False→True→False),表现为快速闪烁,这不是正常的用户操作模式,疑似设备固件异常或通信干扰。", "推理步骤4: 住户 18:00 回家时,入户门传感器 front_door_contact 报告 StateValue = False(门打开),但直到 21:55:36 才报告 StateValue = True(门关闭),中间近 4 小时门处于开启状态。虽然可能是传感器漏报了关门事件,但如果门确实未关,这是一个安全隐患。", "推理步骤5: 烟雾报警器全天无告警,漏水传感器无告警,门锁操作均为合法方式(手动/自动),卧室窗户传感器无异常,整体无入侵或火灾/漏水风险。主要问题集中在设备可靠性层面。"], "key_evidence": ["19:00 厨房温度从 ~2450 骤升至 2837,灶具尚未开启(19:15 才开),跳变异常", "19:16 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失", "06:45 客厅主灯(dimmable_light 类型)错误上报 OccupancySensing.Occupancy 事件,并在 6 秒内闪烁 4 次", "入户门 18:00:02 打开后直到 21:55:36 才记录关闭,长达近 4 小时"], "recommended_actions": ["检查厨房温度传感器的连接状态和电量,清理传感器探头,必要时更换设备以消除 null 读数和异常跳变", "检查客厅主灯 living_room_light_1 的固件版本,考虑重置或升级固件,排查其错误上报占用传感器事件的原因", "检查入户门磁传感器的安装位置和灵敏度,确认是否存在漏报关门事件的情况;如果门确实长时间未关,建议设置门未关超时告警", "考虑为厨房增加通风联动规则:当灶具开启且厨房温度超过阈值时,自动提醒开窗或启动排风"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.587591886520386, "api_error": null} {"episode_id": "SQ4_FP_A_0859", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0859.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261488, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-10T16:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),且入户门在住户回家后长时间未关闭/上锁,存在设备故障和安全疏忽。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约2470跳升至2853(约28.5°C),较前一读数2470(约24.7°C)瞬间上升近4°C,而此时灶具尚未开启(灶具18:52才开),客厅和卧室温度同期仍在正常下降,排除环境整体升温的可能。\",\n \"推理步骤2: 厨房温度传感器在18:30继续报告2863的异常高值,但在18:52灶具实际开启后的18:53和19:35两次报告MeasuredValue=None(空值),说明传感器在需要监测的关键时段反而失效了。19:00恢复正常值2443后,19:35再次报None,传感器工作极不稳定。\",\n \"推理步骤3: 传感器在灶具使用期间(18:52-19:34)无法提供有效温度数据,意味着如果发生灶具过热或火灾风险,温度监测这一安全防线完全失效,这是严重的安全隐患。\",\n \"推理步骤4: 住户18:19回家开门(front_door_contact=False),但直到21:46:36才关门(StateValue=True)并自动上锁,入户门敞开超过3.5小时。虽然住户在家,但对于一室一厅的住宅,长时间不关门存在入侵风险。\",\n \"推理步骤5: 厨房窗户在19:34:30被打开(contact=False),之后日志中未见关闭记录,结合住户22:34已入睡,厨房窗户可能整夜未关,存在安全隐患。\",\n \"推理步骤6: 其余设备行为均正常——住户6:19起床、7:29出门、18:19回家、22:34入睡的作息规律合理;空调16:57远程预开、回家后切换制冷模式符合夏季习惯;门锁出门/回家的开锁上锁流程正确;洗碗机晚间运行属正常使用。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从~2470骤升至2853,18:30继续报2863,而灶具18:52才开启,排除烹饪导致的正常升温\",\n \"18:53和19:35厨房温度传感器报告MeasuredValue=None,在灶具使用的关键时段传感器完全失效\",\n \"入户门18:19:02打开后直到21:46:36才关闭,敞开时间超过3小时27分钟\",\n \"厨房窗户19:34:30打开后日志中无关闭记录,可能整夜敞开\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器,清洁或更换该设备,确保其在灶具使用期间能可靠工作\",\n \"在温度传感器修复前,烹饪时应加强人工监控,并确认烟雾报警器(kitchen_smoke_alarm)工作正常作为备用安全防线\",\n \"设置入户门超时未关提醒(建议阈值5-10分钟),避免长时间敞开\",\n \"确认厨房窗户当前状态,如已入睡应关闭;建议设置就寝模式自动检查所有窗户和门的关闭状态\",\n \"考虑为厨房温度传感器配置异常值告警规则(如30分钟内温差超过3°C或读数为None时立即通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),且入户门在住户回家后长时间未关闭/上锁,存在设备故障和安全疏忽。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约2470跳升至2853(约28.5°C),较前一读数2470(约24.7°C)瞬间上升近4°C,而此时灶具尚未开启(灶具18:52才开),客厅和卧室温度同期仍在正常下降,排除环境整体升温的可能。", "推理步骤2: 厨房温度传感器在18:30继续报告2863的异常高值,但在18:52灶具实际开启后的18:53和19:35两次报告MeasuredValue=None(空值),说明传感器在需要监测的关键时段反而失效了。19:00恢复正常值2443后,19:35再次报None,传感器工作极不稳定。", "推理步骤3: 传感器在灶具使用期间(18:52-19:34)无法提供有效温度数据,意味着如果发生灶具过热或火灾风险,温度监测这一安全防线完全失效,这是严重的安全隐患。", "推理步骤4: 住户18:19回家开门(front_door_contact=False),但直到21:46:36才关门(StateValue=True)并自动上锁,入户门敞开超过3.5小时。虽然住户在家,但对于一室一厅的住宅,长时间不关门存在入侵风险。", "推理步骤5: 厨房窗户在19:34:30被打开(contact=False),之后日志中未见关闭记录,结合住户22:34已入睡,厨房窗户可能整夜未关,存在安全隐患。", "推理步骤6: 其余设备行为均正常——住户6:19起床、7:29出门、18:19回家、22:34入睡的作息规律合理;空调16:57远程预开、回家后切换制冷模式符合夏季习惯;门锁出门/回家的开锁上锁流程正确;洗碗机晚间运行属正常使用。"], "key_evidence": ["18:00厨房温度从~2470骤升至2853,18:30继续报2863,而灶具18:52才开启,排除烹饪导致的正常升温", "18:53和19:35厨房温度传感器报告MeasuredValue=None,在灶具使用的关键时段传感器完全失效", "入户门18:19:02打开后直到21:46:36才关闭,敞开时间超过3小时27分钟", "厨房窗户19:34:30打开后日志中无关闭记录,可能整夜敞开"], "recommended_actions": ["立即检查厨房温度传感器,清洁或更换该设备,确保其在灶具使用期间能可靠工作", "在温度传感器修复前,烹饪时应加强人工监控,并确认烟雾报警器(kitchen_smoke_alarm)工作正常作为备用安全防线", "设置入户门超时未关提醒(建议阈值5-10分钟),避免长时间敞开", "确认厨房窗户当前状态,如已入睡应关闭;建议设置就寝模式自动检查所有窗户和门的关闭状态", "考虑为厨房温度传感器配置异常值告警规则(如30分钟内温差超过3°C或读数为None时立即通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.990519762039185, "api_error": null} {"episode_id": "SQ4_FP_A_0866", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0866.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261495, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-19T11:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在日志结束时仍处于打开状态未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息正常——凌晨在卧室睡眠,06:25 起床如厕,07:14 出门上班(门锁手动开锁→关门→自动上锁),18:19 回家,21:54 就寝,22:32 关灯入睡。整体生活节奏无异常。\",\n \"推理步骤2: 11:56 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3 即远程/密码方式),20秒后同一用户(UserIndex=1)成功开锁进入。这符合住户中午回家输错一次密码后重试成功的场景,单次错误不构成入侵威胁,但值得留意。\",\n \"推理步骤3: 厨房温度传感器在 19:00 出现异常跳变——从 18:30 的 24.54°C 骤升至 28.25°C(+3.71°C / 30分钟),远超当日其他时段的正常波动幅度(通常 ±0.1~0.2°C)。虽然 19:08 灶具开启可解释部分升温,但跳变发生在灶具开启之前(19:00 vs 19:08),时间线不吻合。\",\n \"推理步骤4: 厨房温度传感器在 19:09 和 19:41 两次报告 MeasuredValue = None(空值),表明传感器读数丢失或设备故障。正常传感器不应返回 null。19:30 时又恢复为 28.41°C 的高值,随后 19:40 灶具关闭、窗户打开通风后,20:00 温度回落至 24.14°C,说明传感器间歇性工作。\",\n \"推理步骤5: 厨房窗户在 19:40:30 被打开(StateValue=False),但直到日志结束(23:30)都没有关闭记录。住户 21:54 已进入卧室就寝,厨房窗户整夜开着存在安全隐患(防盗、雨水、虫害等)。\",\n \"推理步骤6: 烟雾报警器全天未触发,排除火灾风险。漏水传感器无报警,排除水患。所有门窗(除厨房窗户外)状态正常,入户门已上锁。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.54°C 骤升至 28.25°C,发生在灶具 19:08 开启之前,时间线矛盾\",\n \"19:09 和 19:41 厨房温度传感器两次返回 MeasuredValue = None,表明设备故障或通信异常\",\n \"19:30 厨房温度高达 28.41°C,为全天所有房间最高值\",\n \"厨房窗户 19:40 打开后至日志结束(23:30)未关闭,住户已就寝\",\n \"11:56 门锁远程操作失败一次(OperationError=1),20秒后同一用户成功开锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,排查 null 读数和异常跳变的原因,必要时更换传感器\",\n \"设置自动化规则:住户就寝或离家时检测厨房窗户是否关闭,未关闭则发送提醒\",\n \"关注门锁操作错误日志,若短期内多次出现 OperationError 应加强门锁安全(如启用双因素认证或检查密码是否泄露)\",\n \"建议立即远程关闭厨房窗户或提醒住户起床关窗\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在日志结束时仍处于打开状态未关闭。", "reasoning": ["推理步骤1: 住户作息正常——凌晨在卧室睡眠,06:25 起床如厕,07:14 出门上班(门锁手动开锁→关门→自动上锁),18:19 回家,21:54 就寝,22:32 关灯入睡。整体生活节奏无异常。", "推理步骤2: 11:56 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3 即远程/密码方式),20秒后同一用户(UserIndex=1)成功开锁进入。这符合住户中午回家输错一次密码后重试成功的场景,单次错误不构成入侵威胁,但值得留意。", "推理步骤3: 厨房温度传感器在 19:00 出现异常跳变——从 18:30 的 24.54°C 骤升至 28.25°C(+3.71°C / 30分钟),远超当日其他时段的正常波动幅度(通常 ±0.1~0.2°C)。虽然 19:08 灶具开启可解释部分升温,但跳变发生在灶具开启之前(19:00 vs 19:08),时间线不吻合。", "推理步骤4: 厨房温度传感器在 19:09 和 19:41 两次报告 MeasuredValue = None(空值),表明传感器读数丢失或设备故障。正常传感器不应返回 null。19:30 时又恢复为 28.41°C 的高值,随后 19:40 灶具关闭、窗户打开通风后,20:00 温度回落至 24.14°C,说明传感器间歇性工作。", "推理步骤5: 厨房窗户在 19:40:30 被打开(StateValue=False),但直到日志结束(23:30)都没有关闭记录。住户 21:54 已进入卧室就寝,厨房窗户整夜开着存在安全隐患(防盗、雨水、虫害等)。", "推理步骤6: 烟雾报警器全天未触发,排除火灾风险。漏水传感器无报警,排除水患。所有门窗(除厨房窗户外)状态正常,入户门已上锁。"], "key_evidence": ["19:00 厨房温度从 24.54°C 骤升至 28.25°C,发生在灶具 19:08 开启之前,时间线矛盾", "19:09 和 19:41 厨房温度传感器两次返回 MeasuredValue = None,表明设备故障或通信异常", "19:30 厨房温度高达 28.41°C,为全天所有房间最高值", "厨房窗户 19:40 打开后至日志结束(23:30)未关闭,住户已就寝", "11:56 门锁远程操作失败一次(OperationError=1),20秒后同一用户成功开锁"], "recommended_actions": ["检查厨房温度传感器硬件状态,排查 null 读数和异常跳变的原因,必要时更换传感器", "设置自动化规则:住户就寝或离家时检测厨房窗户是否关闭,未关闭则发送提醒", "关注门锁操作错误日志,若短期内多次出现 OperationError 应加强门锁安全(如启用双因素认证或检查密码是否泄露)", "建议立即远程关闭厨房窗户或提醒住户起床关窗"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.664782762527466, "api_error": null} {"episode_id": "SQ4_FP_A_0870", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0870.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261499, "scenario_id": "DF-01", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-07T07:46:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在多次读数异常(报告 None 值)及一次疑似温度飙升至 29.85°C 的异常数据,表明传感器可能故障或受到干扰。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:03、12:14、12:47、17:48、18:41),共计 5 次。Matter 协议中 None 值通常表示传感器无法完成测量,单次可理解为瞬态干扰,但一天内反复出现 5 次说明传感器工作状态不稳定。\",\n \"推理步骤2: 12:00 时厨房温度突然从 ~25.5°C 跳升至 29.85°C(MeasuredValue=2985),而同一时刻客厅仅 25.86°C、卧室 24.84°C。虽然灶具当时未开启(12:13 才开),但厨房温度比其他房间高出约 4°C,且 12:30 仍维持在 29.72°C,这一跳变幅度异常。到 13:00 又回落至 25.68°C,说明并非持续热源导致,更像是传感器读数异常。\",\n \"推理步骤3: 排除火灾风险——烟雾报警器全天未触发任何告警,灶具使用时间合理(早餐约 45 分钟、午餐约 33 分钟、晚餐约 53 分钟),且每次关灶后住户都开窗通风,属于正常烹饪行为。\",\n \"推理步骤4: 排除入侵风险——住户生活节奏正常:08:18 起床、09:02 洗漱完毕做早餐、三餐规律、22:48 关灯锁门就寝。入户门全天仅在 22:48 有一次自动上锁记录,门传感器显示关闭状态(StateValue=True),无异常开门事件。\",\n \"推理步骤5: 排除漏水风险——卫生间漏水传感器全天无任何触发记录。\",\n \"推理步骤6: 整体温度趋势合理:夜间 ~22°C,白天随日照升至 ~25.5°C,傍晚逐渐回落,符合夏季一室一厅的自然温度变化。空调在 07:46 和 10:15 开启制冷(SystemMode=3)也与温度上升趋势吻合。\",\n \"推理步骤7: 厨房窗户传感器在灶具关闭后打开(09:48、12:46、18:40),是通风散热的正常操作,但未见关闭记录,可能存在窗户长时间未关的小隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 5 次报告 MeasuredValue = None(09:03、09:49、12:14、12:47、17:48、18:41),均发生在灶具开关前后,疑似受热干扰导致测量失败\",\n \"12:00 厨房温度异常跳升至 2985(29.85°C),较前一读数 2556(25.56°C)骤升 4.29°C,且灶具当时未开启,13:00 又回落至正常范围,属于异常读数\",\n \"烟雾报警器全天无告警,排除真实火灾风险\",\n \"厨房窗户三次打开(09:48、12:46、18:40)但日志中无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至远离热源的位置\",\n \"对厨房温度传感器进行校准或更换,频繁的 None 值和异常跳变表明硬件可能存在故障\",\n \"确认厨房窗户当前是否已关闭,夜间开窗可能带来安全隐患(入侵风险)和能耗浪费\",\n \"建议为灶具设置自动联动规则:灶具开启时温度传感器若持续报告 None,应触发告警提醒住户检查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在多次读数异常(报告 None 值)及一次疑似温度飙升至 29.85°C 的异常数据,表明传感器可能故障或受到干扰。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:03、12:14、12:47、17:48、18:41),共计 5 次。Matter 协议中 None 值通常表示传感器无法完成测量,单次可理解为瞬态干扰,但一天内反复出现 5 次说明传感器工作状态不稳定。", "推理步骤2: 12:00 时厨房温度突然从 ~25.5°C 跳升至 29.85°C(MeasuredValue=2985),而同一时刻客厅仅 25.86°C、卧室 24.84°C。虽然灶具当时未开启(12:13 才开),但厨房温度比其他房间高出约 4°C,且 12:30 仍维持在 29.72°C,这一跳变幅度异常。到 13:00 又回落至 25.68°C,说明并非持续热源导致,更像是传感器读数异常。", "推理步骤3: 排除火灾风险——烟雾报警器全天未触发任何告警,灶具使用时间合理(早餐约 45 分钟、午餐约 33 分钟、晚餐约 53 分钟),且每次关灶后住户都开窗通风,属于正常烹饪行为。", "推理步骤4: 排除入侵风险——住户生活节奏正常:08:18 起床、09:02 洗漱完毕做早餐、三餐规律、22:48 关灯锁门就寝。入户门全天仅在 22:48 有一次自动上锁记录,门传感器显示关闭状态(StateValue=True),无异常开门事件。", "推理步骤5: 排除漏水风险——卫生间漏水传感器全天无任何触发记录。", "推理步骤6: 整体温度趋势合理:夜间 ~22°C,白天随日照升至 ~25.5°C,傍晚逐渐回落,符合夏季一室一厅的自然温度变化。空调在 07:46 和 10:15 开启制冷(SystemMode=3)也与温度上升趋势吻合。", "推理步骤7: 厨房窗户传感器在灶具关闭后打开(09:48、12:46、18:40),是通风散热的正常操作,但未见关闭记录,可能存在窗户长时间未关的小隐患。"], "key_evidence": ["厨房温度传感器一天内 5 次报告 MeasuredValue = None(09:03、09:49、12:14、12:47、17:48、18:41),均发生在灶具开关前后,疑似受热干扰导致测量失败", "12:00 厨房温度异常跳升至 2985(29.85°C),较前一读数 2556(25.56°C)骤升 4.29°C,且灶具当时未开启,13:00 又回落至正常范围,属于异常读数", "烟雾报警器全天无告警,排除真实火灾风险", "厨房窗户三次打开(09:48、12:46、18:40)但日志中无对应关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至远离热源的位置", "对厨房温度传感器进行校准或更换,频繁的 None 值和异常跳变表明硬件可能存在故障", "确认厨房窗户当前是否已关闭,夜间开窗可能带来安全隐患(入侵风险)和能耗浪费", "建议为灶具设置自动联动规则:灶具开启时温度传感器若持续报告 None,应触发告警提醒住户检查"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.97318172454834, "api_error": null} {"episode_id": "SQ4_FP_A_0871", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0871.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261500, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "kitchen", "injection_time": "2026-06-22T19:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:26 起床,07:10 出门并自动锁门,18:15 回家开灯开空调,19:01 做饭,22:01 转入卧室就寝,22:39 关灯入睡,符合典型单人一室一厅作息。\",\n \"推理步骤2: 19:00 厨房温度从 18:30 的 24.63°C 突然跳升至 28.30°C(+3.67°C),而此时灶具尚未开启(19:01:30 才开),且客厅/卧室温度同期反而在下降。这一跳变幅度和时序不合理——灶具未点火前不应出现如此剧烈的厨房升温。\",\n \"推理步骤3: 19:02 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器无法提供有效测量,可能是硬件故障、通信中断或供电异常。\",\n \"推理步骤4: 19:30 厨房温度仍为 28.35°C 的高值,但 19:34 灶具已关闭、19:34:30 厨房窗户已打开通风,到 20:00 温度骤降回 24.07°C。虽然通风可以降温,但从 28.35 降到 24.07 的速度偏快,进一步佐证 19:00/19:30 的高读数可能是传感器漂移而非真实温度。\",\n \"推理步骤5: 19:31 有一次通过 OperationSource=3(远程/PIN)、UserIndex=5 的开锁事件,19:41 同一用户重新锁门。入户门在 18:15 回家后一直未关(BooleanState=False 即门开),直到 22:01:42 才关闭。这说明住户回家后门一直敞开,19:31 的开锁可能是家人/访客,也可能是住户自己外出取物。门长时间未关存在一定安全隐患,但结合客厅持续有人(occupancy=1)判断,属于有意为之的可能性较大,风险较低。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。所有门窗、灯光、空调操作均与人员活动时序吻合,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至 28.30°C,灶具 19:01:30 才开启,时序矛盾\",\n \"19:02 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None(读数丢失)\",\n \"19:30 厨房温度 28.35°C 与 20:00 的 24.07°C 之间降幅过大过快(约 4.3°C/30min),读数可信度存疑\",\n \"入户门从 18:15 至 22:01 持续处于开启状态约 3 小时 46 分钟\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和供电情况,清理探头并确认 Matter 通信链路稳定,必要时更换传感器\",\n \"持续观察厨房温度传感器未来几天的读数,确认 null 值和异常跳变是否复现,以判断是偶发还是持续性故障\",\n \"建议设置入户门长时间未关闭的提醒规则(如超过 15-30 分钟未关门则推送通知),降低安全风险\",\n \"确认 UserIndex=5 的门锁用户身份,确保该远程开锁凭证为已授权的家庭成员或可信人员\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:26 起床,07:10 出门并自动锁门,18:15 回家开灯开空调,19:01 做饭,22:01 转入卧室就寝,22:39 关灯入睡,符合典型单人一室一厅作息。", "推理步骤2: 19:00 厨房温度从 18:30 的 24.63°C 突然跳升至 28.30°C(+3.67°C),而此时灶具尚未开启(19:01:30 才开),且客厅/卧室温度同期反而在下降。这一跳变幅度和时序不合理——灶具未点火前不应出现如此剧烈的厨房升温。", "推理步骤3: 19:02 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器无法提供有效测量,可能是硬件故障、通信中断或供电异常。", "推理步骤4: 19:30 厨房温度仍为 28.35°C 的高值,但 19:34 灶具已关闭、19:34:30 厨房窗户已打开通风,到 20:00 温度骤降回 24.07°C。虽然通风可以降温,但从 28.35 降到 24.07 的速度偏快,进一步佐证 19:00/19:30 的高读数可能是传感器漂移而非真实温度。", "推理步骤5: 19:31 有一次通过 OperationSource=3(远程/PIN)、UserIndex=5 的开锁事件,19:41 同一用户重新锁门。入户门在 18:15 回家后一直未关(BooleanState=False 即门开),直到 22:01:42 才关闭。这说明住户回家后门一直敞开,19:31 的开锁可能是家人/访客,也可能是住户自己外出取物。门长时间未关存在一定安全隐患,但结合客厅持续有人(occupancy=1)判断,属于有意为之的可能性较大,风险较低。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。所有门窗、灯光、空调操作均与人员活动时序吻合,无入侵迹象。"], "key_evidence": ["19:00 厨房温度突跳至 28.30°C,灶具 19:01:30 才开启,时序矛盾", "19:02 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None(读数丢失)", "19:30 厨房温度 28.35°C 与 20:00 的 24.07°C 之间降幅过大过快(约 4.3°C/30min),读数可信度存疑", "入户门从 18:15 至 22:01 持续处于开启状态约 3 小时 46 分钟"], "recommended_actions": ["检查厨房温度传感器的硬件状态和供电情况,清理探头并确认 Matter 通信链路稳定,必要时更换传感器", "持续观察厨房温度传感器未来几天的读数,确认 null 值和异常跳变是否复现,以判断是偶发还是持续性故障", "建议设置入户门长时间未关闭的提醒规则(如超过 15-30 分钟未关门则推送通知),降低安全风险", "确认 UserIndex=5 的门锁用户身份,确保该远程开锁凭证为已授权的家庭成员或可信人员"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.922895669937134, "api_error": null} {"episode_id": "SQ4_FP_A_0881", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0881.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261510, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-17T09:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次 null 值,疑似传感器故障或短暂的环境异常,需要排查。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:00 突然从约 2471(24.71°C)跳升至 2860(28.60°C),升幅近 4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅 24.67°C、卧室 23.58°C)。此时灶具尚未开启(18:51 才开),且住户尚未到家(18:24 才开门),无合理热源解释这一跳变。\",\n \"推理步骤2: 18:30 厨房温度继续维持在 2865(28.65°C),进一步确认这不是单次采样噪声,而是持续性异常读数。\",\n \"推理步骤3: 18:52(灶具刚开启后约 1 分钟)和 19:55(灶具关闭后约 1 分钟),厨房温度传感器两次报告 MeasuredValue = None。正常传感器不应返回 null,这表明传感器可能存在硬件故障、通信中断或过温保护触发后的自我保护机制。\",\n \"推理步骤4: 19:00 厨房温度恢复为 2426(24.26°C),与客厅 2440 基本一致,说明传感器在 null 之后恢复了正常读数,但这种间歇性故障模式本身就是不可靠的信号。\",\n \"推理步骤5: 其余设备行为均属正常——住户 06:25 起床、07:29 出门上锁、18:24 回家开空调、做饭、22:49 就寝,生活节奏合理。09:08 的漏水传感器触发仅持续 2 分钟且有人在场(卫生间有占用),大概率是正常用水溅水,非真实漏水。入户门锁操作均为手动开锁+自动回锁,无异常开锁尝试。烟雾报警器全天未触发。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.71°C 骤升至 28.60°C,18:30 维持 28.65°C,而此时灶具未开、住户未到家,客厅/卧室温度无对应变化\",\n \"18:52 和 19:55 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数中断\",\n \"19:00 之后厨房温度恢复正常范围,与其他房间趋势一致,说明异常是间歇性的\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致午后异常升温\",\n \"检查厨房温度传感器的固件版本和电池电量,两次 null 读数可能是传感器硬件老化或供电不稳的征兆\",\n \"如传感器位置和硬件均无问题,建议更换该传感器或增加一个冗余温度传感器进行交叉验证\",\n \"持续监控未来几天厨房温度数据,确认异常是否复现;若 null 值频繁出现,应立即更换以免影响烟雾/火灾预警联动\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次 null 值,疑似传感器故障或短暂的环境异常,需要排查。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:00 突然从约 2471(24.71°C)跳升至 2860(28.60°C),升幅近 4°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(客厅 24.67°C、卧室 23.58°C)。此时灶具尚未开启(18:51 才开),且住户尚未到家(18:24 才开门),无合理热源解释这一跳变。", "推理步骤2: 18:30 厨房温度继续维持在 2865(28.65°C),进一步确认这不是单次采样噪声,而是持续性异常读数。", "推理步骤3: 18:52(灶具刚开启后约 1 分钟)和 19:55(灶具关闭后约 1 分钟),厨房温度传感器两次报告 MeasuredValue = None。正常传感器不应返回 null,这表明传感器可能存在硬件故障、通信中断或过温保护触发后的自我保护机制。", "推理步骤4: 19:00 厨房温度恢复为 2426(24.26°C),与客厅 2440 基本一致,说明传感器在 null 之后恢复了正常读数,但这种间歇性故障模式本身就是不可靠的信号。", "推理步骤5: 其余设备行为均属正常——住户 06:25 起床、07:29 出门上锁、18:24 回家开空调、做饭、22:49 就寝,生活节奏合理。09:08 的漏水传感器触发仅持续 2 分钟且有人在场(卫生间有占用),大概率是正常用水溅水,非真实漏水。入户门锁操作均为手动开锁+自动回锁,无异常开锁尝试。烟雾报警器全天未触发。"], "key_evidence": ["18:00 厨房温度从 ~24.71°C 骤升至 28.60°C,18:30 维持 28.65°C,而此时灶具未开、住户未到家,客厅/卧室温度无对应变化", "18:52 和 19:55 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数中断", "19:00 之后厨房温度恢复正常范围,与其他房间趋势一致,说明异常是间歇性的"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致午后异常升温", "检查厨房温度传感器的固件版本和电池电量,两次 null 读数可能是传感器硬件老化或供电不稳的征兆", "如传感器位置和硬件均无问题,建议更换该传感器或增加一个冗余温度传感器进行交叉验证", "持续监控未来几天厨房温度数据,确认异常是否复现;若 null 值频繁出现,应立即更换以免影响烟雾/火灾预警联动"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.565815448760986, "api_error": null} {"episode_id": "SQ4_FP_A_0883", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0883.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261512, "scenario_id": "FG-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-24T20:51:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人看管状态下持续运行,且厨房温度传感器出现异常高温读数和故障,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 18:00时厨房温度传感器突然跳升至28.64°C(2864),而此时住户尚未回家、灶具未开启,这是一个异常的温度尖峰,可能是传感器故障或外部热源。\",\n \"推理步骤2: 18:58-19:29住户正常使用灶具做饭,期间厨房温度传感器两次报告None(故障),说明传感器工作不稳定。\",\n \"推理步骤3: 20:51灶具再次开启,但此时客厅运动传感器显示Occupancy=0(住户离开客厅去了厨房,这部分合理)。然而20:56厨房温度升至27.00°C,21:21进一步升至27.50°C,持续升高。\",\n \"推理步骤4: 关键问题——灶具在20:51开启后,日志中没有任何关闭记录。住户在21:49已进入卧室准备睡觉(关灯、关空调、拉窗帘),22:53关灯入睡,但灶具从未显示关闭事件。\",\n \"推理步骤5: 21:00和21:30的厨房常规温度读数恢复正常(约23.8°C),与20:56/21:21的高温读数矛盾,说明温度传感器可能存在间歇性故障,无法可靠监测厨房实际温度。\",\n \"推理步骤6: 厨房窗户在19:29打开后也未见关闭记录,如果灶具确实仍在运行,开窗状态下火焰可能受风影响,增加风险。\"\n ],\n \"key_evidence\": [\n \"20:51灶具开启后全天日志中无关闭记录,住户已于22:53入睡\",\n \"厨房温度传感器多次异常:18:00无故升至28.64°C、18:59和19:30报告None、20:56升至27.00°C、21:21升至27.50°C\",\n \"18:00厨房温度异常尖峰(28.64°C)发生在住户不在家、灶具未开启时,传感器可靠性存疑\",\n \"厨房窗户自19:29打开后未关闭\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除无人看管的火灾隐患\",\n \"向住户发送高优先级告警通知,提醒灶具可能仍在运行\",\n \"安排检修厨房温度传感器,其多次报告None和异常尖峰值表明硬件可能故障\",\n \"考虑设置自动化规则:当灶具开启超过一定时间且无人在厨房活动时自动关闭或告警\",\n \"确认厨房窗户状态,夜间建议关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人看管状态下持续运行,且厨房温度传感器出现异常高温读数和故障,存在火灾风险。", "reasoning": ["推理步骤1: 18:00时厨房温度传感器突然跳升至28.64°C(2864),而此时住户尚未回家、灶具未开启,这是一个异常的温度尖峰,可能是传感器故障或外部热源。", "推理步骤2: 18:58-19:29住户正常使用灶具做饭,期间厨房温度传感器两次报告None(故障),说明传感器工作不稳定。", "推理步骤3: 20:51灶具再次开启,但此时客厅运动传感器显示Occupancy=0(住户离开客厅去了厨房,这部分合理)。然而20:56厨房温度升至27.00°C,21:21进一步升至27.50°C,持续升高。", "推理步骤4: 关键问题——灶具在20:51开启后,日志中没有任何关闭记录。住户在21:49已进入卧室准备睡觉(关灯、关空调、拉窗帘),22:53关灯入睡,但灶具从未显示关闭事件。", "推理步骤5: 21:00和21:30的厨房常规温度读数恢复正常(约23.8°C),与20:56/21:21的高温读数矛盾,说明温度传感器可能存在间歇性故障,无法可靠监测厨房实际温度。", "推理步骤6: 厨房窗户在19:29打开后也未见关闭记录,如果灶具确实仍在运行,开窗状态下火焰可能受风影响,增加风险。"], "key_evidence": ["20:51灶具开启后全天日志中无关闭记录,住户已于22:53入睡", "厨房温度传感器多次异常:18:00无故升至28.64°C、18:59和19:30报告None、20:56升至27.00°C、21:21升至27.50°C", "18:00厨房温度异常尖峰(28.64°C)发生在住户不在家、灶具未开启时,传感器可靠性存疑", "厨房窗户自19:29打开后未关闭"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除无人看管的火灾隐患", "向住户发送高优先级告警通知,提醒灶具可能仍在运行", "安排检修厨房温度传感器,其多次报告None和异常尖峰值表明硬件可能故障", "考虑设置自动化规则:当灶具开启超过一定时间且无人在厨房活动时自动关闭或告警", "确认厨房窗户状态,夜间建议关闭"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.266038417816162, "api_error": null} {"episode_id": "SQ4_FP_A_0882", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0882.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261511, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-02T13:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:19:00 温度突然飙升至 28.36°C(与前一读数相差约 3.5°C),随后两次报告 None(数据丢失),且住户无人在家期间(13:55)空调被远程开启,存在轻微可疑行为。\",\n \"reasoning\": [\n \"推理步骤1: 整体温度趋势分析——凌晨 00:00-05:30 三个区域温度稳定(客厅 ~22.9-23.1°C,卧室 ~21.9-22.1°C,厨房 ~22.9-23.1°C),06:00 起随日出自然升温,午后达到峰值(客厅 ~25.8°C,厨房 ~25.9°C),傍晚后逐步回落,符合夏季一天的正常温度曲线。\",\n \"推理步骤2: 厨房温度传感器异常——19:00 厨房温度从 18:30 的 24.54°C 突然跳升至 28.36°C(+3.82°C),而此时灶具尚未开启(19:06 才开启)。灶具开启后 19:07 和 19:28 传感器连续两次报告 MeasuredValue = None,说明传感器数据丢失或故障。19:30 恢复读数后仍为 28.43°C 的高值,但 20:00 骤降至 24.11°C。这种跳变-丢失-跳变模式高度指向传感器故障或通信异常,而非真实温度变化。\",\n \"推理步骤3: 卧室温度传感器也出现非周期性额外上报——13:55、14:25、14:55、15:25 出现了非整点/半点的额外温度读数(约 25.0°C),与常规 30 分钟周期不一致。这些读数出现在空调远程开启前后,可能是空调联动触发的额外采样,但也可能是传感器轮询异常。\",\n \"推理步骤4: 空调在 13:55 被开启,但住户 07:24 已出门(关灯、锁门),18:18 才回家。无人在家期间空调开启,可能是远程/定时操作,属于合理场景,但无法排除未授权远程访问的可能性。\",\n \"推理步骤5: 入侵风险排查——07:24 出门时门锁自动上锁(LockState=1),18:18 回家手动开锁,期间无任何门窗传感器触发、无运动传感器触发,无异常开锁事件,入侵风险极低。\",\n \"推理步骤6: 火灾/烟雾风险排查——灶具 19:06 开启、19:27 关闭,使用时长约 21 分钟,属正常烹饪。烟雾报警器全天无触发。烹饪后开窗通风(19:27:30 厨房窗户打开),行为合理。\",\n \"推理步骤7: 漏水风险排查——卫生间漏水传感器全天无触发,洗碗机 19:47 正常启动运行,无异常。\",\n \"推理步骤8: 入户门在 18:18 开门后直到 22:09:30 才关闭(约 3 小时 51 分钟门处于开启状态),虽然住户在家,但长时间未关门存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.54°C 突跳至 28.36°C(灶具尚未开启),随后 19:07 和 19:28 传感器报告 MeasuredValue = None(数据丢失)\",\n \"13:55 无人在家时客厅空调被开启\",\n \"卧室温度传感器在 13:55/14:25/14:55/15:25 出现非常规周期的额外上报\",\n \"入户门从 18:18 开启至 22:09 才关闭,持续近 4 小时处于未关状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态和通信连接,确认是否存在故障或信号干扰,必要时更换传感器\",\n \"核实 13:55 空调开启是否为住户本人的远程/定时操作,若非本人操作则检查智能家居平台的访问日志和授权设备列表,排除未授权访问\",\n \"建议设置入户门长时间未关闭的提醒规则(如超过 10 分钟未关门则推送通知)\",\n \"检查卧室温度传感器的上报策略配置,确认非周期性上报是否为联动触发或配置异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:19:00 温度突然飙升至 28.36°C(与前一读数相差约 3.5°C),随后两次报告 None(数据丢失),且住户无人在家期间(13:55)空调被远程开启,存在轻微可疑行为。", "reasoning": ["推理步骤1: 整体温度趋势分析——凌晨 00:00-05:30 三个区域温度稳定(客厅 ~22.9-23.1°C,卧室 ~21.9-22.1°C,厨房 ~22.9-23.1°C),06:00 起随日出自然升温,午后达到峰值(客厅 ~25.8°C,厨房 ~25.9°C),傍晚后逐步回落,符合夏季一天的正常温度曲线。", "推理步骤2: 厨房温度传感器异常——19:00 厨房温度从 18:30 的 24.54°C 突然跳升至 28.36°C(+3.82°C),而此时灶具尚未开启(19:06 才开启)。灶具开启后 19:07 和 19:28 传感器连续两次报告 MeasuredValue = None,说明传感器数据丢失或故障。19:30 恢复读数后仍为 28.43°C 的高值,但 20:00 骤降至 24.11°C。这种跳变-丢失-跳变模式高度指向传感器故障或通信异常,而非真实温度变化。", "推理步骤3: 卧室温度传感器也出现非周期性额外上报——13:55、14:25、14:55、15:25 出现了非整点/半点的额外温度读数(约 25.0°C),与常规 30 分钟周期不一致。这些读数出现在空调远程开启前后,可能是空调联动触发的额外采样,但也可能是传感器轮询异常。", "推理步骤4: 空调在 13:55 被开启,但住户 07:24 已出门(关灯、锁门),18:18 才回家。无人在家期间空调开启,可能是远程/定时操作,属于合理场景,但无法排除未授权远程访问的可能性。", "推理步骤5: 入侵风险排查——07:24 出门时门锁自动上锁(LockState=1),18:18 回家手动开锁,期间无任何门窗传感器触发、无运动传感器触发,无异常开锁事件,入侵风险极低。", "推理步骤6: 火灾/烟雾风险排查——灶具 19:06 开启、19:27 关闭,使用时长约 21 分钟,属正常烹饪。烟雾报警器全天无触发。烹饪后开窗通风(19:27:30 厨房窗户打开),行为合理。", "推理步骤7: 漏水风险排查——卫生间漏水传感器全天无触发,洗碗机 19:47 正常启动运行,无异常。", "推理步骤8: 入户门在 18:18 开门后直到 22:09:30 才关闭(约 3 小时 51 分钟门处于开启状态),虽然住户在家,但长时间未关门存在一定安全隐患。"], "key_evidence": ["19:00 厨房温度从 24.54°C 突跳至 28.36°C(灶具尚未开启),随后 19:07 和 19:28 传感器报告 MeasuredValue = None(数据丢失)", "13:55 无人在家时客厅空调被开启", "卧室温度传感器在 13:55/14:25/14:55/15:25 出现非常规周期的额外上报", "入户门从 18:18 开启至 22:09 才关闭,持续近 4 小时处于未关状态"], "recommended_actions": ["检查厨房温度传感器硬件状态和通信连接,确认是否存在故障或信号干扰,必要时更换传感器", "核实 13:55 空调开启是否为住户本人的远程/定时操作,若非本人操作则检查智能家居平台的访问日志和授权设备列表,排除未授权访问", "建议设置入户门长时间未关闭的提醒规则(如超过 10 分钟未关门则推送通知)", "检查卧室温度传感器的上报策略配置,确认非周期性上报是否为联动触发或配置异常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.46135711669922, "api_error": null} {"episode_id": "SQ4_FP_A_0888", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0888.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261517, "scenario_id": "INS-02", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-21T06:26:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且午间出现异常高温读数(29.70°C→29.89°C),疑似传感器故障或灶具散热异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中共出现 5 次 MeasuredValue = None(09:24、09:31、12:02、12:50、17:55、18:36),均发生在灶具开启或关闭前后。正常传感器即使在高温环境下也应返回数值而非 None,多次出现 None 表明传感器可能受灶具热辐射干扰或自身存在故障。\",\n \"推理步骤2: 12:00 厨房温度突然从 25.56°C 跳升至 29.70°C,12:30 进一步升至 29.89°C,而此时灶具刚在 12:01 开启。相比之下,早餐(09:23)和晚餐(17:54)使用灶具时并未出现类似跳变。这一异常尖峰可能是传感器读数漂移,也可能是午间灶具使用叠加高室温导致的真实高温,但烟雾报警器未触发,排除了明火/烟雾风险。\",\n \"推理步骤3: 入户门锁在 06:26 出现一次 LockOperationError(OperationError=1, OperationSource=3 即键盘/密码),20 秒后同一用户(UserIndex=1)成功解锁。单次密码错误后由已注册用户成功开锁,属于正常的输入失误,不构成入侵威胁。\",\n \"推理步骤4: 整体生活模式合理——凌晨无活动、06:26 住户回家、08:36-09:30 晨间洗漱做早餐、12:00 午餐、17:54 晚餐、22:58 关灯锁门就寝,符合单人一室一厅的日常作息。\",\n \"推理步骤5: 门窗方面,厨房窗户在做饭后开窗通风(09:30、12:49、18:35)是合理行为;卧室窗户传感器全天无异常事件;入户门在 22:58 自动上锁。漏水传感器和烟雾报警器全天未触发,无水灾或火灾迹象。\",\n \"推理步骤6: 客厅空调在 09:49 开启制冷模式(SystemMode=3),22:58 关闭,期间客厅温度从约 25.1°C 缓慢下降,制冷效果正常。卧室窗帘早晨打开(08:44 位置=0%)、晚间关闭(22:58 位置=100%),属正常起居操作。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:24、09:31、12:02、12:50、17:55、18:36 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度从 25.56°C 骤升至 29.70°C,12:30 达 29.89°C,与其他房间温度趋势明显偏离(客厅同期仅 25.87°C)\",\n \"06:26 门锁密码错误一次(OperationError=1),20 秒后 UserIndex=1 成功解锁,属正常误操作\",\n \"烟雾报警器和漏水传感器全天未触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温读数异常和频繁 None 值;如有必要,将传感器迁移至远离热源的位置\",\n \"对厨房温度传感器进行校准或更换,持续出现 None 值可能意味着硬件老化或通信故障\",\n \"关注厨房窗户传感器状态——日志中多次记录开窗(StateValue=False)但未见关窗记录,建议确认睡前厨房窗户是否已关闭,避免夜间安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且午间出现异常高温读数(29.70°C→29.89°C),疑似传感器故障或灶具散热异常。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中共出现 5 次 MeasuredValue = None(09:24、09:31、12:02、12:50、17:55、18:36),均发生在灶具开启或关闭前后。正常传感器即使在高温环境下也应返回数值而非 None,多次出现 None 表明传感器可能受灶具热辐射干扰或自身存在故障。", "推理步骤2: 12:00 厨房温度突然从 25.56°C 跳升至 29.70°C,12:30 进一步升至 29.89°C,而此时灶具刚在 12:01 开启。相比之下,早餐(09:23)和晚餐(17:54)使用灶具时并未出现类似跳变。这一异常尖峰可能是传感器读数漂移,也可能是午间灶具使用叠加高室温导致的真实高温,但烟雾报警器未触发,排除了明火/烟雾风险。", "推理步骤3: 入户门锁在 06:26 出现一次 LockOperationError(OperationError=1, OperationSource=3 即键盘/密码),20 秒后同一用户(UserIndex=1)成功解锁。单次密码错误后由已注册用户成功开锁,属于正常的输入失误,不构成入侵威胁。", "推理步骤4: 整体生活模式合理——凌晨无活动、06:26 住户回家、08:36-09:30 晨间洗漱做早餐、12:00 午餐、17:54 晚餐、22:58 关灯锁门就寝,符合单人一室一厅的日常作息。", "推理步骤5: 门窗方面,厨房窗户在做饭后开窗通风(09:30、12:49、18:35)是合理行为;卧室窗户传感器全天无异常事件;入户门在 22:58 自动上锁。漏水传感器和烟雾报警器全天未触发,无水灾或火灾迹象。", "推理步骤6: 客厅空调在 09:49 开启制冷模式(SystemMode=3),22:58 关闭,期间客厅温度从约 25.1°C 缓慢下降,制冷效果正常。卧室窗帘早晨打开(08:44 位置=0%)、晚间关闭(22:58 位置=100%),属正常起居操作。"], "key_evidence": ["厨房温度传感器在 09:24、09:31、12:02、12:50、17:55、18:36 共 6 次报告 MeasuredValue = None", "12:00 厨房温度从 25.56°C 骤升至 29.70°C,12:30 达 29.89°C,与其他房间温度趋势明显偏离(客厅同期仅 25.87°C)", "06:26 门锁密码错误一次(OperationError=1),20 秒后 UserIndex=1 成功解锁,属正常误操作", "烟雾报警器和漏水传感器全天未触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温读数异常和频繁 None 值;如有必要,将传感器迁移至远离热源的位置", "对厨房温度传感器进行校准或更换,持续出现 None 值可能意味着硬件老化或通信故障", "关注厨房窗户传感器状态——日志中多次记录开窗(StateValue=False)但未见关窗记录,建议确认睡前厨房窗户是否已关闭,避免夜间安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.542428255081177, "api_error": null} {"episode_id": "SQ4_FP_A_0890", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0890.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261519, "scenario_id": "BA-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "kitchen", "injection_time": "2026-06-16T19:45:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及数据丢失,疑似传感器故障;同时入户门和厨房窗户存在未关闭隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从前一时段的~24.5°C跳升至28.43°C,升幅近4°C,而此时灶具尚未开启(19:10才开),且客厅/卧室温度同期在正常下降,排除环境整体升温的可能。\",\n \"推理步骤2: 19:11和19:30厨房温度传感器连续两次报告MeasuredValue=None(空值),说明传感器出现数据丢失或通信中断。虽然19:30的第二条记录恢复为2842(28.42°C),但灶具已于19:29关闭,此时厨房温度仍高达28.42°C不合理——对比客厅同期仅24.36°C。\",\n \"推理步骤3: 到20:00厨房温度骤降回24.14°C(30分钟内下降超4°C),这种剧烈波动不符合正常物理散热规律,进一步佐证传感器读数不可靠而非真实温度变化。\",\n \"推理步骤4: 入户门在18:16:02被打开(BooleanState=False),但直到22:14:42才关闭(BooleanState=True),期间约4小时大门处于开启状态。虽然住户在家,但长时间不关门存在安全隐患。\",\n \"推理步骤5: 厨房窗户在19:29:30被打开(BooleanState=False),此后日志中无关闭记录,住户22:36已入睡,厨房窗户整夜未关。\",\n \"推理步骤6: 其余行为模式正常——住户06:23起床、07:29出门并自动锁门、18:16回家、开空调制冷(SystemMode=3)、做饭、洗碗、22:36就寝,符合独居上班族的典型作息。烟雾报警器全天无触发,漏水传感器无报警,入侵风险低。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度异常跳升至2843(28.43°C),前后时段均为~24-25°C,与客厅/卧室趋势不一致\",\n \"19:11和19:30厨房温度传感器报告MeasuredValue=None,出现数据丢失\",\n \"19:30恢复读数仍为2842,20:00骤降至2414,30分钟内降幅超4°C,不符合物理规律\",\n \"入户门18:16开启后约4小时(至22:14)才关闭\",\n \"厨房窗户19:29开启后全天无关闭记录,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和网络连接,清洁或更换传感器以排除故障\",\n \"设置自动化规则:入户门开启超过一定时间(如10分钟)且住户在家时发送提醒\",\n \"设置就寝模式自动检查:当卧室灯关闭进入睡眠状态时,自动检测所有窗户/门的关闭状态并提醒\",\n \"为厨房温度传感器配置异常值告警(如温度突变超过3°C/30min或出现None值时立即通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及数据丢失,疑似传感器故障;同时入户门和厨房窗户存在未关闭隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从前一时段的~24.5°C跳升至28.43°C,升幅近4°C,而此时灶具尚未开启(19:10才开),且客厅/卧室温度同期在正常下降,排除环境整体升温的可能。", "推理步骤2: 19:11和19:30厨房温度传感器连续两次报告MeasuredValue=None(空值),说明传感器出现数据丢失或通信中断。虽然19:30的第二条记录恢复为2842(28.42°C),但灶具已于19:29关闭,此时厨房温度仍高达28.42°C不合理——对比客厅同期仅24.36°C。", "推理步骤3: 到20:00厨房温度骤降回24.14°C(30分钟内下降超4°C),这种剧烈波动不符合正常物理散热规律,进一步佐证传感器读数不可靠而非真实温度变化。", "推理步骤4: 入户门在18:16:02被打开(BooleanState=False),但直到22:14:42才关闭(BooleanState=True),期间约4小时大门处于开启状态。虽然住户在家,但长时间不关门存在安全隐患。", "推理步骤5: 厨房窗户在19:29:30被打开(BooleanState=False),此后日志中无关闭记录,住户22:36已入睡,厨房窗户整夜未关。", "推理步骤6: 其余行为模式正常——住户06:23起床、07:29出门并自动锁门、18:16回家、开空调制冷(SystemMode=3)、做饭、洗碗、22:36就寝,符合独居上班族的典型作息。烟雾报警器全天无触发,漏水传感器无报警,入侵风险低。"], "key_evidence": ["19:00厨房温度异常跳升至2843(28.43°C),前后时段均为~24-25°C,与客厅/卧室趋势不一致", "19:11和19:30厨房温度传感器报告MeasuredValue=None,出现数据丢失", "19:30恢复读数仍为2842,20:00骤降至2414,30分钟内降幅超4°C,不符合物理规律", "入户门18:16开启后约4小时(至22:14)才关闭", "厨房窗户19:29开启后全天无关闭记录,住户已就寝"], "recommended_actions": ["检查厨房温度传感器的硬件状态和网络连接,清洁或更换传感器以排除故障", "设置自动化规则:入户门开启超过一定时间(如10分钟)且住户在家时发送提醒", "设置就寝模式自动检查:当卧室灯关闭进入睡眠状态时,自动检测所有窗户/门的关闭状态并提醒", "为厨房温度传感器配置异常值告警(如温度突变超过3°C/30min或出现None值时立即通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.47492218017578, "api_error": null} {"episode_id": "SQ4_FP_A_0894", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0894.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261523, "scenario_id": "BA-03", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "living_room", "injection_time": "2026-06-18T16:36:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"发现多项异常:厨房温度传感器疑似故障(异常飙升与读数丢失)、客厅主灯异常闪烁、入户门在住户回家后长时间未关闭、厨房窗户做饭后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约24.8°C跳升至28.63°C,而同一时刻客厅和卧室温度均在正常下降趋势中(客厅24.52°C、卧室23.57°C),此时灶具尚未开启(18:51才开),排除烹饪导致的升温,属于传感器异常读数。\",\n \"推理步骤2: 厨房温度传感器在18:52和19:52两次报告MeasuredValue=None(空值),说明传感器出现了读数丢失/通信故障。结合步骤1的异常飙升,高度怀疑该传感器存在硬件故障或连接不稳定。\",\n \"推理步骤3: 16:36客厅主灯在2秒间隔内连续开关闪烁4次(True→False→True→False),且触发源标记为OccupancySensing.Occupancy=1来自living_room_light_1本身而非living_room_occupancy传感器,属性上报设备ID异常。此时住户不在家(07:29已出门,18:24才回来),无人触发的快速闪烁可能是灯具电气故障或固件异常。\",\n \"推理步骤4: 住户18:24开锁进门,front_door_contact变为False(门开),但直到21:57:33才变为True(门关)并自动上锁。入户门持续敞开约3.5小时,存在安全隐患。虽然可能是住户有意为之,但对于一室一厅的住宅来说,长时间不关门不太寻常。\",\n \"推理步骤5: 厨房窗户在19:51:30被打开(做完饭通风),但直到日志结束(23:30)仍未关闭,住户22:39已入睡。夜间窗户未关存在一定安全风险。\",\n \"推理步骤6: 其余行为模式正常——住户06:17起床、06:50洗漱、07:29出门上锁、18:24回家、18:51做饭、19:51做完饭、21:57就寝准备、22:39入睡,符合典型上班族作息。温度整体走势(夜间低、午间高、晚间回落)符合夏季自然规律,卧室因窗帘遮挡始终偏低约1°C也合理。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器突然飙升至28.63°C(前值约25.0°C),而灶具18:51才开启,且客厅/卧室温度同期无异常升高\",\n \"18:52和19:52厨房温度传感器两次报告MeasuredValue=None,出现读数丢失\",\n \"16:36客厅主灯在无人在家时以2秒间隔快速闪烁4次(开→关→开→关),且占用感应事件错误地上报在灯具设备ID上\",\n \"入户门从18:24:02开启到21:57:33关闭,持续敞开约3小时33分钟\",\n \"厨房窗户19:51:30打开后至日志结束未关闭,住户已于22:39入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头、检查供电和无线连接稳定性,必要时更换设备。该传感器是厨房安全(配合烟雾报警器)的重要一环,故障会影响火灾预警能力。\",\n \"检查客厅主灯(living_room_light_1):排查灯具电气连接和固件版本,确认是否存在接触不良或控制模块异常。同时核查为何OccupancySensing属性出现在灯具设备上而非独立的运动传感器上。\",\n \"设置入户门长时间未关提醒:建议配置自动化规则,当入户门打开超过一定时间(如5-10分钟)时推送通知提醒住户。\",\n \"设置就寝时窗户未关提醒:建议在卧室灯关闭或进入睡眠模式时,自动检查所有窗户传感器状态,若有窗户未关则发出提醒。\",\n \"关注厨房温度传感器修复前的过渡期:在传感器恢复正常前,可适当降低烟雾报警器的灵敏度阈值或增加人工巡检频率,避免因温度监测盲区遗漏火灾风险。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "发现多项异常:厨房温度传感器疑似故障(异常飙升与读数丢失)、客厅主灯异常闪烁、入户门在住户回家后长时间未关闭、厨房窗户做饭后未关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约24.8°C跳升至28.63°C,而同一时刻客厅和卧室温度均在正常下降趋势中(客厅24.52°C、卧室23.57°C),此时灶具尚未开启(18:51才开),排除烹饪导致的升温,属于传感器异常读数。", "推理步骤2: 厨房温度传感器在18:52和19:52两次报告MeasuredValue=None(空值),说明传感器出现了读数丢失/通信故障。结合步骤1的异常飙升,高度怀疑该传感器存在硬件故障或连接不稳定。", "推理步骤3: 16:36客厅主灯在2秒间隔内连续开关闪烁4次(True→False→True→False),且触发源标记为OccupancySensing.Occupancy=1来自living_room_light_1本身而非living_room_occupancy传感器,属性上报设备ID异常。此时住户不在家(07:29已出门,18:24才回来),无人触发的快速闪烁可能是灯具电气故障或固件异常。", "推理步骤4: 住户18:24开锁进门,front_door_contact变为False(门开),但直到21:57:33才变为True(门关)并自动上锁。入户门持续敞开约3.5小时,存在安全隐患。虽然可能是住户有意为之,但对于一室一厅的住宅来说,长时间不关门不太寻常。", "推理步骤5: 厨房窗户在19:51:30被打开(做完饭通风),但直到日志结束(23:30)仍未关闭,住户22:39已入睡。夜间窗户未关存在一定安全风险。", "推理步骤6: 其余行为模式正常——住户06:17起床、06:50洗漱、07:29出门上锁、18:24回家、18:51做饭、19:51做完饭、21:57就寝准备、22:39入睡,符合典型上班族作息。温度整体走势(夜间低、午间高、晚间回落)符合夏季自然规律,卧室因窗帘遮挡始终偏低约1°C也合理。"], "key_evidence": ["18:00厨房温度传感器突然飙升至28.63°C(前值约25.0°C),而灶具18:51才开启,且客厅/卧室温度同期无异常升高", "18:52和19:52厨房温度传感器两次报告MeasuredValue=None,出现读数丢失", "16:36客厅主灯在无人在家时以2秒间隔快速闪烁4次(开→关→开→关),且占用感应事件错误地上报在灯具设备ID上", "入户门从18:24:02开启到21:57:33关闭,持续敞开约3小时33分钟", "厨房窗户19:51:30打开后至日志结束未关闭,住户已于22:39入睡"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头、检查供电和无线连接稳定性,必要时更换设备。该传感器是厨房安全(配合烟雾报警器)的重要一环,故障会影响火灾预警能力。", "检查客厅主灯(living_room_light_1):排查灯具电气连接和固件版本,确认是否存在接触不良或控制模块异常。同时核查为何OccupancySensing属性出现在灯具设备上而非独立的运动传感器上。", "设置入户门长时间未关提醒:建议配置自动化规则,当入户门打开超过一定时间(如5-10分钟)时推送通知提醒住户。", "设置就寝时窗户未关提醒:建议在卧室灯关闭或进入睡眠模式时,自动检查所有窗户传感器状态,若有窗户未关则发出提醒。", "关注厨房温度传感器修复前的过渡期:在传感器恢复正常前,可适当降低烟雾报警器的灵敏度阈值或增加人工巡检频率,避免因温度监测盲区遗漏火灾风险。"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 36.060816526412964, "api_error": null} {"episode_id": "SQ4_FP_A_0897", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0897.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261526, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-12T07:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:18:00 温度突然飙升至 28.68°C(偏离正常值约 4°C),且在灶具使用期间两次报告 None 值,表明传感器可能存在故障或受到灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 纵观全天温度数据,客厅和厨房温度走势高度一致(夜间约 23°C,午间峰值约 25.5-25.8°C,傍晚回落至约 24.6°C),卧室因窗帘遮挡始终低约 1-1.5°C,整体符合夏季一室一厅的正常日变化曲线。\",\n \"推理步骤2: 关键异常出现在 18:00——厨房温度从 17:30 的 24.87°C 突然跳升至 28.68°C,而同一时刻客厅仅为 24.68°C、卧室为 23.52°C。此时灶具尚未开启(灶具 18:50 才开),且住户刚进门(18:04),厨房无人操作,这一约 4°C 的异常偏差无法用正常环境因素解释。\",\n \"推理步骤3: 18:30 厨房温度仍高达 28.59°C,持续偏离。到 18:51(灶具刚开启后)和 19:46(灶具关闭后),厨房温度传感器两次报告 MeasuredValue = None,说明传感器读数丢失。而 19:00 恢复后读数回归正常(24.31°C),与客厅一致。这种\"异常高温→读数丢失→恢复正常\"的模式高度指向传感器自身故障(如间歇性硬件异常或连接不稳定)。\",\n \"推理步骤4: 烟雾报警器全天未触发任何告警,排除了真实火灾或烟雾事件的可能性。如果 28.68°C 是真实环境温度,在密闭厨房中应有明显热源,但当时无任何设备运行。\",\n \"推理步骤5: 其他事件均属正常——住户 06:43 起床、07:24 出门(门锁自动上锁)、18:04 回家(手动开锁、开灯、开空调)、做饭、洗碗、22:57 就寝,生活节奏规律。07:54 卫生间漏水传感器短暂触发 2 分钟后恢复,且当时有人在卫生间,大概率是洗漱溅水所致,非真实漏水。入户门在住户外出期间始终处于锁定状态,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突然从 24.72°C 飙升至 28.68°C,偏离同期客厅温度约 4°C,且当时厨房无任何设备运行\",\n \"18:30 厨房温度仍为 28.59°C,持续异常偏高\",\n \"18:51 和 19:46 厨房温度传感器两次报告 MeasuredValue = None(读数丢失),分别发生在灶具开启后和关闭后\",\n \"19:00 恢复读数后温度回归正常(24.31°C),与客厅温度一致,说明之前的高温并非真实环境温度\",\n \"全天烟雾报警器未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近灶具或其他热源,必要时重新安置到远离灶具的位置\",\n \"检查厨房温度传感器的硬件状态和固件版本,两次 None 值报告提示可能存在间歇性通信故障或传感器老化,考虑更换传感器\",\n \"在传感器修复前,可临时依赖烟雾报警器作为厨房安全的主要监测手段,但不应长期缺少可靠的温度监测\",\n \"卫生间漏水传感器虽本次为误报,建议定期检查传感器灵敏度和安装位置,避免洗漱溅水频繁触发\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:18:00 温度突然飙升至 28.68°C(偏离正常值约 4°C),且在灶具使用期间两次报告 None 值,表明传感器可能存在故障或受到灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 纵观全天温度数据,客厅和厨房温度走势高度一致(夜间约 23°C,午间峰值约 25.5-25.8°C,傍晚回落至约 24.6°C),卧室因窗帘遮挡始终低约 1-1.5°C,整体符合夏季一室一厅的正常日变化曲线。\",\n \"推理步骤2: 关键异常出现在 18:00——厨房温度从 17:30 的 24.87°C 突然跳升至 28.68°C,而同一时刻客厅仅为 24.68°C、卧室为 23.52°C。此时灶具尚未开启(灶具 18:50 才开),且住户刚进门(18:04),厨房无人操作,这一约 4°C 的异常偏差无法用正常环境因素解"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 29.342818021774292, "api_error": null} {"episode_id": "SQ4_FP_A_0899", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0899.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261528, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-08T16:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在潜在的火灾/过热风险需排查。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在19:00突然从约24.6°C跳升至28.37°C,涨幅近4°C,远超正常半小时波动范围。此时灶具尚未开启(19:01:30才开),说明这次温度飙升不是烹饪导致的,传感器读数异常。\",\n \"推理步骤2: 19:02:00和19:35:00厨房温度传感器连续两次报告MeasuredValue=None,表明传感器数据采集失败或通信中断,这是明确的设备故障信号。\",\n \"推理步骤3: 19:30:00厨房温度仍高达28.44°C,而此时灶具已在19:34关闭前仍在运行,但28.4°C的环境温度对于室内厨房来说偏高。对比同时段客厅24.26°C、卧室23.32°C,厨房比其他房间高出约4-5°C,差异显著。\",\n \"推理步骤4: 20:00:00厨房温度回落至24.14°C,与开窗通风(19:34:30厨房窗户打开)吻合,说明住户已注意到厨房过热并采取了措施。但传感器的None值问题仍未解决。\",\n \"推理步骤5: 其余行为模式正常——住户06:19起床、07:16出门上班、18:30回家、19:01做饭、21:51就寝,门锁开关、灯光联动、空调使用均符合独居一室一厅的日常作息,无入侵或其他安全威胁迹象。\",\n \"推理步骤6: 16:25空调远程开启(住户不在家时),属于常见的回家前预冷操作,不构成异常。入户门在住户外出和回家时均正常上锁,自动锁功能工作正常。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度突增至28.37°C(前一读数18:30为24.58°C),灶具尚未开启,涨幅异常\",\n \"19:02:00和19:35:00厨房温度传感器连续两次报告MeasuredValue=None,数据采集失败\",\n \"19:30厨房温度28.44°C,比同时段客厅(24.26°C)高出约4.2°C,差异远超正常房间间温差\",\n \"厨房窗户在19:34:30被打开(BooleanState=False),住户主动通风降温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,排查两次None值的原因(电池电量、通信信号、传感器老化),必要时更换传感器\",\n \"排查19:00厨房异常升温的来源——确认是否有其他热源(如烤箱预热、阳光直射)或传感器本身读数漂移\",\n \"建议为厨房温度传感器设置异常阈值告警(如超过28°C或出现None值时立即推送通知),以便及时发现问题\",\n \"确认厨房烟雾报警器在整个时段内未触发,说明未达到烟雾/CO报警级别,但仍建议定期测试烟雾报警器功能是否正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在潜在的火灾/过热风险需排查。", "reasoning": ["推理步骤1: 厨房温度在19:00突然从约24.6°C跳升至28.37°C,涨幅近4°C,远超正常半小时波动范围。此时灶具尚未开启(19:01:30才开),说明这次温度飙升不是烹饪导致的,传感器读数异常。", "推理步骤2: 19:02:00和19:35:00厨房温度传感器连续两次报告MeasuredValue=None,表明传感器数据采集失败或通信中断,这是明确的设备故障信号。", "推理步骤3: 19:30:00厨房温度仍高达28.44°C,而此时灶具已在19:34关闭前仍在运行,但28.4°C的环境温度对于室内厨房来说偏高。对比同时段客厅24.26°C、卧室23.32°C,厨房比其他房间高出约4-5°C,差异显著。", "推理步骤4: 20:00:00厨房温度回落至24.14°C,与开窗通风(19:34:30厨房窗户打开)吻合,说明住户已注意到厨房过热并采取了措施。但传感器的None值问题仍未解决。", "推理步骤5: 其余行为模式正常——住户06:19起床、07:16出门上班、18:30回家、19:01做饭、21:51就寝,门锁开关、灯光联动、空调使用均符合独居一室一厅的日常作息,无入侵或其他安全威胁迹象。", "推理步骤6: 16:25空调远程开启(住户不在家时),属于常见的回家前预冷操作,不构成异常。入户门在住户外出和回家时均正常上锁,自动锁功能工作正常。"], "key_evidence": ["19:00厨房温度突增至28.37°C(前一读数18:30为24.58°C),灶具尚未开启,涨幅异常", "19:02:00和19:35:00厨房温度传感器连续两次报告MeasuredValue=None,数据采集失败", "19:30厨房温度28.44°C,比同时段客厅(24.26°C)高出约4.2°C,差异远超正常房间间温差", "厨房窗户在19:34:30被打开(BooleanState=False),住户主动通风降温"], "recommended_actions": ["检查厨房温度传感器硬件状态,排查两次None值的原因(电池电量、通信信号、传感器老化),必要时更换传感器", "排查19:00厨房异常升温的来源——确认是否有其他热源(如烤箱预热、阳光直射)或传感器本身读数漂移", "建议为厨房温度传感器设置异常阈值告警(如超过28°C或出现None值时立即推送通知),以便及时发现问题", "确认厨房烟雾报警器在整个时段内未触发,说明未达到烟雾/CO报警级别,但仍建议定期测试烟雾报警器功能是否正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.435105323791504, "api_error": null} {"episode_id": "SQ4_FP_A_0900", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0900.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261529, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bedroom", "injection_time": "2026-06-12T08:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),同时厨房窗户在做完饭后开启但始终未关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约24.8°C跳升至28.54°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.54°C / 23.68°C)。此时灶具尚未开启(18:51才开),住户刚进门,无合理热源解释这一约4°C的突变。\",\n \"推理步骤2: 18:30厨房温度进一步上升至28.58°C,灶具仍未开启,异常持续。这表明要么传感器本身故障产生虚高读数,要么厨房存在未被记录的异常热源。\",\n \"推理步骤3: 18:52(灶具刚开启1分钟后)厨房温度传感器报告 MeasuredValue = None,数据丢失。19:31(灶具关闭后1分钟、厨房窗户刚打开后)再次报告 None。两次 None 读数高度可疑,正常传感器不应在短时间内反复丢失数据。\",\n \"推理步骤4: 19:00温度恢复正常读数24.34°C后,传感器在19:31再次报None,随后20:00恢复至24.14°C并趋于正常。这种间歇性故障模式符合传感器硬件不稳定或受热/受潮导致的间歇性失效特征。\",\n \"推理步骤5: 厨房窗户在19:30:30被打开(BooleanState.StateValue = False),但直到日志结束(23:30)始终未关闭。住户22:40已入睡,厨房窗户整夜敞开存在安全风险(入侵通道、雨水进入等)。\",\n \"推理步骤6: 卧室在08:37-08:43期间出现两次短暂运动检测(各约45秒和50秒),此时住户已于07:38出门且门锁已锁。虽然可能是宠物或传感器误触发,但在无人状态下的运动检测值得关注。不过由于未伴随门锁/门窗异常,判定为低风险。\",\n \"推理步骤7: 其余设备行为均正常——住户06:42起床、07:38出门、18:01回家、22:40就寝的作息规律合理;门锁开关操作正常;空调制冷模式(SystemMode=3)在夏季合理;洗碗机正常启动运行。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度突升至28.54°C(较17:30的24.80°C跳升约3.7°C),同期客厅/卧室温度正常下降,且灶具尚未开启\",\n \"18:30厨房温度继续异常高达28.58°C,灶具仍未开启\",\n \"18:52和19:31厨房温度传感器两次报告 MeasuredValue = None(数据丢失)\",\n \"厨房窗户19:30:30打开后至日志结束(23:30)未关闭,住户已于22:40入睡\",\n \"08:37-08:43住户外出期间卧室出现两次短暂运动检测\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具辐射热影响,必要时更换传感器\",\n \"立即关闭厨房窗户,并考虑设置自动化规则:就寝时检查所有窗户状态并提醒关闭\",\n \"针对传感器 None 读数设置告警规则,连续或频繁出现 None 时及时通知用户\",\n \"关注外出期间卧室运动传感器的触发情况,如无宠物且反复出现,建议排查传感器灵敏度或确认是否有安全隐患\",\n \"建议为厨房窗户增加自动化联动:若灶具关闭超过一定时间且窗户仍开启,发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),同时厨房窗户在做完饭后开启但始终未关闭,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约24.8°C跳升至28.54°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.54°C / 23.68°C)。此时灶具尚未开启(18:51才开),住户刚进门,无合理热源解释这一约4°C的突变。", "推理步骤2: 18:30厨房温度进一步上升至28.58°C,灶具仍未开启,异常持续。这表明要么传感器本身故障产生虚高读数,要么厨房存在未被记录的异常热源。", "推理步骤3: 18:52(灶具刚开启1分钟后)厨房温度传感器报告 MeasuredValue = None,数据丢失。19:31(灶具关闭后1分钟、厨房窗户刚打开后)再次报告 None。两次 None 读数高度可疑,正常传感器不应在短时间内反复丢失数据。", "推理步骤4: 19:00温度恢复正常读数24.34°C后,传感器在19:31再次报None,随后20:00恢复至24.14°C并趋于正常。这种间歇性故障模式符合传感器硬件不稳定或受热/受潮导致的间歇性失效特征。", "推理步骤5: 厨房窗户在19:30:30被打开(BooleanState.StateValue = False),但直到日志结束(23:30)始终未关闭。住户22:40已入睡,厨房窗户整夜敞开存在安全风险(入侵通道、雨水进入等)。", "推理步骤6: 卧室在08:37-08:43期间出现两次短暂运动检测(各约45秒和50秒),此时住户已于07:38出门且门锁已锁。虽然可能是宠物或传感器误触发,但在无人状态下的运动检测值得关注。不过由于未伴随门锁/门窗异常,判定为低风险。", "推理步骤7: 其余设备行为均正常——住户06:42起床、07:38出门、18:01回家、22:40就寝的作息规律合理;门锁开关操作正常;空调制冷模式(SystemMode=3)在夏季合理;洗碗机正常启动运行。"], "key_evidence": ["18:00厨房温度突升至28.54°C(较17:30的24.80°C跳升约3.7°C),同期客厅/卧室温度正常下降,且灶具尚未开启", "18:30厨房温度继续异常高达28.58°C,灶具仍未开启", "18:52和19:31厨房温度传感器两次报告 MeasuredValue = None(数据丢失)", "厨房窗户19:30:30打开后至日志结束(23:30)未关闭,住户已于22:40入睡", "08:37-08:43住户外出期间卧室出现两次短暂运动检测"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具辐射热影响,必要时更换传感器", "立即关闭厨房窗户,并考虑设置自动化规则:就寝时检查所有窗户状态并提醒关闭", "针对传感器 None 读数设置告警规则,连续或频繁出现 None 时及时通知用户", "关注外出期间卧室运动传感器的触发情况,如无宠物且反复出现,建议排查传感器灵敏度或确认是否有安全隐患", "建议为厨房窗户增加自动化联动:若灶具关闭超过一定时间且窗户仍开启,发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.15904664993286, "api_error": null} {"episode_id": "SQ4_FP_A_0910", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0910.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261539, "scenario_id": "INS-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-29T10:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间出现异常高温读数及两次 null 值,且卧室窗户传感器在住户外出期间被打开后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息正常——06:25 起床、07:25 出门上班、18:25 回家、22:38 入睡,全天活动模式合理,无入侵迹象。\",\n \"推理步骤2: 07:25 出门时门锁手动解锁→开门→关门→自动上锁,18:25 回家同样流程,门锁操作均为 Manual/Auto,无异常解锁事件。\",\n \"推理步骤3: 19:00 厨房温度传感器突然从约 2459(24.59°C)跳升至 2843(28.43°C),升幅约 4°C,远超同时段其他房间变化幅度。虽然灶具在 19:00:30 开启可解释部分升温,但 19:01 和 19:35 传感器连续报告 MeasuredValue = None(空值),说明传感器可能因高温或故障丢失读数。\",\n \"推理步骤4: 19:30 厨房温度仍为 2844(28.44°C),灶具 19:34 关闭后住户开窗通风(kitchen_window_contact = False),到 20:00 温度回落至 2419,说明烹饪本身是正常行为,但传感器两次报 null 值属于设备异常。\",\n \"推理步骤5: 10:07 住户外出期间卧室出现短暂活动——运动传感器触发、灯亮、窗户传感器变为 False(窗户打开)、灯灭、运动消失,整个过程仅 13 秒。此后直到 21:49 回卧室,bedroom_window_contact 始终未报告关闭(StateValue = True),窗户在无人状态下保持打开约 11 小时。这可能是住户有意通风,但也存在安全隐患。\",\n \"推理步骤6: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水灾风险。客厅空调 18:25 开启制冷(SystemMode=3),21:49 关闭,温度从约 24.6°C 降至约 23.5°C,行为正常。\"\n ],\n \"key_evidence\": [\n \"19:01 和 19:35 厨房温度传感器报告 MeasuredValue = None,正常传感器不应返回空值\",\n \"19:00 厨房温度从 2459 骤升至 2843(+3.84°C),与灶具开启时间几乎同步但升幅异常大\",\n \"10:07:10 卧室窗户打开(bedroom_window_contact = False),之后全天日志中未见关闭事件,窗户在无人期间长时间敞开\",\n \"10:07 的卧室活动仅持续 13 秒(进入→开灯→开窗→关灯→离开),行为模式短促异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,导致烹饪时读数异常和 null 值;考虑重新校准或更换传感器\",\n \"确认卧室窗户当前状态——如窗户确实仍然打开,建议关闭以防夜间安全隐患(外人进入、雨水等)\",\n \"建议为卧室窗户传感器设置「无人在家且窗户打开超过一定时长」的自动提醒规则\",\n \"观察厨房温度传感器在后续烹饪中是否再次出现 null 值,若反复出现则确认为硬件故障需更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间出现异常高温读数及两次 null 值,且卧室窗户传感器在住户外出期间被打开后未关闭。", "reasoning": ["推理步骤1: 住户作息正常——06:25 起床、07:25 出门上班、18:25 回家、22:38 入睡,全天活动模式合理,无入侵迹象。", "推理步骤2: 07:25 出门时门锁手动解锁→开门→关门→自动上锁,18:25 回家同样流程,门锁操作均为 Manual/Auto,无异常解锁事件。", "推理步骤3: 19:00 厨房温度传感器突然从约 2459(24.59°C)跳升至 2843(28.43°C),升幅约 4°C,远超同时段其他房间变化幅度。虽然灶具在 19:00:30 开启可解释部分升温,但 19:01 和 19:35 传感器连续报告 MeasuredValue = None(空值),说明传感器可能因高温或故障丢失读数。", "推理步骤4: 19:30 厨房温度仍为 2844(28.44°C),灶具 19:34 关闭后住户开窗通风(kitchen_window_contact = False),到 20:00 温度回落至 2419,说明烹饪本身是正常行为,但传感器两次报 null 值属于设备异常。", "推理步骤5: 10:07 住户外出期间卧室出现短暂活动——运动传感器触发、灯亮、窗户传感器变为 False(窗户打开)、灯灭、运动消失,整个过程仅 13 秒。此后直到 21:49 回卧室,bedroom_window_contact 始终未报告关闭(StateValue = True),窗户在无人状态下保持打开约 11 小时。这可能是住户有意通风,但也存在安全隐患。", "推理步骤6: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水灾风险。客厅空调 18:25 开启制冷(SystemMode=3),21:49 关闭,温度从约 24.6°C 降至约 23.5°C,行为正常。"], "key_evidence": ["19:01 和 19:35 厨房温度传感器报告 MeasuredValue = None,正常传感器不应返回空值", "19:00 厨房温度从 2459 骤升至 2843(+3.84°C),与灶具开启时间几乎同步但升幅异常大", "10:07:10 卧室窗户打开(bedroom_window_contact = False),之后全天日志中未见关闭事件,窗户在无人期间长时间敞开", "10:07 的卧室活动仅持续 13 秒(进入→开灯→开窗→关灯→离开),行为模式短促异常"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,导致烹饪时读数异常和 null 值;考虑重新校准或更换传感器", "确认卧室窗户当前状态——如窗户确实仍然打开,建议关闭以防夜间安全隐患(外人进入、雨水等)", "建议为卧室窗户传感器设置「无人在家且窗户打开超过一定时长」的自动提醒规则", "观察厨房温度传感器在后续烹饪中是否再次出现 null 值,若反复出现则确认为硬件故障需更换"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.93531584739685, "api_error": null} {"episode_id": "SQ4_FP_A_0904", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0904.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261533, "scenario_id": "DF-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "bedroom", "injection_time": "2026-06-26T18:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器出现周期性异常跳变,厨房温度传感器在做饭期间报告 None 值,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息正常——06:30 起床、07:39 出门、18:16 回家、22:30 就寝,所有灯光/门锁/运动传感器事件与单人一室一厅的生活模式完全吻合,排除入侵威胁。\",\n \"推理步骤2: 卧室温度传感器在住户不在家期间(18:03、18:33、19:03、19:33)出现4次异常跳变,从正常的 23.xx°C 突然跳到 25.00-25.02°C,随后在下一个整点读数又恢复正常。这些跳变发生在无人操作、无空调运行的卧室,且幅度约 1.3-1.7°C 的瞬间升高不符合物理规律,高度疑似传感器硬件故障或通信干扰导致的错误读数。\",\n \"推理步骤3: 厨房温度传感器在 19:08 和 19:45 两次报告 MeasuredValue = None(空值)。虽然当时灶具正在使用(19:07-19:44),但 Matter 协议下传感器应报告数值或明确的错误状态,返回 None 说明传感器可能因高温导致读数溢出、通信中断或硬件异常。\",\n \"推理步骤4: 厨房温度在 19:00 达到 28.25°C、19:30 达到 28.42°C,这是做饭期间的正常升温。灶具关闭后(19:44)用户打开了厨房窗户通风(19:44:30 窗户传感器 False),20:00 温度回落至 24.09°C,处置合理。烟雾报警器全天无触发,排除火灾风险。\",\n \"推理步骤5: 客厅空调在 18:03(住户回家前)被远程开启,18:16 住户到家后再次确认开启并设为制冷模式(SystemMode=3),21:56 睡前关闭,属于正常使用。全天室温走势符合夏季白天升温、夜间降温的自然规律。\",\n \"推理步骤6: 入户门在 18:16 开门后直到 21:56 才关闭并自动上锁(约 3 小时 40 分钟门处于开启状态),虽然住户在家,但长时间未关门存在轻微安全隐患。\",\n \"推理步骤7: 洗碗机 19:51 启动后日志中无关闭记录,但这属于正常情况——洗碗机运行周期通常为 1-2 小时,可能在日志截止后自动完成。\",\n \"推理步骤8: 漏水传感器全天无触发,所有窗户传感器状态合理,烟雾报警器无告警,排除水灾和火灾风险。\"\n ],\n \"key_evidence\": [\n \"卧室温度传感器在 18:03、18:33、19:03、19:33 出现4次异常跳变(从 ~23.5°C 突跳至 ~25.0°C),与周围环境温度趋势不符,且发生在无人无设备操作的房间\",\n \"厨房温度传感器在 19:08 和 19:45 两次报告 MeasuredValue = None,正常传感器不应返回空值\",\n \"入户门从 18:16:02 开启至 21:56:34 关闭,持续约 3 小时 40 分钟处于未关状态\"\n ],\n \"recommended_actions\": [\n \"检查卧室温度传感器的硬件状态和固件版本,必要时重新校准或更换,排除间歇性故障\",\n \"检查厨房温度传感器的耐温范围和安装位置,确认其在灶具使用时能否正常工作,考虑将其远离热源安装或更换为耐高温型号\",\n \"建议设置入户门长时间未关闭的自动提醒(如超过 10 分钟未关门则推送通知),提升居家安全性\",\n \"对卧室温度传感器的异常跳变时间点进行网络日志排查,确认是否存在 Zigbee/Thread 网络干扰或 Matter 通信丢包问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卧室温度传感器出现周期性异常跳变,厨房温度传感器在做饭期间报告 None 值,存在设备故障风险。", "reasoning": ["推理步骤1: 住户作息正常——06:30 起床、07:39 出门、18:16 回家、22:30 就寝,所有灯光/门锁/运动传感器事件与单人一室一厅的生活模式完全吻合,排除入侵威胁。", "推理步骤2: 卧室温度传感器在住户不在家期间(18:03、18:33、19:03、19:33)出现4次异常跳变,从正常的 23.xx°C 突然跳到 25.00-25.02°C,随后在下一个整点读数又恢复正常。这些跳变发生在无人操作、无空调运行的卧室,且幅度约 1.3-1.7°C 的瞬间升高不符合物理规律,高度疑似传感器硬件故障或通信干扰导致的错误读数。", "推理步骤3: 厨房温度传感器在 19:08 和 19:45 两次报告 MeasuredValue = None(空值)。虽然当时灶具正在使用(19:07-19:44),但 Matter 协议下传感器应报告数值或明确的错误状态,返回 None 说明传感器可能因高温导致读数溢出、通信中断或硬件异常。", "推理步骤4: 厨房温度在 19:00 达到 28.25°C、19:30 达到 28.42°C,这是做饭期间的正常升温。灶具关闭后(19:44)用户打开了厨房窗户通风(19:44:30 窗户传感器 False),20:00 温度回落至 24.09°C,处置合理。烟雾报警器全天无触发,排除火灾风险。", "推理步骤5: 客厅空调在 18:03(住户回家前)被远程开启,18:16 住户到家后再次确认开启并设为制冷模式(SystemMode=3),21:56 睡前关闭,属于正常使用。全天室温走势符合夏季白天升温、夜间降温的自然规律。", "推理步骤6: 入户门在 18:16 开门后直到 21:56 才关闭并自动上锁(约 3 小时 40 分钟门处于开启状态),虽然住户在家,但长时间未关门存在轻微安全隐患。", "推理步骤7: 洗碗机 19:51 启动后日志中无关闭记录,但这属于正常情况——洗碗机运行周期通常为 1-2 小时,可能在日志截止后自动完成。", "推理步骤8: 漏水传感器全天无触发,所有窗户传感器状态合理,烟雾报警器无告警,排除水灾和火灾风险。"], "key_evidence": ["卧室温度传感器在 18:03、18:33、19:03、19:33 出现4次异常跳变(从 ~23.5°C 突跳至 ~25.0°C),与周围环境温度趋势不符,且发生在无人无设备操作的房间", "厨房温度传感器在 19:08 和 19:45 两次报告 MeasuredValue = None,正常传感器不应返回空值", "入户门从 18:16:02 开启至 21:56:34 关闭,持续约 3 小时 40 分钟处于未关状态"], "recommended_actions": ["检查卧室温度传感器的硬件状态和固件版本,必要时重新校准或更换,排除间歇性故障", "检查厨房温度传感器的耐温范围和安装位置,确认其在灶具使用时能否正常工作,考虑将其远离热源安装或更换为耐高温型号", "建议设置入户门长时间未关闭的自动提醒(如超过 10 分钟未关门则推送通知),提升居家安全性", "对卧室温度传感器的异常跳变时间点进行网络日志排查,确认是否存在 Zigbee/Thread 网络干扰或 Matter 通信丢包问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.98175048828125, "api_error": null} {"episode_id": "SQ4_FP_A_0912", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0912.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261541, "scenario_id": "BA-05", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "living_room", "injection_time": "2026-06-27T18:39:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.71°C),疑似传感器故障或存在局部过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(08:56、09:52、12:11、12:55、18:06、18:41),每次都紧跟在灶具开启或关闭之后。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受热干扰或自身存在故障。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2971(29.71°C),而同一时刻客厅为 25.73°C、卧室为 24.89°C。厨房温度比其他房间高出约 4°C,且灶具是在 12:10 才开启的,说明这个高温读数出现在灶具开启之前,属于异常跳变。12:30 进一步升至 2989(29.89°C),与其他房间温差接近 5°C。\",\n \"推理步骤3: 对比早晨 08:55 灶具使用场景——灶具开启后传感器立即报 None,09:00 恢复正常读数 24.98°C,与客厅 24.90°C 基本一致。但中午 12:00 灶具尚未开启时温度已飙升至 29.71°C,这不是正常的烹饪升温模式,更像是传感器读数漂移或厨房存在其他热源。\",\n \"推理步骤4: 其余设备行为均属正常——住户约 08:32 起床,早中晚三次使用灶具做饭,18:39 有人用 UserIndex=5 的凭证开门进入(可能是家庭成员回家),22:57 关灯锁门就寝,整体生活节奏合理。门锁操作均通过合法凭证(OperationSource=3 为密码/PIN),无入侵迹象。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除明火风险。但传感器频繁报 None 加上异常高温读数,说明该传感器工作状态不稳定,可能导致真正的厨房高温事件无法被及时检测到,这是一个安全盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 08:56、09:52、12:11、12:55、18:06、18:41 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度异常跳升至 2971(29.71°C),此时灶具尚未开启,客厅仅 25.73°C,温差近 4°C\",\n \"12:30 厨房温度继续升至 2989(29.89°C),与客厅温差约 4.1°C\",\n \"每次灶具操作前后传感器都会丢失读数(None),恢复后读数有时正常有时异常,行为不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至远离热源的位置\",\n \"对厨房温度传感器进行校准或更换,频繁的 None 值和异常跳变表明硬件可能已老化或损坏\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段\",\n \"考虑为厨房增加一个冗余温度传感器,避免单点故障导致安全监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.71°C),疑似传感器故障或存在局部过热风险。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(08:56、09:52、12:11、12:55、18:06、18:41),每次都紧跟在灶具开启或关闭之后。正常传感器不应因灶具操作而丢失读数,这表明传感器可能受热干扰或自身存在故障。", "推理步骤2: 12:00 厨房温度传感器报告 2971(29.71°C),而同一时刻客厅为 25.73°C、卧室为 24.89°C。厨房温度比其他房间高出约 4°C,且灶具是在 12:10 才开启的,说明这个高温读数出现在灶具开启之前,属于异常跳变。12:30 进一步升至 2989(29.89°C),与其他房间温差接近 5°C。", "推理步骤3: 对比早晨 08:55 灶具使用场景——灶具开启后传感器立即报 None,09:00 恢复正常读数 24.98°C,与客厅 24.90°C 基本一致。但中午 12:00 灶具尚未开启时温度已飙升至 29.71°C,这不是正常的烹饪升温模式,更像是传感器读数漂移或厨房存在其他热源。", "推理步骤4: 其余设备行为均属正常——住户约 08:32 起床,早中晚三次使用灶具做饭,18:39 有人用 UserIndex=5 的凭证开门进入(可能是家庭成员回家),22:57 关灯锁门就寝,整体生活节奏合理。门锁操作均通过合法凭证(OperationSource=3 为密码/PIN),无入侵迹象。", "推理步骤5: 烟雾报警器全天未触发,排除明火风险。但传感器频繁报 None 加上异常高温读数,说明该传感器工作状态不稳定,可能导致真正的厨房高温事件无法被及时检测到,这是一个安全盲区。"], "key_evidence": ["厨房温度传感器在 08:56、09:52、12:11、12:55、18:06、18:41 共 6 次报告 MeasuredValue = None", "12:00 厨房温度异常跳升至 2971(29.71°C),此时灶具尚未开启,客厅仅 25.73°C,温差近 4°C", "12:30 厨房温度继续升至 2989(29.89°C),与客厅温差约 4.1°C", "每次灶具操作前后传感器都会丢失读数(None),恢复后读数有时正常有时异常,行为不一致"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将其移至远离热源的位置", "对厨房温度传感器进行校准或更换,频繁的 None 值和异常跳变表明硬件可能已老化或损坏", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段", "考虑为厨房增加一个冗余温度传感器,避免单点故障导致安全监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.189504146575928, "api_error": null} {"episode_id": "SQ4_FP_A_0914", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0914.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261543, "scenario_id": "DF-01", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-21T22:47:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在深夜持续出现异常温度跳变,住户已入睡且无任何烹饪活动,疑似传感器故障或存在未知热源。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息分析——08:34 起床,22:50 关灯/锁门/进卧室就寝,生活节奏规律,属于独居一人。\",\n \"推理步骤2: 白天厨房温度传感器多次报告 None 值,均发生在灶具开启期间(09:17、12:03、18:14),推测是烹饪高温导致传感器超量程返回 None,这本身是已知的传感器行为,但也说明该传感器在高温下表现不稳定。\",\n \"推理步骤3: 12:00 厨房温度突然跳至 2982(29.82°C),而同时段客厅为 25.72°C、卧室为 24.81°C,灶具在 12:03 才开启,说明灶具尚未使用时厨房温度已异常偏高约 4°C,传感器读数可疑。\",\n \"推理步骤4: 关键异常——22:47 厨房温度从 23.50°C 骤升至 25.00°C,此时住户正在关灯准备就寝,灶具处于关闭状态,厨房无任何设备活动。同时段客厅和卧室温度均在持续下降(23.53→23.33、22.50→22.31),厨房却逆势上升约 1.5°C,不符合物理规律。\",\n \"推理步骤5: 23:00 厨房温度回落至 23.30°C(与客厅 23.33°C 一致),但 23:17 再次跳至 25.02°C,23:30 又回落至 23.38°C,23:47 再跳至 24.98°C,00:17 仍为 25.01°C。呈现约 30 分钟周期的脉冲式跳变模式。\",\n \"推理步骤6: 排除火灾风险——厨房烟雾报警器全天无任何触发记录,若存在真实热源(明火、电器短路等),烟雾/CO 报警器大概率会响应。且温度仅在 25°C 附近跳变,未持续攀升,不符合火灾特征。\",\n \"推理步骤7: 排除正常原因——厨房窗户在 18:35 被打开后日志中无关闭记录,深夜室外温度应低于室内(从整体温度下降趋势可判断),开窗不会导致温度上升。洗碗机 18:35 启动,但距异常发生已过 4 小时以上,且洗碗机不会产生如此周期性的温度波动。\",\n \"推理步骤8: 综合判断——厨房温度传感器存在间歇性故障,表现为周期性虚高读数(约每 30 分钟跳变一次,幅度约 1.5°C)。白天 12:00 的异常高温(29.82°C)也支持该传感器存在偶发性读数偏差的结论。\"\n ],\n \"key_evidence\": [\n \"22:47 厨房温度从 23.50°C 骤升至 25.00°C,灶具关闭、无人活动、其他房间温度均在下降\",\n \"23:17(25.02°C)→ 23:30(23.38°C)→ 23:47(24.98°C)→ 00:17(25.01°C),呈现约 30 分钟周期的脉冲式异常跳变\",\n \"12:00 灶具未开启时厨房温度已达 29.82°C,比客厅高出 4°C,属于异常偏高\",\n \"烟雾报警器全天未触发,排除真实火灾/热源的可能性\",\n \"烹饪期间传感器多次返回 None,说明该传感器在极端条件下工作不稳定\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,清洁探头并确认无油污覆盖或线路接触不良\",\n \"对比厨房温度传感器与其他房间传感器的读数,持续监测数日以确认异常跳变是否重复出现\",\n \"如确认传感器故障,尽快更换,避免因错误读数影响基于温度的自动化规则(如空调联动、火灾预警等)\",\n \"虽然烟雾报警器未触发,仍建议人工检查厨房是否存在隐蔽热源(如电器待机异常发热),以彻底排除安全隐患\",\n \"厨房窗户自 18:35 开启后未见关闭记录,住户已入睡,建议确认窗户状态并考虑设置就寝模式自动关窗提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在深夜持续出现异常温度跳变,住户已入睡且无任何烹饪活动,疑似传感器故障或存在未知热源。", "reasoning": ["推理步骤1: 住户作息分析——08:34 起床,22:50 关灯/锁门/进卧室就寝,生活节奏规律,属于独居一人。", "推理步骤2: 白天厨房温度传感器多次报告 None 值,均发生在灶具开启期间(09:17、12:03、18:14),推测是烹饪高温导致传感器超量程返回 None,这本身是已知的传感器行为,但也说明该传感器在高温下表现不稳定。", "推理步骤3: 12:00 厨房温度突然跳至 2982(29.82°C),而同时段客厅为 25.72°C、卧室为 24.81°C,灶具在 12:03 才开启,说明灶具尚未使用时厨房温度已异常偏高约 4°C,传感器读数可疑。", "推理步骤4: 关键异常——22:47 厨房温度从 23.50°C 骤升至 25.00°C,此时住户正在关灯准备就寝,灶具处于关闭状态,厨房无任何设备活动。同时段客厅和卧室温度均在持续下降(23.53→23.33、22.50→22.31),厨房却逆势上升约 1.5°C,不符合物理规律。", "推理步骤5: 23:00 厨房温度回落至 23.30°C(与客厅 23.33°C 一致),但 23:17 再次跳至 25.02°C,23:30 又回落至 23.38°C,23:47 再跳至 24.98°C,00:17 仍为 25.01°C。呈现约 30 分钟周期的脉冲式跳变模式。", "推理步骤6: 排除火灾风险——厨房烟雾报警器全天无任何触发记录,若存在真实热源(明火、电器短路等),烟雾/CO 报警器大概率会响应。且温度仅在 25°C 附近跳变,未持续攀升,不符合火灾特征。", "推理步骤7: 排除正常原因——厨房窗户在 18:35 被打开后日志中无关闭记录,深夜室外温度应低于室内(从整体温度下降趋势可判断),开窗不会导致温度上升。洗碗机 18:35 启动,但距异常发生已过 4 小时以上,且洗碗机不会产生如此周期性的温度波动。", "推理步骤8: 综合判断——厨房温度传感器存在间歇性故障,表现为周期性虚高读数(约每 30 分钟跳变一次,幅度约 1.5°C)。白天 12:00 的异常高温(29.82°C)也支持该传感器存在偶发性读数偏差的结论。"], "key_evidence": ["22:47 厨房温度从 23.50°C 骤升至 25.00°C,灶具关闭、无人活动、其他房间温度均在下降", "23:17(25.02°C)→ 23:30(23.38°C)→ 23:47(24.98°C)→ 00:17(25.01°C),呈现约 30 分钟周期的脉冲式异常跳变", "12:00 灶具未开启时厨房温度已达 29.82°C,比客厅高出 4°C,属于异常偏高", "烟雾报警器全天未触发,排除真实火灾/热源的可能性", "烹饪期间传感器多次返回 None,说明该传感器在极端条件下工作不稳定"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,清洁探头并确认无油污覆盖或线路接触不良", "对比厨房温度传感器与其他房间传感器的读数,持续监测数日以确认异常跳变是否重复出现", "如确认传感器故障,尽快更换,避免因错误读数影响基于温度的自动化规则(如空调联动、火灾预警等)", "虽然烟雾报警器未触发,仍建议人工检查厨房是否存在隐蔽热源(如电器待机异常发热),以彻底排除安全隐患", "厨房窗户自 18:35 开启后未见关闭记录,住户已入睡,建议确认窗户状态并考虑设置就寝模式自动关窗提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.76375603675842, "api_error": null} {"episode_id": "SQ4_FP_A_0919", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0919.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261548, "scenario_id": "BA-03", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "bedroom", "injection_time": "2026-06-07T06:22:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.89135479927063, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ4_FP_A_0917", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0917.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261546, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "kitchen", "injection_time": "2026-06-17T17:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:两次报告 None 值,且在无人使用灶具期间出现不合理的温度飙升(从约24.7°C骤升至28.6°C),疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息正常——06:25起床、07:24出门、17:58回家、22:49入睡,所有灯光、门锁、运动传感器的联动时序合理,无入侵迹象。\",\n \"推理步骤2: 17:58住户回家时,入户门仅解锁(LockOperationType=1)但未见关门/上锁记录,直到18:08才再次操作门锁完成关门上锁流程。期间约10分钟门处于未锁状态,但结合客厅运动传感器在17:58:05即检测到人,判断为住户进门后短暂未关门,属于轻微疏忽而非安全威胁。\",\n \"推理步骤3: 厨房温度传感器在18:00和18:30报告值为2863和2868(即28.63°C和28.68°C),而同时段客厅温度为24.5°C左右、卧室为23.5°C左右。此时灶具尚未开启(18:57才开灶),厨房不应有如此大的温差(比客厅高出约4°C),且此前厨房与客厅温度一直非常接近(差值<1°C)。这一异常飙升无合理热源解释。\",\n \"推理步骤4: 厨房温度传感器在18:58和19:38两次报告 MeasuredValue = None,说明传感器读数失败。第一次发生在灶具刚开启后1分钟,第二次发生在灶具关闭后1分钟。结合步骤3的异常高温读数,高度怀疑该传感器存在硬件故障或连接不稳定。\",\n \"推理步骤5: 19:00传感器恢复后读数回到24.29°C,与客厅24.41°C基本一致,说明18:00-18:30的高温读数确实是异常值而非真实温度。\",\n \"推理步骤6: 厨房窗户在19:37:30被打开(contact=False),此后日志中未见关闭记录。截至日志结束(23:30),厨房窗户仍处于打开状态。住户22:49已入睡,夜间窗户未关存在一定安全隐患。\",\n \"推理步骤7: 其余设备运行正常——烟雾报警器未触发、漏水传感器无报警、门锁在22:11自动上锁、洗碗机正常启动运行、空调制冷模式工作后正常关闭。整体家庭安全状况良好,主要问题集中在厨房温度传感器的可靠性上。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:00和18:30读数飙升至28.6°C,而灶具18:57才开启,同时段客厅仅24.5°C,无合理热源解释\",\n \"厨房温度传感器在18:58和19:38两次报告 MeasuredValue = None(读数失败)\",\n \"19:00恢复后读数回归正常(24.29°C),证实18:00-18:30的高温为异常值\",\n \"厨房窗户19:37打开后至日志结束(23:30)未关闭,住户已入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和供电/通信连接,必要时更换传感器\",\n \"关闭厨房窗户或设置自动化规则:入睡后若窗户仍开启则发送提醒\",\n \"建议设置温度传感器读数为 None 时的即时告警,以便及时发现传感器离线\",\n \"可考虑为入户门设置未锁超时提醒(如超过2分钟未上锁则通知),避免进门后忘记关门\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:两次报告 None 值,且在无人使用灶具期间出现不合理的温度飙升(从约24.7°C骤升至28.6°C),疑似传感器故障。", "reasoning": ["推理步骤1: 住户作息正常——06:25起床、07:24出门、17:58回家、22:49入睡,所有灯光、门锁、运动传感器的联动时序合理,无入侵迹象。", "推理步骤2: 17:58住户回家时,入户门仅解锁(LockOperationType=1)但未见关门/上锁记录,直到18:08才再次操作门锁完成关门上锁流程。期间约10分钟门处于未锁状态,但结合客厅运动传感器在17:58:05即检测到人,判断为住户进门后短暂未关门,属于轻微疏忽而非安全威胁。", "推理步骤3: 厨房温度传感器在18:00和18:30报告值为2863和2868(即28.63°C和28.68°C),而同时段客厅温度为24.5°C左右、卧室为23.5°C左右。此时灶具尚未开启(18:57才开灶),厨房不应有如此大的温差(比客厅高出约4°C),且此前厨房与客厅温度一直非常接近(差值<1°C)。这一异常飙升无合理热源解释。", "推理步骤4: 厨房温度传感器在18:58和19:38两次报告 MeasuredValue = None,说明传感器读数失败。第一次发生在灶具刚开启后1分钟,第二次发生在灶具关闭后1分钟。结合步骤3的异常高温读数,高度怀疑该传感器存在硬件故障或连接不稳定。", "推理步骤5: 19:00传感器恢复后读数回到24.29°C,与客厅24.41°C基本一致,说明18:00-18:30的高温读数确实是异常值而非真实温度。", "推理步骤6: 厨房窗户在19:37:30被打开(contact=False),此后日志中未见关闭记录。截至日志结束(23:30),厨房窗户仍处于打开状态。住户22:49已入睡,夜间窗户未关存在一定安全隐患。", "推理步骤7: 其余设备运行正常——烟雾报警器未触发、漏水传感器无报警、门锁在22:11自动上锁、洗碗机正常启动运行、空调制冷模式工作后正常关闭。整体家庭安全状况良好,主要问题集中在厨房温度传感器的可靠性上。"], "key_evidence": ["厨房温度传感器在18:00和18:30读数飙升至28.6°C,而灶具18:57才开启,同时段客厅仅24.5°C,无合理热源解释", "厨房温度传感器在18:58和19:38两次报告 MeasuredValue = None(读数失败)", "19:00恢复后读数回归正常(24.29°C),证实18:00-18:30的高温为异常值", "厨房窗户19:37打开后至日志结束(23:30)未关闭,住户已入睡"], "recommended_actions": ["检查厨房温度传感器的硬件状态和供电/通信连接,必要时更换传感器", "关闭厨房窗户或设置自动化规则:入睡后若窗户仍开启则发送提醒", "建议设置温度传感器读数为 None 时的即时告警,以便及时发现传感器离线", "可考虑为入户门设置未锁超时提醒(如超过2分钟未上锁则通知),避免进门后忘记关门"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.65532350540161, "api_error": null} {"episode_id": "SQ4_FP_A_0920", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0920.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261549, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "bedroom", "injection_time": "2026-06-01T14:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在日志结束时仍处于开启状态未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息正常——06:43 起床、07:11 出门上班、18:28 回家、22:40 入睡,所有灯光、门锁、运动传感器事件与单人独居一室一厅的生活节奏完全吻合。\",\n \"推理步骤2: 入侵风险排除——14:35 的开锁事件使用了 OperationSource=3(远程/密码)且携带 UserIndex=5,属于已注册用户凭证操作,10 分钟后重新上锁,期间客厅有人体感应,判断为住户远程开门(如快递/家政),非非法入侵。\",\n \"推理步骤3: 厨房温度传感器异常——19:00 时厨房温度从 18:30 的 24.55°C 突然跳升至 28.30°C(+3.75°C/30min),而灶具直到 19:05 才开启,说明温度跳变发生在灶具使用之前,不能完全用烹饪解释。更关键的是,19:06 和 19:34 传感器连续两次报告 MeasuredValue = None(空值),表明传感器可能存在故障或通信中断。\",\n \"推理步骤4: 19:30 传感器恢复后读数为 28.41°C,灶具已于 19:33 关闭,到 20:00 温度回落至 24.06°C,降幅合理,说明传感器后续恢复了工作,但两次 null 读数仍属异常。\",\n \"推理步骤5: 厨房窗户于 19:33:30 被打开(BooleanState=False),此后整个日志中再无关闭记录。住户 22:10 已回到卧室准备睡觉,厨房窗户仍然敞开,存在夜间安全隐患(通风散热合理,但遗忘关窗过夜不理想)。\",\n \"推理步骤6: 其他系统均正常——门锁在住户出门和睡前均自动上锁(LockState=1),烟雾报警器和漏水传感器全天无告警,客厅/卧室温度曲线符合夏季自然升降规律,空调制冷效果正常。\"\n ],\n \"key_evidence\": [\n \"19:06 和 19:34 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器故障或通信异常\",\n \"19:00 厨房温度从 24.55°C 跳升至 28.30°C,灶具 19:05 才开启,跳变时间早于烹饪开始\",\n \"19:33:30 厨房窗户打开后至日志结束(23:30)未关闭,住户已入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和固件版本,排查两次 null 读数的原因,必要时重新配对或更换传感器\",\n \"设置自动化规则:当住户进入睡眠模式时检查所有窗户传感器状态,若有窗户未关闭则发送提醒通知\",\n \"为厨房温度传感器设置异常值监控:当温度在短时间内跳变超过 3°C 或出现 null 值时触发告警\",\n \"建议关闭当前仍敞开的厨房窗户,避免夜间安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在日志结束时仍处于开启状态未关闭。", "reasoning": ["推理步骤1: 住户作息正常——06:43 起床、07:11 出门上班、18:28 回家、22:40 入睡,所有灯光、门锁、运动传感器事件与单人独居一室一厅的生活节奏完全吻合。", "推理步骤2: 入侵风险排除——14:35 的开锁事件使用了 OperationSource=3(远程/密码)且携带 UserIndex=5,属于已注册用户凭证操作,10 分钟后重新上锁,期间客厅有人体感应,判断为住户远程开门(如快递/家政),非非法入侵。", "推理步骤3: 厨房温度传感器异常——19:00 时厨房温度从 18:30 的 24.55°C 突然跳升至 28.30°C(+3.75°C/30min),而灶具直到 19:05 才开启,说明温度跳变发生在灶具使用之前,不能完全用烹饪解释。更关键的是,19:06 和 19:34 传感器连续两次报告 MeasuredValue = None(空值),表明传感器可能存在故障或通信中断。", "推理步骤4: 19:30 传感器恢复后读数为 28.41°C,灶具已于 19:33 关闭,到 20:00 温度回落至 24.06°C,降幅合理,说明传感器后续恢复了工作,但两次 null 读数仍属异常。", "推理步骤5: 厨房窗户于 19:33:30 被打开(BooleanState=False),此后整个日志中再无关闭记录。住户 22:10 已回到卧室准备睡觉,厨房窗户仍然敞开,存在夜间安全隐患(通风散热合理,但遗忘关窗过夜不理想)。", "推理步骤6: 其他系统均正常——门锁在住户出门和睡前均自动上锁(LockState=1),烟雾报警器和漏水传感器全天无告警,客厅/卧室温度曲线符合夏季自然升降规律,空调制冷效果正常。"], "key_evidence": ["19:06 和 19:34 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器故障或通信异常", "19:00 厨房温度从 24.55°C 跳升至 28.30°C,灶具 19:05 才开启,跳变时间早于烹饪开始", "19:33:30 厨房窗户打开后至日志结束(23:30)未关闭,住户已入睡"], "recommended_actions": ["检查厨房温度传感器的连接状态和固件版本,排查两次 null 读数的原因,必要时重新配对或更换传感器", "设置自动化规则:当住户进入睡眠模式时检查所有窗户传感器状态,若有窗户未关闭则发送提醒通知", "为厨房温度传感器设置异常值监控:当温度在短时间内跳变超过 3°C 或出现 null 值时触发告警", "建议关闭当前仍敞开的厨房窗户,避免夜间安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.98742699623108, "api_error": null} {"episode_id": "SQ4_FP_A_0922", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0922.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261551, "scenario_id": "BA-05", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "bedroom", "injection_time": "2026-06-06T09:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.70°C),疑似传感器故障或存在局部过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中共出现 6 次 MeasuredValue = None(09:18、09:36、12:12、12:49、17:55、18:53),均发生在灶具开启或关闭前后。正常传感器不应频繁丢失读数,这表明传感器可能受灶具热辐射干扰或自身存在间歇性故障。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2970(29.70°C),而同一时刻客厅为 25.90°C、卧室为 24.76°C。厨房比其他房间高出约 4-5°C,且此时灶具尚未开启(12:11 才开灶)。这一异常高温读数无法用烹饪解释,可能是传感器漂移或厨房存在未知热源。到 12:30 仍为 29.83°C,进一步确认异常。\",\n \"推理步骤3: 住户行为模式正常——凌晨无活动,08:30 起床,09:17 做早餐,09:55 有人通过密码(UserIndex=5)开锁进入后 10:05 锁门离开(短暂访问),12:11 做午餐,17:54 做晚餐,22:58 关灯锁门就寝。入户门锁操作均通过合法凭证(OperationSource=3 为键盘/PIN),无入侵迹象。\",\n \"推理步骤4: 厨房烟雾报警器全天未触发,排除明火/烟雾风险。但传感器频繁 None 值意味着在真正发生危险时可能无法提供有效温度监测,这本身就是安全隐患。\",\n \"推理步骤5: 厨房窗户在每次做完饭后都被打开(09:35、12:48、18:52 StateValue=False 表示窗户打开),说明住户有通风习惯,但日志中未见窗户关闭事件,厨房窗户可能整夜处于开启状态,存在轻微安全隐患。\",\n \"推理步骤6: 其他设备运行正常——客厅空调 10:00 开启制冷(SystemMode=3)后室温从约 25.3°C 逐步下降;卧室窗帘早晚正常开合;洗碗机晚餐后启动;漏水传感器无报警。整体家居运行状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:18、09:36、12:12、12:49、17:55、18:53 共 6 次报告 MeasuredValue = None\",\n \"12:00 厨房温度异常飙升至 2970(29.70°C),12:30 仍为 2983(29.83°C),此时灶具尚未开启,比同期客厅高约 4°C\",\n \"厨房窗户三次被打开(09:35、12:48、18:52)但日志中无关闭记录,可能整夜未关\",\n \"入户门锁操作均为合法凭证(OperationSource=3, UserIndex=5),无异常开锁事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数异常和频繁丢失,必要时重新校准或更换传感器\",\n \"排查 12:00 厨房异常高温的原因——确认是否有其他热源(如烤箱、阳光直射)或传感器本身故障\",\n \"建议设置自动化规则:当厨房温度传感器连续报告 None 值时发送告警通知,避免监测盲区\",\n \"确认厨房窗户是否仍处于打开状态,夜间建议关闭以保障安全\",\n \"09:55 的 UserIndex=5 访客开锁记录建议住户确认是否为已知授权人员,定期审查门锁用户列表\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.70°C),疑似传感器故障或存在局部过热风险。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中共出现 6 次 MeasuredValue = None(09:18、09:36、12:12、12:49、17:55、18:53),均发生在灶具开启或关闭前后。正常传感器不应频繁丢失读数,这表明传感器可能受灶具热辐射干扰或自身存在间歇性故障。", "推理步骤2: 12:00 厨房温度传感器报告 2970(29.70°C),而同一时刻客厅为 25.90°C、卧室为 24.76°C。厨房比其他房间高出约 4-5°C,且此时灶具尚未开启(12:11 才开灶)。这一异常高温读数无法用烹饪解释,可能是传感器漂移或厨房存在未知热源。到 12:30 仍为 29.83°C,进一步确认异常。", "推理步骤3: 住户行为模式正常——凌晨无活动,08:30 起床,09:17 做早餐,09:55 有人通过密码(UserIndex=5)开锁进入后 10:05 锁门离开(短暂访问),12:11 做午餐,17:54 做晚餐,22:58 关灯锁门就寝。入户门锁操作均通过合法凭证(OperationSource=3 为键盘/PIN),无入侵迹象。", "推理步骤4: 厨房烟雾报警器全天未触发,排除明火/烟雾风险。但传感器频繁 None 值意味着在真正发生危险时可能无法提供有效温度监测,这本身就是安全隐患。", "推理步骤5: 厨房窗户在每次做完饭后都被打开(09:35、12:48、18:52 StateValue=False 表示窗户打开),说明住户有通风习惯,但日志中未见窗户关闭事件,厨房窗户可能整夜处于开启状态,存在轻微安全隐患。", "推理步骤6: 其他设备运行正常——客厅空调 10:00 开启制冷(SystemMode=3)后室温从约 25.3°C 逐步下降;卧室窗帘早晚正常开合;洗碗机晚餐后启动;漏水传感器无报警。整体家居运行状态良好。"], "key_evidence": ["厨房温度传感器在 09:18、09:36、12:12、12:49、17:55、18:53 共 6 次报告 MeasuredValue = None", "12:00 厨房温度异常飙升至 2970(29.70°C),12:30 仍为 2983(29.83°C),此时灶具尚未开启,比同期客厅高约 4°C", "厨房窗户三次被打开(09:35、12:48、18:52)但日志中无关闭记录,可能整夜未关", "入户门锁操作均为合法凭证(OperationSource=3, UserIndex=5),无异常开锁事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数异常和频繁丢失,必要时重新校准或更换传感器", "排查 12:00 厨房异常高温的原因——确认是否有其他热源(如烤箱、阳光直射)或传感器本身故障", "建议设置自动化规则:当厨房温度传感器连续报告 None 值时发送告警通知,避免监测盲区", "确认厨房窗户是否仍处于打开状态,夜间建议关闭以保障安全", "09:55 的 UserIndex=5 访客开锁记录建议住户确认是否为已知授权人员,定期审查门锁用户列表"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.94391369819641, "api_error": null} {"episode_id": "SQ4_FP_A_0923", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0923.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261552, "scenario_id": "DF-03", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-15T17:46:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:19:00 温度突然飙升至 28.33°C 并在烹饪期间两次报告 None(数据丢失),疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式正常——06:37 起床、07:14 出门上班、18:30 回家、22:53 就寝,符合典型单人上班族作息,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均为正常方式(Manual 开锁、Auto 自动上锁),开关门时间间隔合理(1-2秒),未出现异常开锁事件。\",\n \"推理步骤3: 全屋温度整体走势合理——夜间约 22-23°C,白天随日照升至 25-26°C,傍晚回落。客厅开空调(制冷模式 SystemMode=3)后温度从 24.6°C 降至 23.6°C,符合预期。\",\n \"推理步骤4: 关键异常——厨房温度在 18:30 为 24.68°C,到 19:00 突然跳升至 28.33°C(+3.65°C / 30分钟),这一涨幅远超同期客厅和卧室的变化。虽然 19:03 灶具开启可部分解释升温,但灶具是在 19:00 之后才开的,说明 19:00 的读数本身就异常偏高。\",\n \"推理步骤5: 19:04 和 19:29 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据丢失。正常传感器不应返回 None,这指向传感器故障、通信中断或受高温影响导致读数异常。\",\n \"推理步骤6: 19:30 传感器恢复后读数为 28.28°C,仍然异常偏高;但到 20:00 骤降至 24.15°C(-4.13°C / 30分钟),降幅同样不自然,进一步佐证传感器工作状态不稳定。\",\n \"推理步骤7: 烟雾报警器全天未触发任何告警,排除了火灾或燃气泄漏的可能性。厨房烹饪后住户开窗通风(19:28 窗户传感器 StateValue=False),操作合理。\",\n \"推理步骤8: 卫生间 17:46-17:52 出现两次短暂的运动检测但灯未开启,结合住户尚未到家(18:30 才开门),可能是宠物活动或传感器误触发,但无其他异常联动,风险较低。\",\n \"推理步骤9: 洗碗机 20:05 启动后日志中未见运行结束事件,但这可能是日志截止时间(23:30)前仍在运行或日志未记录结束状态,不构成明确异常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 24.68°C 骤升至 28.33°C,灶具尚未开启(19:03 才开),涨幅异常\",\n \"19:04 和 19:29 厨房温度传感器连续两次报告 MeasuredValue = None,数据丢失\",\n \"19:30 读数 28.28°C 到 20:00 骤降至 24.15°C,30分钟内降幅 4.13°C 不自然\",\n \"17:46-17:52 卫生间运动传感器在住户不在家时触发两次,但无灯光联动\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新定位\",\n \"检查厨房温度传感器的通信连接和固件版本,排查 None 值的根因(硬件故障/通信丢包/过热保护)\",\n \"关注卫生间运动传感器在无人时段的误触发情况,如频繁出现建议调整灵敏度或检查是否有宠物等干扰源\",\n \"确认厨房窗户是否已关闭(日志中 19:28 开窗后未见关窗记录),夜间开窗可能存在安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:19:00 温度突然飙升至 28.33°C 并在烹饪期间两次报告 None(数据丢失),疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 住户行为模式正常——06:37 起床、07:14 出门上班、18:30 回家、22:53 就寝,符合典型单人上班族作息,无入侵迹象。", "推理步骤2: 入户门锁操作均为正常方式(Manual 开锁、Auto 自动上锁),开关门时间间隔合理(1-2秒),未出现异常开锁事件。", "推理步骤3: 全屋温度整体走势合理——夜间约 22-23°C,白天随日照升至 25-26°C,傍晚回落。客厅开空调(制冷模式 SystemMode=3)后温度从 24.6°C 降至 23.6°C,符合预期。", "推理步骤4: 关键异常——厨房温度在 18:30 为 24.68°C,到 19:00 突然跳升至 28.33°C(+3.65°C / 30分钟),这一涨幅远超同期客厅和卧室的变化。虽然 19:03 灶具开启可部分解释升温,但灶具是在 19:00 之后才开的,说明 19:00 的读数本身就异常偏高。", "推理步骤5: 19:04 和 19:29 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据丢失。正常传感器不应返回 None,这指向传感器故障、通信中断或受高温影响导致读数异常。", "推理步骤6: 19:30 传感器恢复后读数为 28.28°C,仍然异常偏高;但到 20:00 骤降至 24.15°C(-4.13°C / 30分钟),降幅同样不自然,进一步佐证传感器工作状态不稳定。", "推理步骤7: 烟雾报警器全天未触发任何告警,排除了火灾或燃气泄漏的可能性。厨房烹饪后住户开窗通风(19:28 窗户传感器 StateValue=False),操作合理。", "推理步骤8: 卫生间 17:46-17:52 出现两次短暂的运动检测但灯未开启,结合住户尚未到家(18:30 才开门),可能是宠物活动或传感器误触发,但无其他异常联动,风险较低。", "推理步骤9: 洗碗机 20:05 启动后日志中未见运行结束事件,但这可能是日志截止时间(23:30)前仍在运行或日志未记录结束状态,不构成明确异常。"], "key_evidence": ["19:00 厨房温度从 24.68°C 骤升至 28.33°C,灶具尚未开启(19:03 才开),涨幅异常", "19:04 和 19:29 厨房温度传感器连续两次报告 MeasuredValue = None,数据丢失", "19:30 读数 28.28°C 到 20:00 骤降至 24.15°C,30分钟内降幅 4.13°C 不自然", "17:46-17:52 卫生间运动传感器在住户不在家时触发两次,但无灯光联动"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热干扰,必要时重新定位", "检查厨房温度传感器的通信连接和固件版本,排查 None 值的根因(硬件故障/通信丢包/过热保护)", "关注卫生间运动传感器在无人时段的误触发情况,如频繁出现建议调整灵敏度或检查是否有宠物等干扰源", "确认厨房窗户是否已关闭(日志中 19:28 开窗后未见关窗记录),夜间开窗可能存在安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 9, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.569563388824463, "api_error": null} {"episode_id": "SQ4_FP_A_0924", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0924.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261553, "scenario_id": "BA-01", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bathroom", "injection_time": "2026-06-21T17:47:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 11:00-11:30 期间无人使用灶具时厨房温度异常飙升至约 29.5°C,疑似传感器故障或厨房存在异常热源。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(09:04、09:39、11:46、12:42、17:48、18:31),每次都紧跟在灶具开启或关闭、窗户打开等事件之后。这表明传感器在厨房环境变化时频繁失效,属于设备异常。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告值分别为 2947 和 2952(即约 29.5°C),而此时灶具处于关闭状态(上次灶具在 09:38 已关闭,下次开启在 11:45)。同一时段客厅温度仅约 25.4°C、卧室约 24.6°C,厨房温度比其他房间高出约 4-5°C,这一异常温差在灶具未使用时不应出现。\",\n \"推理步骤3: 对比全天温度曲线,客厅和卧室的温度变化平滑且一致(夜间约 22-23°C,午间峰值约 25-26°C),而厨房在 11:00 出现了从 25.2°C 到 29.5°C 的突变(30 分钟内跳升约 4.3°C),随后在 12:00 又回落到 25.7°C。这种突变不符合自然升温规律,更像是传感器读数异常或存在未被记录的热源。\",\n \"推理步骤4: 厨房烟雾报警器全天未触发任何告警,排除了明火或烟雾的可能性。因此 11:00 的温度飙升更可能是传感器故障导致的误读,而非真实火灾风险。\",\n \"推理步骤5: 其他方面均正常——住户作息合理(08:38 起床、23:02 就寝),入户门在就寝时自动上锁,灶具使用时长合理(早餐约 35 分钟、午餐约 56 分钟、晚餐约 43 分钟),漏水传感器无告警,门窗状态正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:04、09:39、11:46、12:42、17:48、18:31 共 6 次报告 MeasuredValue = None,频繁丢失数据\",\n \"11:00-11:30 厨房温度飙升至 2947-2952(约 29.5°C),而灶具在 09:38 已关闭、11:45 才重新开启,期间无任何热源操作记录\",\n \"同时段客厅仅 25.4°C、卧室仅 24.6°C,厨房与其他房间温差异常达 4-5°C\",\n \"12:00 厨房温度突然回落至 25.7°C,30 分钟内下降近 4°C,不符合自然降温曲线\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,频繁报告 None 值说明传感器可能存在连接不稳定或硬件老化问题,建议清洁或更换\",\n \"排查 11:00 前后厨房是否有未被智能设备记录的热源(如阳光直射、烤箱等非联网设备使用),确认温度飙升的真实原因\",\n \"如确认为传感器故障,建议尽快更换,因为厨房温度监测是火灾预警的重要辅助手段,传感器失效会降低安全保障能力\",\n \"考虑为厨房温度传感器设置数据有效性校验规则:当读数在短时间内突变超过阈值(如 30 分钟内变化超过 3°C)且无关联设备操作时,自动发出告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 11:00-11:30 期间无人使用灶具时厨房温度异常飙升至约 29.5°C,疑似传感器故障或厨房存在异常热源。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(09:04、09:39、11:46、12:42、17:48、18:31),每次都紧跟在灶具开启或关闭、窗户打开等事件之后。这表明传感器在厨房环境变化时频繁失效,属于设备异常。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器报告值分别为 2947 和 2952(即约 29.5°C),而此时灶具处于关闭状态(上次灶具在 09:38 已关闭,下次开启在 11:45)。同一时段客厅温度仅约 25.4°C、卧室约 24.6°C,厨房温度比其他房间高出约 4-5°C,这一异常温差在灶具未使用时不应出现。", "推理步骤3: 对比全天温度曲线,客厅和卧室的温度变化平滑且一致(夜间约 22-23°C,午间峰值约 25-26°C),而厨房在 11:00 出现了从 25.2°C 到 29.5°C 的突变(30 分钟内跳升约 4.3°C),随后在 12:00 又回落到 25.7°C。这种突变不符合自然升温规律,更像是传感器读数异常或存在未被记录的热源。", "推理步骤4: 厨房烟雾报警器全天未触发任何告警,排除了明火或烟雾的可能性。因此 11:00 的温度飙升更可能是传感器故障导致的误读,而非真实火灾风险。", "推理步骤5: 其他方面均正常——住户作息合理(08:38 起床、23:02 就寝),入户门在就寝时自动上锁,灶具使用时长合理(早餐约 35 分钟、午餐约 56 分钟、晚餐约 43 分钟),漏水传感器无告警,门窗状态正常。"], "key_evidence": ["厨房温度传感器在 09:04、09:39、11:46、12:42、17:48、18:31 共 6 次报告 MeasuredValue = None,频繁丢失数据", "11:00-11:30 厨房温度飙升至 2947-2952(约 29.5°C),而灶具在 09:38 已关闭、11:45 才重新开启,期间无任何热源操作记录", "同时段客厅仅 25.4°C、卧室仅 24.6°C,厨房与其他房间温差异常达 4-5°C", "12:00 厨房温度突然回落至 25.7°C,30 分钟内下降近 4°C,不符合自然降温曲线"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,频繁报告 None 值说明传感器可能存在连接不稳定或硬件老化问题,建议清洁或更换", "排查 11:00 前后厨房是否有未被智能设备记录的热源(如阳光直射、烤箱等非联网设备使用),确认温度飙升的真实原因", "如确认为传感器故障,建议尽快更换,因为厨房温度监测是火灾预警的重要辅助手段,传感器失效会降低安全保障能力", "考虑为厨房温度传感器设置数据有效性校验规则:当读数在短时间内突变超过阈值(如 30 分钟内变化超过 3°C)且无关联设备操作时,自动发出告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.37568235397339, "api_error": null} {"episode_id": "SQ4_FP_A_0928", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0928.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261557, "scenario_id": "INS-01", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-28T19:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 11:00-11:30 期间出现异常高温读数(约29.4-29.5°C),同时厨房窗户在做饭后开启但日志中未见关闭记录,存在设备故障与安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 09:24、09:32、11:57、12:33、17:48、18:56 共6次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器在厨房环境变化时频繁失效,属于设备故障。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器读数分别为 2940(29.4°C)和 2951(29.5°C),而同时段客厅约 25.5°C、卧室约 24.5°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未处于开启状态(09:31 已关闭,11:56 才再次开启)。这一异常高温可能是传感器故障导致的虚高读数,也可能是厨房存在未被记录的热源。\",\n \"推理步骤3: 厨房窗户传感器在 09:31:30、12:32:30、18:55:30 三次记录 BooleanState.StateValue = False(窗户打开),但日志中始终没有对应的关闭事件(StateValue = True)。如果窗户确实一直处于打开状态,夜间无人时存在安全隐患。\",\n \"推理步骤4: 卧室在 19:35 出现一段短暂活动——运动检测触发、灯亮、窗户传感器报告打开、灯灭、运动消失,整个过程仅 20 秒。这个序列本身可以解释为住户短暂进入卧室开窗通风,行为合理,不构成威胁。\",\n \"推理步骤5: 其余设备行为均符合正常生活模式:住户约 08:21 起床,早中晚三餐使用灶具,22:50 就寝时关灯、关空调、锁门、关窗帘,门锁自动上锁。入户门和门锁状态正常,无入侵迹象。漏水传感器和烟雾报警器全天无告警。\",\n \"推理步骤6: 客厅空调在 09:56 开启制冷模式(SystemMode=3),22:50 关闭,期间客厅温度从约 25.1°C 逐步下降,工作正常。卧室窗帘早晨打开(0%)、晚间关闭(100%),符合日常作息。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 MeasuredValue = None,集中在灶具状态切换前后\",\n \"11:00-11:30 厨房温度异常飙升至 29.4-29.5°C,而灶具在 09:31 已关闭、11:56 才重新开启,期间不应有如此高温\",\n \"厨房窗户传感器 3 次记录打开事件但全天无关闭记录,夜间厨房窗户可能处于敞开状态\",\n \"卧室窗户传感器在 19:35 报告打开,之后也无关闭记录,夜间卧室窗户可能未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排查其在高温/油烟环境下频繁返回 None 的原因\",\n \"排查 11:00-11:30 厨房异常高温的来源:确认是否为传感器漂移/故障,或厨房是否存在未关闭的热源(如烤箱)\",\n \"确认厨房窗户和卧室窗户当前的实际开关状态,夜间无人区域窗户敞开存在安防风险,建议设置就寝模式自动检查窗户状态\",\n \"为厨房窗户传感器和卧室窗户传感器添加「长时间未关闭」告警规则,避免遗忘关窗\",\n \"考虑为厨房温度传感器设置合理阈值告警(如超过 28°C 且灶具未开启时自动通知),以便及时发现异常热源\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 11:00-11:30 期间出现异常高温读数(约29.4-29.5°C),同时厨房窗户在做饭后开启但日志中未见关闭记录,存在设备故障与安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 09:24、09:32、11:57、12:33、17:48、18:56 共6次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器在厨房环境变化时频繁失效,属于设备故障。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器读数分别为 2940(29.4°C)和 2951(29.5°C),而同时段客厅约 25.5°C、卧室约 24.5°C。厨房温度比其他房间高出约 4-5°C,且此时灶具并未处于开启状态(09:31 已关闭,11:56 才再次开启)。这一异常高温可能是传感器故障导致的虚高读数,也可能是厨房存在未被记录的热源。", "推理步骤3: 厨房窗户传感器在 09:31:30、12:32:30、18:55:30 三次记录 BooleanState.StateValue = False(窗户打开),但日志中始终没有对应的关闭事件(StateValue = True)。如果窗户确实一直处于打开状态,夜间无人时存在安全隐患。", "推理步骤4: 卧室在 19:35 出现一段短暂活动——运动检测触发、灯亮、窗户传感器报告打开、灯灭、运动消失,整个过程仅 20 秒。这个序列本身可以解释为住户短暂进入卧室开窗通风,行为合理,不构成威胁。", "推理步骤5: 其余设备行为均符合正常生活模式:住户约 08:21 起床,早中晚三餐使用灶具,22:50 就寝时关灯、关空调、锁门、关窗帘,门锁自动上锁。入户门和门锁状态正常,无入侵迹象。漏水传感器和烟雾报警器全天无告警。", "推理步骤6: 客厅空调在 09:56 开启制冷模式(SystemMode=3),22:50 关闭,期间客厅温度从约 25.1°C 逐步下降,工作正常。卧室窗帘早晨打开(0%)、晚间关闭(100%),符合日常作息。"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 MeasuredValue = None,集中在灶具状态切换前后", "11:00-11:30 厨房温度异常飙升至 29.4-29.5°C,而灶具在 09:31 已关闭、11:56 才重新开启,期间不应有如此高温", "厨房窗户传感器 3 次记录打开事件但全天无关闭记录,夜间厨房窗户可能处于敞开状态", "卧室窗户传感器在 19:35 报告打开,之后也无关闭记录,夜间卧室窗户可能未关"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,排查其在高温/油烟环境下频繁返回 None 的原因", "排查 11:00-11:30 厨房异常高温的来源:确认是否为传感器漂移/故障,或厨房是否存在未关闭的热源(如烤箱)", "确认厨房窗户和卧室窗户当前的实际开关状态,夜间无人区域窗户敞开存在安防风险,建议设置就寝模式自动检查窗户状态", "为厨房窗户传感器和卧室窗户传感器添加「长时间未关闭」告警规则,避免遗忘关窗", "考虑为厨房温度传感器设置合理阈值告警(如超过 28°C 且灶具未开启时自动通知),以便及时发现异常热源"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.632065773010254, "api_error": null} {"episode_id": "SQ4_FP_A_0930", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0930.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261559, "scenario_id": "INS-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "kitchen", "injection_time": "2026-06-29T09:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),同时住户外出期间卧室疑似有短暂入侵迹象,存在多项需关注的问题。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约24.7°C跳升至28.52°C,18:30进一步升至28.65°C。此时住户刚到家(18:29开门),灶具尚未开启(18:55才开),没有任何热源可以解释这近4°C的突变。同时段客厅和卧室温度正常下降,排除全屋升温的可能。\",\n \"推理步骤2: 厨房温度传感器在18:56和19:42两次报告MeasuredValue=None。第一次发生在灶具刚开启后1分钟,第二次发生在灶具关闭、厨房窗户打开后1分钟。传感器在正常工况下不应返回None,这表明传感器可能存在硬件故障或通信异常,在温度变化较大时失去响应。\",\n \"推理步骤3: 19:00传感器恢复后读数为24.32°C,相比18:30的28.65°C骤降超过4°C,这个恢复值与客厅温度(24.40°C)基本一致,说明之前的28°C+读数很可能是传感器故障导致的虚高,而非真实环境温度。\",\n \"推理步骤4: 09:07住户已于07:36出门且门锁已自动上锁,但卧室运动传感器检测到有人活动,卧室灯被打开,卧室窗户传感器报告打开(StateValue=False),随后灯关闭、运动传感器恢复无人,整个过程仅13秒。这一事件发生在无人在家期间,需要排查是否为入侵、宠物活动或传感器误报。\",\n \"推理步骤5: 22:34卧室灯关闭、22:34:48运动传感器报告无人,但22:43卧室灯的亮度被调整为CurrentLevel=39。灯在关闭状态下收到亮度调节指令,可能是住户通过手机/语音远程操作,也可能是自动化规则触发,属于低风险但值得确认。\",\n \"推理步骤6: 其余行为模式正常——早晨起床(06:31)、洗漱、早餐、出门上锁(07:36)、傍晚回家(18:29)、做饭、洗碗机运行、晚间就寝(22:02-22:34),符合单人一室一厅的日常生活节奏。门锁操作均为Manual解锁+Auto上锁,无异常解锁尝试。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从约24.7°C异常跳升至28.52°C,18:30达28.65°C,而此时灶具未开启,客厅/卧室温度正常\",\n \"厨房温度传感器在18:56和19:42两次报告MeasuredValue=None,传感器数据中断\",\n \"09:07住户不在家时卧室出现13秒的运动检测+开灯+窗户打开+关灯+运动消失序列\",\n \"传感器恢复后19:00读数为24.32°C,与之前28.65°C形成不合理的骤降\"\n ],\n \"recommended_actions\": [\n \"优先检查厨房温度传感器:清洁传感器探头,检查其安装位置是否靠近热源(如冰箱散热口、阳光直射处),确认固件版本并考虑更换传感器\",\n \"排查09:07卧室异常活动:查看是否有宠物、检查卧室窗户当前状态(日志中未见关闭记录,窗户可能仍处于打开状态),回放该时段的安防摄像头录像(如有)\",\n \"确认卧室窗户是否已关闭:从09:07:10窗户传感器报告打开后,日志中无关闭记录,若窗户仍开着存在安全隐患\",\n \"检查22:43卧室灯亮度调节的来源:确认是否为定时自动化规则或误触,避免不必要的设备唤醒\",\n \"建议为厨房温度传感器设置异常值告警阈值(如30秒内变化超过2°C或读数为None时立即通知),以便及时发现传感器故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),同时住户外出期间卧室疑似有短暂入侵迹象,存在多项需关注的问题。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约24.7°C跳升至28.52°C,18:30进一步升至28.65°C。此时住户刚到家(18:29开门),灶具尚未开启(18:55才开),没有任何热源可以解释这近4°C的突变。同时段客厅和卧室温度正常下降,排除全屋升温的可能。", "推理步骤2: 厨房温度传感器在18:56和19:42两次报告MeasuredValue=None。第一次发生在灶具刚开启后1分钟,第二次发生在灶具关闭、厨房窗户打开后1分钟。传感器在正常工况下不应返回None,这表明传感器可能存在硬件故障或通信异常,在温度变化较大时失去响应。", "推理步骤3: 19:00传感器恢复后读数为24.32°C,相比18:30的28.65°C骤降超过4°C,这个恢复值与客厅温度(24.40°C)基本一致,说明之前的28°C+读数很可能是传感器故障导致的虚高,而非真实环境温度。", "推理步骤4: 09:07住户已于07:36出门且门锁已自动上锁,但卧室运动传感器检测到有人活动,卧室灯被打开,卧室窗户传感器报告打开(StateValue=False),随后灯关闭、运动传感器恢复无人,整个过程仅13秒。这一事件发生在无人在家期间,需要排查是否为入侵、宠物活动或传感器误报。", "推理步骤5: 22:34卧室灯关闭、22:34:48运动传感器报告无人,但22:43卧室灯的亮度被调整为CurrentLevel=39。灯在关闭状态下收到亮度调节指令,可能是住户通过手机/语音远程操作,也可能是自动化规则触发,属于低风险但值得确认。", "推理步骤6: 其余行为模式正常——早晨起床(06:31)、洗漱、早餐、出门上锁(07:36)、傍晚回家(18:29)、做饭、洗碗机运行、晚间就寝(22:02-22:34),符合单人一室一厅的日常生活节奏。门锁操作均为Manual解锁+Auto上锁,无异常解锁尝试。"], "key_evidence": ["18:00厨房温度从约24.7°C异常跳升至28.52°C,18:30达28.65°C,而此时灶具未开启,客厅/卧室温度正常", "厨房温度传感器在18:56和19:42两次报告MeasuredValue=None,传感器数据中断", "09:07住户不在家时卧室出现13秒的运动检测+开灯+窗户打开+关灯+运动消失序列", "传感器恢复后19:00读数为24.32°C,与之前28.65°C形成不合理的骤降"], "recommended_actions": ["优先检查厨房温度传感器:清洁传感器探头,检查其安装位置是否靠近热源(如冰箱散热口、阳光直射处),确认固件版本并考虑更换传感器", "排查09:07卧室异常活动:查看是否有宠物、检查卧室窗户当前状态(日志中未见关闭记录,窗户可能仍处于打开状态),回放该时段的安防摄像头录像(如有)", "确认卧室窗户是否已关闭:从09:07:10窗户传感器报告打开后,日志中无关闭记录,若窗户仍开着存在安全隐患", "检查22:43卧室灯亮度调节的来源:确认是否为定时自动化规则或误触,避免不必要的设备唤醒", "建议为厨房温度传感器设置异常值告警阈值(如30秒内变化超过2°C或读数为None时立即通知),以便及时发现传感器故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.843526124954224, "api_error": null} {"episode_id": "SQ4_FP_A_0932", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0932.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261561, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "bathroom", "injection_time": "2026-06-02T15:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在厨房窗户未关闭的安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.7°C 跳升至 28.65°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.54°C / 23.59°C),跨房间对比排除了全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度仍为 28.68°C,但此时灶具尚未开启(灶具 18:46 才打开),说明这次异常高温并非烹饪导致,更可能是传感器自身故障或局部环境异常。\",\n \"推理步骤3: 18:47(灶具刚开启约1分钟后)厨房温度传感器报告 MeasuredValue = None,数据丢失;19:00 恢复正常读数 24.36°C;19:30 灶具关闭后再次报告 None;20:00 又恢复为 24.17°C。两次 None 读数表明传感器存在间歇性故障。\",\n \"推理步骤4: 烟雾报警器全天未触发任何告警,排除了真实火灾风险;厨房温度在 19:00 恢复后数值与客厅基本一致,说明实际厨房温度并未真正达到 28°C+。\",\n \"推理步骤5: 19:30 厨房窗户传感器报告 StateValue = False(窗户打开),之后日志中再无关闭记录。住户 22:02 已回卧室就寝,厨房窗户整夜处于开启状态,存在安全隐患。\",\n \"推理步骤6: 15:01 入户门通过 UserIndex=5 远程/密码开锁,门开启约10分钟后上锁,期间客厅检测到有人。该用户可能是家政或访客,行为模式尚属正常但值得留意。\",\n \"推理步骤7: 住户整体作息模式正常:06:27 起床、07:39 出门(门自动上锁)、18:09 回家、22:31 就寝,门锁和灯光操作均与人员活动吻合,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突升至 28.65°C(较 17:30 的 24.71°C 骤升近 4°C),而灶具 18:46 才开启,无法解释此次升温\",\n \"18:47 和 19:31 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性数据丢失\",\n \"18:30 厨房温度仍为 28.68°C,灶具未开启状态下持续异常高温\",\n \"19:30 厨房窗户打开后至日志结束(23:30)未见关闭记录,住户已就寝\",\n \"15:01 UserIndex=5 通过远程/密码方式开锁进入,15:11 上锁离开\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,解决间歇性 None 读数和异常高温问题\",\n \"关闭厨房窗户,或设置自动化规则:就寝时检查所有窗户状态并提醒关闭\",\n \"确认 UserIndex=5 的身份和授权情况,如为临时访客建议设置时效性密码\",\n \"考虑为厨房温度传感器设置异常阈值告警(如短时间内温升超过 3°C 且灶具未开启时触发通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时存在厨房窗户未关闭的安全隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.7°C 跳升至 28.65°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.54°C / 23.59°C),跨房间对比排除了全屋升温的可能。", "推理步骤2: 18:30 厨房温度仍为 28.68°C,但此时灶具尚未开启(灶具 18:46 才打开),说明这次异常高温并非烹饪导致,更可能是传感器自身故障或局部环境异常。", "推理步骤3: 18:47(灶具刚开启约1分钟后)厨房温度传感器报告 MeasuredValue = None,数据丢失;19:00 恢复正常读数 24.36°C;19:30 灶具关闭后再次报告 None;20:00 又恢复为 24.17°C。两次 None 读数表明传感器存在间歇性故障。", "推理步骤4: 烟雾报警器全天未触发任何告警,排除了真实火灾风险;厨房温度在 19:00 恢复后数值与客厅基本一致,说明实际厨房温度并未真正达到 28°C+。", "推理步骤5: 19:30 厨房窗户传感器报告 StateValue = False(窗户打开),之后日志中再无关闭记录。住户 22:02 已回卧室就寝,厨房窗户整夜处于开启状态,存在安全隐患。", "推理步骤6: 15:01 入户门通过 UserIndex=5 远程/密码开锁,门开启约10分钟后上锁,期间客厅检测到有人。该用户可能是家政或访客,行为模式尚属正常但值得留意。", "推理步骤7: 住户整体作息模式正常:06:27 起床、07:39 出门(门自动上锁)、18:09 回家、22:31 就寝,门锁和灯光操作均与人员活动吻合,无入侵迹象。"], "key_evidence": ["18:00 厨房温度突升至 28.65°C(较 17:30 的 24.71°C 骤升近 4°C),而灶具 18:46 才开启,无法解释此次升温", "18:47 和 19:31 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性数据丢失", "18:30 厨房温度仍为 28.68°C,灶具未开启状态下持续异常高温", "19:30 厨房窗户打开后至日志结束(23:30)未见关闭记录,住户已就寝", "15:01 UserIndex=5 通过远程/密码方式开锁进入,15:11 上锁离开"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,解决间歇性 None 读数和异常高温问题", "关闭厨房窗户,或设置自动化规则:就寝时检查所有窗户状态并提醒关闭", "确认 UserIndex=5 的身份和授权情况,如为临时访客建议设置时效性密码", "考虑为厨房温度传感器设置异常阈值告警(如短时间内温升超过 3°C 且灶具未开启时触发通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.516562700271606, "api_error": null} {"episode_id": "SQ4_FP_A_0941", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0941.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20261570, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-03T10:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 空值,同时 10:24 有非住户常用用户(UserIndex=5)通过远程方式开锁进入,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 读数从 ~2470 骤升至 2840(约 28.4°C),升幅约 3.7°C,远超同时段客厅/卧室的变化幅度。虽然 19:15 灶具开启可部分解释升温,但该跳变发生在灶具开启之前(19:00 vs 19:15),时间线不吻合。\",\n \"推理步骤2: 厨房温度传感器在 19:16 和 19:32 两次报告 MeasuredValue = None,表示传感器读数丢失。Matter 协议下温度传感器返回 null 通常意味着传感器故障、通信中断或读数超出量程。这在全天其他时段从未出现,属于明确异常。\",\n \"推理步骤3: 19:30 厨房温度仍为 2829,灶具已于 19:31 关闭,之后 20:00 温度回落至 2412,说明高温持续了约 30 分钟。期间烟雾报警器未触发,排除了明火/烟雾风险,但传感器的 None 值仍需排查。\",\n \"推理步骤4: 10:24 入户门锁事件显示 OperationSource=3(远程/网络开锁),使用 UserIndex=5。住户本人 07:11 出门时使用 Manual 方式,18:09 回家也是 Manual。UserIndex=5 的远程开锁身份不明,且开锁后客厅检测到有人(10:24:05),但此后无任何灯光、空调等操作,住户直到 18:09 才正式回家,中间这段访问行为值得确认。\",\n \"推理步骤5: 其余设备行为均正常——住户 06:22 起床、07:11 出门上锁、18:09 回家、22:10 入睡,作息规律;门锁自动上锁功能正常;空调制冷模式(SystemMode=3)合理(夏季白天温度峰值约 25.8°C);卧室窗帘早开晚关;洗碗机晚间运行;厨房做饭后开窗通风——均为正常生活模式。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度异常跳升至 2840,灶具尚未开启(19:15 才开),时间线矛盾\",\n \"19:16 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,全天仅此两次\",\n \"10:24 入户门通过远程方式(OperationSource=3)由 UserIndex=5 开锁,身份待确认\",\n \"10:24 开锁后客厅检测到人员活动,但无任何灯光/设备操作,行为模式异于住户习惯\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具热辐射直接影响,必要时更换传感器\",\n \"核实门锁 UserIndex=5 的身份——确认是否为已授权的家政人员、亲友或快递代收等,如非授权用户应立即删除该凭证并更换门锁密码\",\n \"审查门锁访问日志,确认 UserIndex=5 的历史开锁记录,排除凭证泄露风险\",\n \"考虑为远程开锁操作设置实时推送通知,确保住户第一时间知晓非本人开锁事件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 空值,同时 10:24 有非住户常用用户(UserIndex=5)通过远程方式开锁进入,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 读数从 ~2470 骤升至 2840(约 28.4°C),升幅约 3.7°C,远超同时段客厅/卧室的变化幅度。虽然 19:15 灶具开启可部分解释升温,但该跳变发生在灶具开启之前(19:00 vs 19:15),时间线不吻合。", "推理步骤2: 厨房温度传感器在 19:16 和 19:32 两次报告 MeasuredValue = None,表示传感器读数丢失。Matter 协议下温度传感器返回 null 通常意味着传感器故障、通信中断或读数超出量程。这在全天其他时段从未出现,属于明确异常。", "推理步骤3: 19:30 厨房温度仍为 2829,灶具已于 19:31 关闭,之后 20:00 温度回落至 2412,说明高温持续了约 30 分钟。期间烟雾报警器未触发,排除了明火/烟雾风险,但传感器的 None 值仍需排查。", "推理步骤4: 10:24 入户门锁事件显示 OperationSource=3(远程/网络开锁),使用 UserIndex=5。住户本人 07:11 出门时使用 Manual 方式,18:09 回家也是 Manual。UserIndex=5 的远程开锁身份不明,且开锁后客厅检测到有人(10:24:05),但此后无任何灯光、空调等操作,住户直到 18:09 才正式回家,中间这段访问行为值得确认。", "推理步骤5: 其余设备行为均正常——住户 06:22 起床、07:11 出门上锁、18:09 回家、22:10 入睡,作息规律;门锁自动上锁功能正常;空调制冷模式(SystemMode=3)合理(夏季白天温度峰值约 25.8°C);卧室窗帘早开晚关;洗碗机晚间运行;厨房做饭后开窗通风——均为正常生活模式。"], "key_evidence": ["19:00 厨房温度异常跳升至 2840,灶具尚未开启(19:15 才开),时间线矛盾", "19:16 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,全天仅此两次", "10:24 入户门通过远程方式(OperationSource=3)由 UserIndex=5 开锁,身份待确认", "10:24 开锁后客厅检测到人员活动,但无任何灯光/设备操作,行为模式异于住户习惯"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具热辐射直接影响,必要时更换传感器", "核实门锁 UserIndex=5 的身份——确认是否为已授权的家政人员、亲友或快递代收等,如非授权用户应立即删除该凭证并更换门锁密码", "审查门锁访问日志,确认 UserIndex=5 的历史开锁记录,排除凭证泄露风险", "考虑为远程开锁操作设置实时推送通知,确保住户第一时间知晓非本人开锁事件"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.960614919662476, "api_error": null} {"episode_id": "SQ4_FP_A_0943", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0943.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261572, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-19T16:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次 None 空值,疑似传感器故障;同时厨房窗户在日志结束时仍处于打开状态,存在夜间安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:33 起床、07:13 出门上班、16:55/18:13 回家、22:41 就寝,灯光/门锁/运动传感器的时序完全吻合单人一室一厅的日常模式。\",\n \"推理步骤2: 16:55 的门锁操作错误(LockOperationError, OperationError=1, OperationSource=3)后 20 秒即通过合法用户(UserIndex=1)成功开锁,属于密码/指纹输入失误后重试成功,不构成入侵威胁。\",\n \"推理步骤3: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.53°C,18:30 继续升至 28.69°C,而同一时刻客厅和卧室温度仍在正常下降通道中。灶具直到 18:52 才开启,说明 18:00-18:30 的异常高温并非烹饪导致,传感器可能受到干扰或出现故障。\",\n \"推理步骤4: 厨房温度传感器在 18:53 和 19:41 两次报告 MeasuredValue = None(空值),但在 19:00 又恢复正常读数 24.34°C。间歇性空值是传感器通信不稳定或硬件故障的典型表现。\",\n \"推理步骤5: 19:00 之后厨房温度恢复到与客厅一致的正常水平并持续下降,烟雾报警器全天无触发,排除真实火灾风险,进一步指向传感器自身问题。\",\n \"推理步骤6: 厨房窗户在 19:40:30 被打开(StateValue=False),此后日志中再无关闭记录。住户 22:41 已入睡,厨房窗户整夜敞开存在安全与防盗隐患。\",\n \"推理步骤7: 入户门在 21:58 已关闭并自动上锁(LockState=1),卧室窗帘已关闭(10000=全关),漏水传感器和烟雾报警器全天无告警,其余设备状态均正常。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突升至 2853(28.53°C),较 17:30 的 2485(24.85°C)骤升约 3.7°C,同期客厅/卧室温度正常下降\",\n \"18:53 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性空值\",\n \"灶具 18:52 才开启,无法解释 18:00-18:30 的异常高温\",\n \"厨房窗户 19:40 打开后至日志结束(23:30)未关闭,住户已于 22:41 入睡\",\n \"16:55 门锁操作错误后 20 秒由 UserIndex=1 合法用户成功开锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,确认是否靠近热源或存在通信干扰,必要时更换传感器\",\n \"关闭厨房窗户,或设置自动化规则:当住户进入就寝模式时自动检查并提醒关闭所有窗户\",\n \"持续观察门锁操作错误的频率,若频繁出现 OperationError 需排查锁具机械或电池问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次 None 空值,疑似传感器故障;同时厨房窗户在日志结束时仍处于打开状态,存在夜间安全隐患。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:33 起床、07:13 出门上班、16:55/18:13 回家、22:41 就寝,灯光/门锁/运动传感器的时序完全吻合单人一室一厅的日常模式。", "推理步骤2: 16:55 的门锁操作错误(LockOperationError, OperationError=1, OperationSource=3)后 20 秒即通过合法用户(UserIndex=1)成功开锁,属于密码/指纹输入失误后重试成功,不构成入侵威胁。", "推理步骤3: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.53°C,18:30 继续升至 28.69°C,而同一时刻客厅和卧室温度仍在正常下降通道中。灶具直到 18:52 才开启,说明 18:00-18:30 的异常高温并非烹饪导致,传感器可能受到干扰或出现故障。", "推理步骤4: 厨房温度传感器在 18:53 和 19:41 两次报告 MeasuredValue = None(空值),但在 19:00 又恢复正常读数 24.34°C。间歇性空值是传感器通信不稳定或硬件故障的典型表现。", "推理步骤5: 19:00 之后厨房温度恢复到与客厅一致的正常水平并持续下降,烟雾报警器全天无触发,排除真实火灾风险,进一步指向传感器自身问题。", "推理步骤6: 厨房窗户在 19:40:30 被打开(StateValue=False),此后日志中再无关闭记录。住户 22:41 已入睡,厨房窗户整夜敞开存在安全与防盗隐患。", "推理步骤7: 入户门在 21:58 已关闭并自动上锁(LockState=1),卧室窗帘已关闭(10000=全关),漏水传感器和烟雾报警器全天无告警,其余设备状态均正常。"], "key_evidence": ["18:00 厨房温度突升至 2853(28.53°C),较 17:30 的 2485(24.85°C)骤升约 3.7°C,同期客厅/卧室温度正常下降", "18:53 和 19:41 厨房温度传感器两次报告 MeasuredValue = None,出现间歇性空值", "灶具 18:52 才开启,无法解释 18:00-18:30 的异常高温", "厨房窗户 19:40 打开后至日志结束(23:30)未关闭,住户已于 22:41 入睡", "16:55 门锁操作错误后 20 秒由 UserIndex=1 合法用户成功开锁"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,确认是否靠近热源或存在通信干扰,必要时更换传感器", "关闭厨房窗户,或设置自动化规则:当住户进入就寝模式时自动检查并提醒关闭所有窗户", "持续观察门锁操作错误的频率,若频繁出现 OperationError 需排查锁具机械或电池问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.495192289352417, "api_error": null} {"episode_id": "SQ4_FP_A_0946", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0946.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261575, "scenario_id": "BA-05", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "kitchen", "injection_time": "2026-06-02T10:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障或曾存在真实高温隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 24.78°C 跳升至 28.68°C,而同一时刻客厅(24.50°C)和卧室(23.70°C)温度正常下降,厨房出现约 4°C 的异常偏高,且此时灶具尚未开启(18:55 才开)。\",\n \"推理步骤2: 18:30 厨房温度仍维持在 28.65°C 的高位,进一步确认这不是瞬时噪声,而是持续性异常读数。\",\n \"推理步骤3: 18:56(灶具刚开启1分钟后)和 19:27(灶具关闭后1分钟)厨房温度传感器两次报告 MeasuredValue = None,说明传感器出现数据丢失或通信中断,这是典型的设备故障信号。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到与客厅接近的正常水平(约 24.25°C),说明 18:00-18:30 的高温读数并非环境真实持续升温,更可能是传感器异常或短暂的局部热源影响。\",\n \"推理步骤5: 综合来看——灶具未开时出现异常高温、灶具使用期间传感器两次掉数据——厨房温度传感器的可靠性存疑,这对厨房火灾预警体系构成隐患。\",\n \"推理步骤6: 其余方面均正常:住户作息规律(06:26 起床、07:24 出门、18:29 回家、22:31 就寝);10:31 有 UserIndex=5 的授权用户短暂进入约10分钟后离开,属正常访客/家政行为;门锁自动上锁、入户门关闭状态正常;无入侵、漏水或烟雾报警触发。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突升至 2868(28.68°C),较前一读数 2478(24.78°C)骤升近 4°C,同期其他房间温度正常下降\",\n \"18:30 厨房温度仍为 2865(28.65°C),持续异常高位\",\n \"18:56 和 19:27 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失\",\n \"灶具 18:55 才开启,无法解释 18:00 时的异常高温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如烤箱排气口、阳光直射处)\",\n \"排查传感器通信链路,确认两次 None 读数是传感器本身故障还是网络丢包\",\n \"如传感器确认故障,尽快更换,因为厨房温度监测是烟雾报警的重要辅助手段\",\n \"检查 18:00 前后厨房是否有其他热源(如烤箱定时预热、阳光直射等)以排除环境因素\",\n \"建议为厨房温度传感器设置异常值告警规则(如30分钟内温升超过3°C 或读数为 None 时立即通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及多次数据丢失(None),疑似传感器故障或曾存在真实高温隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 24.78°C 跳升至 28.68°C,而同一时刻客厅(24.50°C)和卧室(23.70°C)温度正常下降,厨房出现约 4°C 的异常偏高,且此时灶具尚未开启(18:55 才开)。", "推理步骤2: 18:30 厨房温度仍维持在 28.65°C 的高位,进一步确认这不是瞬时噪声,而是持续性异常读数。", "推理步骤3: 18:56(灶具刚开启1分钟后)和 19:27(灶具关闭后1分钟)厨房温度传感器两次报告 MeasuredValue = None,说明传感器出现数据丢失或通信中断,这是典型的设备故障信号。", "推理步骤4: 19:00 之后厨房温度恢复到与客厅接近的正常水平(约 24.25°C),说明 18:00-18:30 的高温读数并非环境真实持续升温,更可能是传感器异常或短暂的局部热源影响。", "推理步骤5: 综合来看——灶具未开时出现异常高温、灶具使用期间传感器两次掉数据——厨房温度传感器的可靠性存疑,这对厨房火灾预警体系构成隐患。", "推理步骤6: 其余方面均正常:住户作息规律(06:26 起床、07:24 出门、18:29 回家、22:31 就寝);10:31 有 UserIndex=5 的授权用户短暂进入约10分钟后离开,属正常访客/家政行为;门锁自动上锁、入户门关闭状态正常;无入侵、漏水或烟雾报警触发。"], "key_evidence": ["18:00 厨房温度突升至 2868(28.68°C),较前一读数 2478(24.78°C)骤升近 4°C,同期其他房间温度正常下降", "18:30 厨房温度仍为 2865(28.65°C),持续异常高位", "18:56 和 19:27 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失", "灶具 18:55 才开启,无法解释 18:00 时的异常高温"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如烤箱排气口、阳光直射处)", "排查传感器通信链路,确认两次 None 读数是传感器本身故障还是网络丢包", "如传感器确认故障,尽快更换,因为厨房温度监测是烟雾报警的重要辅助手段", "检查 18:00 前后厨房是否有其他热源(如烤箱定时预热、阳光直射等)以排除环境因素", "建议为厨房温度传感器设置异常值告警规则(如30分钟内温升超过3°C 或读数为 None 时立即通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.01396608352661, "api_error": null} {"episode_id": "SQ4_FP_A_0951", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_A_0951.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261580, "scenario_id": "FG-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-22T19:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次出现异常读数(突然飙升至28.59°C及报告None),且灶具关闭后厨房仍持续高温,传感器工作状态不稳定。\",\n \"reasoning\": [\n \"推理步骤1: 18:00厨房温度传感器突然从约24.7°C跳升至28.59°C(2859),而此时灶具尚未开启(18:52才开),客厅和卧室温度同期仅正常下降。这一跳变幅度(约4°C)在半小时内无合理热源解释,属于异常读数。\",\n \"推理步骤2: 18:30厨房温度仍报28.56°C,灶具依然未开,进一步确认这不是烹饪导致的升温,而是传感器自身读数异常。\",\n \"推理步骤3: 18:52灶具开启后,18:53和19:28厨房温度传感器两次报告MeasuredValue=None(空值),说明传感器在高温环境下出现了数据丢失或通信故障。\",\n \"推理步骤4: 19:00温度恢复正常(24.29°C),但19:08又跳至27.00°C、19:33跳至27.50°C,这些读数与灶具已于19:27关闭的时间线矛盾——灶具关闭后温度不应继续上升。这些异常高温读数穿插在正常读数之间,呈现不稳定的跳变模式。\",\n \"推理步骤5: 对比客厅和卧室传感器,全天温度曲线平滑且符合日间升温、夜间降温的自然规律,唯独厨房传感器出现多次不合理跳变和空值,可以排除是真实环境温度变化,判定为传感器硬件故障或通信异常。\",\n \"推理步骤6: 入户门在18:11开锁进门后一直未关门(BooleanState.StateValue=False),直到21:54:34才关闭并自动上锁。住户在家期间门未关约3小时43分钟,虽非设备故障,但存在一定安全隐患。\",\n \"推理步骤7: 其余设备行为均正常——住户06:34起床、07:13出门、18:11回家、22:49就寝的作息规律合理;门锁开关、灯光、空调、洗碗机操作均符合日常生活模式;烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从约24.75°C骤升至28.59°C,灶具尚未开启,无合理热源\",\n \"18:53和19:28厨房温度传感器报告MeasuredValue=None,出现两次数据丢失\",\n \"19:08报27.00°C、19:33报27.50°C,与前后正常读数(24.29°C/24.35°C)形成剧烈跳变,且19:33时灶具已关闭6分钟\",\n \"客厅和卧室传感器全天读数平滑正常,排除环境因素\",\n \"入户门从18:11至21:54保持未关闭状态约3小时43分钟\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具热辐射直接影响,必要时更换传感器\",\n \"检查厨房温度传感器的Matter通信链路,排查None值是否由无线信号干扰或固件Bug导致\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,避免因温度传感器失灵而遗漏真实的火灾/过热风险\",\n \"建议设置入户门未关闭超时提醒(如超过5分钟未关门则推送告警),提升居家安全性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次出现异常读数(突然飙升至28.59°C及报告None),且灶具关闭后厨房仍持续高温,传感器工作状态不稳定。", "reasoning": ["推理步骤1: 18:00厨房温度传感器突然从约24.7°C跳升至28.59°C(2859),而此时灶具尚未开启(18:52才开),客厅和卧室温度同期仅正常下降。这一跳变幅度(约4°C)在半小时内无合理热源解释,属于异常读数。", "推理步骤2: 18:30厨房温度仍报28.56°C,灶具依然未开,进一步确认这不是烹饪导致的升温,而是传感器自身读数异常。", "推理步骤3: 18:52灶具开启后,18:53和19:28厨房温度传感器两次报告MeasuredValue=None(空值),说明传感器在高温环境下出现了数据丢失或通信故障。", "推理步骤4: 19:00温度恢复正常(24.29°C),但19:08又跳至27.00°C、19:33跳至27.50°C,这些读数与灶具已于19:27关闭的时间线矛盾——灶具关闭后温度不应继续上升。这些异常高温读数穿插在正常读数之间,呈现不稳定的跳变模式。", "推理步骤5: 对比客厅和卧室传感器,全天温度曲线平滑且符合日间升温、夜间降温的自然规律,唯独厨房传感器出现多次不合理跳变和空值,可以排除是真实环境温度变化,判定为传感器硬件故障或通信异常。", "推理步骤6: 入户门在18:11开锁进门后一直未关门(BooleanState.StateValue=False),直到21:54:34才关闭并自动上锁。住户在家期间门未关约3小时43分钟,虽非设备故障,但存在一定安全隐患。", "推理步骤7: 其余设备行为均正常——住户06:34起床、07:13出门、18:11回家、22:49就寝的作息规律合理;门锁开关、灯光、空调、洗碗机操作均符合日常生活模式;烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["18:00厨房温度从约24.75°C骤升至28.59°C,灶具尚未开启,无合理热源", "18:53和19:28厨房温度传感器报告MeasuredValue=None,出现两次数据丢失", "19:08报27.00°C、19:33报27.50°C,与前后正常读数(24.29°C/24.35°C)形成剧烈跳变,且19:33时灶具已关闭6分钟", "客厅和卧室传感器全天读数平滑正常,排除环境因素", "入户门从18:11至21:54保持未关闭状态约3小时43分钟"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受灶具热辐射直接影响,必要时更换传感器", "检查厨房温度传感器的Matter通信链路,排查None值是否由无线信号干扰或固件Bug导致", "在传感器修复前,加强对厨房烟雾报警器的依赖,避免因温度传感器失灵而遗漏真实的火灾/过热风险", "建议设置入户门未关闭超时提醒(如超过5分钟未关门则推送告警),提升居家安全性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.58159589767456, "api_error": null} {"episode_id": "SQ4_FP_B_0852", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0852.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261481, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "second_bedroom", "injection_time": "2026-06-25T06:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:22 入户门开锁后未观察到关门/上锁记录,门可能处于未关闭状态长达约 1.5 小时。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:11、18:13、19:21 四次报告 MeasuredValue = None。虽然每次都与灶具开关操作时间接近,但正常传感器不应返回 None,这表明传感器可能受灶具热量干扰或自身存在间歇性故障。\",\n \"推理步骤2: 16:22 入户门通过手动方式解锁(LockOperationType=1, Manual),门传感器显示门被打开(StateValue=False),玄关运动传感器检测到有人。但之后直到 17:56 下一次开门事件之间,没有任何关门(StateValue=True)或上锁记录。这意味着入户门可能在 16:22 至 17:56 之间处于未关闭/未上锁状态,存在安全隐患。\",\n \"推理步骤3: 对比 07:33 的出门流程(关灯→手动开锁→开门→关门→自动上锁,全过程在 3 秒内完成)和 22:29 的睡前流程(确认关门→自动上锁),可以看出系统具备自动上锁能力。但 16:22 开门后缺失了关门和上锁事件,这不符合正常模式。\",\n \"推理步骤4: 06:54 和 06:59 分别有 UserIndex=1 和 UserIndex=2 通过远程方式(OperationSource=3)解锁,间隔 5 分钟,这符合家庭两位成员分别远程开锁的场景(如给访客或家人开门),属于正常行为。\",\n \"推理步骤5: 整体温度趋势合理——夜间约 23°C,白天升至约 25.8°C 峰值后回落,各房间温度一致,无局部异常升温,排除火灾风险。\",\n \"推理步骤6: 灶具使用模式正常(早 06:51-07:10 做早餐,晚 18:12-19:20 做晚餐),关火后开窗通风,烟雾报警器未触发,厨房安全。\",\n \"推理步骤7: 漏水传感器、烟雾报警器全天无告警,卫生间和厨房无水/烟异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:52、07:11、18:13、19:21 四次报告 MeasuredValue = None,指示传感器工作异常\",\n \"16:22:00 入户门手动解锁并打开(StateValue=False),但之后无对应的关门(StateValue=True)和上锁记录,直到 17:56 才出现下一次门事件\",\n \"对比 07:33 出门时完整的 开门→关门→自动上锁 流程,16:22 的事件序列明显缺失关门和上锁步骤\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常;如传感器本身故障,建议更换\",\n \"检查入户门自动上锁策略,确认为何 16:22 开门后未触发自动关门/上锁,考虑增加「门长时间未关闭」的告警规则\",\n \"建议设置入户门超过 2 分钟未关闭时自动推送提醒,防止门户敞开带来的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:22 入户门开锁后未观察到关门/上锁记录,门可能处于未关闭状态长达约 1.5 小时。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:11、18:13、19:21 四次报告 MeasuredValue = None。虽然每次都与灶具开关操作时间接近,但正常传感器不应返回 None,这表明传感器可能受灶具热量干扰或自身存在间歇性故障。", "推理步骤2: 16:22 入户门通过手动方式解锁(LockOperationType=1, Manual),门传感器显示门被打开(StateValue=False),玄关运动传感器检测到有人。但之后直到 17:56 下一次开门事件之间,没有任何关门(StateValue=True)或上锁记录。这意味着入户门可能在 16:22 至 17:56 之间处于未关闭/未上锁状态,存在安全隐患。", "推理步骤3: 对比 07:33 的出门流程(关灯→手动开锁→开门→关门→自动上锁,全过程在 3 秒内完成)和 22:29 的睡前流程(确认关门→自动上锁),可以看出系统具备自动上锁能力。但 16:22 开门后缺失了关门和上锁事件,这不符合正常模式。", "推理步骤4: 06:54 和 06:59 分别有 UserIndex=1 和 UserIndex=2 通过远程方式(OperationSource=3)解锁,间隔 5 分钟,这符合家庭两位成员分别远程开锁的场景(如给访客或家人开门),属于正常行为。", "推理步骤5: 整体温度趋势合理——夜间约 23°C,白天升至约 25.8°C 峰值后回落,各房间温度一致,无局部异常升温,排除火灾风险。", "推理步骤6: 灶具使用模式正常(早 06:51-07:10 做早餐,晚 18:12-19:20 做晚餐),关火后开窗通风,烟雾报警器未触发,厨房安全。", "推理步骤7: 漏水传感器、烟雾报警器全天无告警,卫生间和厨房无水/烟异常。"], "key_evidence": ["厨房温度传感器在 06:52、07:11、18:13、19:21 四次报告 MeasuredValue = None,指示传感器工作异常", "16:22:00 入户门手动解锁并打开(StateValue=False),但之后无对应的关门(StateValue=True)和上锁记录,直到 17:56 才出现下一次门事件", "对比 07:33 出门时完整的 开门→关门→自动上锁 流程,16:22 的事件序列明显缺失关门和上锁步骤"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常;如传感器本身故障,建议更换", "检查入户门自动上锁策略,确认为何 16:22 开门后未触发自动关门/上锁,考虑增加「门长时间未关闭」的告警规则", "建议设置入户门超过 2 分钟未关闭时自动推送提醒,防止门户敞开带来的安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.672013759613037, "api_error": null} {"episode_id": "SQ4_FP_B_0855", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0855.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261484, "scenario_id": "BA-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "kitchen", "injection_time": "2026-06-26T13:02:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰损坏。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约 23.0°C,白天随气温上升至中午峰值约 25.9°C,傍晚回落,符合夏季自然温度曲线,各传感器之间差异很小(通常 <0.2°C),整体正常。\",\n \"推理步骤2: 厨房温度传感器在 19:00 突然从约 24.5°C 跳升至 28.3°C,19:30 进一步升至 28.44°C。同一时刻其他三个房间温度均在 24.3-24.4°C 范围,厨房比其他房间高出约 4°C。虽然 19:13 灶具开启可以解释一定程度的升温,但 28.3°C 的读数在灶具尚未开启时(19:00)就已出现,说明传感器可能在灶具开启前就已受到干扰或出现故障。\",\n \"推理步骤3: 更关键的是,厨房温度传感器在 19:14 和 19:47 两次报告 MeasuredValue = None(空值),这是明确的设备异常信号。正常传感器不应返回 null 值,说明传感器在灶具使用期间出现了读数中断或通信故障。\",\n \"推理步骤4: 灶具关闭(19:46)后,20:00 厨房温度恢复到 24.12°C,与其他房间基本一致,之后读数恢复正常。这表明传感器可能受灶具高温辐射影响导致间歇性故障,而非永久损坏。\",\n \"推理步骤5: 住户行为模式完全正常——早晨 6:48 起床如厕、7:36 出门上班并自动锁门、18:01 回家开灯开空调、19:13 做饭、22:03 关灯锁门就寝,属于典型的单人工作日作息。入户门锁操作均为 Manual 开锁 + Auto 上锁,无异常开锁事件。\",\n \"推理步骤6: 厨房窗户在 19:46 灶具关闭后打开(通风散热),属于合理操作。洗碗机 19:51 启动也是做饭后的正常行为。烟雾报警器全天无触发,排除火灾风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2830(28.3°C),灶具此时尚未开启(19:13 才开启),比同时刻其他房间高约 4°C\",\n \"19:14 和 19:47 厨房温度传感器两次报告 MeasuredValue = None,出现空值读数\",\n \"19:30 厨房温度进一步升至 2844(28.44°C),而灶具 19:46 关闭后 20:00 温度恢复正常(2412)\",\n \"其他三个房间温度传感器全天读数一致且平滑,无任何异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到热辐射直接影响\",\n \"对厨房温度传感器进行诊断测试,确认 null 值报告的原因(可能是高温导致的传感器过热保护或通信中断)\",\n \"考虑将厨房温度传感器迁移到远离灶具的位置,或加装隔热防护\",\n \"持续监控该传感器后续表现,若 null 值频繁出现建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰损坏。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约 23.0°C,白天随气温上升至中午峰值约 25.9°C,傍晚回落,符合夏季自然温度曲线,各传感器之间差异很小(通常 <0.2°C),整体正常。", "推理步骤2: 厨房温度传感器在 19:00 突然从约 24.5°C 跳升至 28.3°C,19:30 进一步升至 28.44°C。同一时刻其他三个房间温度均在 24.3-24.4°C 范围,厨房比其他房间高出约 4°C。虽然 19:13 灶具开启可以解释一定程度的升温,但 28.3°C 的读数在灶具尚未开启时(19:00)就已出现,说明传感器可能在灶具开启前就已受到干扰或出现故障。", "推理步骤3: 更关键的是,厨房温度传感器在 19:14 和 19:47 两次报告 MeasuredValue = None(空值),这是明确的设备异常信号。正常传感器不应返回 null 值,说明传感器在灶具使用期间出现了读数中断或通信故障。", "推理步骤4: 灶具关闭(19:46)后,20:00 厨房温度恢复到 24.12°C,与其他房间基本一致,之后读数恢复正常。这表明传感器可能受灶具高温辐射影响导致间歇性故障,而非永久损坏。", "推理步骤5: 住户行为模式完全正常——早晨 6:48 起床如厕、7:36 出门上班并自动锁门、18:01 回家开灯开空调、19:13 做饭、22:03 关灯锁门就寝,属于典型的单人工作日作息。入户门锁操作均为 Manual 开锁 + Auto 上锁,无异常开锁事件。", "推理步骤6: 厨房窗户在 19:46 灶具关闭后打开(通风散热),属于合理操作。洗碗机 19:51 启动也是做饭后的正常行为。烟雾报警器全天无触发,排除火灾风险。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2830(28.3°C),灶具此时尚未开启(19:13 才开启),比同时刻其他房间高约 4°C", "19:14 和 19:47 厨房温度传感器两次报告 MeasuredValue = None,出现空值读数", "19:30 厨房温度进一步升至 2844(28.44°C),而灶具 19:46 关闭后 20:00 温度恢复正常(2412)", "其他三个房间温度传感器全天读数一致且平滑,无任何异常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到热辐射直接影响", "对厨房温度传感器进行诊断测试,确认 null 值报告的原因(可能是高温导致的传感器过热保护或通信中断)", "考虑将厨房温度传感器迁移到远离灶具的位置,或加装隔热防护", "持续监控该传感器后续表现,若 null 值频繁出现建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.2338387966156, "api_error": null} {"episode_id": "SQ4_FP_B_0858", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0858.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261487, "scenario_id": "BA-01", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "bathroom", "injection_time": "2026-06-17T08:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且住户下午回家后入户门未关闭/未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:30 主卧有人起床,07:24 出门上班(门锁手动开锁→开门→关门→自动上锁),17:56 回家,22:22 就寝,符合单人上班族作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后(06:35、07:12、18:44、18:57)共 4 次上报 MeasuredValue = None。正常传感器在灶具工作时应能持续测量温度,None 值表明传感器可能因高温或故障进入异常状态,无法提供有效读数。这会导致灶具使用期间失去厨房温度监控能力,削弱火灾预警。\",\n \"推理步骤3: 16:17 入户门被手动开锁(LockState=2)、门被打开(StateValue=False)、玄关检测到人,但之后直到 22:22 才出现门关闭(StateValue=True)和自动上锁记录。这意味着从 16:17 到 17:56 住户正式回家之间约 1 小时 40 分钟,入户门处于开启未锁状态,存在安全隐患。结合 17:56 的第二次开门记录,16:17 的开门者身份不明或住户忘记关门。\",\n \"推理步骤4: 厨房窗户在 07:11 和 18:56 做饭后被打开,但日志中无关闭记录。虽然通风是合理行为,但长时间(尤其是出门后 07:24 至 17:56 期间)窗户保持开启,在无人时存在一定安全风险。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至 25.8-25.9°C 峰值(约 12:00-12:30),傍晚逐步回落,各房间温度一致,无异常热源迹象。烟雾报警器未触发,无漏水报警,洗碗机正常运行。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:35、07:12、18:44、18:57 四次上报 MeasuredValue = None,均发生在灶具使用前后\",\n \"16:17 入户门手动开锁并打开,但直到 22:22 才有关门和上锁记录,中间长达约 6 小时门可能处于未关闭状态\",\n \"厨房窗户在 07:11 打开后全天无关闭记录,住户 07:24 已出门\",\n \"16:17 的开门事件与 17:56 住户回家之间存在约 1 小时 40 分钟的间隔,16:17 开门者身份或意图不明确\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认其在高温环境下是否存在硬件故障或安装位置不当(距灶具过近),必要时更换或重新定位\",\n \"核实 16:17 的开门事件是否为住户本人操作(如快递、短暂回家等),若非本人应排查安全隐患\",\n \"建议设置离家模式自动化规则:出门后若入户门未关闭超过一定时间,发送告警通知\",\n \"建议设置厨房窗户在离家模式下的开启告警,避免无人时窗户长时间敞开\",\n \"考虑为灶具使用场景增加温度监控冗余,当厨房温度传感器上报 None 时触发告警,确保烹饪期间始终有有效的温度监测\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且住户下午回家后入户门未关闭/未上锁。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:30 主卧有人起床,07:24 出门上班(门锁手动开锁→开门→关门→自动上锁),17:56 回家,22:22 就寝,符合单人上班族作息。", "推理步骤2: 厨房温度传感器在灶具开启后(06:35、07:12、18:44、18:57)共 4 次上报 MeasuredValue = None。正常传感器在灶具工作时应能持续测量温度,None 值表明传感器可能因高温或故障进入异常状态,无法提供有效读数。这会导致灶具使用期间失去厨房温度监控能力,削弱火灾预警。", "推理步骤3: 16:17 入户门被手动开锁(LockState=2)、门被打开(StateValue=False)、玄关检测到人,但之后直到 22:22 才出现门关闭(StateValue=True)和自动上锁记录。这意味着从 16:17 到 17:56 住户正式回家之间约 1 小时 40 分钟,入户门处于开启未锁状态,存在安全隐患。结合 17:56 的第二次开门记录,16:17 的开门者身份不明或住户忘记关门。", "推理步骤4: 厨房窗户在 07:11 和 18:56 做饭后被打开,但日志中无关闭记录。虽然通风是合理行为,但长时间(尤其是出门后 07:24 至 17:56 期间)窗户保持开启,在无人时存在一定安全风险。", "推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至 25.8-25.9°C 峰值(约 12:00-12:30),傍晚逐步回落,各房间温度一致,无异常热源迹象。烟雾报警器未触发,无漏水报警,洗碗机正常运行。"], "key_evidence": ["厨房温度传感器在 06:35、07:12、18:44、18:57 四次上报 MeasuredValue = None,均发生在灶具使用前后", "16:17 入户门手动开锁并打开,但直到 22:22 才有关门和上锁记录,中间长达约 6 小时门可能处于未关闭状态", "厨房窗户在 07:11 打开后全天无关闭记录,住户 07:24 已出门", "16:17 的开门事件与 17:56 住户回家之间存在约 1 小时 40 分钟的间隔,16:17 开门者身份或意图不明确"], "recommended_actions": ["检查厨房温度传感器,确认其在高温环境下是否存在硬件故障或安装位置不当(距灶具过近),必要时更换或重新定位", "核实 16:17 的开门事件是否为住户本人操作(如快递、短暂回家等),若非本人应排查安全隐患", "建议设置离家模式自动化规则:出门后若入户门未关闭超过一定时间,发送告警通知", "建议设置厨房窗户在离家模式下的开启告警,避免无人时窗户长时间敞开", "考虑为灶具使用场景增加温度监控冗余,当厨房温度传感器上报 None 时触发告警,确保烹饪期间始终有有效的温度监测"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.565876245498657, "api_error": null} {"episode_id": "SQ4_FP_B_0864", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0864.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261493, "scenario_id": "DF-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-13T09:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧空调在09:10开启后制冷效果极差,室温持续上升与其他未开空调房间一致,疑似空调故障。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全屋四个区域在00:00-05:30期间温度稳定在22.9-23.1°C,从06:00起随日照升温,12:00-12:30达到峰值约25.8°C,之后逐步回落,至23:30降回23.3°C左右。这是典型的夏季昼夜温度曲线,整体正常。\",\n \"推理步骤2: 主卧空调在09:10开启(OnOff.OnOff = True),当时主卧温度为25.00°C。但开启后主卧温度并未出现明显下降,反而继续上升:09:30为24.96°C、10:00为25.21°C、10:30为25.28°C、11:00为25.51°C、12:00达到25.78°C。\",\n \"推理步骤3: 对比未开空调的客厅和次卧,主卧的温度变化趋势几乎完全一致,没有体现出任何制冷效果。正常情况下空调开启后20-30分钟应有明显降温。\",\n \"推理步骤4: 09:40和10:10、10:40出现了主卧温度传感器的额外上报(非整点/半点),值分别为25.02、24.98、25.01°C,这些可能是空调控制回路的温度采样,但温度始终在25°C附近波动,说明空调设定温度可能是25°C,但实际室温远超此值时仍无法拉低温度。\",\n \"推理步骤5: 日志中未见空调关闭记录,说明空调可能一直处于开启状态,但全天未产生可观测的制冷效果。这强烈指向空调设备故障(如制冷剂不足、压缩机未启动、或室外机异常)。\",\n \"推理步骤6: 除温度数据和空调事件外,整个24小时内无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的事件上报,无入侵、火灾或漏水风险。\"\n ],\n \"key_evidence\": [\n \"主卧空调09:10开启,但此后主卧温度从25.00°C持续上升至12:00的25.78°C,与未开空调的房间升温曲线一致\",\n \"空调开启后超过14小时无关闭记录,且全天未观测到任何制冷降温效果\",\n \"09:40/10:10/10:40出现额外温度采样,温度在25°C附近,疑似空调控制回路采样但无法有效制冷\"\n ],\n \"recommended_actions\": [\n \"检查主卧空调运行状态,确认压缩机和室外机是否正常工作\",\n \"检查空调制冷剂是否充足,滤网是否堵塞\",\n \"如空调确认故障,建议关闭空调避免无效耗电,并安排维修\",\n \"可考虑临时开启客厅空调或打开窗户通风来调节室内温度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "主卧空调在09:10开启后制冷效果极差,室温持续上升与其他未开空调房间一致,疑似空调故障。", "reasoning": ["推理步骤1: 温度数据分析——全屋四个区域在00:00-05:30期间温度稳定在22.9-23.1°C,从06:00起随日照升温,12:00-12:30达到峰值约25.8°C,之后逐步回落,至23:30降回23.3°C左右。这是典型的夏季昼夜温度曲线,整体正常。", "推理步骤2: 主卧空调在09:10开启(OnOff.OnOff = True),当时主卧温度为25.00°C。但开启后主卧温度并未出现明显下降,反而继续上升:09:30为24.96°C、10:00为25.21°C、10:30为25.28°C、11:00为25.51°C、12:00达到25.78°C。", "推理步骤3: 对比未开空调的客厅和次卧,主卧的温度变化趋势几乎完全一致,没有体现出任何制冷效果。正常情况下空调开启后20-30分钟应有明显降温。", "推理步骤4: 09:40和10:10、10:40出现了主卧温度传感器的额外上报(非整点/半点),值分别为25.02、24.98、25.01°C,这些可能是空调控制回路的温度采样,但温度始终在25°C附近波动,说明空调设定温度可能是25°C,但实际室温远超此值时仍无法拉低温度。", "推理步骤5: 日志中未见空调关闭记录,说明空调可能一直处于开启状态,但全天未产生可观测的制冷效果。这强烈指向空调设备故障(如制冷剂不足、压缩机未启动、或室外机异常)。", "推理步骤6: 除温度数据和空调事件外,整个24小时内无任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的事件上报,无入侵、火灾或漏水风险。"], "key_evidence": ["主卧空调09:10开启,但此后主卧温度从25.00°C持续上升至12:00的25.78°C,与未开空调的房间升温曲线一致", "空调开启后超过14小时无关闭记录,且全天未观测到任何制冷降温效果", "09:40/10:10/10:40出现额外温度采样,温度在25°C附近,疑似空调控制回路采样但无法有效制冷"], "recommended_actions": ["检查主卧空调运行状态,确认压缩机和室外机是否正常工作", "检查空调制冷剂是否充足,滤网是否堵塞", "如空调确认故障,建议关闭空调避免无效耗电,并安排维修", "可考虑临时开启客厅空调或打开窗户通风来调节室内温度"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.37169599533081, "api_error": null} {"episode_id": "SQ4_FP_B_0868", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0868.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261497, "scenario_id": "WD-01", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-07T13:44:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),与同时段其他房间温差达4°C,且灶具当时处于关闭状态,疑似传感器故障或局部热源异常。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,随日照升温至中午峰值约25.5-25.9°C,午后逐步回落至夜间23.3°C左右,整体符合夏季自然温度曲线,属正常。\",\n \"推理步骤2: 厨房温度异常——在11:00时,客厅/主卧/次卧温度均约25.5°C,但厨房温度传感器报告2955(29.55°C),11:30报告2944(29.44°C),比其他房间高出约4°C。此时灶具自09:43关闭后直到11:56才再次开启,厨房不应有明显热源。\",\n \"推理步骤3: 厨房温度传感器多次报告None值——在08:59、09:44、11:57、12:28、18:14、18:48共6次报告MeasuredValue=None,均发生在灶具开关前后。灶具使用期间传感器读数丢失可理解为高温保护或干扰,但11:00-11:30的异常高温发生在灶具关闭期间,说明传感器本身可能存在故障或漂移。\",\n \"推理步骤4: 烟雾报警器未触发——整个时段kitchen_smoke_alarm没有任何告警事件,排除了实际火灾或烟雾的可能性,进一步支持传感器故障的判断而非真实高温。\",\n \"推理步骤5: 卫生间漏水事件分析——13:44漏水传感器触发,但13:46即恢复,同时有人在场(occupancy=1、灯亮),持续仅2分钟,符合正常用水(如洗衣、拖地)溅水后擦干的场景,非持续性漏水。\",\n \"推理步骤6: 入户安全分析——全天仅22:59出现一次门锁/门磁事件,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto),属于正常的睡前锁门行为。无异常开锁、无未授权进入记录。\",\n \"推理步骤7: 日常活动模式正常——住户约08:52起床(卫生间),08:58进厨房做早餐,09:43结束后开窗通风,09:45到客厅开灯开空调(制冷模式SystemMode=3)拉窗帘,11:56做午餐,18:13做晚餐后启动洗碗机,22:59关灯关空调锁门就寝,生活节奏规律合理。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度传感器读数2955(29.55°C),11:30读数2944(29.44°C),同时段其他房间均约25.5°C,温差约4°C\",\n \"此时段厨房灶具处于关闭状态(09:43关闭,11:56才再次开启),无合理热源解释该高温\",\n \"厨房温度传感器全天6次报告None值,显示该传感器工作状态不稳定\",\n \"烟雾报警器全天无告警,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射区域),必要时更换传感器\",\n \"排查厨房温度传感器频繁报告None值的原因,可能是灶具电磁干扰或传感器供电/通信不稳定,考虑调整传感器与灶具的距离\",\n \"持续监测厨房温度传感器未来几天的数据,确认异常是否复现,以区分偶发故障和持续性硬件问题\",\n \"卫生间漏水传感器虽为短暂触发,建议定期检查卫生间水管接头和地漏密封情况,防患于未然\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),与同时段其他房间温差达4°C,且灶具当时处于关闭状态,疑似传感器故障或局部热源异常。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,随日照升温至中午峰值约25.5-25.9°C,午后逐步回落至夜间23.3°C左右,整体符合夏季自然温度曲线,属正常。", "推理步骤2: 厨房温度异常——在11:00时,客厅/主卧/次卧温度均约25.5°C,但厨房温度传感器报告2955(29.55°C),11:30报告2944(29.44°C),比其他房间高出约4°C。此时灶具自09:43关闭后直到11:56才再次开启,厨房不应有明显热源。", "推理步骤3: 厨房温度传感器多次报告None值——在08:59、09:44、11:57、12:28、18:14、18:48共6次报告MeasuredValue=None,均发生在灶具开关前后。灶具使用期间传感器读数丢失可理解为高温保护或干扰,但11:00-11:30的异常高温发生在灶具关闭期间,说明传感器本身可能存在故障或漂移。", "推理步骤4: 烟雾报警器未触发——整个时段kitchen_smoke_alarm没有任何告警事件,排除了实际火灾或烟雾的可能性,进一步支持传感器故障的判断而非真实高温。", "推理步骤5: 卫生间漏水事件分析——13:44漏水传感器触发,但13:46即恢复,同时有人在场(occupancy=1、灯亮),持续仅2分钟,符合正常用水(如洗衣、拖地)溅水后擦干的场景,非持续性漏水。", "推理步骤6: 入户安全分析——全天仅22:59出现一次门锁/门磁事件,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto),属于正常的睡前锁门行为。无异常开锁、无未授权进入记录。", "推理步骤7: 日常活动模式正常——住户约08:52起床(卫生间),08:58进厨房做早餐,09:43结束后开窗通风,09:45到客厅开灯开空调(制冷模式SystemMode=3)拉窗帘,11:56做午餐,18:13做晚餐后启动洗碗机,22:59关灯关空调锁门就寝,生活节奏规律合理。"], "key_evidence": ["11:00厨房温度传感器读数2955(29.55°C),11:30读数2944(29.44°C),同时段其他房间均约25.5°C,温差约4°C", "此时段厨房灶具处于关闭状态(09:43关闭,11:56才再次开启),无合理热源解释该高温", "厨房温度传感器全天6次报告None值,显示该传感器工作状态不稳定", "烟雾报警器全天无告警,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射区域),必要时更换传感器", "排查厨房温度传感器频繁报告None值的原因,可能是灶具电磁干扰或传感器供电/通信不稳定,考虑调整传感器与灶具的距离", "持续监测厨房温度传感器未来几天的数据,确认异常是否复现,以区分偶发故障和持续性硬件问题", "卫生间漏水传感器虽为短暂触发,建议定期检查卫生间水管接头和地漏密封情况,防患于未然"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.134628534317017, "api_error": null} {"episode_id": "SQ4_FP_B_0869", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0869.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261498, "scenario_id": "INS-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "second_bedroom", "injection_time": "2026-06-19T09:15:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房高温/火灾预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:17起床,07:30出门上班并自动锁门,傍晚17:45回家,22:37就寝,符合典型单人上班族作息。\",\n \"推理步骤2: 09:15有一次通过 OperationSource=3(远程/密码)且 UserIndex=5 的开锁事件,随后客厅有人体感应和开灯,但未见关门和重新上锁记录。这可能是保洁/访客使用预设密码进入,属于可解释行为,但入户门在此后较长时间未确认关闭上锁,存在轻微安全隐患。\",\n \"推理步骤3: 厨房温度传感器在06:49(灶具开启后约30秒)和07:16(灶具关闭后约1分钟)均报告 MeasuredValue = None;晚间18:48和18:55同样出现 None。灶具使用时恰恰是最需要温度监控的时段,传感器在此关键时刻失效,意味着如果发生灶具异常高温,系统将无法及时检测和报警。\",\n \"推理步骤4: 16:11入户门手动开锁、门打开、玄关有人,但之后没有关门记录(BooleanState.StateValue 未恢复为 True),直到22:37才记录到门关闭并自动上锁。这段约6.5小时内入户门可能处于未关闭状态,存在入侵风险。不过也可能是住户回家后门虽关上但传感器未上报中间状态,需结合实际确认。\",\n \"推理步骤5: 温度趋势方面,全屋温度从夜间约23°C逐步升至中午约25.8°C再回落,属于夏季正常日变化曲线,无异常高温。烟雾报警器和漏水传感器全天无告警,厨房窗户在做饭后打开通风属正常操作。\",\n \"推理步骤6: 厨房温度传感器的 None 值问题是最值得关注的异常——它在一天中出现了4次,且均与灶具操作高度相关,可能是高温导致传感器暂时失灵或通信中断,属于设备故障类问题。\"\n ],\n \"key_evidence\": [\n \"06:49、07:16、18:48、18:55 厨房温度传感器报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"16:11 入户门开锁开门后,直到22:37才有关门上锁记录,中间约6.5小时门状态不明\",\n \"09:15 通过 UserIndex=5 远程开锁进入,未见对应的关门上锁事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:可能因灶具高温或油烟干扰导致读数丢失,建议调整传感器安装位置(远离灶具直接热源),或更换耐高温型号\",\n \"确认入户门传感器工作状态:16:11至22:37期间门状态缺失,建议检查门磁传感器是否松动或存在上报延迟\",\n \"审查 UserIndex=5 的门锁用户权限:确认该用户身份(如保洁人员),并考虑设置临时密码或时间段限制,避免长期有效的固定密码\",\n \"建议为厨房增加联动规则:当灶具开启且温度传感器无数据时,自动触发告警通知住户,防止传感器失效期间发生安全事故\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房高温/火灾预警失效。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:17起床,07:30出门上班并自动锁门,傍晚17:45回家,22:37就寝,符合典型单人上班族作息。", "推理步骤2: 09:15有一次通过 OperationSource=3(远程/密码)且 UserIndex=5 的开锁事件,随后客厅有人体感应和开灯,但未见关门和重新上锁记录。这可能是保洁/访客使用预设密码进入,属于可解释行为,但入户门在此后较长时间未确认关闭上锁,存在轻微安全隐患。", "推理步骤3: 厨房温度传感器在06:49(灶具开启后约30秒)和07:16(灶具关闭后约1分钟)均报告 MeasuredValue = None;晚间18:48和18:55同样出现 None。灶具使用时恰恰是最需要温度监控的时段,传感器在此关键时刻失效,意味着如果发生灶具异常高温,系统将无法及时检测和报警。", "推理步骤4: 16:11入户门手动开锁、门打开、玄关有人,但之后没有关门记录(BooleanState.StateValue 未恢复为 True),直到22:37才记录到门关闭并自动上锁。这段约6.5小时内入户门可能处于未关闭状态,存在入侵风险。不过也可能是住户回家后门虽关上但传感器未上报中间状态,需结合实际确认。", "推理步骤5: 温度趋势方面,全屋温度从夜间约23°C逐步升至中午约25.8°C再回落,属于夏季正常日变化曲线,无异常高温。烟雾报警器和漏水传感器全天无告警,厨房窗户在做饭后打开通风属正常操作。", "推理步骤6: 厨房温度传感器的 None 值问题是最值得关注的异常——它在一天中出现了4次,且均与灶具操作高度相关,可能是高温导致传感器暂时失灵或通信中断,属于设备故障类问题。"], "key_evidence": ["06:49、07:16、18:48、18:55 厨房温度传感器报告 MeasuredValue = None,均发生在灶具使用前后", "16:11 入户门开锁开门后,直到22:37才有关门上锁记录,中间约6.5小时门状态不明", "09:15 通过 UserIndex=5 远程开锁进入,未见对应的关门上锁事件"], "recommended_actions": ["检查厨房温度传感器:可能因灶具高温或油烟干扰导致读数丢失,建议调整传感器安装位置(远离灶具直接热源),或更换耐高温型号", "确认入户门传感器工作状态:16:11至22:37期间门状态缺失,建议检查门磁传感器是否松动或存在上报延迟", "审查 UserIndex=5 的门锁用户权限:确认该用户身份(如保洁人员),并考虑设置临时密码或时间段限制,避免长期有效的固定密码", "建议为厨房增加联动规则:当灶具开启且温度传感器无数据时,自动触发告警通知住户,防止传感器失效期间发生安全事故"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.90881609916687, "api_error": null} {"episode_id": "SQ4_FP_B_0872", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0872.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261501, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-18T17:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在住户外出期间(16:20)被物理开启后长时间未关闭/未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:20 主卧有人起床,07:01 厨房做早餐,07:43 出门上锁(自动锁),18:18 回家开灯开空调,做晚饭,22:13 关灯就寝并自动锁门。这是典型的单人/双人上班族作息。\",\n \"推理步骤2: 厨房温度传感器在 07:02、07:14、18:28、18:59 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后。虽然灶具使用时局部温度波动可能导致传感器短暂异常,但正常传感器不应返回 None,这表明传感器可能存在故障或受高温影响导致读数丢失。如果传感器持续失效,将无法配合烟雾报警器监测厨房火灾风险。\",\n \"推理步骤3: 16:20 入户门被手动开锁(Manual),门传感器显示门被打开(StateValue=False),玄关检测到有人。但此后直到 18:18 住户回家,日志中没有关门(StateValue=True)和上锁的记录。门直到 22:13 才显示关闭并自动上锁。这意味着从 16:20 到 22:13 近 6 小时,入户门可能处于未关闭状态。\",\n \"推理步骤4: 17:25 和 17:30 出现了两次门锁解锁事件(OperationSource=3,即远程/密码方式,分别为 UserIndex=1 和 UserIndex=2),但没有对应的门传感器开关记录和运动传感器触发。这可能是远程解锁操作(门本身未被物理打开),也可能是门已经处于开启状态所以传感器未变化。如果是非授权远程操作则需要关注。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天逐步升至 25.8°C 峰值(约 12:00-12:30),傍晚回落。18:18 开启空调制冷(SystemMode=3)后温度从约 24.5°C 降至 22:13 关闭时的约 23.6°C,符合预期。无异常温升,无火灾迹象。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,阳台门传感器无异常事件,窗户传感器仅在做饭后开窗通风时触发,均属正常行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:02、07:14、18:28、18:59 四次报告 MeasuredValue = None,传感器可能存在故障\",\n \"16:20 入户门手动开锁并打开,但直到 22:13 才有关门和上锁记录,中间约 6 小时门可能未关闭\",\n \"17:25 和 17:30 出现两次远程/密码解锁事件(UserIndex=1 和 2),无对应的物理进出记录\",\n \"厨房做饭后开窗(07:13、18:58)属正常通风行为,非异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温导致传感器故障或连接不稳定,必要时更换或重新定位传感器\",\n \"核实 16:20 的入户门开启事件——确认是否为住户本人操作,以及门是否确实长时间未关闭。建议设置门未关闭超时告警(如超过 5 分钟未关门则推送通知)\",\n \"核实 17:25 和 17:30 的远程解锁操作是否为授权用户的正常行为,检查 UserIndex=1 和 UserIndex=2 对应的用户身份\",\n \"建议为入户门配置自动锁定策略:门关闭后自动上锁,以及门长时间未关闭时发出告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在住户外出期间(16:20)被物理开启后长时间未关闭/未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:20 主卧有人起床,07:01 厨房做早餐,07:43 出门上锁(自动锁),18:18 回家开灯开空调,做晚饭,22:13 关灯就寝并自动锁门。这是典型的单人/双人上班族作息。", "推理步骤2: 厨房温度传感器在 07:02、07:14、18:28、18:59 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后。虽然灶具使用时局部温度波动可能导致传感器短暂异常,但正常传感器不应返回 None,这表明传感器可能存在故障或受高温影响导致读数丢失。如果传感器持续失效,将无法配合烟雾报警器监测厨房火灾风险。", "推理步骤3: 16:20 入户门被手动开锁(Manual),门传感器显示门被打开(StateValue=False),玄关检测到有人。但此后直到 18:18 住户回家,日志中没有关门(StateValue=True)和上锁的记录。门直到 22:13 才显示关闭并自动上锁。这意味着从 16:20 到 22:13 近 6 小时,入户门可能处于未关闭状态。", "推理步骤4: 17:25 和 17:30 出现了两次门锁解锁事件(OperationSource=3,即远程/密码方式,分别为 UserIndex=1 和 UserIndex=2),但没有对应的门传感器开关记录和运动传感器触发。这可能是远程解锁操作(门本身未被物理打开),也可能是门已经处于开启状态所以传感器未变化。如果是非授权远程操作则需要关注。", "推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天逐步升至 25.8°C 峰值(约 12:00-12:30),傍晚回落。18:18 开启空调制冷(SystemMode=3)后温度从约 24.5°C 降至 22:13 关闭时的约 23.6°C,符合预期。无异常温升,无火灾迹象。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,阳台门传感器无异常事件,窗户传感器仅在做饭后开窗通风时触发,均属正常行为。"], "key_evidence": ["厨房温度传感器在 07:02、07:14、18:28、18:59 四次报告 MeasuredValue = None,传感器可能存在故障", "16:20 入户门手动开锁并打开,但直到 22:13 才有关门和上锁记录,中间约 6 小时门可能未关闭", "17:25 和 17:30 出现两次远程/密码解锁事件(UserIndex=1 和 2),无对应的物理进出记录", "厨房做饭后开窗(07:13、18:58)属正常通风行为,非异常"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温导致传感器故障或连接不稳定,必要时更换或重新定位传感器", "核实 16:20 的入户门开启事件——确认是否为住户本人操作,以及门是否确实长时间未关闭。建议设置门未关闭超时告警(如超过 5 分钟未关门则推送通知)", "核实 17:25 和 17:30 的远程解锁操作是否为授权用户的正常行为,检查 UserIndex=1 和 UserIndex=2 对应的用户身份", "建议为入户门配置自动锁定策略:门关闭后自动上锁,以及门长时间未关闭时发出告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.074758768081665, "api_error": null} {"episode_id": "SQ4_FP_B_0880", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0880.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261509, "scenario_id": "INS-04", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kitchen", "injection_time": "2026-06-20T19:39:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.4°C),与同时段其他房间温度(约25.5°C)偏差近4°C,且该传感器多次报告None值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据整体趋势合理——凌晨约23°C,白天随气温上升至25-26°C,傍晚回落,符合夏季(6月20日)昼夜温度变化规律。各房间温度基本同步,偏差通常在0.1-0.2°C以内。\",\n \"推理步骤2: 关键异常——厨房温度传感器在11:00读数为2944(29.44°C),11:30读数为2943(29.43°C),而同时段客厅约25.5°C、主卧约25.5°C、次卧约25.5°C。厨房与其他房间温差高达约4°C,且此时灶具处于关闭状态(09:32已关闭,11:51才再次开启),无合理热源解释这一异常高温。\",\n \"推理步骤3: 厨房温度传感器多次报告MeasuredValue=None(08:58、09:33、11:52、12:46、17:48、18:36),这些None值均出现在灶具开启或窗户操作前后。虽然部分None可能与灶具使用时的传感器保护机制有关,但结合11:00-11:30的异常高温读数,更可能指向传感器本身存在间歇性故障或受到干扰。\",\n \"推理步骤4: 住户行为模式正常——早餐(~08:57-09:32)、午餐(~11:51-12:45)、晚餐(~17:47-18:35)三次使用灶具,时间合理;做完饭开窗通风(kitchen_window_contact=False)是正常习惯;洗碗机在晚餐后启动也合理。\",\n \"推理步骤5: 入侵风险排除——19:39入户门通过密码/指纹(OperationSource=3)由UserIndex=5正常解锁,随后玄关和客厅检测到人体活动,灯和空调开启,属于住户正常回家。23:01关灯关空调后门锁自动上锁(OperationSource=Auto),是正常的离家/就寝流程。\",\n \"推理步骤6: 火灾和漏水风险排除——烟雾报警器全天无触发,卫生间漏水传感器无报警,灶具使用时长合理(每次30-60分钟),无持续无人看管的情况。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度传感器读数2944(29.44°C),11:30读数2943(29.43°C),同时段其他房间均约25.5°C,偏差约4°C,且此时灶具处于关闭状态\",\n \"厨房温度传感器全天6次报告MeasuredValue=None,存在间歇性数据丢失\",\n \"异常高温出现在灶具关闭期间(09:32关闭至11:51再开启之间),排除了烹饪导致的正常升温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温\",\n \"对厨房温度传感器进行校准或更换,多次None值和异常高温读数表明传感器可能存在硬件故障\",\n \"在传感器修复前,可临时增加对厨房烟雾报警器的关注,避免因温度传感器失准而遗漏真实的高温预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.4°C),与同时段其他房间温度(约25.5°C)偏差近4°C,且该传感器多次报告None值,存在传感器故障风险。", "reasoning": ["推理步骤1: 温度数据整体趋势合理——凌晨约23°C,白天随气温上升至25-26°C,傍晚回落,符合夏季(6月20日)昼夜温度变化规律。各房间温度基本同步,偏差通常在0.1-0.2°C以内。", "推理步骤2: 关键异常——厨房温度传感器在11:00读数为2944(29.44°C),11:30读数为2943(29.43°C),而同时段客厅约25.5°C、主卧约25.5°C、次卧约25.5°C。厨房与其他房间温差高达约4°C,且此时灶具处于关闭状态(09:32已关闭,11:51才再次开启),无合理热源解释这一异常高温。", "推理步骤3: 厨房温度传感器多次报告MeasuredValue=None(08:58、09:33、11:52、12:46、17:48、18:36),这些None值均出现在灶具开启或窗户操作前后。虽然部分None可能与灶具使用时的传感器保护机制有关,但结合11:00-11:30的异常高温读数,更可能指向传感器本身存在间歇性故障或受到干扰。", "推理步骤4: 住户行为模式正常——早餐(~08:57-09:32)、午餐(~11:51-12:45)、晚餐(~17:47-18:35)三次使用灶具,时间合理;做完饭开窗通风(kitchen_window_contact=False)是正常习惯;洗碗机在晚餐后启动也合理。", "推理步骤5: 入侵风险排除——19:39入户门通过密码/指纹(OperationSource=3)由UserIndex=5正常解锁,随后玄关和客厅检测到人体活动,灯和空调开启,属于住户正常回家。23:01关灯关空调后门锁自动上锁(OperationSource=Auto),是正常的离家/就寝流程。", "推理步骤6: 火灾和漏水风险排除——烟雾报警器全天无触发,卫生间漏水传感器无报警,灶具使用时长合理(每次30-60分钟),无持续无人看管的情况。"], "key_evidence": ["11:00厨房温度传感器读数2944(29.44°C),11:30读数2943(29.43°C),同时段其他房间均约25.5°C,偏差约4°C,且此时灶具处于关闭状态", "厨房温度传感器全天6次报告MeasuredValue=None,存在间歇性数据丢失", "异常高温出现在灶具关闭期间(09:32关闭至11:51再开启之间),排除了烹饪导致的正常升温"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)导致局部高温", "对厨房温度传感器进行校准或更换,多次None值和异常高温读数表明传感器可能存在硬件故障", "在传感器修复前,可临时增加对厨房烟雾报警器的关注,避免因温度传感器失准而遗漏真实的高温预警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.624765872955322, "api_error": null} {"episode_id": "SQ4_FP_B_0885", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0885.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261514, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-24T06:20:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做完饭后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器报告 2857(约28.57°C),而同一时刻其他房间温度均在 24.5°C 左右,厨房温度异常偏高约 4°C 以上。此时灶具并未开启(灶具在 18:49 才开启),无合理热源解释该高温。\",\n \"推理步骤2: 18:30 厨房温度传感器仍报告 2851(约28.51°C),持续异常高温。但到 19:00 突然恢复为 2434(约24.34°C),降幅超过 4°C,这种跳变不符合自然降温规律,高度怀疑是传感器故障或干扰导致的虚假读数。\",\n \"推理步骤3: 18:50 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(空值)。18:50 时灶具刚开启一分钟,19:35 时灶具刚关闭一分钟。传感器在灶具状态切换时连续出现数据丢失,说明传感器可能受灶具电磁干扰影响,或自身存在硬件/通信故障。\",\n \"推理步骤4: 06:20 灶具首次开启时,06:25 厨房温度从约 23.9°C 跳升至 27.0°C,06:50 达到 27.5°C,这属于做饭时的正常升温。但对比 18:00 的异常——灶具尚未开启就出现 28.57°C——可以排除做饭因素,进一步确认传感器异常。\",\n \"推理步骤5: 19:34:30 厨房窗户传感器报告 StateValue=False(窗户打开),这是做完饭后通风的合理操作。但在后续日志中未见窗户关闭记录,截至日志结束(23:30)窗户仍处于开启状态。夜间无人看管时窗户持续开启存在安全隐患。\",\n \"推理步骤6: 其余设备行为均正常——早晨起床、出门上班(07:22 手动开锁出门、自动上锁)、傍晚回家(18:00 开锁进门、开灯开空调)、做饭、洗碗、睡前关灯锁门,符合单人居住的日常作息模式。入侵、火灾、漏水等威胁均无证据支持。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度 2857、18:30 温度 2851,灶具此时未开启,其他房间温度正常(约 2454-2459),属于无热源情况下的异常高温\",\n \"18:50 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,数据丢失与灶具开关时间高度吻合\",\n \"19:00 厨房温度突然从 2851 恢复至 2434,30 分钟内骤降超 4°C,不符合物理降温规律\",\n \"19:34:30 厨房窗户打开后,至日志结束(23:30)未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否存在故障、接触不良或受灶具电磁干扰,必要时更换传感器或调整安装位置\",\n \"关闭厨房窗户或设置自动化规则:当夜间无人活动时自动提醒关闭厨房窗户\",\n \"为厨房温度传感器设置数据有效性校验规则:当读数出现 None 或与相邻房间温差超过阈值时触发告警\",\n \"考虑在灶具开关操作前后增加传感器数据平滑/过滤逻辑,避免瞬态干扰导致误读\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,同时厨房窗户在做完饭后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器报告 2857(约28.57°C),而同一时刻其他房间温度均在 24.5°C 左右,厨房温度异常偏高约 4°C 以上。此时灶具并未开启(灶具在 18:49 才开启),无合理热源解释该高温。", "推理步骤2: 18:30 厨房温度传感器仍报告 2851(约28.51°C),持续异常高温。但到 19:00 突然恢复为 2434(约24.34°C),降幅超过 4°C,这种跳变不符合自然降温规律,高度怀疑是传感器故障或干扰导致的虚假读数。", "推理步骤3: 18:50 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(空值)。18:50 时灶具刚开启一分钟,19:35 时灶具刚关闭一分钟。传感器在灶具状态切换时连续出现数据丢失,说明传感器可能受灶具电磁干扰影响,或自身存在硬件/通信故障。", "推理步骤4: 06:20 灶具首次开启时,06:25 厨房温度从约 23.9°C 跳升至 27.0°C,06:50 达到 27.5°C,这属于做饭时的正常升温。但对比 18:00 的异常——灶具尚未开启就出现 28.57°C——可以排除做饭因素,进一步确认传感器异常。", "推理步骤5: 19:34:30 厨房窗户传感器报告 StateValue=False(窗户打开),这是做完饭后通风的合理操作。但在后续日志中未见窗户关闭记录,截至日志结束(23:30)窗户仍处于开启状态。夜间无人看管时窗户持续开启存在安全隐患。", "推理步骤6: 其余设备行为均正常——早晨起床、出门上班(07:22 手动开锁出门、自动上锁)、傍晚回家(18:00 开锁进门、开灯开空调)、做饭、洗碗、睡前关灯锁门,符合单人居住的日常作息模式。入侵、火灾、漏水等威胁均无证据支持。"], "key_evidence": ["18:00 厨房温度 2857、18:30 温度 2851,灶具此时未开启,其他房间温度正常(约 2454-2459),属于无热源情况下的异常高温", "18:50 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,数据丢失与灶具开关时间高度吻合", "19:00 厨房温度突然从 2851 恢复至 2434,30 分钟内骤降超 4°C,不符合物理降温规律", "19:34:30 厨房窗户打开后,至日志结束(23:30)未见关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否存在故障、接触不良或受灶具电磁干扰,必要时更换传感器或调整安装位置", "关闭厨房窗户或设置自动化规则:当夜间无人活动时自动提醒关闭厨房窗户", "为厨房温度传感器设置数据有效性校验规则:当读数出现 None 或与相邻房间温差超过阈值时触发告警", "考虑在灶具开关操作前后增加传感器数据平滑/过滤逻辑,避免瞬态干扰导致误读"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.741437196731567, "api_error": null} {"episode_id": "SQ4_FP_B_0887", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0887.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261516, "scenario_id": "INS-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "master_bedroom", "injection_time": "2026-06-29T15:37:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰损坏。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,白天随气温上升至中午峰值约 25.8°C,傍晚回落,符合夏季自然温度曲线,整体正常。\",\n \"推理步骤2: 厨房温度传感器在 19:00 突然从约 24.7°C 跳升至 28.42°C(值 2842),升幅约 3.7°C,远超同时段其他房间的变化幅度。虽然 19:02 灶具开启可部分解释升温,但该跳变发生在灶具开启之前(19:00 vs 19:02),且幅度异常大。\",\n \"推理步骤3: 更关键的是,19:03 和 19:46 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是明确的设备故障信号。\",\n \"推理步骤4: 19:30 传感器恢复报告时仍为 28.38°C(值 2838),灶具已运行近 30 分钟但温度几乎未变,说明传感器可能卡在异常值上。直到 19:45 灶具关闭、19:45:30 厨房窗户打开通风后,20:00 温度才恢复到 24.01°C 的合理范围。\",\n \"推理步骤5: 住户行为链完全正常——早晨 06:55 起床洗漱、07:12 厨房早餐、07:25 出门上班并自动锁门;15:37 短暂回家开窗;18:21 下班回家开灯开空调;19:02 做饭、19:45 结束做饭开窗通风、20:07 启动洗碗机;21:58 关灯关空调确认门锁。无入侵迹象。\",\n \"推理步骤6: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,操作源合理,无异常远程解锁或暴力开锁事件。烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水患风险。\",\n \"推理步骤7: 厨房温度传感器的 null 读数是核心问题——如果传感器在灶具使用期间失效,将无法在真正的厨房火灾或过热场景中提供预警,构成安全监控盲区。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数从 ~24.7°C 突跳至 28.42°C,灶具尚未开启(19:02 才开启),跳变异常\",\n \"19:03 厨房温度传感器报告 MeasuredValue = None(第一次空值)\",\n \"19:46 厨房温度传感器再次报告 MeasuredValue = None(第二次空值)\",\n \"19:30 传感器读数 28.38°C 与 19:00 的 28.42°C 几乎无变化,灶具运行 30 分钟后温度未进一步上升,读数可能不可靠\",\n \"烟雾报警器全天未触发,排除实际火灾可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰或热损伤\",\n \"对厨房温度传感器进行功能测试或校准,确认 null 读数的根因(传感器硬件故障、通信中断或软件异常)\",\n \"如传感器确认故障,尽快更换,避免厨房温度监控出现盲区影响烟雾/火灾预警联动\",\n \"考虑将厨房温度传感器与烟雾报警器建立联动规则:当温度传感器离线或报 null 时自动发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受灶具高温干扰损坏。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,白天随气温上升至中午峰值约 25.8°C,傍晚回落,符合夏季自然温度曲线,整体正常。", "推理步骤2: 厨房温度传感器在 19:00 突然从约 24.7°C 跳升至 28.42°C(值 2842),升幅约 3.7°C,远超同时段其他房间的变化幅度。虽然 19:02 灶具开启可部分解释升温,但该跳变发生在灶具开启之前(19:00 vs 19:02),且幅度异常大。", "推理步骤3: 更关键的是,19:03 和 19:46 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是明确的设备故障信号。", "推理步骤4: 19:30 传感器恢复报告时仍为 28.38°C(值 2838),灶具已运行近 30 分钟但温度几乎未变,说明传感器可能卡在异常值上。直到 19:45 灶具关闭、19:45:30 厨房窗户打开通风后,20:00 温度才恢复到 24.01°C 的合理范围。", "推理步骤5: 住户行为链完全正常——早晨 06:55 起床洗漱、07:12 厨房早餐、07:25 出门上班并自动锁门;15:37 短暂回家开窗;18:21 下班回家开灯开空调;19:02 做饭、19:45 结束做饭开窗通风、20:07 启动洗碗机;21:58 关灯关空调确认门锁。无入侵迹象。", "推理步骤6: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,操作源合理,无异常远程解锁或暴力开锁事件。烟雾报警器全天未触发,漏水传感器无报警,排除火灾和水患风险。", "推理步骤7: 厨房温度传感器的 null 读数是核心问题——如果传感器在灶具使用期间失效,将无法在真正的厨房火灾或过热场景中提供预警,构成安全监控盲区。"], "key_evidence": ["19:00 厨房温度传感器读数从 ~24.7°C 突跳至 28.42°C,灶具尚未开启(19:02 才开启),跳变异常", "19:03 厨房温度传感器报告 MeasuredValue = None(第一次空值)", "19:46 厨房温度传感器再次报告 MeasuredValue = None(第二次空值)", "19:30 传感器读数 28.38°C 与 19:00 的 28.42°C 几乎无变化,灶具运行 30 分钟后温度未进一步上升,读数可能不可靠", "烟雾报警器全天未触发,排除实际火灾可能"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰或热损伤", "对厨房温度传感器进行功能测试或校准,确认 null 读数的根因(传感器硬件故障、通信中断或软件异常)", "如传感器确认故障,尽快更换,避免厨房温度监控出现盲区影响烟雾/火灾预警联动", "考虑将厨房温度传感器与烟雾报警器建立联动规则:当温度传感器离线或报 null 时自动发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.886071920394897, "api_error": null} {"episode_id": "SQ4_FP_B_0895", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0895.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261524, "scenario_id": "INS-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-21T11:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全天温度变化符合夏季(6月21日)自然规律:凌晨约23°C,中午升至约25.9°C,傍晚逐渐回落至23.3°C。各房间温度同步变化,无单一房间异常升温,排除火灾风险。\",\n \"推理步骤2: 门锁事件分析——11:32出现一次LockOperationError(OperationError=1, OperationSource=3,即键盘/密码输入错误),20秒后同一来源UserIndex=1成功解锁。这是典型的住户输错一次密码后重新输入正确密码的场景,非暴力破解尝试(仅1次失败,间隔极短,且使用了已注册用户凭证)。\",\n \"推理步骤3: 入户门传感器和玄关运动传感器在解锁后2-3秒内依次触发(门开启→检测到人),时序合理,确认是正常入户行为。\",\n \"推理步骤4: 整日无烟雾报警、无漏水报警、无异常时段的运动检测,其他安防传感器均未触发,系统运行正常。\"\n ],\n \"key_evidence\": [\n \"门锁仅1次密码错误后20秒内由已注册用户(UserIndex=1)成功解锁,属正常操作失误\",\n \"全屋温度变化同步且符合夏季昼夜自然温差曲线(23°C~25.9°C),无异常热源\",\n \"入户门开启与玄关运动检测时序一致(11:32:20解锁→11:32:22门开→11:32:25检测到人)\"\n ],\n \"recommended_actions\": [\n \"无需采取措施,系统运行正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁", "reasoning": ["推理步骤1: 温度数据分析——全天温度变化符合夏季(6月21日)自然规律:凌晨约23°C,中午升至约25.9°C,傍晚逐渐回落至23.3°C。各房间温度同步变化,无单一房间异常升温,排除火灾风险。", "推理步骤2: 门锁事件分析——11:32出现一次LockOperationError(OperationError=1, OperationSource=3,即键盘/密码输入错误),20秒后同一来源UserIndex=1成功解锁。这是典型的住户输错一次密码后重新输入正确密码的场景,非暴力破解尝试(仅1次失败,间隔极短,且使用了已注册用户凭证)。", "推理步骤3: 入户门传感器和玄关运动传感器在解锁后2-3秒内依次触发(门开启→检测到人),时序合理,确认是正常入户行为。", "推理步骤4: 整日无烟雾报警、无漏水报警、无异常时段的运动检测,其他安防传感器均未触发,系统运行正常。"], "key_evidence": ["门锁仅1次密码错误后20秒内由已注册用户(UserIndex=1)成功解锁,属正常操作失误", "全屋温度变化同步且符合夏季昼夜自然温差曲线(23°C~25.9°C),无异常热源", "入户门开启与玄关运动检测时序一致(11:32:20解锁→11:32:22门开→11:32:25检测到人)"], "recommended_actions": ["无需采取措施,系统运行正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.112255811691284, "api_error": null} {"episode_id": "SQ4_FP_B_0898", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0898.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261527, "scenario_id": "WD-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-22T15:36:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数飙升和多次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然报告 2842(约28.42°C),而同一时刻其他房间温度均在 24.3-24.5°C 范围,厨房温度比其他房间高出约 4°C 尚可理解为做饭前的预热或环境差异,但灶具此时尚未开启(19:09 才开),这一跳变缺乏合理触发源。\",\n \"推理步骤2: 19:10 和 19:53 厨房温度传感器连续两次报告 MeasuredValue = None(空值),正常传感器不应输出 None。这表明传感器可能存在通信故障、供电异常或硬件损坏。\",\n \"推理步骤3: 19:30 厨房温度仍为 2839(约28.39°C),此时灶具已开启约20分钟,但到 20:00 灶具关闭后温度骤降回 2407(约24.07°C),降幅约 4.3°C 仅用了 30 分钟,且与其他房间温度完全对齐。结合 None 值,更倾向于传感器数据不可靠而非真实温度变化。\",\n \"推理步骤4: 19:52 灶具关闭后厨房窗户被打开(BooleanState = False),但在整个日志剩余时段内未见窗户关闭记录。当前住户已于 21:49 离家(关灯、关空调、锁门),厨房窗户仍处于开启状态,存在安全隐患。\",\n \"推理步骤5: 15:36 卫生间漏水传感器短暂触发(2分钟后恢复),当时有人在卫生间且灯亮着,判断为正常用水溅水,非真实漏水。\",\n \"推理步骤6: 入户门的开锁/关锁、出入行为模式正常——早晨 07:13 手动开锁出门后自动上锁,傍晚 18:16 手动开锁回家,21:49 离家后自动上锁,门锁状态始终受控。\",\n \"推理步骤7: 全屋温度整体趋势合理:夜间约 23°C,午间升至约 25.9°C,傍晚回落,符合夏季自然温度变化曲线。唯独厨房在 19:00-19:30 的异常高值和 None 值是离群点。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2842(28.42°C),灶具尚未开启,其他房间温度仅约 24.4°C\",\n \"19:10 和 19:53 厨房温度传感器报告 MeasuredValue = None,传感器数据中断\",\n \"19:30 厨房温度仍为 2839,但 20:00 骤降回 2407,与其他房间重新对齐,变化不符合物理规律\",\n \"19:52 厨房窗户打开后至日志结束(23:30)未见关闭,住户已于 21:49 离家\",\n \"21:49 住户离家流程正常:关灯→关空调→门锁自动上锁,但未关闭厨房窗户\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障\",\n \"远程关闭厨房窗户或尽快回家关窗,避免夜间开窗带来的安全风险(防盗、防雨)\",\n \"设置离家模式自动化规则:当入户门上锁且无人在家时,自动检查并关闭所有窗户\",\n \"为厨房温度传感器设置 None 值告警,出现空值时立即通知用户\",\n \"卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发需检查管道密封\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数飙升和多次 None 空值,疑似传感器故障;同时厨房窗户在做饭结束后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然报告 2842(约28.42°C),而同一时刻其他房间温度均在 24.3-24.5°C 范围,厨房温度比其他房间高出约 4°C 尚可理解为做饭前的预热或环境差异,但灶具此时尚未开启(19:09 才开),这一跳变缺乏合理触发源。", "推理步骤2: 19:10 和 19:53 厨房温度传感器连续两次报告 MeasuredValue = None(空值),正常传感器不应输出 None。这表明传感器可能存在通信故障、供电异常或硬件损坏。", "推理步骤3: 19:30 厨房温度仍为 2839(约28.39°C),此时灶具已开启约20分钟,但到 20:00 灶具关闭后温度骤降回 2407(约24.07°C),降幅约 4.3°C 仅用了 30 分钟,且与其他房间温度完全对齐。结合 None 值,更倾向于传感器数据不可靠而非真实温度变化。", "推理步骤4: 19:52 灶具关闭后厨房窗户被打开(BooleanState = False),但在整个日志剩余时段内未见窗户关闭记录。当前住户已于 21:49 离家(关灯、关空调、锁门),厨房窗户仍处于开启状态,存在安全隐患。", "推理步骤5: 15:36 卫生间漏水传感器短暂触发(2分钟后恢复),当时有人在卫生间且灯亮着,判断为正常用水溅水,非真实漏水。", "推理步骤6: 入户门的开锁/关锁、出入行为模式正常——早晨 07:13 手动开锁出门后自动上锁,傍晚 18:16 手动开锁回家,21:49 离家后自动上锁,门锁状态始终受控。", "推理步骤7: 全屋温度整体趋势合理:夜间约 23°C,午间升至约 25.9°C,傍晚回落,符合夏季自然温度变化曲线。唯独厨房在 19:00-19:30 的异常高值和 None 值是离群点。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2842(28.42°C),灶具尚未开启,其他房间温度仅约 24.4°C", "19:10 和 19:53 厨房温度传感器报告 MeasuredValue = None,传感器数据中断", "19:30 厨房温度仍为 2839,但 20:00 骤降回 2407,与其他房间重新对齐,变化不符合物理规律", "19:52 厨房窗户打开后至日志结束(23:30)未见关闭,住户已于 21:49 离家", "21:49 住户离家流程正常:关灯→关空调→门锁自动上锁,但未关闭厨房窗户"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障", "远程关闭厨房窗户或尽快回家关窗,避免夜间开窗带来的安全风险(防盗、防雨)", "设置离家模式自动化规则:当入户门上锁且无人在家时,自动检查并关闭所有窗户", "为厨房温度传感器设置 None 值告警,出现空值时立即通知用户", "卫生间漏水传感器本次为短暂触发,建议持续观察,若频繁触发需检查管道密封"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.13321089744568, "api_error": null} {"episode_id": "SQ4_FP_B_0901", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0901.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261530, "scenario_id": "INS-02", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "balcony", "injection_time": "2026-06-30T08:04:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或存在局部过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2453(24.53°C)跳升至 2842(28.42°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差接近 4°C,远超正常烹饪前的环境温差。灶具在 19:05 才开启,说明这次异常高温出现在烹饪之前,不能用灶具加热解释。\",\n \"推理步骤2: 19:06 和 19:54 厨房温度传感器连续两次报告 MeasuredValue = None,表示传感器读数丢失。正常传感器不应出现 null 值,这是典型的传感器故障或通信异常信号。\",\n \"推理步骤3: 19:30 厨房温度仍高达 2831(28.31°C),此时灶具已运行约 25 分钟,虽然烹饪会升温,但结合 19:00 灶具未开时就已出现异常高温,以及两次 None 读数,更倾向于传感器本身存在故障,读数不可信。\",\n \"推理步骤4: 19:53 灶具关闭后厨房窗户被打开通风,20:00 厨房温度回落至 2418(24.18°C),之后恢复正常趋势,说明传感器可能间歇性恢复,但不排除后续再次故障。\",\n \"推理步骤5: 其他事件均属正常——早晨 06:46 起床如厕、07:21 出门上班(手动开锁、门关后自动上锁)、08:04 有一次开锁错误后成功用 UserIndex=1 开锁(可能是住户回来取东西,输错一次密码后成功)、18:23 下班回家、19:05-19:53 做饭、20:07 启动洗碗机、21:57 关灯锁门就寝,均符合单人工作日生活规律。\",\n \"推理步骤6: 全天温度曲线呈现夏季典型走势(夜间 22-23°C,午间峰值 25-26°C,傍晚回落),各房间温度高度一致,唯独厨房在 19:00 和 19:30 出现显著偏离,进一步佐证厨房传感器异常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数 2842(28.42°C),灶具尚未开启,比其他房间高约 4°C\",\n \"19:06 厨房温度传感器报告 MeasuredValue = None(第一次数据丢失)\",\n \"19:54 厨房温度传感器再次报告 MeasuredValue = None(第二次数据丢失)\",\n \"19:30 厨房温度仍为 2831(28.31°C),与其他房间偏差约 4°C\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和安装位置,确认是否靠近热源或存在接线问题\",\n \"清理传感器探头,排除灰尘或油污导致的测量偏差\",\n \"观察未来几天传感器是否再次出现 None 读数,若反复出现建议更换传感器\",\n \"在传感器可靠性确认之前,建议为厨房烟雾报警器(kitchen_smoke_alarm)设置更灵敏的阈值,作为安全冗余\",\n \"08:04 的一次门锁操作错误(LockOperationError)为低风险事件,但建议关注是否频繁出现,若多次出现可能提示有人尝试非法开锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障或存在局部过热风险。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2453(24.53°C)跳升至 2842(28.42°C),而同一时刻其他房间温度均在 24.3-24.4°C 范围内,温差接近 4°C,远超正常烹饪前的环境温差。灶具在 19:05 才开启,说明这次异常高温出现在烹饪之前,不能用灶具加热解释。", "推理步骤2: 19:06 和 19:54 厨房温度传感器连续两次报告 MeasuredValue = None,表示传感器读数丢失。正常传感器不应出现 null 值,这是典型的传感器故障或通信异常信号。", "推理步骤3: 19:30 厨房温度仍高达 2831(28.31°C),此时灶具已运行约 25 分钟,虽然烹饪会升温,但结合 19:00 灶具未开时就已出现异常高温,以及两次 None 读数,更倾向于传感器本身存在故障,读数不可信。", "推理步骤4: 19:53 灶具关闭后厨房窗户被打开通风,20:00 厨房温度回落至 2418(24.18°C),之后恢复正常趋势,说明传感器可能间歇性恢复,但不排除后续再次故障。", "推理步骤5: 其他事件均属正常——早晨 06:46 起床如厕、07:21 出门上班(手动开锁、门关后自动上锁)、08:04 有一次开锁错误后成功用 UserIndex=1 开锁(可能是住户回来取东西,输错一次密码后成功)、18:23 下班回家、19:05-19:53 做饭、20:07 启动洗碗机、21:57 关灯锁门就寝,均符合单人工作日生活规律。", "推理步骤6: 全天温度曲线呈现夏季典型走势(夜间 22-23°C,午间峰值 25-26°C,傍晚回落),各房间温度高度一致,唯独厨房在 19:00 和 19:30 出现显著偏离,进一步佐证厨房传感器异常。"], "key_evidence": ["19:00 厨房温度传感器读数 2842(28.42°C),灶具尚未开启,比其他房间高约 4°C", "19:06 厨房温度传感器报告 MeasuredValue = None(第一次数据丢失)", "19:54 厨房温度传感器再次报告 MeasuredValue = None(第二次数据丢失)", "19:30 厨房温度仍为 2831(28.31°C),与其他房间偏差约 4°C"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和安装位置,确认是否靠近热源或存在接线问题", "清理传感器探头,排除灰尘或油污导致的测量偏差", "观察未来几天传感器是否再次出现 None 读数,若反复出现建议更换传感器", "在传感器可靠性确认之前,建议为厨房烟雾报警器(kitchen_smoke_alarm)设置更灵敏的阈值,作为安全冗余", "08:04 的一次门锁操作错误(LockOperationError)为低风险事件,但建议关注是否频繁出现,若多次出现可能提示有人尝试非法开锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.301796197891235, "api_error": null} {"episode_id": "SQ4_FP_B_0908", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0908.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261537, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-14T22:29:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常回家。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度数据——四个传感器(客厅、主卧、次卧、厨房)全天温度走势一致:凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~12:30达到峰值约25.8°C,之后随日落逐步回落,至23:30降至约23.3°C。这是典型的夏季(6月中旬)自然昼夜温度曲线,无任何突变或异常尖峰。\",\n \"推理步骤2: 各房间温度高度同步,彼此差异始终在1°C以内,说明没有局部热源异常(如火灾隐患)或单个传感器故障。厨房温度未出现独立于其他房间的异常升高,排除灶具遗忘关闭等风险。\",\n \"推理步骤3: 22:29 和 22:34 的两次门锁解锁事件,LockOperationType=1 表示解锁操作,OperationSource=3 表示通过密码/凭证方式开锁,UserIndex 分别为 1 和 2,说明是两位已注册的授权用户先后回家。时间间隔5分钟,符合家庭成员前后脚到家的正常场景。\",\n \"推理步骤4: 整个24小时内,烟雾报警器、漏水传感器、运动传感器、门窗接触传感器均无异常事件上报,所有安防类设备处于静默正常状态。\",\n \"推理步骤5: 06:00 时温度从约23.0°C跳升至约24.0°C(约1°C),这是日出后的正常升温,四个房间同步变化,非异常。\"\n ],\n \"key_evidence\": [\n \"四个房间温度全天同步变化,范围22.9°C~25.9°C,符合6月夏季昼夜自然温度曲线,无异常突变\",\n \"22:29 和 22:34 两次门锁解锁均为授权用户(UserIndex=1 和 2)通过凭证方式(OperationSource=3)操作,属正常回家行为\",\n \"全天无烟雾报警、漏水报警、异常门窗开启等安防事件触发\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状况良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,温度变化符合自然昼夜规律,门锁操作为授权用户正常回家。", "reasoning": ["推理步骤1: 分析温度数据——四个传感器(客厅、主卧、次卧、厨房)全天温度走势一致:凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~12:30达到峰值约25.8°C,之后随日落逐步回落,至23:30降至约23.3°C。这是典型的夏季(6月中旬)自然昼夜温度曲线,无任何突变或异常尖峰。", "推理步骤2: 各房间温度高度同步,彼此差异始终在1°C以内,说明没有局部热源异常(如火灾隐患)或单个传感器故障。厨房温度未出现独立于其他房间的异常升高,排除灶具遗忘关闭等风险。", "推理步骤3: 22:29 和 22:34 的两次门锁解锁事件,LockOperationType=1 表示解锁操作,OperationSource=3 表示通过密码/凭证方式开锁,UserIndex 分别为 1 和 2,说明是两位已注册的授权用户先后回家。时间间隔5分钟,符合家庭成员前后脚到家的正常场景。", "推理步骤4: 整个24小时内,烟雾报警器、漏水传感器、运动传感器、门窗接触传感器均无异常事件上报,所有安防类设备处于静默正常状态。", "推理步骤5: 06:00 时温度从约23.0°C跳升至约24.0°C(约1°C),这是日出后的正常升温,四个房间同步变化,非异常。"], "key_evidence": ["四个房间温度全天同步变化,范围22.9°C~25.9°C,符合6月夏季昼夜自然温度曲线,无异常突变", "22:29 和 22:34 两次门锁解锁均为授权用户(UserIndex=1 和 2)通过凭证方式(OperationSource=3)操作,属正常回家行为", "全天无烟雾报警、漏水报警、异常门窗开启等安防事件触发"], "recommended_actions": ["当前无需采取任何措施,家庭安全状况良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.38927459716797, "api_error": null} {"episode_id": "SQ4_FP_B_0909", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0909.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261538, "scenario_id": "WD-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-26T20:20:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.6°C),随后两次报告None值,疑似传感器故障;同时卫生间漏水传感器短暂触发,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约23°C,随日照升温至中午峰值约25.7-25.9°C,午后逐步回落,符合夏季自然温度曲线,各房间温差在合理范围内(±0.2°C),整体正常。\",\n \"推理步骤2: 厨房温度异常——18:00时客厅/主卧/次卧温度均在24.6°C左右,但厨房温度突然跳升至28.61°C(2861),18:30进一步升至28.68°C(2868)。此时灶具尚未开启(18:53才开),且没有任何厨房活动记录,其他房间温度正常下降,说明这不是环境温度变化,而是传感器本身异常。\",\n \"推理步骤3: 厨房温度传感器两次报告None值(18:54和19:52),表明传感器出现读数失败。第一次None发生在灶具刚开启后1分钟,第二次发生在灶具关闭后1分钟。19:00恢复正常读数24.4°C后又再次None,说明传感器工作不稳定,可能存在硬件故障或连接问题。\",\n \"推理步骤4: 卫生间漏水传感器在20:20触发(StateValue=True),2分钟后恢复(20:22 False)。当时卫生间有人(occupancy=1)且灯亮,推测是住户洗浴用水溅到传感器附近导致短暂触发,属于轻微事件,但仍需留意是否反复发生。\",\n \"推理步骤5: 入侵风险排查——早晨07:38住户手动开锁出门,门自动上锁;傍晚18:21手动开锁回家,入户流程正常(玄关运动→客厅运动→开灯→开空调)。21:58关灯关空调后门锁确认上锁。全天无异常开锁事件,无未授权访问。\",\n \"推理步骤6: 火灾风险排查——厨房烟雾报警器全天未触发,灶具18:53开启、19:51关闭,使用时长约58分钟属正常烹饪。关灶后开窗通风(19:51:30窗户打开),操作合理。虽然传感器异常高温读数本身不代表真实火灾风险,但传感器故障意味着如果真的发生厨房高温事件,可能无法被准确监测。\",\n \"推理步骤7: 厨房窗户在19:51打开后日志中未见关闭记录,截至23:30仍处于开启状态。夜间窗户未关存在一定安全隐患(虽然取决于楼层)。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器读数2861(28.61°C),比同时刻其他房间高出约4°C,无对应的厨房设备活动\",\n \"18:30厨房温度传感器读数2868(28.68°C),异常持续\",\n \"18:54和19:52厨房温度传感器两次报告MeasuredValue=None,表明传感器读数失败\",\n \"19:00厨房温度恢复正常值2440后19:52再次None,传感器工作不稳定\",\n \"20:20卫生间漏水传感器短暂触发(2分钟后恢复),伴随有人活动\",\n \"19:51厨房窗户打开后至日志结束(23:30)未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受热源干扰,必要时更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"关注卫生间漏水传感器是否再次触发,检查传感器安装位置是否容易被正常用水溅到,必要时调整位置\",\n \"确认厨房窗户是否需要关闭,夜间长时间开窗可能存在安全或蚊虫问题\",\n \"建议为厨房温度传感器设置异常值告警规则(如读数突变超过3°C或出现None时立即通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.6°C),随后两次报告None值,疑似传感器故障;同时卫生间漏水传感器短暂触发,需关注。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约23°C,随日照升温至中午峰值约25.7-25.9°C,午后逐步回落,符合夏季自然温度曲线,各房间温差在合理范围内(±0.2°C),整体正常。", "推理步骤2: 厨房温度异常——18:00时客厅/主卧/次卧温度均在24.6°C左右,但厨房温度突然跳升至28.61°C(2861),18:30进一步升至28.68°C(2868)。此时灶具尚未开启(18:53才开),且没有任何厨房活动记录,其他房间温度正常下降,说明这不是环境温度变化,而是传感器本身异常。", "推理步骤3: 厨房温度传感器两次报告None值(18:54和19:52),表明传感器出现读数失败。第一次None发生在灶具刚开启后1分钟,第二次发生在灶具关闭后1分钟。19:00恢复正常读数24.4°C后又再次None,说明传感器工作不稳定,可能存在硬件故障或连接问题。", "推理步骤4: 卫生间漏水传感器在20:20触发(StateValue=True),2分钟后恢复(20:22 False)。当时卫生间有人(occupancy=1)且灯亮,推测是住户洗浴用水溅到传感器附近导致短暂触发,属于轻微事件,但仍需留意是否反复发生。", "推理步骤5: 入侵风险排查——早晨07:38住户手动开锁出门,门自动上锁;傍晚18:21手动开锁回家,入户流程正常(玄关运动→客厅运动→开灯→开空调)。21:58关灯关空调后门锁确认上锁。全天无异常开锁事件,无未授权访问。", "推理步骤6: 火灾风险排查——厨房烟雾报警器全天未触发,灶具18:53开启、19:51关闭,使用时长约58分钟属正常烹饪。关灶后开窗通风(19:51:30窗户打开),操作合理。虽然传感器异常高温读数本身不代表真实火灾风险,但传感器故障意味着如果真的发生厨房高温事件,可能无法被准确监测。", "推理步骤7: 厨房窗户在19:51打开后日志中未见关闭记录,截至23:30仍处于开启状态。夜间窗户未关存在一定安全隐患(虽然取决于楼层)。"], "key_evidence": ["18:00厨房温度传感器读数2861(28.61°C),比同时刻其他房间高出约4°C,无对应的厨房设备活动", "18:30厨房温度传感器读数2868(28.68°C),异常持续", "18:54和19:52厨房温度传感器两次报告MeasuredValue=None,表明传感器读数失败", "19:00厨房温度恢复正常值2440后19:52再次None,传感器工作不稳定", "20:20卫生间漏水传感器短暂触发(2分钟后恢复),伴随有人活动", "19:51厨房窗户打开后至日志结束(23:30)未见关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受热源干扰,必要时更换传感器", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "关注卫生间漏水传感器是否再次触发,检查传感器安装位置是否容易被正常用水溅到,必要时调整位置", "确认厨房窗户是否需要关闭,夜间长时间开窗可能存在安全或蚊虫问题", "建议为厨房温度传感器设置异常值告警规则(如读数突变超过3°C或出现None时立即通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.05684566497803, "api_error": null} {"episode_id": "SQ4_FP_B_0915", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0915.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261544, "scenario_id": "INS-04", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-13T10:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),与同时段其他房间温差达4°C,且该传感器多次报告None值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 分析全天温度趋势——凌晨0:00-5:30各房间温度稳定在22.9-23.1°C,6:00起随日照升温,12:00-13:00达到峰值约25.8°C,之后逐步回落,至23:00降至23.3°C左右。整体趋势合理,符合夏季昼夜温差规律。\",\n \"推理步骤2: 发现厨房温度异常——11:00时厨房温度突然跳至2958(29.58°C),11:30仍为2954(29.54°C),而同时段客厅/主卧/次卧均在25.5-25.6°C范围内。厨房与其他房间温差高达约4°C,且此时灶具并未开启(灶具在11:48才开),无合理热源解释这一突增。\",\n \"推理步骤3: 到12:00厨房温度恢复至2571(25.71°C),与其他房间一致,说明这不是持续性环境温升,更像是传感器短暂故障或受到干扰后自行恢复。\",\n \"推理步骤4: 厨房温度传感器多次报告MeasuredValue=None(08:57、09:29、11:49、12:28、18:13、18:35),均发生在灶具开启/关闭前后。虽然灶具使用时传感器暂时无法读数可能是设计行为(如高温保护),但结合11:00的异常高温读数,该传感器的可靠性值得关注。\",\n \"推理步骤5: 排查入侵风险——10:03入户门通过密码/指纹(OperationSource=3)由UserIndex=5解锁,随后玄关和客厅检测到人员活动,属于正常授权用户进入。23:02离家时门自动上锁(LockState=1),流程正常。\",\n \"推理步骤6: 排查火灾风险——灶具三次使用(08:56-09:28、11:48-12:27、18:12-18:34)时长均在22-39分钟内,属于正常烹饪时长。每次关灶后都有开窗通风动作,烟雾报警器全天无触发,无火灾迹象。\",\n \"推理步骤7: 排查水患风险——卫生间漏水传感器全天无报警,洗碗机18:34启动运行正常,无异常。\",\n \"推理步骤8: 其他设备行为均正常——客厅空调09:54开启制冷模式(SystemMode=3)配合窗帘关闭,符合夏季使用习惯;洗衣机无异常事件;各运动传感器触发时间与灯光联动合理。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度传感器读数2958(29.58°C),11:30读数2954(29.54°C),同时段其他房间均为25.5°C左右,温差约4°C且无热源解释\",\n \"厨房温度传感器全天6次报告MeasuredValue=None,虽部分与灶具使用相关,但频率偏高\",\n \"12:00厨房温度自行恢复至25.71°C,与其他房间一致,排除真实环境高温的可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源或受到灶具辐射热影响,必要时重新定位\",\n \"对厨房温度传感器进行校准测试,与已知准确的温度计对比读数,确认传感器是否存在硬件故障\",\n \"关注该传感器后续是否再次出现无热源情况下的异常高温读数,如反复出现建议更换传感器\",\n \"检查传感器固件版本,确认是否有可用更新以修复可能的None值上报问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),与同时段其他房间温差达4°C,且该传感器多次报告None值,存在传感器故障风险。", "reasoning": ["推理步骤1: 分析全天温度趋势——凌晨0:00-5:30各房间温度稳定在22.9-23.1°C,6:00起随日照升温,12:00-13:00达到峰值约25.8°C,之后逐步回落,至23:00降至23.3°C左右。整体趋势合理,符合夏季昼夜温差规律。", "推理步骤2: 发现厨房温度异常——11:00时厨房温度突然跳至2958(29.58°C),11:30仍为2954(29.54°C),而同时段客厅/主卧/次卧均在25.5-25.6°C范围内。厨房与其他房间温差高达约4°C,且此时灶具并未开启(灶具在11:48才开),无合理热源解释这一突增。", "推理步骤3: 到12:00厨房温度恢复至2571(25.71°C),与其他房间一致,说明这不是持续性环境温升,更像是传感器短暂故障或受到干扰后自行恢复。", "推理步骤4: 厨房温度传感器多次报告MeasuredValue=None(08:57、09:29、11:49、12:28、18:13、18:35),均发生在灶具开启/关闭前后。虽然灶具使用时传感器暂时无法读数可能是设计行为(如高温保护),但结合11:00的异常高温读数,该传感器的可靠性值得关注。", "推理步骤5: 排查入侵风险——10:03入户门通过密码/指纹(OperationSource=3)由UserIndex=5解锁,随后玄关和客厅检测到人员活动,属于正常授权用户进入。23:02离家时门自动上锁(LockState=1),流程正常。", "推理步骤6: 排查火灾风险——灶具三次使用(08:56-09:28、11:48-12:27、18:12-18:34)时长均在22-39分钟内,属于正常烹饪时长。每次关灶后都有开窗通风动作,烟雾报警器全天无触发,无火灾迹象。", "推理步骤7: 排查水患风险——卫生间漏水传感器全天无报警,洗碗机18:34启动运行正常,无异常。", "推理步骤8: 其他设备行为均正常——客厅空调09:54开启制冷模式(SystemMode=3)配合窗帘关闭,符合夏季使用习惯;洗衣机无异常事件;各运动传感器触发时间与灯光联动合理。"], "key_evidence": ["11:00厨房温度传感器读数2958(29.58°C),11:30读数2954(29.54°C),同时段其他房间均为25.5°C左右,温差约4°C且无热源解释", "厨房温度传感器全天6次报告MeasuredValue=None,虽部分与灶具使用相关,但频率偏高", "12:00厨房温度自行恢复至25.71°C,与其他房间一致,排除真实环境高温的可能"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源或受到灶具辐射热影响,必要时重新定位", "对厨房温度传感器进行校准测试,与已知准确的温度计对比读数,确认传感器是否存在硬件故障", "关注该传感器后续是否再次出现无热源情况下的异常高温读数,如反复出现建议更换传感器", "检查传感器固件版本,确认是否有可用更新以修复可能的None值上报问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.66914129257202, "api_error": null} {"episode_id": "SQ4_FP_B_0916", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0916.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261545, "scenario_id": "BA-01", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "second_bedroom", "injection_time": "2026-06-21T21:54:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在12:00和12:30报告异常高温(约29.76-29.79°C),与同时段其他房间温差达4°C,且传感器多次报告None值,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 分析全天温度趋势。Matter协议中TemperatureMeasurement.MeasuredValue单位为0.01°C,因此数值2300=23.00°C,2976=29.76°C。全屋温度从凌晨约23°C逐步升至午间约25.8°C,再回落至夜间约23.3°C,符合夏季(6月21日)自然昼夜温度变化规律。\",\n \"推理步骤2: 厨房温度传感器在12:00突然报告2976(29.76°C),而同一时刻客厅25.75°C、主卧25.82°C、次卧25.73°C,厨房与其他房间温差高达约4°C。12:30再次报告2979(29.79°C),其他房间仍在25.7-25.9°C范围。然而此时灶具已在12:06开启、12:25关闭,12:30时灶具已关闭5分钟,温度不应仍维持在近30°C的高位。到13:00厨房温度骤降回25.59°C,这种突变不符合自然散热曲线。\",\n \"推理步骤3: 厨房温度传感器在全天多次报告MeasuredValue=None(08:58、09:30、12:07、12:26、18:04、18:54),均发生在灶具开启或关闭前后。其他三个温度传感器全天无任何None值。这表明厨房温度传感器可能受灶具热辐射干扰,或传感器本身存在间歇性故障。\",\n \"推理步骤4: 对比三次做饭场景——早餐(08:57-09:29)、午餐(12:06-12:25)、晚餐(18:03-18:53),只有午餐时段出现异常高温读数(29.76°C),早餐和晚餐时段传感器直接报None后恢复正常值,说明传感器行为不一致,进一步佐证设备故障。\",\n \"推理步骤5: 其他设备行为均正常——入户门在22:58关闭并自动上锁;客厅空调白天制冷运行(SystemMode=3)、晚间关闭;厨房窗户在每次做饭后打开通风;洗碗机晚餐后启动;卫生间无漏水报警;烟雾报警器未触发。住户作息规律(早起、三餐、晚间就寝)无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在12:00和12:30分别报告2976和2979(约29.8°C),而同时段其他房间温度仅约25.7-25.9°C,温差达4°C,且13:00骤降回25.59°C\",\n \"厨房温度传感器全天6次报告MeasuredValue=None(08:58、09:30、12:07、12:26、18:04、18:54),其他传感器无此现象\",\n \"12:30时灶具已关闭5分钟,但厨房温度仍高达29.79°C,不符合正常散热规律\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数受热辐射干扰,建议将传感器迁移至远离热源的位置\",\n \"对厨房温度传感器进行校准测试或更换,排除硬件故障(间歇性None值和异常跳变均指向传感器可靠性问题)\",\n \"在传感器修复前,建议加强厨房烟雾报警器的监控灵敏度,避免因温度传感器失准而遗漏真实的火灾或过热风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在12:00和12:30报告异常高温(约29.76-29.79°C),与同时段其他房间温差达4°C,且传感器多次报告None值,存在设备故障风险。", "reasoning": ["推理步骤1: 分析全天温度趋势。Matter协议中TemperatureMeasurement.MeasuredValue单位为0.01°C,因此数值2300=23.00°C,2976=29.76°C。全屋温度从凌晨约23°C逐步升至午间约25.8°C,再回落至夜间约23.3°C,符合夏季(6月21日)自然昼夜温度变化规律。", "推理步骤2: 厨房温度传感器在12:00突然报告2976(29.76°C),而同一时刻客厅25.75°C、主卧25.82°C、次卧25.73°C,厨房与其他房间温差高达约4°C。12:30再次报告2979(29.79°C),其他房间仍在25.7-25.9°C范围。然而此时灶具已在12:06开启、12:25关闭,12:30时灶具已关闭5分钟,温度不应仍维持在近30°C的高位。到13:00厨房温度骤降回25.59°C,这种突变不符合自然散热曲线。", "推理步骤3: 厨房温度传感器在全天多次报告MeasuredValue=None(08:58、09:30、12:07、12:26、18:04、18:54),均发生在灶具开启或关闭前后。其他三个温度传感器全天无任何None值。这表明厨房温度传感器可能受灶具热辐射干扰,或传感器本身存在间歇性故障。", "推理步骤4: 对比三次做饭场景——早餐(08:57-09:29)、午餐(12:06-12:25)、晚餐(18:03-18:53),只有午餐时段出现异常高温读数(29.76°C),早餐和晚餐时段传感器直接报None后恢复正常值,说明传感器行为不一致,进一步佐证设备故障。", "推理步骤5: 其他设备行为均正常——入户门在22:58关闭并自动上锁;客厅空调白天制冷运行(SystemMode=3)、晚间关闭;厨房窗户在每次做饭后打开通风;洗碗机晚餐后启动;卫生间无漏水报警;烟雾报警器未触发。住户作息规律(早起、三餐、晚间就寝)无异常。"], "key_evidence": ["厨房温度传感器在12:00和12:30分别报告2976和2979(约29.8°C),而同时段其他房间温度仅约25.7-25.9°C,温差达4°C,且13:00骤降回25.59°C", "厨房温度传感器全天6次报告MeasuredValue=None(08:58、09:30、12:07、12:26、18:04、18:54),其他传感器无此现象", "12:30时灶具已关闭5分钟,但厨房温度仍高达29.79°C,不符合正常散热规律"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数受热辐射干扰,建议将传感器迁移至远离热源的位置", "对厨房温度传感器进行校准测试或更换,排除硬件故障(间歇性None值和异常跳变均指向传感器可靠性问题)", "在传感器修复前,建议加强厨房烟雾报警器的监控灵敏度,避免因温度传感器失准而遗漏真实的火灾或过热风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.956295490264893, "api_error": null} {"episode_id": "SQ4_FP_B_0939", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0939.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261568, "scenario_id": "DF-03", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "living_room", "injection_time": "2026-06-30T09:12:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:20开锁后长时间未关闭/未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:42、06:59、18:14、19:12四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间接近,但传感器不应因灶具开关而丢失读数,正常情况下应报告升高的温度值而非 None,这表明传感器可能存在故障或受到灶具热量干扰导致异常。\",\n \"推理步骤2: 16:20入户门通过手动方式解锁(LockState=2)并打开(contact=False),但直到22:21才记录到门关闭(contact=True)和自动上锁(LockState=1)。中间近6小时入户门处于开启/未锁状态,期间18:13又有一次开锁记录,说明住户回家,但16:20那次开门后门一直未关闭,存在入侵风险窗口。\",\n \"推理步骤3: 09:12-09:18客厅运动传感器出现短暂的占用/清除交替(两次触发间隔约5分钟,每次持续不到1分钟),此时住户已于07:15出门且门已上锁。这可能是宠物活动、传感器误触发,也可能是异常活动,但由于门锁状态正常且未伴随其他入侵迹象,判定为低风险。\",\n \"推理步骤4: 温度趋势整体正常——夜间约22.9°C,白天逐步升至25.8°C峰值(约12:00-12:30),傍晚回落,符合6月底夏季自然温度变化规律。18:13开启空调制冷(SystemMode=3)后温度逐步下降,行为合理。\",\n \"推理步骤5: 厨房窗户在06:58和19:11灶具关闭后打开(contact=False),属于做饭后通风的正常行为,但日志中未见窗户关闭记录,需确认窗户是否仍处于打开状态。\",\n \"推理步骤6: 其余设备行为均符合正常生活模式——05:58起床开灯、06:41做早餐、07:15出门锁门、18:13回家开灯开空调做饭、19:24启动洗碗机、22:21关灯关空调拉窗帘睡觉。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:42、06:59、18:14、19:12四次报告 MeasuredValue = None,传感器读数异常\",\n \"入户门16:20解锁开启后,直到22:21才关闭上锁,中间约6小时门处于未关闭状态\",\n \"09:12-09:18住户外出期间客厅运动传感器两次短暂触发\",\n \"厨房窗户两次打开后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否工作正常,确认其安装位置是否距灶具过近导致高温时读数异常,必要时更换或重新校准\",\n \"设置入户门长时间未关闭/未上锁的自动提醒规则(如超过5分钟未关门则推送告警),避免安全盲区\",\n \"排查09:12-09:18客厅运动传感器触发原因,如家中有宠物可调整灵敏度或设置过滤规则,如无宠物则需关注是否有异常进入\",\n \"为厨房窗户设置长时间未关闭提醒,避免夜间或外出时窗户保持打开状态带来的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:20开锁后长时间未关闭/未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在06:42、06:59、18:14、19:12四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间接近,但传感器不应因灶具开关而丢失读数,正常情况下应报告升高的温度值而非 None,这表明传感器可能存在故障或受到灶具热量干扰导致异常。", "推理步骤2: 16:20入户门通过手动方式解锁(LockState=2)并打开(contact=False),但直到22:21才记录到门关闭(contact=True)和自动上锁(LockState=1)。中间近6小时入户门处于开启/未锁状态,期间18:13又有一次开锁记录,说明住户回家,但16:20那次开门后门一直未关闭,存在入侵风险窗口。", "推理步骤3: 09:12-09:18客厅运动传感器出现短暂的占用/清除交替(两次触发间隔约5分钟,每次持续不到1分钟),此时住户已于07:15出门且门已上锁。这可能是宠物活动、传感器误触发,也可能是异常活动,但由于门锁状态正常且未伴随其他入侵迹象,判定为低风险。", "推理步骤4: 温度趋势整体正常——夜间约22.9°C,白天逐步升至25.8°C峰值(约12:00-12:30),傍晚回落,符合6月底夏季自然温度变化规律。18:13开启空调制冷(SystemMode=3)后温度逐步下降,行为合理。", "推理步骤5: 厨房窗户在06:58和19:11灶具关闭后打开(contact=False),属于做饭后通风的正常行为,但日志中未见窗户关闭记录,需确认窗户是否仍处于打开状态。", "推理步骤6: 其余设备行为均符合正常生活模式——05:58起床开灯、06:41做早餐、07:15出门锁门、18:13回家开灯开空调做饭、19:24启动洗碗机、22:21关灯关空调拉窗帘睡觉。"], "key_evidence": ["厨房温度传感器在06:42、06:59、18:14、19:12四次报告 MeasuredValue = None,传感器读数异常", "入户门16:20解锁开启后,直到22:21才关闭上锁,中间约6小时门处于未关闭状态", "09:12-09:18住户外出期间客厅运动传感器两次短暂触发", "厨房窗户两次打开后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器是否工作正常,确认其安装位置是否距灶具过近导致高温时读数异常,必要时更换或重新校准", "设置入户门长时间未关闭/未上锁的自动提醒规则(如超过5分钟未关门则推送告警),避免安全盲区", "排查09:12-09:18客厅运动传感器触发原因,如家中有宠物可调整灵敏度或设置过滤规则,如无宠物则需关注是否有异常进入", "为厨房窗户设置长时间未关闭提醒,避免夜间或外出时窗户保持打开状态带来的安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.894922256469727, "api_error": null} {"episode_id": "SQ4_FP_B_0947", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0947.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261576, "scenario_id": "DF-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "second_bedroom", "injection_time": "2026-06-11T18:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"次卧温度传感器出现间歇性异常跳变,厨房温度传感器多次报告 None 值,且住户外出期间厨房灶具未关闭近9小时存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:27起床,07:28出门上班(门锁手动开锁、开门、关门、自动上锁),16:19/18:18回家,22:43就寝(关灯、关空调、拉窗帘、确认门锁)。入户门的开锁/上锁序列均为正常操作,无入侵迹象。\",\n \"推理步骤2: 厨房灶具在07:02开启后,住户07:28即出门,但灶具直到18:36之后的某个时间点才被关注。日志显示灶具在06:57曾处于Off状态,07:02:37被打开,而下一次关闭记录是19:13。这意味着灶具在住户外出的近9小时内(07:28~16:19期间)可能一直处于开启状态,这是一个显著的火灾/燃气安全隐患。虽然厨房烟雾报警器未触发,但这仍然是高风险行为。\",\n \"推理步骤3: 厨房温度传感器在06:58、07:03、18:37、19:14多次报告 MeasuredValue = None。这与灶具开关操作时间高度吻合,可能是灶具工作时高温导致传感器读数溢出或传感器故障。但传感器在整点的常规采集中又能正常报告数值,说明故障是间歇性的,需要排查传感器是否安装位置过近灶具或存在硬件问题。\",\n \"推理步骤4: 次卧温度传感器在18:08(2500)、18:38(2502)、19:08(2498)、19:38(2501)出现了异常跳变——当时全屋其他传感器温度在2430~2450范围内持续下降,而次卧传感器突然跳升至约25°C,与周围环境温差约5°C,且这些异常读数出现在非整点时刻(每隔约30分钟),与正常的整点/半点采集周期不同。次卧在此期间无人员活动、无空调开启记录,这种跳变不合理,高度怀疑传感器故障或受到干扰。\",\n \"推理步骤5: 16:19住户回家时开了门锁、开了门,但日志中没有关门(BooleanState.StateValue = True)和上锁的记录,直到22:43才出现关门上锁。这可能意味着入户门在16:19~22:43期间一直处于未关闭/未上锁状态,存在安全风险。不过也可能是18:18第二次开门事件覆盖了中间状态。\",\n \"推理步骤6: 温度趋势整体合理——夜间约23°C,白天逐步升至25.8°C峰值(12:00左右),傍晚回落。18:08开启客厅空调制冷(SystemMode=3)后温度从24.6°C降至22:00的23.5°C,符合预期。漏水传感器、烟雾报警器均未触发,无水灾或火灾告警。\"\n ],\n \"key_evidence\": [\n \"厨房灶具07:02开启,住户07:28离家,灶具可能在无人看管状态下运行数小时\",\n \"厨房温度传感器在06:58、07:03、18:37、19:14四次报告 None 值,与灶具操作时间吻合\",\n \"次卧温度传感器在18:08/18:38/19:08/19:38出现约25°C的异常跳变,偏离同期全屋温度约5°C,且出现在非标准采集周期\",\n \"16:19入户门开锁开门后无关门/上锁记录,直到22:43才确认门锁关闭\",\n \"18:08客厅空调开启时无人在家(18:18才有人进门),可能是远程操控(正常)但也需确认\"\n ],\n \"recommended_actions\": [\n \"设置灶具离家自动关闭规则:当入户门上锁且无人在家时,自动关闭厨房灶具并发送提醒\",\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如有硬件问题建议更换\",\n \"排查次卧温度传感器硬件状态,确认是否存在间歇性故障或无线干扰,必要时更换传感器\",\n \"设置入户门未关闭/未上锁超时提醒(如超过5分钟未关门则推送告警)\",\n \"建议为厨房灶具增加长时间无操作自动断气/断电的安全联动规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "次卧温度传感器出现间歇性异常跳变,厨房温度传感器多次报告 None 值,且住户外出期间厨房灶具未关闭近9小时存在安全隐患。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:27起床,07:28出门上班(门锁手动开锁、开门、关门、自动上锁),16:19/18:18回家,22:43就寝(关灯、关空调、拉窗帘、确认门锁)。入户门的开锁/上锁序列均为正常操作,无入侵迹象。", "推理步骤2: 厨房灶具在07:02开启后,住户07:28即出门,但灶具直到18:36之后的某个时间点才被关注。日志显示灶具在06:57曾处于Off状态,07:02:37被打开,而下一次关闭记录是19:13。这意味着灶具在住户外出的近9小时内(07:28~16:19期间)可能一直处于开启状态,这是一个显著的火灾/燃气安全隐患。虽然厨房烟雾报警器未触发,但这仍然是高风险行为。", "推理步骤3: 厨房温度传感器在06:58、07:03、18:37、19:14多次报告 MeasuredValue = None。这与灶具开关操作时间高度吻合,可能是灶具工作时高温导致传感器读数溢出或传感器故障。但传感器在整点的常规采集中又能正常报告数值,说明故障是间歇性的,需要排查传感器是否安装位置过近灶具或存在硬件问题。", "推理步骤4: 次卧温度传感器在18:08(2500)、18:38(2502)、19:08(2498)、19:38(2501)出现了异常跳变——当时全屋其他传感器温度在2430~2450范围内持续下降,而次卧传感器突然跳升至约25°C,与周围环境温差约5°C,且这些异常读数出现在非整点时刻(每隔约30分钟),与正常的整点/半点采集周期不同。次卧在此期间无人员活动、无空调开启记录,这种跳变不合理,高度怀疑传感器故障或受到干扰。", "推理步骤5: 16:19住户回家时开了门锁、开了门,但日志中没有关门(BooleanState.StateValue = True)和上锁的记录,直到22:43才出现关门上锁。这可能意味着入户门在16:19~22:43期间一直处于未关闭/未上锁状态,存在安全风险。不过也可能是18:18第二次开门事件覆盖了中间状态。", "推理步骤6: 温度趋势整体合理——夜间约23°C,白天逐步升至25.8°C峰值(12:00左右),傍晚回落。18:08开启客厅空调制冷(SystemMode=3)后温度从24.6°C降至22:00的23.5°C,符合预期。漏水传感器、烟雾报警器均未触发,无水灾或火灾告警。"], "key_evidence": ["厨房灶具07:02开启,住户07:28离家,灶具可能在无人看管状态下运行数小时", "厨房温度传感器在06:58、07:03、18:37、19:14四次报告 None 值,与灶具操作时间吻合", "次卧温度传感器在18:08/18:38/19:08/19:38出现约25°C的异常跳变,偏离同期全屋温度约5°C,且出现在非标准采集周期", "16:19入户门开锁开门后无关门/上锁记录,直到22:43才确认门锁关闭", "18:08客厅空调开启时无人在家(18:18才有人进门),可能是远程操控(正常)但也需确认"], "recommended_actions": ["设置灶具离家自动关闭规则:当入户门上锁且无人在家时,自动关闭厨房灶具并发送提醒", "检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常;如有硬件问题建议更换", "排查次卧温度传感器硬件状态,确认是否存在间歇性故障或无线干扰,必要时更换传感器", "设置入户门未关闭/未上锁超时提醒(如超过5分钟未关门则推送告警)", "建议为厨房灶具增加长时间无操作自动断气/断电的安全联动规则"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 36.17838764190674, "api_error": null} {"episode_id": "SQ4_FP_B_0949", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0949.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261578, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "balcony", "injection_time": "2026-06-23T14:32:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在下午至傍晚时段出现异常高温读数和两次 null 值,疑似传感器故障,同时存在灶具长时间无人看管的潜在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 14:32 灶具开启,14:37 厨房温度从 2530(25.3°C)跳升至 2700(27.0°C),属于烹饪导致的正常升温范围,但此时客厅运动传感器显示无人(14:32 Occupancy=0),直到 14:52 才重新检测到人,灶具在此期间处于无人看管状态约 20 分钟。\",\n \"推理步骤2: 15:02 厨房温度继续升至 2750(27.5°C),但 15:00 的定时读数却回落到 2526(25.26°C),15:30 又降至 2513(25.13°C)。灶具开启期间温度读数出现矛盾——短间隔内既有高温又有正常温度,说明传感器读数不稳定。\",\n \"推理步骤3: 18:00 厨房温度突然飙升至 2858(28.58°C),而同一时刻其他房间温度均在 24.5°C 左右,厨房比其他房间高出约 4°C。18:30 进一步升至 2869(28.69°C)。此时灶具并未开启(14:32 开启后日志中无关闭记录,直到 18:50 才再次开启),这段异常高温缺乏合理热源解释。\",\n \"推理步骤4: 18:51 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(空值),这是典型的传感器故障或通信异常表现。正常传感器不应返回 null。\",\n \"推理步骤5: 19:00 之后厨房温度恢复到 2441(24.41°C),与其他房间一致,说明 18:00-18:51 期间的高温读数很可能是传感器故障产生的虚假数据,而非真实环境温度。\",\n \"推理步骤6: 关于灶具使用安全——14:32 灶具首次开启后,日志中没有关闭记录,直到 18:50 再次出现开启事件,19:34 才关闭。如果灶具在 14:32 至 19:34 之间一直处于开启状态,则持续了近 5 小时,其中大部分时间家中无人(住户 07:10 出门,18:05 回家),这是严重的火灾隐患。\",\n \"推理步骤7: 其他方面均正常——入户门锁在出门和回家时正确执行了开锁/自动上锁流程;烟雾报警器全天未触发;漏水传感器无报警;夜间温度变化符合自然昼夜规律。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度 2858(28.58°C)、18:30 达 2869(28.69°C),比同时刻其他房间高约 4°C,且此时灶具未处于已知开启状态\",\n \"18:51 和 19:35 厨房温度传感器两次返回 MeasuredValue = None,属于异常空值\",\n \"14:32 灶具开启后无对应关闭记录,直到 19:34 才关闭,期间住户 07:10 已出门、18:05 才回家,灶具可能长时间无人看管\",\n \"14:37 温度 2700 与 15:00 温度 2526 之间存在矛盾,传感器读数不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障\",\n \"设置灶具安全联动规则:当客厅和厨房运动传感器均无人超过一定时间时,自动关闭灶具或发送告警\",\n \"为灶具添加最大连续使用时长告警(如超过 2 小时未关闭则推送提醒)\",\n \"在灶具开启期间,若厨房温度传感器返回 null 值,应立即触发告警通知住户\",\n \"建议增加厨房运动传感器,以更精确判断厨房是否有人在场\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在下午至傍晚时段出现异常高温读数和两次 null 值,疑似传感器故障,同时存在灶具长时间无人看管的潜在火灾风险。", "reasoning": ["推理步骤1: 14:32 灶具开启,14:37 厨房温度从 2530(25.3°C)跳升至 2700(27.0°C),属于烹饪导致的正常升温范围,但此时客厅运动传感器显示无人(14:32 Occupancy=0),直到 14:52 才重新检测到人,灶具在此期间处于无人看管状态约 20 分钟。", "推理步骤2: 15:02 厨房温度继续升至 2750(27.5°C),但 15:00 的定时读数却回落到 2526(25.26°C),15:30 又降至 2513(25.13°C)。灶具开启期间温度读数出现矛盾——短间隔内既有高温又有正常温度,说明传感器读数不稳定。", "推理步骤3: 18:00 厨房温度突然飙升至 2858(28.58°C),而同一时刻其他房间温度均在 24.5°C 左右,厨房比其他房间高出约 4°C。18:30 进一步升至 2869(28.69°C)。此时灶具并未开启(14:32 开启后日志中无关闭记录,直到 18:50 才再次开启),这段异常高温缺乏合理热源解释。", "推理步骤4: 18:51 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(空值),这是典型的传感器故障或通信异常表现。正常传感器不应返回 null。", "推理步骤5: 19:00 之后厨房温度恢复到 2441(24.41°C),与其他房间一致,说明 18:00-18:51 期间的高温读数很可能是传感器故障产生的虚假数据,而非真实环境温度。", "推理步骤6: 关于灶具使用安全——14:32 灶具首次开启后,日志中没有关闭记录,直到 18:50 再次出现开启事件,19:34 才关闭。如果灶具在 14:32 至 19:34 之间一直处于开启状态,则持续了近 5 小时,其中大部分时间家中无人(住户 07:10 出门,18:05 回家),这是严重的火灾隐患。", "推理步骤7: 其他方面均正常——入户门锁在出门和回家时正确执行了开锁/自动上锁流程;烟雾报警器全天未触发;漏水传感器无报警;夜间温度变化符合自然昼夜规律。"], "key_evidence": ["18:00 厨房温度 2858(28.58°C)、18:30 达 2869(28.69°C),比同时刻其他房间高约 4°C,且此时灶具未处于已知开启状态", "18:51 和 19:35 厨房温度传感器两次返回 MeasuredValue = None,属于异常空值", "14:32 灶具开启后无对应关闭记录,直到 19:34 才关闭,期间住户 07:10 已出门、18:05 才回家,灶具可能长时间无人看管", "14:37 温度 2700 与 15:00 温度 2526 之间存在矛盾,传感器读数不一致"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除传感器故障", "设置灶具安全联动规则:当客厅和厨房运动传感器均无人超过一定时间时,自动关闭灶具或发送告警", "为灶具添加最大连续使用时长告警(如超过 2 小时未关闭则推送提醒)", "在灶具开启期间,若厨房温度传感器返回 null 值,应立即触发告警通知住户", "建议增加厨房运动传感器,以更精确判断厨房是否有人在场"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.015706300735474, "api_error": null} {"episode_id": "SQ4_FP_B_0950", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_B_0950.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261579, "scenario_id": "INS-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-13T17:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全屋四个温度传感器在24小时内呈现一致的自然变化曲线:凌晨约23.0°C,午间峰值约25.8°C,夜间回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 入户门锁事件分析——17:19出现一次LockOperationError(OperationError=1, OperationSource=3),随后20秒内同一用户(UserIndex=1)通过相同来源(OperationSource=3,即键盘/密码)成功解锁。这符合住户输错一次密码后立即重新输入正确密码的典型场景,不构成入侵威胁。\",\n \"推理步骤3: 门锁解锁后的联动验证——解锁后2秒入户门传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1),时序完全吻合正常进门流程,且时间点(17:19,傍晚下班时段)符合住户回家的生活习惯。\",\n \"推理步骤4: 其他安全设备状态——整个日志周期内,烟雾报警器、漏水传感器、阳台门传感器均无任何告警事件上报,厨房灶具和其他设备也无异常状态变化。\",\n \"推理步骤5: 仅出现一次密码错误且立即成功解锁,不存在多次连续失败的暴力破解特征,判定为正常操作失误。\"\n ],\n \"key_evidence\": [\n \"17:19:00 门锁密码输入失败1次,17:19:20 同一用户(UserIndex=1)通过密码方式成功解锁,间隔仅20秒\",\n \"解锁后入户门开启和玄关运动检测的时序完全吻合正常进门流程(2-5秒内连续触发)\",\n \"全屋温度曲线平稳一致,呈自然昼夜变化规律,无异常热源\",\n \"全天无烟雾、漏水、非法开门等安全告警事件\"\n ],\n \"recommended_actions\": [\n \"可关注门锁密码输入错误的频率,若后续频繁出现失败记录,建议检查是否有人尝试猜测密码\",\n \"日常建议:定期检查各传感器电池电量和在线状态,确保安防设备持续有效\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁。", "reasoning": ["推理步骤1: 温度数据分析——全屋四个温度传感器在24小时内呈现一致的自然变化曲线:凌晨约23.0°C,午间峰值约25.8°C,夜间回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温,排除火灾或设备过热风险。", "推理步骤2: 入户门锁事件分析——17:19出现一次LockOperationError(OperationError=1, OperationSource=3),随后20秒内同一用户(UserIndex=1)通过相同来源(OperationSource=3,即键盘/密码)成功解锁。这符合住户输错一次密码后立即重新输入正确密码的典型场景,不构成入侵威胁。", "推理步骤3: 门锁解锁后的联动验证——解锁后2秒入户门传感器报告开门(StateValue=False),3秒后玄关运动传感器检测到有人(Occupancy=1),时序完全吻合正常进门流程,且时间点(17:19,傍晚下班时段)符合住户回家的生活习惯。", "推理步骤4: 其他安全设备状态——整个日志周期内,烟雾报警器、漏水传感器、阳台门传感器均无任何告警事件上报,厨房灶具和其他设备也无异常状态变化。", "推理步骤5: 仅出现一次密码错误且立即成功解锁,不存在多次连续失败的暴力破解特征,判定为正常操作失误。"], "key_evidence": ["17:19:00 门锁密码输入失败1次,17:19:20 同一用户(UserIndex=1)通过密码方式成功解锁,间隔仅20秒", "解锁后入户门开启和玄关运动检测的时序完全吻合正常进门流程(2-5秒内连续触发)", "全屋温度曲线平稳一致,呈自然昼夜变化规律,无异常热源", "全天无烟雾、漏水、非法开门等安全告警事件"], "recommended_actions": ["可关注门锁密码输入错误的频率,若后续频繁出现失败记录,建议检查是否有人尝试猜测密码", "日常建议:定期检查各传感器电池电量和在线状态,确保安防设备持续有效"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.61528468132019, "api_error": null} {"episode_id": "SQ4_FP_C_0853", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0853.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261482, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-18T06:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器存在周期性异常跳变,厨房温度传感器在灶具使用期间多次报告 None 值,提示设备故障或干扰。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器在 06:06、07:06、07:36 出现突发跳变(从约 2400 跳至 2500 左右,约 1°C 瞬间升高),而同时段其他房间传感器无对应变化,且客厅空调 06:06 刚开启时温度不应立即上升,说明该传感器读数异常。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后(06:32、07:26、18:42、19:08)多次报告 MeasuredValue = None,表明传感器在高温环境下出现读数丢失或通信中断,属于设备异常行为。\",\n \"推理步骤3: 整体生活模式正常——早晨 6 点起床、7:11 出门上班/上学并自动锁门、16:33 孩子放学回家、18:13 大人回家做饭、21:11 孩子就寝、22:26 大人就寝并锁门,无入侵迹象。\",\n \"推理步骤4: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。烟雾报警器和漏水传感器全天无触发。\",\n \"推理步骤5: 06:00 时所有房间温度同步跳升约 1°C(从 ~23.0°C 到 ~24.0°C),可能是空调定时预热或外部环境变化,属于可解释范围,但客厅传感器额外跳至 25°C 则不合理。\"\n ],\n \"key_evidence\": [\n \"客厅温度传感器在 06:06 报告 2500(25.00°C),而 06:00 时为 2406(24.06°C),06:30 又回落至 2405,存在不合理的瞬时尖峰;类似现象在 07:06(2498)和 07:36(2501)重复出现\",\n \"厨房温度传感器在 06:32、07:26、18:42、19:08 四次报告 MeasuredValue = None,均发生在灶具开启或刚关闭时段\",\n \"入户门在 16:33 开锁后未关闭(front_door_contact 未恢复 True),直到 22:26 才关门上锁,期间约 6 小时入户门处于未关状态\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器是否受到空调出风口直吹或其他热源干扰,考虑重新校准或更换位置\",\n \"检查厨房温度传感器的耐热性能和安装位置,确认其在灶具使用时是否超出工作温度范围导致通信中断\",\n \"确认入户门在家人回家后是否有意保持开启状态;如非有意,建议设置门未关闭超时提醒(如 5 分钟未关门则告警)\",\n \"对客厅温度传感器的周期性尖峰进行持续监测,若频繁出现建议更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅温度传感器存在周期性异常跳变,厨房温度传感器在灶具使用期间多次报告 None 值,提示设备故障或干扰。", "reasoning": ["推理步骤1: 客厅温度传感器在 06:06、07:06、07:36 出现突发跳变(从约 2400 跳至 2500 左右,约 1°C 瞬间升高),而同时段其他房间传感器无对应变化,且客厅空调 06:06 刚开启时温度不应立即上升,说明该传感器读数异常。", "推理步骤2: 厨房温度传感器在灶具开启后(06:32、07:26、18:42、19:08)多次报告 MeasuredValue = None,表明传感器在高温环境下出现读数丢失或通信中断,属于设备异常行为。", "推理步骤3: 整体生活模式正常——早晨 6 点起床、7:11 出门上班/上学并自动锁门、16:33 孩子放学回家、18:13 大人回家做饭、21:11 孩子就寝、22:26 大人就寝并锁门,无入侵迹象。", "推理步骤4: 门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制)。烟雾报警器和漏水传感器全天无触发。", "推理步骤5: 06:00 时所有房间温度同步跳升约 1°C(从 ~23.0°C 到 ~24.0°C),可能是空调定时预热或外部环境变化,属于可解释范围,但客厅传感器额外跳至 25°C 则不合理。"], "key_evidence": ["客厅温度传感器在 06:06 报告 2500(25.00°C),而 06:00 时为 2406(24.06°C),06:30 又回落至 2405,存在不合理的瞬时尖峰;类似现象在 07:06(2498)和 07:36(2501)重复出现", "厨房温度传感器在 06:32、07:26、18:42、19:08 四次报告 MeasuredValue = None,均发生在灶具开启或刚关闭时段", "入户门在 16:33 开锁后未关闭(front_door_contact 未恢复 True),直到 22:26 才关门上锁,期间约 6 小时入户门处于未关状态"], "recommended_actions": ["检查客厅温度传感器是否受到空调出风口直吹或其他热源干扰,考虑重新校准或更换位置", "检查厨房温度传感器的耐热性能和安装位置,确认其在灶具使用时是否超出工作温度范围导致通信中断", "确认入户门在家人回家后是否有意保持开启状态;如非有意,建议设置门未关闭超时提醒(如 5 分钟未关门则告警)", "对客厅温度传感器的周期性尖峰进行持续监测,若频繁出现建议更换传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.424429655075073, "api_error": null} {"episode_id": "SQ4_FP_C_0861", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0861.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261490, "scenario_id": "INS-01", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "balcony", "injection_time": "2026-06-27T14:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"14:31 客厅出现短暂人体活动并操作了灯和窗帘,但全天无任何入户门开锁/开门记录,且整天几乎无其他房间活动痕迹,疑似有人通过非正常途径进入。\",\n \"reasoning\": [\n \"推理步骤1: 全天日志中,入户门锁(front_door_lock)和入户门传感器(front_door_contact)没有任何事件记录,说明整天没有人通过正门进出。\",\n \"推理步骤2: 14:31 客厅运动传感器检测到有人(Occupancy=1),随后3秒内客厅主灯被打开,7秒后窗帘被关闭(StateValue=False),5秒后灯又被关闭,最后运动传感器恢复无人(Occupancy=0)。整个过程仅持续约20秒,行为非常短促。\",\n \"推理步骤3: 除此之外,全天24小时没有任何其他房间的运动传感器、灯光、门锁、窗帘等设备产生事件,说明住户大概率全天不在家。\",\n \"推理步骤4: 在住户不在家的情况下,客厅出现短暂的人体活动并操作设备,且没有正门进出记录,存在两种可能:(a) 有人通过阳台门或窗户等非正常途径进入;(b) 自动化场景误触发,但运动传感器确实检测到了人体存在。\",\n \"推理步骤5: 温度数据方面,所有房间温度走势一致(夜间约23°C,午间峰值约25.9°C,晚间回落至23.3°C),符合夏季自然昼夜温差规律,无空调运行痕迹,无厨房异常升温,排除火灾和设备故障风险。\",\n \"推理步骤6: 烟雾报警器、漏水传感器均无告警事件,排除火灾和水患风险。\",\n \"推理步骤7: 置信度定为 medium 而非 high,是因为不能完全排除宠物触发运动传感器或自动化规则联动的可能性,但20秒内完成开灯→关窗帘→关灯的操作序列更像是人为行为。\"\n ],\n \"key_evidence\": [\n \"全天无入户门锁(front_door_lock)和入户门传感器(front_door_contact)事件,无人通过正门进出\",\n \"14:31:00 客厅运动传感器触发(Occupancy=1),14:31:03 主灯开启,14:31:10 窗帘关闭,14:31:15 主灯关闭,14:31:20 运动传感器恢复(Occupancy=0),整个过程仅20秒\",\n \"全天除客厅14:31这一组事件外,无任何其他房间的运动、灯光、门窗事件,住户大概率全天外出\",\n \"阳台门传感器(balcony_door_contact)全天无事件记录,但窗户传感器未覆盖所有窗户,不能排除窗户入侵\"\n ],\n \"recommended_actions\": [\n \"立即查看客厅区域的监控录像(如有),确认14:31前后是否有陌生人进入\",\n \"远程确认所有门窗传感器当前状态,特别是阳台门和客厅窗户是否处于关闭状态\",\n \"如确认无人应在家,建议远程锁定入户门并开启安防警戒模式\",\n \"检查是否存在自动化规则可能在运动传感器触发时联动灯光和窗帘,排除误触发可能\",\n \"考虑在阳台和客厅窗户区域增加入侵检测传感器,弥补当前监测盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "14:31 客厅出现短暂人体活动并操作了灯和窗帘,但全天无任何入户门开锁/开门记录,且整天几乎无其他房间活动痕迹,疑似有人通过非正常途径进入。", "reasoning": ["推理步骤1: 全天日志中,入户门锁(front_door_lock)和入户门传感器(front_door_contact)没有任何事件记录,说明整天没有人通过正门进出。", "推理步骤2: 14:31 客厅运动传感器检测到有人(Occupancy=1),随后3秒内客厅主灯被打开,7秒后窗帘被关闭(StateValue=False),5秒后灯又被关闭,最后运动传感器恢复无人(Occupancy=0)。整个过程仅持续约20秒,行为非常短促。", "推理步骤3: 除此之外,全天24小时没有任何其他房间的运动传感器、灯光、门锁、窗帘等设备产生事件,说明住户大概率全天不在家。", "推理步骤4: 在住户不在家的情况下,客厅出现短暂的人体活动并操作设备,且没有正门进出记录,存在两种可能:(a) 有人通过阳台门或窗户等非正常途径进入;(b) 自动化场景误触发,但运动传感器确实检测到了人体存在。", "推理步骤5: 温度数据方面,所有房间温度走势一致(夜间约23°C,午间峰值约25.9°C,晚间回落至23.3°C),符合夏季自然昼夜温差规律,无空调运行痕迹,无厨房异常升温,排除火灾和设备故障风险。", "推理步骤6: 烟雾报警器、漏水传感器均无告警事件,排除火灾和水患风险。", "推理步骤7: 置信度定为 medium 而非 high,是因为不能完全排除宠物触发运动传感器或自动化规则联动的可能性,但20秒内完成开灯→关窗帘→关灯的操作序列更像是人为行为。"], "key_evidence": ["全天无入户门锁(front_door_lock)和入户门传感器(front_door_contact)事件,无人通过正门进出", "14:31:00 客厅运动传感器触发(Occupancy=1),14:31:03 主灯开启,14:31:10 窗帘关闭,14:31:15 主灯关闭,14:31:20 运动传感器恢复(Occupancy=0),整个过程仅20秒", "全天除客厅14:31这一组事件外,无任何其他房间的运动、灯光、门窗事件,住户大概率全天外出", "阳台门传感器(balcony_door_contact)全天无事件记录,但窗户传感器未覆盖所有窗户,不能排除窗户入侵"], "recommended_actions": ["立即查看客厅区域的监控录像(如有),确认14:31前后是否有陌生人进入", "远程确认所有门窗传感器当前状态,特别是阳台门和客厅窗户是否处于关闭状态", "如确认无人应在家,建议远程锁定入户门并开启安防警戒模式", "检查是否存在自动化规则可能在运动传感器触发时联动灯光和窗帘,排除误触发可能", "考虑在阳台和客厅窗户区域增加入侵检测传感器,弥补当前监测盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.61268925666809, "api_error": null} {"episode_id": "SQ4_FP_C_0854", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0854.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261483, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kids_room", "injection_time": "2026-06-02T22:49:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房温度传感器在深夜持续报告异常高温读数,与全屋其他传感器趋势严重背离,高度疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 全屋温度趋势一致——从凌晨约23°C逐步升至中午约25.8°C,午后回落,至23:30左右降回约23.3-23.4°C,符合夏季自然昼夜温差规律。\",\n \"推理步骤2: 儿童房温度传感器在22:49突然从约23.5°C跳升至25.0°C(2500),而同一时刻客厅、主卧、厨房温度均在23.4-23.6°C区间。此后23:00的定时读数恢复正常(2328),但23:19再次跳至25.02°C,23:30又恢复正常(2330),23:49再跳至24.98°C,次日00:19又报25.01°C。呈现出在正常读数和异常高值之间反复跳变的模式。\",\n \"推理步骤3: 如果是真实温升(如火灾或暖气),温度应持续上升且不会在11分钟后自行恢复正常再反复。厨房和客厅烟雾报警器全程无触发,排除火灾可能。\",\n \"推理步骤4: 儿童房窗帘在20:59已关闭(10000=全关),灯也已关闭,孩子应已入睡。房间内没有运动传感器触发、没有空调或其他热源开启的记录,不存在合理的物理热源。\",\n \"推理步骤5: 异常读数约每30分钟出现一次(22:49、23:19、23:49、00:19),且数值高度一致(2498-2502),介于正常定时采样之间,呈现周期性间歇故障特征,极可能是传感器硬件故障或接线问题导致的间歇性错误读数。\",\n \"推理步骤6: 另外注意到厨房温度传感器在06:52、06:53、18:50、19:07多次报告 None 值,均发生在灶具使用前后,可能是高温环境下传感器暂时超量程或通信中断,属于轻度异常。\",\n \"推理步骤7: 22:49客厅灯在全家已就寝后突然开启,且无对应的运动传感器触发、无入户门开锁记录,可能是误触、自动化规则触发或设备异常,需关注但威胁等级较低。\"\n ],\n \"key_evidence\": [\n \"22:49 儿童房温度突跳至2500,同时刻其他房间温度均在2339-2355范围\",\n \"23:00恢复正常(2328)后,23:19再次跳至2502,23:30又恢复(2330),23:49跳至2498,00:19跳至2501——间歇性跳变模式\",\n \"异常读数高度集中在2498-2502区间,数值一致性指向传感器固定偏移故障而非真实温度变化\",\n \"儿童房无任何热源开启记录(空调关闭、灯关闭、无运动检测),无法解释真实温升\",\n \"全屋烟雾报警器无触发,排除火灾风险\",\n \"厨房温度传感器在灶具使用期间多次报告None值\",\n \"22:49客厅主灯在无人活动情况下开启\"\n ],\n \"recommended_actions\": [\n \"优先检查儿童房温度传感器(kids_room_temp_sensor)硬件状态,清洁探头、检查接线,必要时更换传感器\",\n \"在传感器修复前,对儿童房温度读数设置异常过滤规则,避免基于错误数据触发自动化(如空调联动)\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的耐高温性能和安装位置,确认其在灶具使用时报告None的原因\",\n \"排查22:49客厅灯开启的原因——检查自动化规则、遥控器误触或设备固件状态\",\n \"建议为儿童房增加一个备用温度传感器做交叉验证,提高监测可靠性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "儿童房温度传感器在深夜持续报告异常高温读数,与全屋其他传感器趋势严重背离,高度疑似传感器故障。", "reasoning": ["推理步骤1: 全屋温度趋势一致——从凌晨约23°C逐步升至中午约25.8°C,午后回落,至23:30左右降回约23.3-23.4°C,符合夏季自然昼夜温差规律。", "推理步骤2: 儿童房温度传感器在22:49突然从约23.5°C跳升至25.0°C(2500),而同一时刻客厅、主卧、厨房温度均在23.4-23.6°C区间。此后23:00的定时读数恢复正常(2328),但23:19再次跳至25.02°C,23:30又恢复正常(2330),23:49再跳至24.98°C,次日00:19又报25.01°C。呈现出在正常读数和异常高值之间反复跳变的模式。", "推理步骤3: 如果是真实温升(如火灾或暖气),温度应持续上升且不会在11分钟后自行恢复正常再反复。厨房和客厅烟雾报警器全程无触发,排除火灾可能。", "推理步骤4: 儿童房窗帘在20:59已关闭(10000=全关),灯也已关闭,孩子应已入睡。房间内没有运动传感器触发、没有空调或其他热源开启的记录,不存在合理的物理热源。", "推理步骤5: 异常读数约每30分钟出现一次(22:49、23:19、23:49、00:19),且数值高度一致(2498-2502),介于正常定时采样之间,呈现周期性间歇故障特征,极可能是传感器硬件故障或接线问题导致的间歇性错误读数。", "推理步骤6: 另外注意到厨房温度传感器在06:52、06:53、18:50、19:07多次报告 None 值,均发生在灶具使用前后,可能是高温环境下传感器暂时超量程或通信中断,属于轻度异常。", "推理步骤7: 22:49客厅灯在全家已就寝后突然开启,且无对应的运动传感器触发、无入户门开锁记录,可能是误触、自动化规则触发或设备异常,需关注但威胁等级较低。"], "key_evidence": ["22:49 儿童房温度突跳至2500,同时刻其他房间温度均在2339-2355范围", "23:00恢复正常(2328)后,23:19再次跳至2502,23:30又恢复(2330),23:49跳至2498,00:19跳至2501——间歇性跳变模式", "异常读数高度集中在2498-2502区间,数值一致性指向传感器固定偏移故障而非真实温度变化", "儿童房无任何热源开启记录(空调关闭、灯关闭、无运动检测),无法解释真实温升", "全屋烟雾报警器无触发,排除火灾风险", "厨房温度传感器在灶具使用期间多次报告None值", "22:49客厅主灯在无人活动情况下开启"], "recommended_actions": ["优先检查儿童房温度传感器(kids_room_temp_sensor)硬件状态,清洁探头、检查接线,必要时更换传感器", "在传感器修复前,对儿童房温度读数设置异常过滤规则,避免基于错误数据触发自动化(如空调联动)", "检查厨房温度传感器(kitchen_temp_sensor)的耐高温性能和安装位置,确认其在灶具使用时报告None的原因", "排查22:49客厅灯开启的原因——检查自动化规则、遥控器误触或设备固件状态", "建议为儿童房增加一个备用温度传感器做交叉验证,提高监测可靠性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.48265552520752, "api_error": null} {"episode_id": "SQ4_FP_C_0862", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0862.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261491, "scenario_id": "CH-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01-FP", "scenario_name": "CH-01-FP: 孩子生病请假在家(家长陪护)", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "家长也在家(多个房间有活动),不只是儿童房,说明有成人陪护", "target_room": "master_bathroom", "injection_time": "2026-06-07T12:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁。温度变化符合夏季昼夜自然规律,少量人体活动事件属于正常居家行为。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——所有传感器在 00:00~05:30 期间读数约 22.9~23.1°C,属于夏季夜间正常室温;06:00 起随日出逐步升高,12:00~12:30 达到峰值约 25.8°C,之后缓慢回落,至 23:30 回到约 23.3°C。四个房间温度走势高度一致,呈现典型的夏季昼夜温度曲线,无任何单点异常飙升。\",\n \"推理步骤2: 厨房温度未出现独立于其他房间的异常升高,排除灶具遗忘关闭或火灾隐患;厨房烟雾报警器全天无触发记录,进一步确认无火灾风险。\",\n \"推理步骤3: 人体活动事件仅有三条——12:03 儿童房检测到有人并开灯、12:13 主卧检测到有人、12:23 客厅检测到有人。时间在中午 12 点左右,间隔合理,符合住户午间起床或回家后依次经过各房间的正常动线。\",\n \"推理步骤4: 入户门锁、入户门传感器、所有窗户传感器、阳台门传感器全天无开关状态变化记录,说明门窗保持原有状态未被异常打开,排除入侵风险。\",\n \"推理步骤5: 漏水传感器(厨房、主卫、次卫)全天无报警,烟雾/CO 报警器(厨房、客厅)全天无触发,排除水灾和火灾/一氧化碳风险。\",\n \"推理步骤6: 所有设备日志中未出现离线、通信故障或异常状态值,设备运行正常。\"\n ],\n \"key_evidence\": [\n \"四个房间温度传感器全天走势一致,呈标准夏季昼夜曲线(夜间约 22.9°C → 正午峰值约 25.9°C → 夜间回落至约 23.3°C),无异常突变\",\n \"人体活动仅在 12:03~12:23 出现三次,时间集中且动线合理(儿童房→主卧→客厅),符合住户正常活动\",\n \"全天无任何门窗传感器状态变化、无烟雾/CO 报警、无漏水报警、无门锁异常事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状况良好\",\n \"建议关注全天无空调运行记录,正午室温接近 26°C,如有老人或儿童在家可考虑设置空调自动开启阈值以保障舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁。温度变化符合夏季昼夜自然规律,少量人体活动事件属于正常居家行为。", "reasoning": ["推理步骤1: 温度数据分析——所有传感器在 00:00~05:30 期间读数约 22.9~23.1°C,属于夏季夜间正常室温;06:00 起随日出逐步升高,12:00~12:30 达到峰值约 25.8°C,之后缓慢回落,至 23:30 回到约 23.3°C。四个房间温度走势高度一致,呈现典型的夏季昼夜温度曲线,无任何单点异常飙升。", "推理步骤2: 厨房温度未出现独立于其他房间的异常升高,排除灶具遗忘关闭或火灾隐患;厨房烟雾报警器全天无触发记录,进一步确认无火灾风险。", "推理步骤3: 人体活动事件仅有三条——12:03 儿童房检测到有人并开灯、12:13 主卧检测到有人、12:23 客厅检测到有人。时间在中午 12 点左右,间隔合理,符合住户午间起床或回家后依次经过各房间的正常动线。", "推理步骤4: 入户门锁、入户门传感器、所有窗户传感器、阳台门传感器全天无开关状态变化记录,说明门窗保持原有状态未被异常打开,排除入侵风险。", "推理步骤5: 漏水传感器(厨房、主卫、次卫)全天无报警,烟雾/CO 报警器(厨房、客厅)全天无触发,排除水灾和火灾/一氧化碳风险。", "推理步骤6: 所有设备日志中未出现离线、通信故障或异常状态值,设备运行正常。"], "key_evidence": ["四个房间温度传感器全天走势一致,呈标准夏季昼夜曲线(夜间约 22.9°C → 正午峰值约 25.9°C → 夜间回落至约 23.3°C),无异常突变", "人体活动仅在 12:03~12:23 出现三次,时间集中且动线合理(儿童房→主卧→客厅),符合住户正常活动", "全天无任何门窗传感器状态变化、无烟雾/CO 报警、无漏水报警、无门锁异常事件"], "recommended_actions": ["当前无需采取任何措施,家庭安全状况良好", "建议关注全天无空调运行记录,正午室温接近 26°C,如有老人或儿童在家可考虑设置空调自动开启阈值以保障舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.9599871635437, "api_error": null} {"episode_id": "SQ4_FP_C_0863", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0863.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261492, "scenario_id": "BA-03", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "kids_room", "injection_time": "2026-06-16T21:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;入户门在16:30开锁进入后长时间未关闭/上锁,直到22:14才确认关门上锁;儿童房灯在21:03出现快速反复开关的异常行为。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:43、07:00、18:41、19:16四次报告 MeasuredValue = None。两次发生在灶具开启后约30秒(06:42开灶→06:43报None,18:40开灶→18:41报None),两次发生在灶具关闭后(06:59关灶→07:00报None,19:15关灶→19:16报None)。灶具操作导致传感器读数丢失,可能是高温干扰、传感器故障或通信中断。虽然07:00和19:30的后续读数恢复正常,但反复出现None值表明传感器工作不稳定。\",\n \"推理步骤2: 入户门在16:30被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但直到22:14才记录到门关闭(StateValue=True)并自动上锁。中间近5小时45分钟内没有关门/上锁记录。虽然18:17有一次开锁进入事件,但16:30开门后一直没有关门记录,说明入户门可能长时间处于未关闭状态,存在安全隐患。\",\n \"推理步骤3: 儿童房灯在21:03出现2秒间隔的快速开关循环(开→关→开→关,21:03:02到21:03:08),此前20:50儿童房灯已关闭且窗帘已完全关闭(孩子准备睡觉)。这种快速闪烁模式不像正常人为操作,可能是设备故障、智能开关抖动,或儿童玩耍开关。\",\n \"推理步骤4: 整体生活模式正常——06:12起床、07:48出门上锁、16:30孩子放学回家、18:17大人回家、22:14就寝锁门,符合典型三口之家作息。温度从夜间23°C逐步升至中午25.9°C再回落,符合夏季自然温度曲线。灶具使用时间合理(早餐约17分钟、晚餐约35分钟),做完饭后开厨房窗通风也是正常行为。空调在18:17开启制冷模式(SystemMode=3),22:14关闭,客厅温度从24.6°C降至23.6°C,合理。\",\n \"推理步骤5: 未发现入侵迹象——所有门锁操作均为手动开锁,无异常远程或暴力开锁事件。烟雾报警器和漏水传感器全天无告警。厨房窗户在做饭后打开通风是合理行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:43、07:00、18:41、19:16四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"入户门16:30:02开启(StateValue=False)后,直到22:14:21才记录关闭(StateValue=True),中间约5小时45分钟无关门记录\",\n \"儿童房灯在21:03:02至21:03:08之间以2秒间隔快速开关4次,模式异常\",\n \"16:30开锁进入后未见关门上锁记录,18:17再次开锁进入,说明门可能一直未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换或重新校准\",\n \"检查入户门自动上锁策略,建议设置门未关闭超过一定时间(如5分钟)的告警提醒,避免长时间门户大开\",\n \"检查儿童房灯的智能开关是否存在硬件抖动或固件问题;如果是孩子玩耍导致,可考虑在就寝时间段锁定开关\",\n \"建议为入户门增加「开门超时未关」的自动化告警规则,提升家庭安防等级\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;入户门在16:30开锁进入后长时间未关闭/上锁,直到22:14才确认关门上锁;儿童房灯在21:03出现快速反复开关的异常行为。", "reasoning": ["推理步骤1: 厨房温度传感器在06:43、07:00、18:41、19:16四次报告 MeasuredValue = None。两次发生在灶具开启后约30秒(06:42开灶→06:43报None,18:40开灶→18:41报None),两次发生在灶具关闭后(06:59关灶→07:00报None,19:15关灶→19:16报None)。灶具操作导致传感器读数丢失,可能是高温干扰、传感器故障或通信中断。虽然07:00和19:30的后续读数恢复正常,但反复出现None值表明传感器工作不稳定。", "推理步骤2: 入户门在16:30被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但直到22:14才记录到门关闭(StateValue=True)并自动上锁。中间近5小时45分钟内没有关门/上锁记录。虽然18:17有一次开锁进入事件,但16:30开门后一直没有关门记录,说明入户门可能长时间处于未关闭状态,存在安全隐患。", "推理步骤3: 儿童房灯在21:03出现2秒间隔的快速开关循环(开→关→开→关,21:03:02到21:03:08),此前20:50儿童房灯已关闭且窗帘已完全关闭(孩子准备睡觉)。这种快速闪烁模式不像正常人为操作,可能是设备故障、智能开关抖动,或儿童玩耍开关。", "推理步骤4: 整体生活模式正常——06:12起床、07:48出门上锁、16:30孩子放学回家、18:17大人回家、22:14就寝锁门,符合典型三口之家作息。温度从夜间23°C逐步升至中午25.9°C再回落,符合夏季自然温度曲线。灶具使用时间合理(早餐约17分钟、晚餐约35分钟),做完饭后开厨房窗通风也是正常行为。空调在18:17开启制冷模式(SystemMode=3),22:14关闭,客厅温度从24.6°C降至23.6°C,合理。", "推理步骤5: 未发现入侵迹象——所有门锁操作均为手动开锁,无异常远程或暴力开锁事件。烟雾报警器和漏水传感器全天无告警。厨房窗户在做饭后打开通风是合理行为。"], "key_evidence": ["厨房温度传感器在06:43、07:00、18:41、19:16四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "入户门16:30:02开启(StateValue=False)后,直到22:14:21才记录关闭(StateValue=True),中间约5小时45分钟无关门记录", "儿童房灯在21:03:02至21:03:08之间以2秒间隔快速开关4次,模式异常", "16:30开锁进入后未见关门上锁记录,18:17再次开锁进入,说明门可能一直未关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换或重新校准", "检查入户门自动上锁策略,建议设置门未关闭超过一定时间(如5分钟)的告警提醒,避免长时间门户大开", "检查儿童房灯的智能开关是否存在硬件抖动或固件问题;如果是孩子玩耍导致,可考虑在就寝时间段锁定开关", "建议为入户门增加「开门超时未关」的自动化告警规则,提升家庭安防等级"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.372783184051514, "api_error": null} {"episode_id": "SQ4_FP_C_0865", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0865.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261494, "scenario_id": "INS-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "balcony", "injection_time": "2026-06-21T11:35:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全天四个传感器(客厅、主卧、儿童房、厨房)的温度变化呈现典型的夏季昼夜曲线:凌晨最低约22.9°C,中午前后最高约25.9°C,傍晚逐步回落。各房间温差始终在2°C以内,无任何局部异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 入户门锁事件分析——11:35:00 出现一次 LockOperationError(OperationError=1, OperationSource=3),20秒后同一来源(OperationSource=3 为键盘/密码方式)由 UserIndex=1(已注册的家庭用户)成功解锁。这是典型的输错一次密码后重新输入正确密码的场景,属于正常使用行为。\",\n \"推理步骤3: 门锁成功解锁后,入户门传感器在2秒内报告开门(StateValue=False),3秒后玄关运动传感器检测到有人进入(Occupancy=1),时间序列完全吻合正常的开门入户流程。\",\n \"推理步骤4: 全天无烟雾报警、无漏水报警、无CO报警触发;所有窗户和阳台门传感器未报告异常开合;无深夜异常运动检测事件。整体设备运行状态平稳。\",\n \"推理步骤5: 仅出现一次密码输入错误且紧接着由合法用户成功解锁,不构成暴力破解或入侵模式(通常需要短时间内多次连续失败才值得警惕)。\"\n ],\n \"key_evidence\": [\n \"温度全天在22.9°C~25.9°C之间平稳波动,各房间高度一致,符合夏季自然昼夜温差规律\",\n \"门锁操作错误仅1次,20秒后由已注册用户(UserIndex=1)通过密码方式成功解锁,随后门传感器和运动传感器依次正常响应\",\n \"全天无烟雾、漏水、CO等安全报警触发\"\n ],\n \"recommended_actions\": [\n \"可关注门锁密码输入错误的频率,若后续频繁出现错误尝试,建议开启连续失败锁定策略\",\n \"夏季中午室温接近26°C,如有需要可考虑在午间时段自动开启空调以保持舒适温度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁。", "reasoning": ["推理步骤1: 温度数据分析——全天四个传感器(客厅、主卧、儿童房、厨房)的温度变化呈现典型的夏季昼夜曲线:凌晨最低约22.9°C,中午前后最高约25.9°C,傍晚逐步回落。各房间温差始终在2°C以内,无任何局部异常升温,排除火灾或设备过热风险。", "推理步骤2: 入户门锁事件分析——11:35:00 出现一次 LockOperationError(OperationError=1, OperationSource=3),20秒后同一来源(OperationSource=3 为键盘/密码方式)由 UserIndex=1(已注册的家庭用户)成功解锁。这是典型的输错一次密码后重新输入正确密码的场景,属于正常使用行为。", "推理步骤3: 门锁成功解锁后,入户门传感器在2秒内报告开门(StateValue=False),3秒后玄关运动传感器检测到有人进入(Occupancy=1),时间序列完全吻合正常的开门入户流程。", "推理步骤4: 全天无烟雾报警、无漏水报警、无CO报警触发;所有窗户和阳台门传感器未报告异常开合;无深夜异常运动检测事件。整体设备运行状态平稳。", "推理步骤5: 仅出现一次密码输入错误且紧接着由合法用户成功解锁,不构成暴力破解或入侵模式(通常需要短时间内多次连续失败才值得警惕)。"], "key_evidence": ["温度全天在22.9°C~25.9°C之间平稳波动,各房间高度一致,符合夏季自然昼夜温差规律", "门锁操作错误仅1次,20秒后由已注册用户(UserIndex=1)通过密码方式成功解锁,随后门传感器和运动传感器依次正常响应", "全天无烟雾、漏水、CO等安全报警触发"], "recommended_actions": ["可关注门锁密码输入错误的频率,若后续频繁出现错误尝试,建议开启连续失败锁定策略", "夏季中午室温接近26°C,如有需要可考虑在午间时段自动开启空调以保持舒适温度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.348018169403076, "api_error": null} {"episode_id": "SQ4_FP_C_0867", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0867.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261496, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-15T10:26:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:37、07:02、18:25、19:16 共四次报告 MeasuredValue = None,且均发生在灶具使用前后,说明该传感器在高温或油烟环境下工作不稳定,存在间歇性故障。\",\n \"推理步骤2: 厨房温度传感器是厨房安全监控的关键组件,与烟雾报警器配合使用。如果传感器在灶具工作期间失效,可能导致火灾或过热事件无法被及时检测。\",\n \"推理步骤3: 厨房窗户在 07:01:30 开启(BooleanState.StateValue = False 表示打开),之后日志中未见关闭事件。19:15:30 再次出现开启事件,说明窗户可能一直处于打开状态,或中间关闭后又被打开。全家 07:37 出门后厨房窗户持续开启,存在安全隐患。\",\n \"推理步骤4: 10:26 有一次通过 OperationSource=3(远程/密码)且 UserIndex=5 的开锁事件。该用户进入后开了客厅灯,之后无其他异常行为,可能是家政人员或授权访客,但需确认 UserIndex=5 的身份。\",\n \"推理步骤5: 其余行为模式正常——早晨 06:00 起床、07:37 全家出门并自动锁门、15:56 孩子放学回家、18:13 大人下班回家、21:15 孩子就寝、22:23 大人就寝。温度变化符合夏季昼夜规律(夜间约 23°C,午间峰值约 25.8°C),空调制冷模式(SystemMode=3)合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37、07:02、18:25、19:16 四次报告 MeasuredValue = None,均与灶具使用时段高度相关\",\n \"kitchen_window_contact 在 07:01:30 报告 StateValue = False(窗户打开),全天日志中未见对应的关闭(StateValue = True)事件,家人 07:37 出门后窗户仍处于开启状态\",\n \"10:26 出现 UserIndex=5 的远程开锁事件(OperationSource=3),该用户身份未在常规家庭成员行为模式中出现过\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器,该传感器在灶具工作期间频繁失效,影响厨房安全监控能力\",\n \"确认 UserIndex=5 对应的用户身份,如为家政人员或临时访客,建议设置时间段访问权限限制\",\n \"建议设置离家模式自动化规则:出门锁门后自动检查所有窗户传感器状态,若有窗户未关闭则发送提醒\",\n \"厨房做饭后开窗通风是合理行为,但建议设置定时提醒,避免长时间无人时窗户保持开启\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:37、07:02、18:25、19:16 共四次报告 MeasuredValue = None,且均发生在灶具使用前后,说明该传感器在高温或油烟环境下工作不稳定,存在间歇性故障。", "推理步骤2: 厨房温度传感器是厨房安全监控的关键组件,与烟雾报警器配合使用。如果传感器在灶具工作期间失效,可能导致火灾或过热事件无法被及时检测。", "推理步骤3: 厨房窗户在 07:01:30 开启(BooleanState.StateValue = False 表示打开),之后日志中未见关闭事件。19:15:30 再次出现开启事件,说明窗户可能一直处于打开状态,或中间关闭后又被打开。全家 07:37 出门后厨房窗户持续开启,存在安全隐患。", "推理步骤4: 10:26 有一次通过 OperationSource=3(远程/密码)且 UserIndex=5 的开锁事件。该用户进入后开了客厅灯,之后无其他异常行为,可能是家政人员或授权访客,但需确认 UserIndex=5 的身份。", "推理步骤5: 其余行为模式正常——早晨 06:00 起床、07:37 全家出门并自动锁门、15:56 孩子放学回家、18:13 大人下班回家、21:15 孩子就寝、22:23 大人就寝。温度变化符合夏季昼夜规律(夜间约 23°C,午间峰值约 25.8°C),空调制冷模式(SystemMode=3)合理。"], "key_evidence": ["kitchen_temp_sensor 在 06:37、07:02、18:25、19:16 四次报告 MeasuredValue = None,均与灶具使用时段高度相关", "kitchen_window_contact 在 07:01:30 报告 StateValue = False(窗户打开),全天日志中未见对应的关闭(StateValue = True)事件,家人 07:37 出门后窗户仍处于开启状态", "10:26 出现 UserIndex=5 的远程开锁事件(OperationSource=3),该用户身份未在常规家庭成员行为模式中出现过"], "recommended_actions": ["检修或更换厨房温度传感器,该传感器在灶具工作期间频繁失效,影响厨房安全监控能力", "确认 UserIndex=5 对应的用户身份,如为家政人员或临时访客,建议设置时间段访问权限限制", "建议设置离家模式自动化规则:出门锁门后自动检查所有窗户传感器状态,若有窗户未关闭则发送提醒", "厨房做饭后开窗通风是合理行为,但建议设置定时提醒,避免长时间无人时窗户保持开启"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.893598079681396, "api_error": null} {"episode_id": "SQ4_FP_C_0873", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0873.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261502, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "master_bathroom", "injection_time": "2026-06-29T08:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;厨房灶具关闭后未见厨房窗户关闭记录,且入户门在16:03开锁后长时间未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:03、18:26、19:07 四次报告 MeasuredValue = None。每次都与灶具操作时间高度相关(灶具关闭或开启前后),说明传感器可能受灶具热源干扰或自身存在间歇性故障。虽然后续半小时整点读数恢复正常,但反复出现 None 值不应忽视。\",\n \"推理步骤2: 厨房窗户传感器在 06:51:30 和 19:06:30 两次记录 StateValue=False(窗户打开),这是做饭后通风的合理行为。但整个日志中没有对应的 StateValue=True(窗户关闭)记录。如果窗户确实一直未关,夜间存在安全隐患(入侵通道、雨水进入等)。\",\n \"推理步骤3: 入户门在 07:42 出门时正常上锁(LockState=1),16:03 有人回家开锁(LockState=2),但直到 17:45 第二次开门事件都没有中间的上锁记录。17:45 之后同样没有上锁记录,直到 22:11 才由自动锁执行上锁。16:03 到 22:11 之间超过 6 小时门锁处于未锁定状态,虽然家中有人,但仍是安全隐患。\",\n \"推理步骤4: 08:56 厨房漏水传感器短暂触发(True),2分钟后恢复(False)。此时家中无人(07:42已出门),可能是洗碗机管路微渗或传感器误触发。虽然很快恢复,但家中无人时出现漏水告警值得关注。\",\n \"推理步骤5: 其余行为模式正常——凌晨全屋安静,06:12起床,07:42出门上锁,16:03孩子放学回家,17:45大人回家,晚餐做饭、洗碗机运行、21:03孩子就寝、22:11大人就寝并自动锁门。温度曲线符合夏季昼夜变化(夜间约23°C,午间峰值约25.9°C)。空调制冷模式(SystemMode=3)合理。无入侵、火灾或烟雾告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:52、07:03、18:26、19:07 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 两次记录打开(06:51:30 和 19:06:30),全天无关闭记录\",\n \"front_door_lock 在 16:03 开锁后直到 22:11 才自动上锁,中间超过 6 小时未锁\",\n \"kitchen_water_leak 在 08:56 无人在家时短暂触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,清洁或重新校准,排除灶具热源干扰导致的间歇性 None 值问题\",\n \"确认厨房窗户当前状态,如已打开请及时关闭;检查窗户传感器是否正常上报关闭事件\",\n \"建议为入户门锁设置自动上锁策略(如开锁后 5 分钟无操作自动锁定),避免长时间未锁\",\n \"排查厨房漏水告警原因,检查洗碗机进出水管路连接处是否有渗漏\",\n \"考虑为无人在家时段设置安全模式,漏水、门窗异常等事件自动推送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;厨房灶具关闭后未见厨房窗户关闭记录,且入户门在16:03开锁后长时间未上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:03、18:26、19:07 四次报告 MeasuredValue = None。每次都与灶具操作时间高度相关(灶具关闭或开启前后),说明传感器可能受灶具热源干扰或自身存在间歇性故障。虽然后续半小时整点读数恢复正常,但反复出现 None 值不应忽视。", "推理步骤2: 厨房窗户传感器在 06:51:30 和 19:06:30 两次记录 StateValue=False(窗户打开),这是做饭后通风的合理行为。但整个日志中没有对应的 StateValue=True(窗户关闭)记录。如果窗户确实一直未关,夜间存在安全隐患(入侵通道、雨水进入等)。", "推理步骤3: 入户门在 07:42 出门时正常上锁(LockState=1),16:03 有人回家开锁(LockState=2),但直到 17:45 第二次开门事件都没有中间的上锁记录。17:45 之后同样没有上锁记录,直到 22:11 才由自动锁执行上锁。16:03 到 22:11 之间超过 6 小时门锁处于未锁定状态,虽然家中有人,但仍是安全隐患。", "推理步骤4: 08:56 厨房漏水传感器短暂触发(True),2分钟后恢复(False)。此时家中无人(07:42已出门),可能是洗碗机管路微渗或传感器误触发。虽然很快恢复,但家中无人时出现漏水告警值得关注。", "推理步骤5: 其余行为模式正常——凌晨全屋安静,06:12起床,07:42出门上锁,16:03孩子放学回家,17:45大人回家,晚餐做饭、洗碗机运行、21:03孩子就寝、22:11大人就寝并自动锁门。温度曲线符合夏季昼夜变化(夜间约23°C,午间峰值约25.9°C)。空调制冷模式(SystemMode=3)合理。无入侵、火灾或烟雾告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:52、07:03、18:26、19:07 四次报告 MeasuredValue = None", "kitchen_window_contact 两次记录打开(06:51:30 和 19:06:30),全天无关闭记录", "front_door_lock 在 16:03 开锁后直到 22:11 才自动上锁,中间超过 6 小时未锁", "kitchen_water_leak 在 08:56 无人在家时短暂触发"], "recommended_actions": ["检查厨房温度传感器,清洁或重新校准,排除灶具热源干扰导致的间歇性 None 值问题", "确认厨房窗户当前状态,如已打开请及时关闭;检查窗户传感器是否正常上报关闭事件", "建议为入户门锁设置自动上锁策略(如开锁后 5 分钟无操作自动锁定),避免长时间未锁", "排查厨房漏水告警原因,检查洗碗机进出水管路连接处是否有渗漏", "考虑为无人在家时段设置安全模式,漏水、门窗异常等事件自动推送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.832194328308105, "api_error": null} {"episode_id": "SQ4_FP_C_0875", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0875.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261504, "scenario_id": "BA-05", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "master_bathroom", "injection_time": "2026-06-30T19:13:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:02、07:14、18:23、19:21 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。None 值出现的时间点恰好与灶具开启/关闭时段重合,可能是高温或蒸汽导致传感器故障,也可能是设备本身通信异常。\",\n \"推理步骤2: 厨房窗户传感器在 07:13:30 报告 StateValue = False(窗户打开),之后在 19:20:30 再次报告 StateValue = False(窗户打开),但整个日志中没有任何 kitchen_window_contact StateValue = True(窗户关闭)的记录。这意味着厨房窗户从早上 7:13 起就一直处于打开状态,直到日志结束(23:30)仍未关闭。家中无人时段(07:10~16:17)窗户持续敞开存在入侵风险。\",\n \"推理步骤3: 入户门在 16:17 开锁时未见随后的锁门记录(front_door_contact 未恢复 True、LockState 未恢复 1),直到 22:10 才确认门关闭并自动上锁。16:17~18:06 期间入户门可能处于未锁状态,结合仅有儿童房检测到人(kids_room_occupancy),说明可能是孩子放学回家但未锁门。\",\n \"推理步骤4: 19:13 的开锁事件使用了 OperationSource=3(远程/密码键盘)且 UserIndex=5,这是一个不同于早晚手动开锁的操作方式。虽然可能是家庭成员使用密码开门,但需确认 UserIndex=5 是否为已授权用户。\",\n \"推理步骤5: 其余行为模式正常——早晨 6:19 起床、7:10 出门、灶具使用后关闭、晚间 22:10 就寝、温度随日照自然升降(夜间约 23°C,午间峰值约 25.8°C)、空调制冷模式(SystemMode=3)运行后室温下降、儿童房 20:48 关灯拉窗帘符合孩子就寝习惯。烟雾报警器和漏水传感器均未触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:02、07:14、18:23、19:21 四次报告 MeasuredValue = None,其他传感器同期正常\",\n \"kitchen_window_contact 在 07:13:30 报告打开(False),全天日志中无关闭(True)记录,窗户持续敞开超过 16 小时\",\n \"front_door_lock 在 16:17 解锁后无立即锁门记录,直到 22:10:18 才确认门关闭上锁,中间约 2 小时(至 18:06 下一次开门)门锁状态不明\",\n \"19:13 开锁事件使用 OperationSource=3, UserIndex=5,与其他手动开锁方式不同\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,确认是否因灶具高温/油烟导致间歇性故障\",\n \"设置自动化规则:当灶具关闭超过一定时间后提醒关闭厨房窗户,避免长时间无人时窗户敞开\",\n \"确认入户门锁 UserIndex=5 对应的用户身份,审查门锁用户列表,删除不再使用的授权\",\n \"为儿童回家场景设置自动化:入户门解锁后若超过 2 分钟未检测到锁门动作,发送提醒通知\",\n \"考虑在厨房增加备用温度传感器或将现有传感器安装位置远离灶具热源,提高监测可靠性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:02、07:14、18:23、19:21 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。None 值出现的时间点恰好与灶具开启/关闭时段重合,可能是高温或蒸汽导致传感器故障,也可能是设备本身通信异常。", "推理步骤2: 厨房窗户传感器在 07:13:30 报告 StateValue = False(窗户打开),之后在 19:20:30 再次报告 StateValue = False(窗户打开),但整个日志中没有任何 kitchen_window_contact StateValue = True(窗户关闭)的记录。这意味着厨房窗户从早上 7:13 起就一直处于打开状态,直到日志结束(23:30)仍未关闭。家中无人时段(07:10~16:17)窗户持续敞开存在入侵风险。", "推理步骤3: 入户门在 16:17 开锁时未见随后的锁门记录(front_door_contact 未恢复 True、LockState 未恢复 1),直到 22:10 才确认门关闭并自动上锁。16:17~18:06 期间入户门可能处于未锁状态,结合仅有儿童房检测到人(kids_room_occupancy),说明可能是孩子放学回家但未锁门。", "推理步骤4: 19:13 的开锁事件使用了 OperationSource=3(远程/密码键盘)且 UserIndex=5,这是一个不同于早晚手动开锁的操作方式。虽然可能是家庭成员使用密码开门,但需确认 UserIndex=5 是否为已授权用户。", "推理步骤5: 其余行为模式正常——早晨 6:19 起床、7:10 出门、灶具使用后关闭、晚间 22:10 就寝、温度随日照自然升降(夜间约 23°C,午间峰值约 25.8°C)、空调制冷模式(SystemMode=3)运行后室温下降、儿童房 20:48 关灯拉窗帘符合孩子就寝习惯。烟雾报警器和漏水传感器均未触发。"], "key_evidence": ["kitchen_temp_sensor 在 07:02、07:14、18:23、19:21 四次报告 MeasuredValue = None,其他传感器同期正常", "kitchen_window_contact 在 07:13:30 报告打开(False),全天日志中无关闭(True)记录,窗户持续敞开超过 16 小时", "front_door_lock 在 16:17 解锁后无立即锁门记录,直到 22:10:18 才确认门关闭上锁,中间约 2 小时(至 18:06 下一次开门)门锁状态不明", "19:13 开锁事件使用 OperationSource=3, UserIndex=5,与其他手动开锁方式不同"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,确认是否因灶具高温/油烟导致间歇性故障", "设置自动化规则:当灶具关闭超过一定时间后提醒关闭厨房窗户,避免长时间无人时窗户敞开", "确认入户门锁 UserIndex=5 对应的用户身份,审查门锁用户列表,删除不再使用的授权", "为儿童回家场景设置自动化:入户门解锁后若超过 2 分钟未检测到锁门动作,发送提醒通知", "考虑在厨房增加备用温度传感器或将现有传感器安装位置远离灶具热源,提高监测可靠性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.90022850036621, "api_error": null} {"episode_id": "SQ4_FP_C_0877", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0877.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261506, "scenario_id": "BA-05", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-05-FP", "scenario_name": "BA-05-FP: 邻居/亲友代为浇花/喂宠物", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有效的临时 UserIndex),进出有完整的开锁+锁门记录", "target_room": "kids_room", "injection_time": "2026-06-16T21:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时 21:01 入户门通过未知用户凭证(UserIndex=5)解锁且门未及时关闭,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:35、07:23、18:17、19:18 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,虽然可能与高温/蒸汽有关,但传感器不应返回 None,这表明传感器存在间歇性故障或通信异常。\",\n \"推理步骤2: 21:01 入户门锁通过 OperationSource=3(即远程/密码/凭证方式)由 UserIndex=5 解锁。该用户编号在当天早晚的正常出入中未出现过(早上 07:29 和下午 16:23、18:00 均为 Manual 操作且无 UserIndex)。需确认 UserIndex=5 是否为已授权的家庭成员或访客。\",\n \"推理步骤3: 21:01 门锁解锁后,门传感器显示门打开(StateValue=False),但直到 22:19 才记录到门关闭(StateValue=True)并自动上锁。中间间隔约 78 分钟,期间入户门处于未关闭状态,存在安全隐患。\",\n \"推理步骤4: 其余行为模式正常——早上 06:12 起床、07:29 出门(关灯锁门)、16:23 孩子放学回家、18:00 大人回家做饭、19:17 晚餐、21:13 孩子睡觉关灯拉窗帘、22:19 大人就寝。温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C)。\",\n \"推理步骤5: 06:34 主卫灯快速开关(OnOff=True 后立即 OnOff=False,同一秒内)可能是误触或传感器抖动,属于轻微异常但无安全威胁。\",\n \"推理步骤6: 厨房窗户在做完饭后打开(07:22:30 和 19:17:30)属于通风的正常行为,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:35、07:23、18:17、19:18 四次报告 MeasuredValue = None\",\n \"21:01 front_door_lock 由 UserIndex=5 通过 OperationSource=3 解锁,该用户在当天其他出入事件中未出现\",\n \"入户门从 21:01 开启到 22:19 才关闭,持续约 78 分钟未关门\",\n \"06:34 master_bathroom_light 在同一秒内开关(OnOff=True → OnOff=False)\",\n \"厨房窗户两次打开(07:22:30、19:17:30)但日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和连接,排查间歇性 None 值的原因,必要时更换传感器\",\n \"确认门锁 UserIndex=5 的身份,如非授权用户应立即删除该凭证并检查门锁访问日志\",\n \"设置入户门长时间未关闭的告警规则(如超过 5 分钟未关门则推送提醒),避免门户大开的安全风险\",\n \"确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;如仍开着且无人在家时应关闭\",\n \"检查主卫灯开关是否存在接触不良或传感器抖动问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时 21:01 入户门通过未知用户凭证(UserIndex=5)解锁且门未及时关闭,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:35、07:23、18:17、19:18 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,虽然可能与高温/蒸汽有关,但传感器不应返回 None,这表明传感器存在间歇性故障或通信异常。", "推理步骤2: 21:01 入户门锁通过 OperationSource=3(即远程/密码/凭证方式)由 UserIndex=5 解锁。该用户编号在当天早晚的正常出入中未出现过(早上 07:29 和下午 16:23、18:00 均为 Manual 操作且无 UserIndex)。需确认 UserIndex=5 是否为已授权的家庭成员或访客。", "推理步骤3: 21:01 门锁解锁后,门传感器显示门打开(StateValue=False),但直到 22:19 才记录到门关闭(StateValue=True)并自动上锁。中间间隔约 78 分钟,期间入户门处于未关闭状态,存在安全隐患。", "推理步骤4: 其余行为模式正常——早上 06:12 起床、07:29 出门(关灯锁门)、16:23 孩子放学回家、18:00 大人回家做饭、19:17 晚餐、21:13 孩子睡觉关灯拉窗帘、22:19 大人就寝。温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C)。", "推理步骤5: 06:34 主卫灯快速开关(OnOff=True 后立即 OnOff=False,同一秒内)可能是误触或传感器抖动,属于轻微异常但无安全威胁。", "推理步骤6: 厨房窗户在做完饭后打开(07:22:30 和 19:17:30)属于通风的正常行为,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:35、07:23、18:17、19:18 四次报告 MeasuredValue = None", "21:01 front_door_lock 由 UserIndex=5 通过 OperationSource=3 解锁,该用户在当天其他出入事件中未出现", "入户门从 21:01 开启到 22:19 才关闭,持续约 78 分钟未关门", "06:34 master_bathroom_light 在同一秒内开关(OnOff=True → OnOff=False)", "厨房窗户两次打开(07:22:30、19:17:30)但日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和连接,排查间歇性 None 值的原因,必要时更换传感器", "确认门锁 UserIndex=5 的身份,如非授权用户应立即删除该凭证并检查门锁访问日志", "设置入户门长时间未关闭的告警规则(如超过 5 分钟未关门则推送提醒),避免门户大开的安全风险", "确认厨房窗户当前状态,如已关闭则检查窗户传感器是否漏报;如仍开着且无人在家时应关闭", "检查主卫灯开关是否存在接触不良或传感器抖动问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.083008766174316, "api_error": null} {"episode_id": "SQ4_FP_C_0889", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0889.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261518, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "second_bedroom", "injection_time": "2026-06-25T13:09:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及入户门在 13:09/13:14 有两次仅解锁无开门记录的异常操作。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57、07:05、18:40、19:08 共4次报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器可能存在间歇性故障或与灶具使用时的高温/油烟干扰有关。\",\n \"推理步骤2: 厨房窗户传感器在 07:04:30 报告 StateValue=False(窗户打开),之后日志中未见关闭事件。晚间 19:07:30 再次报告 False(打开),同样未见关闭。如果窗户确实一直处于打开状态,夜间无人时存在安全隐患。\",\n \"推理步骤3: 13:09 和 13:14 入户门锁出现两次 LockOperationType=1(解锁)事件,OperationSource=3(远程/密码),分别由 UserIndex=1 和 UserIndex=2 触发,但没有对应的门接触传感器开/关事件,也没有运动传感器触发。这可能是远程解锁测试,也可能是异常的远程访问尝试。\",\n \"推理步骤4: 整体生活模式正常——早晨 6:12 起床、7:14 出门上班/上学、16:22 孩子放学回家、18:12 大人回家、20:47 孩子就寝、22:17 大人就寝,符合典型三口之家作息。\",\n \"推理步骤5: 温度趋势正常,夜间约 23°C,午间峰值约 25.9°C,晚间开空调后逐步降温,无异常温升。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\",\n \"推理步骤6: 入户门在出门(07:14)和就寝(22:17)时均自动上锁,门锁安全机制运作正常。但 13:09/13:14 的远程解锁未配合实际开门动作,需要确认是否为授权操作。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:57、07:05、18:40、19:08 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:04:30 和 19:07:30 报告 StateValue=False(打开),全天未见关闭(StateValue=True)记录\",\n \"front_door_lock 在 13:09 和 13:14 出现两次远程解锁(OperationSource=3),无对应的 front_door_contact 开关事件和 entrance_occupancy 触发\",\n \"所有烟雾报警器和漏水传感器全天无告警事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁传感器探头或更换设备,排查是否因灶具高温导致间歇性失灵\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间无人时建议关闭窗户以保障安全\",\n \"核实 13:09 和 13:14 的两次远程解锁操作是否为户主本人授权,如非本人操作,建议立即更改门锁密码并检查远程访问权限\",\n \"建议为厨房温度传感器设置 None 值告警规则,在传感器离线或异常时及时通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及入户门在 13:09/13:14 有两次仅解锁无开门记录的异常操作。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:57、07:05、18:40、19:08 共4次报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器可能存在间歇性故障或与灶具使用时的高温/油烟干扰有关。", "推理步骤2: 厨房窗户传感器在 07:04:30 报告 StateValue=False(窗户打开),之后日志中未见关闭事件。晚间 19:07:30 再次报告 False(打开),同样未见关闭。如果窗户确实一直处于打开状态,夜间无人时存在安全隐患。", "推理步骤3: 13:09 和 13:14 入户门锁出现两次 LockOperationType=1(解锁)事件,OperationSource=3(远程/密码),分别由 UserIndex=1 和 UserIndex=2 触发,但没有对应的门接触传感器开/关事件,也没有运动传感器触发。这可能是远程解锁测试,也可能是异常的远程访问尝试。", "推理步骤4: 整体生活模式正常——早晨 6:12 起床、7:14 出门上班/上学、16:22 孩子放学回家、18:12 大人回家、20:47 孩子就寝、22:17 大人就寝,符合典型三口之家作息。", "推理步骤5: 温度趋势正常,夜间约 23°C,午间峰值约 25.9°C,晚间开空调后逐步降温,无异常温升。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。", "推理步骤6: 入户门在出门(07:14)和就寝(22:17)时均自动上锁,门锁安全机制运作正常。但 13:09/13:14 的远程解锁未配合实际开门动作,需要确认是否为授权操作。"], "key_evidence": ["kitchen_temp_sensor 在 06:57、07:05、18:40、19:08 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:04:30 和 19:07:30 报告 StateValue=False(打开),全天未见关闭(StateValue=True)记录", "front_door_lock 在 13:09 和 13:14 出现两次远程解锁(OperationSource=3),无对应的 front_door_contact 开关事件和 entrance_occupancy 触发", "所有烟雾报警器和漏水传感器全天无告警事件"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁传感器探头或更换设备,排查是否因灶具高温导致间歇性失灵", "确认厨房窗户当前是否仍处于打开状态,夜间无人时建议关闭窗户以保障安全", "核实 13:09 和 13:14 的两次远程解锁操作是否为户主本人授权,如非本人操作,建议立即更改门锁密码并检查远程访问权限", "建议为厨房温度传感器设置 None 值告警规则,在传感器离线或异常时及时通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.792422771453857, "api_error": null} {"episode_id": "SQ4_FP_C_0891", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0891.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261520, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "kids_room", "injection_time": "2026-06-15T21:11:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、07:16、18:28、19:10 共四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明传感器可能受灶具热源干扰导致读数异常,或传感器本身存在间歇性故障。\",\n \"推理步骤2: 厨房窗户传感器在 07:15:30 报告 StateValue = False(窗户打开),之后整天日志中未出现对应的 StateValue = True(关闭)事件。晚间 19:09:30 再次报告 StateValue = False,说明窗户可能一直处于打开状态。家人 07:18 出门后厨房窗户持续敞开,在无人看管的白天存在入侵风险。\",\n \"推理步骤3: 其余设备行为均符合正常家庭作息模式——06:11 主卧起床、06:38 儿童房起床、06:55 做早餐、07:18 全家出门并自动锁门、16:04 孩子放学回家、18:17 大人回家做晚餐、20:50 孩子就寝、22:23 大人就寝并锁门。入户门锁的开锁/上锁操作、运动传感器触发、灯光开关均与该作息吻合,无入侵迹象。\",\n \"推理步骤4: 温度数据整体呈现合理的日间升温(凌晨约 23°C → 正午约 25.8°C)和夜间降温趋势,各房间温差在正常范围内,无异常热源指示。\",\n \"推理步骤5: 烟雾报警器、漏水传感器全天无告警事件,门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程操作或暴力开锁记录。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:56、07:16、18:28、19:10 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"kitchen_window_contact 在 07:15:30 报告 StateValue = False(开窗),此后全天日志无关闭记录,家人 07:18 已出门,窗户在无人期间持续敞开\",\n \"19:09:30 再次出现 kitchen_window_contact StateValue = False,进一步印证窗户未被关闭过\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否距灶具过近导致高温干扰或读数溢出,必要时更换传感器\",\n \"设置厨房窗户自动提醒规则:当家人离家(门锁上锁)时,若厨房窗户仍处于打开状态,自动推送通知提醒关窗\",\n \"考虑为厨房窗户加装智能窗户执行器,支持远程关闭,避免长时间无人时窗户敞开带来的安全风险\",\n \"建议在灶具开启期间对厨房温度传感器的 null 值做容错处理,避免因传感器失效导致火灾预警系统失灵\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、07:16、18:28、19:10 共四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明传感器可能受灶具热源干扰导致读数异常,或传感器本身存在间歇性故障。", "推理步骤2: 厨房窗户传感器在 07:15:30 报告 StateValue = False(窗户打开),之后整天日志中未出现对应的 StateValue = True(关闭)事件。晚间 19:09:30 再次报告 StateValue = False,说明窗户可能一直处于打开状态。家人 07:18 出门后厨房窗户持续敞开,在无人看管的白天存在入侵风险。", "推理步骤3: 其余设备行为均符合正常家庭作息模式——06:11 主卧起床、06:38 儿童房起床、06:55 做早餐、07:18 全家出门并自动锁门、16:04 孩子放学回家、18:17 大人回家做晚餐、20:50 孩子就寝、22:23 大人就寝并锁门。入户门锁的开锁/上锁操作、运动传感器触发、灯光开关均与该作息吻合,无入侵迹象。", "推理步骤4: 温度数据整体呈现合理的日间升温(凌晨约 23°C → 正午约 25.8°C)和夜间降温趋势,各房间温差在正常范围内,无异常热源指示。", "推理步骤5: 烟雾报警器、漏水传感器全天无告警事件,门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程操作或暴力开锁记录。"], "key_evidence": ["kitchen_temp_sensor 在 06:56、07:16、18:28、19:10 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "kitchen_window_contact 在 07:15:30 报告 StateValue = False(开窗),此后全天日志无关闭记录,家人 07:18 已出门,窗户在无人期间持续敞开", "19:09:30 再次出现 kitchen_window_contact StateValue = False,进一步印证窗户未被关闭过"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否距灶具过近导致高温干扰或读数溢出,必要时更换传感器", "设置厨房窗户自动提醒规则:当家人离家(门锁上锁)时,若厨房窗户仍处于打开状态,自动推送通知提醒关窗", "考虑为厨房窗户加装智能窗户执行器,支持远程关闭,避免长时间无人时窗户敞开带来的安全风险", "建议在灶具开启期间对厨房温度传感器的 null 值做容错处理,避免因传感器失效导致火灾预警系统失灵"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.663506746292114, "api_error": null} {"episode_id": "SQ4_FP_C_0892", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0892.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261521, "scenario_id": "DF-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "master_bedroom", "injection_time": "2026-06-25T14:52:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:01、18:14、19:28 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温或油烟环境可能导致传感器读数异常或通信中断。\",\n \"推理步骤2: 厨房窗户传感器在 07:00:30 报告 StateValue = False(窗户打开),之后整天日志中未出现 StateValue = True 的关闭记录。19:27:30 再次报告 StateValue = False,说明窗户可能一直处于打开状态,或者在中间某个时间关闭后又被打开。无论哪种情况,到日志结束时(23:30)窗户仍处于开启状态,夜间无人时窗户未关存在安全风险。\",\n \"推理步骤3: 主卧空调在 14:52 远程开启(当时家中无人,住户 07:24 已全部出门,16:21 才有人回来),这本身不算异常——可能是住户通过手机远程预冷房间,且空调设置为制冷模式(SystemMode=3),主卧温度也确实从约 25.4°C 逐步降至约 25.0°C,行为合理。\",\n \"推理步骤4: 入户门锁的操作模式正常:早晨 07:24 手动开锁出门后自动上锁,下午 16:21 和 18:13 手动开锁进门,晚间 22:18 确认门已关闭并自动上锁。所有开锁操作均为 Manual 来源,无异常入侵迹象。\",\n \"推理步骤5: 全天温度变化符合夏季昼夜规律——凌晨约 22.9-23.1°C,中午升至约 25.7-25.9°C,傍晚逐步回落,无异常温升提示火灾风险。烟雾报警器全天未触发。\",\n \"推理步骤6: 住户生活作息合理:06:08 主卧起床、06:25 儿童房活动、06:43 主卫洗漱、06:51 厨房做早餐、07:00 餐厅用餐、07:24 全家出门;16:21 孩子先回家、18:13 大人回家做晚餐、19:27 晚餐、21:00 孩子就寝、22:18 大人就寝。模式完全符合有学龄儿童的家庭。\",\n \"推理步骤7: 漏水传感器(厨房、主卫、次卫)全天无报警,洗碗机和洗衣机运行正常,无水患风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:52、07:01、18:14、19:28 四次报告 MeasuredValue = None,均与灶具使用时段高度相关\",\n \"厨房窗户 07:00:30 开启后至日志结束(23:30)未见关闭记录,夜间窗户处于开启状态\",\n \"入户门锁操作均为 Manual 来源,无异常开锁事件,22:18 已自动上锁\",\n \"烟雾报警器和漏水传感器全天无触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰;清洁传感器并测试其在高温环境下的稳定性,必要时更换或重新定位\",\n \"关闭厨房窗户或设置自动化规则:当入户门上锁且全屋无人活动时,自动提醒或关闭厨房窗户,避免夜间安全隐患\",\n \"考虑为厨房温度传感器设置 None 值告警,当连续报告无效读数时及时通知住户,防止在真正需要温度监测(如火灾预警)时传感器失效\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:01、18:14、19:28 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温或油烟环境可能导致传感器读数异常或通信中断。", "推理步骤2: 厨房窗户传感器在 07:00:30 报告 StateValue = False(窗户打开),之后整天日志中未出现 StateValue = True 的关闭记录。19:27:30 再次报告 StateValue = False,说明窗户可能一直处于打开状态,或者在中间某个时间关闭后又被打开。无论哪种情况,到日志结束时(23:30)窗户仍处于开启状态,夜间无人时窗户未关存在安全风险。", "推理步骤3: 主卧空调在 14:52 远程开启(当时家中无人,住户 07:24 已全部出门,16:21 才有人回来),这本身不算异常——可能是住户通过手机远程预冷房间,且空调设置为制冷模式(SystemMode=3),主卧温度也确实从约 25.4°C 逐步降至约 25.0°C,行为合理。", "推理步骤4: 入户门锁的操作模式正常:早晨 07:24 手动开锁出门后自动上锁,下午 16:21 和 18:13 手动开锁进门,晚间 22:18 确认门已关闭并自动上锁。所有开锁操作均为 Manual 来源,无异常入侵迹象。", "推理步骤5: 全天温度变化符合夏季昼夜规律——凌晨约 22.9-23.1°C,中午升至约 25.7-25.9°C,傍晚逐步回落,无异常温升提示火灾风险。烟雾报警器全天未触发。", "推理步骤6: 住户生活作息合理:06:08 主卧起床、06:25 儿童房活动、06:43 主卫洗漱、06:51 厨房做早餐、07:00 餐厅用餐、07:24 全家出门;16:21 孩子先回家、18:13 大人回家做晚餐、19:27 晚餐、21:00 孩子就寝、22:18 大人就寝。模式完全符合有学龄儿童的家庭。", "推理步骤7: 漏水传感器(厨房、主卫、次卫)全天无报警,洗碗机和洗衣机运行正常,无水患风险。"], "key_evidence": ["厨房温度传感器在 06:52、07:01、18:14、19:28 四次报告 MeasuredValue = None,均与灶具使用时段高度相关", "厨房窗户 07:00:30 开启后至日志结束(23:30)未见关闭记录,夜间窗户处于开启状态", "入户门锁操作均为 Manual 来源,无异常开锁事件,22:18 已自动上锁", "烟雾报警器和漏水传感器全天无触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰;清洁传感器并测试其在高温环境下的稳定性,必要时更换或重新定位", "关闭厨房窗户或设置自动化规则:当入户门上锁且全屋无人活动时,自动提醒或关闭厨房窗户,避免夜间安全隐患", "考虑为厨房温度传感器设置 None 值告警,当连续报告无效读数时及时通知住户,防止在真正需要温度监测(如火灾预警)时传感器失效"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.067532777786255, "api_error": null} {"episode_id": "SQ4_FP_C_0893", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0893.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261522, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-18T13:02:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似设备故障或过热保护触发,存在安全监测盲区。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——早晨6:16儿童起床、6:34主卧起床、7:01做早餐、7:22全家出门并自动上锁,下午16:16孩子回家、17:41大人回家,晚间22:34就寝锁门,符合典型三口之家作息。\",\n \"推理步骤2: 入户门锁操作均正常——早晨手动开锁出门后自动上锁,下午/傍晚手动开锁进门,晚间确认门关闭后自动上锁。13:02和13:07的两次远程开锁事件(OperationSource=3,UserIndex=1和2)发生在家人外出期间,可能是远程为访客开门,间隔5分钟,属于合理操作。\",\n \"推理步骤3: 厨房温度传感器在两次做饭期间(07:01-07:13 和 18:40-18:52)灶具开启后均报告 MeasuredValue = None(07:02、07:14、18:41、18:53共4次),而其他时段正常报告数值。这表明传感器在灶具使用导致厨房温度升高时失效,可能是过热保护触发或传感器故障。\",\n \"推理步骤4: 厨房温度传感器的失效意味着在最需要温度监测的做饭时段(火灾风险最高时),恰恰失去了温度监控能力,形成安全盲区。虽然厨房烟雾报警器(kitchen_smoke_alarm)未触发任何告警,说明当前没有实际火灾风险,但温度传感器的持续异常需要关注。\",\n \"推理步骤5: 其他方面均正常——各房间温度随昼夜自然波动(夜间约23°C,午间峰值约25.8°C),烟雾报警器和漏水传感器无告警,厨房窗户在做饭后打开通风属正常行为,洗碗机晚餐后运行也是正常使用。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间4次报告 None 值:07:02、07:14(早餐)和 18:41、18:53(晚餐),呈现可复现的故障模式\",\n \"故障仅在灶具开启后出现,灶具关闭、厨房温度恢复正常后传感器读数恢复,指向过热相关的传感器问题\",\n \"13:02 和 13:07 入户门锁远程开锁(OperationSource=3)发生在全家外出期间,但未见异常入侵迹象(无运动传感器触发、无灯光异常开启),判断为正常远程操作\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致过热,必要时重新安装到合理位置\",\n \"如重新定位后仍出现 None 值,建议更换厨房温度传感器,确保做饭期间的温度监控不中断\",\n \"确认13:02/13:07的远程开锁是否为户主本人操作,如非本人操作需立即更改门锁密码并审查授权用户列表\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似设备故障或过热保护触发,存在安全监测盲区。", "reasoning": ["推理步骤1: 整体生活模式正常——早晨6:16儿童起床、6:34主卧起床、7:01做早餐、7:22全家出门并自动上锁,下午16:16孩子回家、17:41大人回家,晚间22:34就寝锁门,符合典型三口之家作息。", "推理步骤2: 入户门锁操作均正常——早晨手动开锁出门后自动上锁,下午/傍晚手动开锁进门,晚间确认门关闭后自动上锁。13:02和13:07的两次远程开锁事件(OperationSource=3,UserIndex=1和2)发生在家人外出期间,可能是远程为访客开门,间隔5分钟,属于合理操作。", "推理步骤3: 厨房温度传感器在两次做饭期间(07:01-07:13 和 18:40-18:52)灶具开启后均报告 MeasuredValue = None(07:02、07:14、18:41、18:53共4次),而其他时段正常报告数值。这表明传感器在灶具使用导致厨房温度升高时失效,可能是过热保护触发或传感器故障。", "推理步骤4: 厨房温度传感器的失效意味着在最需要温度监测的做饭时段(火灾风险最高时),恰恰失去了温度监控能力,形成安全盲区。虽然厨房烟雾报警器(kitchen_smoke_alarm)未触发任何告警,说明当前没有实际火灾风险,但温度传感器的持续异常需要关注。", "推理步骤5: 其他方面均正常——各房间温度随昼夜自然波动(夜间约23°C,午间峰值约25.8°C),烟雾报警器和漏水传感器无告警,厨房窗户在做饭后打开通风属正常行为,洗碗机晚餐后运行也是正常使用。"], "key_evidence": ["厨房温度传感器在灶具运行期间4次报告 None 值:07:02、07:14(早餐)和 18:41、18:53(晚餐),呈现可复现的故障模式", "故障仅在灶具开启后出现,灶具关闭、厨房温度恢复正常后传感器读数恢复,指向过热相关的传感器问题", "13:02 和 13:07 入户门锁远程开锁(OperationSource=3)发生在全家外出期间,但未见异常入侵迹象(无运动传感器触发、无灯光异常开启),判断为正常远程操作"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致过热,必要时重新安装到合理位置", "如重新定位后仍出现 None 值,建议更换厨房温度传感器,确保做饭期间的温度监控不中断", "确认13:02/13:07的远程开锁是否为户主本人操作,如非本人操作需立即更改门锁密码并审查授权用户列表"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.05516481399536, "api_error": null} {"episode_id": "SQ4_FP_C_0896", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0896.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261525, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kids_room", "injection_time": "2026-06-23T08:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:18 起床,07:15 全家出门并自动上锁,15:55 孩子放学回家,18:00 大人回家,22:13 就寝锁门,符合典型三口之家作息。\",\n \"推理步骤2: 入户门锁操作均正常:07:15 手动开锁出门后自动上锁;08:33 通过 UserIndex=5 远程/密码开锁(可能是保姆或家政人员),之后客厅有活动和开灯,行为合理;15:55 和 18:00 手动开锁回家,22:13 门关闭后自动上锁。无异常入侵迹象。\",\n \"推理步骤3: 厨房温度传感器在 06:37、06:52、18:21、19:04 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久。虽然可能是灶具高温导致传感器暂时超量程,但传感器应报告极值而非 None,连续出现 None 提示传感器通信异常或硬件故障。\",\n \"推理步骤4: 厨房窗户传感器在 06:51:30 报告 StateValue=False(窗户打开),之后在 19:03:30 再次报告 StateValue=False(窗户打开),但整个日志中没有任何 kitchen_window_contact StateValue=True 的记录,说明厨房窗户从早上开启后全天未关闭,或者传感器未能上报关闭事件。家中白天无人时窗户持续开启存在安全隐患。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9°C,白天升至约 25.8°C 峰值,傍晚回落,符合夏季自然温度变化。客厅空调 18:00 开启制冷(SystemMode=3),客厅温度从 24.7°C 降至 22:00 的 23.7°C,表现合理。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,洗碗机正常启动运行,洗衣机无异常事件,儿童房 20:57 关灯拉窗帘符合孩子就寝习惯。整体无火灾、漏水或入侵威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37、06:52、18:21、19:04 四次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_window_contact 在 06:51:30 报告窗户打开(StateValue=False),全天日志中无关闭记录,白天家中无人期间窗户可能持续敞开\",\n \"08:33 通过 UserIndex=5 远程开锁,非家庭常规成员操作,但后续行为(客厅活动、开灯)无异常,判断为授权访问(如家政人员)\",\n \"入户门在 07:15 和 22:13 均正常上锁,全天门锁操作链完整无缺口\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致通信中断或传感器损坏,必要时更换或重新定位传感器远离热源\",\n \"确认厨房窗户当前实际状态——如果确实未关闭,建议立即关闭;如果已关闭但传感器未上报,则需检查窗户传感器电池或连接状态\",\n \"建议设置自动化规则:当全家离家(门锁上锁)时,若厨房窗户仍处于打开状态则发送提醒通知\",\n \"确认 UserIndex=5 的身份和授权是否仍然有效,定期审查门锁用户列表\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:18 起床,07:15 全家出门并自动上锁,15:55 孩子放学回家,18:00 大人回家,22:13 就寝锁门,符合典型三口之家作息。", "推理步骤2: 入户门锁操作均正常:07:15 手动开锁出门后自动上锁;08:33 通过 UserIndex=5 远程/密码开锁(可能是保姆或家政人员),之后客厅有活动和开灯,行为合理;15:55 和 18:00 手动开锁回家,22:13 门关闭后自动上锁。无异常入侵迹象。", "推理步骤3: 厨房温度传感器在 06:37、06:52、18:21、19:04 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久。虽然可能是灶具高温导致传感器暂时超量程,但传感器应报告极值而非 None,连续出现 None 提示传感器通信异常或硬件故障。", "推理步骤4: 厨房窗户传感器在 06:51:30 报告 StateValue=False(窗户打开),之后在 19:03:30 再次报告 StateValue=False(窗户打开),但整个日志中没有任何 kitchen_window_contact StateValue=True 的记录,说明厨房窗户从早上开启后全天未关闭,或者传感器未能上报关闭事件。家中白天无人时窗户持续开启存在安全隐患。", "推理步骤5: 温度趋势正常——夜间约 22.9°C,白天升至约 25.8°C 峰值,傍晚回落,符合夏季自然温度变化。客厅空调 18:00 开启制冷(SystemMode=3),客厅温度从 24.7°C 降至 22:00 的 23.7°C,表现合理。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,洗碗机正常启动运行,洗衣机无异常事件,儿童房 20:57 关灯拉窗帘符合孩子就寝习惯。整体无火灾、漏水或入侵威胁。"], "key_evidence": ["kitchen_temp_sensor 在 06:37、06:52、18:21、19:04 四次报告 MeasuredValue = None,传感器工作异常", "kitchen_window_contact 在 06:51:30 报告窗户打开(StateValue=False),全天日志中无关闭记录,白天家中无人期间窗户可能持续敞开", "08:33 通过 UserIndex=5 远程开锁,非家庭常规成员操作,但后续行为(客厅活动、开灯)无异常,判断为授权访问(如家政人员)", "入户门在 07:15 和 22:13 均正常上锁,全天门锁操作链完整无缺口"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致通信中断或传感器损坏,必要时更换或重新定位传感器远离热源", "确认厨房窗户当前实际状态——如果确实未关闭,建议立即关闭;如果已关闭但传感器未上报,则需检查窗户传感器电池或连接状态", "建议设置自动化规则:当全家离家(门锁上锁)时,若厨房窗户仍处于打开状态则发送提醒通知", "确认 UserIndex=5 的身份和授权是否仍然有效,定期审查门锁用户列表"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.931143283843994, "api_error": null} {"episode_id": "SQ4_FP_C_0902", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0902.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261531, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "second_bedroom", "injection_time": "2026-06-22T10:46:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时厨房灶具做饭后厨房窗户持续未关闭需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、07:26、18:46、19:15 四次报告 MeasuredValue = None,而同一时段其他房间传感器均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。\",\n \"推理步骤2: None 值出现的时间点与灶具开关操作高度相关(06:55 灶具开启 → 06:56 None;18:45 灶具开启 → 18:46 None;19:14 灶具关闭后 19:15 仍为 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常。这在安全上值得关注——厨房恰恰是最需要温度监测的区域,传感器在烹饪时失效意味着无法及时发现过热风险。\",\n \"推理步骤3: 10:46 灶具再次开启,10:51 和 11:16 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),比同时段其他房间高出约 1.5-2°C,随后 11:00 的定时上报却回落到 2543,数据跳变较大,进一步印证传感器在灶具工作期间读数不稳定。\",\n \"推理步骤4: 厨房窗户在 07:25 被打开(StateValue=False)后,日志中再无关闭记录;19:14 又一次打开窗户,同样无关闭记录。虽然做饭后开窗通风是正常行为,但长时间未关窗(尤其是夜间入睡后)存在安全隐患。\",\n \"推理步骤5: 入侵方面未发现异常——07:17 和 18:00 的开门均为手动解锁、有运动传感器配合、且门后自动上锁;15:59 回家时有儿童房活动配合,符合家长带孩子放学回家的模式。22:47 入睡前门已确认关闭并自动上锁。\",\n \"推理步骤6: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无报警,门锁状态正常,整体安防状态良好。其余设备行为(灯光、空调、窗帘、洗碗机、洗衣机)均符合三口之家的日常作息规律。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:56、07:26、18:46、19:15 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"10:51 厨房温度突升至 2700、11:16 升至 2750,与同时段其他房间温差明显偏大,且与 11:00 定时上报值(2543)存在不一致跳变\",\n \"厨房窗户 07:25 打开后全天无关闭记录,19:14 再次打开后同样无关闭记录,夜间入睡后窗户仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数;必要时更换或重新定位传感器\",\n \"为厨房温度传感器设置 None 值告警规则,当传感器在烹饪期间失效时及时通知住户,避免温度监测盲区\",\n \"设置厨房窗户长时间未关闭的自动提醒(如超过 2 小时或夜间 22:00 后仍未关闭),防止夜间安全隐患\",\n \"考虑在灶具开启期间加强对厨房烟雾报警器状态的监测频率,作为温度传感器失效时的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时厨房灶具做饭后厨房窗户持续未关闭需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、07:26、18:46、19:15 四次报告 MeasuredValue = None,而同一时段其他房间传感器均正常上报数值,说明这不是系统级通信中断,而是该传感器自身的问题。", "推理步骤2: None 值出现的时间点与灶具开关操作高度相关(06:55 灶具开启 → 06:56 None;18:45 灶具开启 → 18:46 None;19:14 灶具关闭后 19:15 仍为 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常。这在安全上值得关注——厨房恰恰是最需要温度监测的区域,传感器在烹饪时失效意味着无法及时发现过热风险。", "推理步骤3: 10:46 灶具再次开启,10:51 和 11:16 厨房温度分别飙升至 2700(27.00°C)和 2750(27.50°C),比同时段其他房间高出约 1.5-2°C,随后 11:00 的定时上报却回落到 2543,数据跳变较大,进一步印证传感器在灶具工作期间读数不稳定。", "推理步骤4: 厨房窗户在 07:25 被打开(StateValue=False)后,日志中再无关闭记录;19:14 又一次打开窗户,同样无关闭记录。虽然做饭后开窗通风是正常行为,但长时间未关窗(尤其是夜间入睡后)存在安全隐患。", "推理步骤5: 入侵方面未发现异常——07:17 和 18:00 的开门均为手动解锁、有运动传感器配合、且门后自动上锁;15:59 回家时有儿童房活动配合,符合家长带孩子放学回家的模式。22:47 入睡前门已确认关闭并自动上锁。", "推理步骤6: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无报警,门锁状态正常,整体安防状态良好。其余设备行为(灯光、空调、窗帘、洗碗机、洗衣机)均符合三口之家的日常作息规律。"], "key_evidence": ["kitchen_temp_sensor 在 06:56、07:26、18:46、19:15 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "10:51 厨房温度突升至 2700、11:16 升至 2750,与同时段其他房间温差明显偏大,且与 11:00 定时上报值(2543)存在不一致跳变", "厨房窗户 07:25 打开后全天无关闭记录,19:14 再次打开后同样无关闭记录,夜间入睡后窗户仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数;必要时更换或重新定位传感器", "为厨房温度传感器设置 None 值告警规则,当传感器在烹饪期间失效时及时通知住户,避免温度监测盲区", "设置厨房窗户长时间未关闭的自动提醒(如超过 2 小时或夜间 22:00 后仍未关闭),防止夜间安全隐患", "考虑在灶具开启期间加强对厨房烟雾报警器状态的监测频率,作为温度传感器失效时的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.560673236846924, "api_error": null} {"episode_id": "SQ4_FP_C_0903", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0903.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261532, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-26T14:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 14:13 的开锁事件使用了未知 UserIndex=5 且缺少关门/上锁记录,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:34、07:05、18:49、19:16 共四次报告 MeasuredValue = None。每次都发生在灶具使用前后,可能是高温干扰导致传感器读数丢失,也可能是传感器本身存在硬件或通信故障。正常传感器即使在灶具附近也不应频繁丢失读数。\",\n \"推理步骤2: 14:13 入户门锁通过 OperationSource=3(远程/密码方式)由 UserIndex=5 解锁。该用户索引未在其他事件中出现过,需确认是否为已授权用户。解锁后有人进入客厅并开灯,行为模式正常,但该事件之后没有看到明确的关门(front_door_contact 恢复 True)和重新上锁记录,直到 22:15 才出现关门和自动上锁,意味着入户门可能长时间处于未锁定状态。\",\n \"推理步骤3: 16:11 的开锁事件同样是手动解锁后没有立即出现关门/上锁记录,入户门在 16:11 至 22:15 之间可能一直未上锁,存在安全隐患。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 6 点起床、做早餐、7:45 出门并自动上锁、下午/傍晚回家、晚餐、22:15 就寝关灯锁门。温度从夜间 ~23°C 升至午间 ~25.9°C 再回落,符合夏季自然变化。空调在 18:19 开启制冷(SystemMode=3)、22:15 关闭,合理。儿童房 20:54 关灯拉窗帘符合孩子就寝习惯。厨房做饭后开窗通风、启动洗碗机均为正常操作。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:34、07:05、18:49、19:16 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"14:13 front_door_lock 由 UserIndex=5 通过 OperationSource=3 远程解锁,该用户身份未知\",\n \"14:13 和 16:11 两次开锁后均无关门/上锁记录,直到 22:15 才出现 front_door_contact=True 和自动上锁,入户门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或检查通信模块\",\n \"核实门锁 UserIndex=5 的身份,确认是否为已授权家庭成员或临时访客;如非授权用户应立即删除该凭证并检查门锁访问日志\",\n \"建议为入户门锁配置自动上锁策略(如开门超过一定时间未锁则自动上锁并推送提醒),避免长时间处于未锁定状态\",\n \"考虑为厨房温度传感器设置离线/异常值告警,以便在传感器失效时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 14:13 的开锁事件使用了未知 UserIndex=5 且缺少关门/上锁记录,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:34、07:05、18:49、19:16 共四次报告 MeasuredValue = None。每次都发生在灶具使用前后,可能是高温干扰导致传感器读数丢失,也可能是传感器本身存在硬件或通信故障。正常传感器即使在灶具附近也不应频繁丢失读数。", "推理步骤2: 14:13 入户门锁通过 OperationSource=3(远程/密码方式)由 UserIndex=5 解锁。该用户索引未在其他事件中出现过,需确认是否为已授权用户。解锁后有人进入客厅并开灯,行为模式正常,但该事件之后没有看到明确的关门(front_door_contact 恢复 True)和重新上锁记录,直到 22:15 才出现关门和自动上锁,意味着入户门可能长时间处于未锁定状态。", "推理步骤3: 16:11 的开锁事件同样是手动解锁后没有立即出现关门/上锁记录,入户门在 16:11 至 22:15 之间可能一直未上锁,存在安全隐患。", "推理步骤4: 其余行为模式均属正常——早晨 6 点起床、做早餐、7:45 出门并自动上锁、下午/傍晚回家、晚餐、22:15 就寝关灯锁门。温度从夜间 ~23°C 升至午间 ~25.9°C 再回落,符合夏季自然变化。空调在 18:19 开启制冷(SystemMode=3)、22:15 关闭,合理。儿童房 20:54 关灯拉窗帘符合孩子就寝习惯。厨房做饭后开窗通风、启动洗碗机均为正常操作。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:34、07:05、18:49、19:16 四次报告 MeasuredValue = None,均与灶具使用时段重合", "14:13 front_door_lock 由 UserIndex=5 通过 OperationSource=3 远程解锁,该用户身份未知", "14:13 和 16:11 两次开锁后均无关门/上锁记录,直到 22:15 才出现 front_door_contact=True 和自动上锁,入户门可能长时间未锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或检查通信模块", "核实门锁 UserIndex=5 的身份,确认是否为已授权家庭成员或临时访客;如非授权用户应立即删除该凭证并检查门锁访问日志", "建议为入户门锁配置自动上锁策略(如开门超过一定时间未锁则自动上锁并推送提醒),避免长时间处于未锁定状态", "考虑为厨房温度传感器设置离线/异常值告警,以便在传感器失效时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.805906534194946, "api_error": null} {"episode_id": "SQ4_FP_C_0905", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0905.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261534, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "master_bathroom", "injection_time": "2026-06-11T19:12:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;厨房漏水传感器曾短暂触发;厨房窗户做饭后未关闭,入夜后仍处于开启状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:41、07:29、18:21、19:19 四次报告 MeasuredValue = None,分别出现在两次灶具使用期间及关闭后。其他三个温度传感器全天无 None 值。这表明该传感器可能受灶具热量干扰导致读数溢出,或传感器本身存在硬件故障/通信异常。\",\n \"推理步骤2: 19:12 厨房漏水传感器触发 StateValue=True,2 分钟后恢复 False。时间点与做饭/洗碗活动吻合,可能是水溅到传感器附近。持续时间短且自行恢复,单次事件暂不构成严重威胁,但需关注是否反复出现。\",\n \"推理步骤3: 厨房窗户在 07:28(早餐做饭后)和 19:18(晚餐做饭后)两次打开(StateValue=False),但日志中始终未出现对应的关闭事件(StateValue=True)。到 23:30 日志结束时,厨房窗户仍处于开启状态。夜间窗户未关存在安全隐患(入侵风险、蚊虫、夜间降温)。\",\n \"推理步骤4: 16:06 入户门开锁后未见关门/上锁记录,直到 22:32 才记录到门关闭并自动上锁。期间约 6.5 小时入户门可能处于未锁状态。不过考虑到家中有人活动(客厅、厨房、餐厅均有占用),这可能是住户有意为之(等待其他家庭成员回来),17:49 确实有第二次进门记录,之后 22:32 统一锁门,属于合理生活模式。\",\n \"推理步骤5: 整体生活模式正常——06:14 主卧起床、06:28 儿童房起床、06:40 做早餐、07:12 出门上学/上班、16:06 孩子放学回家、17:49 大人下班回家、18:20 做晚饭、21:01 孩子睡觉、22:32 大人睡觉。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式。烟雾报警器全天未触发。温度曲线符合夏季昼夜变化规律(夜间 22-23°C,午间峰值 25-26°C)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:41、07:29、18:21、19:19 四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"kitchen_water_leak 在 19:12 触发漏水报警,19:14 恢复,持续约 2 分钟\",\n \"kitchen_window_contact 在 07:28 和 19:18 两次报告 StateValue=False(窗户打开),全天日志中无关闭记录,入夜后仍处于开启状态\",\n \"入户门 16:06 开锁后至 22:32 才重新上锁,期间约 6.5 小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认其安装位置是否距灶具过近导致高温时读数异常,必要时更换传感器或调整安装位置\",\n \"关闭厨房窗户:当前厨房窗户仍处于开启状态,建议立即关闭,并考虑设置自动化规则在夜间(如 22:00 后)自动提醒关窗\",\n \"关注厨房漏水传感器:虽然本次为短暂触发,建议检查水槽及管道连接处是否有渗漏迹象,避免隐患积累\",\n \"建议设置入户门未锁提醒:可配置自动化规则,当入户门解锁超过一定时间(如 30 分钟)且无人进出时发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;厨房漏水传感器曾短暂触发;厨房窗户做饭后未关闭,入夜后仍处于开启状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:41、07:29、18:21、19:19 四次报告 MeasuredValue = None,分别出现在两次灶具使用期间及关闭后。其他三个温度传感器全天无 None 值。这表明该传感器可能受灶具热量干扰导致读数溢出,或传感器本身存在硬件故障/通信异常。", "推理步骤2: 19:12 厨房漏水传感器触发 StateValue=True,2 分钟后恢复 False。时间点与做饭/洗碗活动吻合,可能是水溅到传感器附近。持续时间短且自行恢复,单次事件暂不构成严重威胁,但需关注是否反复出现。", "推理步骤3: 厨房窗户在 07:28(早餐做饭后)和 19:18(晚餐做饭后)两次打开(StateValue=False),但日志中始终未出现对应的关闭事件(StateValue=True)。到 23:30 日志结束时,厨房窗户仍处于开启状态。夜间窗户未关存在安全隐患(入侵风险、蚊虫、夜间降温)。", "推理步骤4: 16:06 入户门开锁后未见关门/上锁记录,直到 22:32 才记录到门关闭并自动上锁。期间约 6.5 小时入户门可能处于未锁状态。不过考虑到家中有人活动(客厅、厨房、餐厅均有占用),这可能是住户有意为之(等待其他家庭成员回来),17:49 确实有第二次进门记录,之后 22:32 统一锁门,属于合理生活模式。", "推理步骤5: 整体生活模式正常——06:14 主卧起床、06:28 儿童房起床、06:40 做早餐、07:12 出门上学/上班、16:06 孩子放学回家、17:49 大人下班回家、18:20 做晚饭、21:01 孩子睡觉、22:32 大人睡觉。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式。烟雾报警器全天未触发。温度曲线符合夏季昼夜变化规律(夜间 22-23°C,午间峰值 25-26°C)。"], "key_evidence": ["kitchen_temp_sensor 在 06:41、07:29、18:21、19:19 四次报告 MeasuredValue = None,均与灶具使用时段相关", "kitchen_water_leak 在 19:12 触发漏水报警,19:14 恢复,持续约 2 分钟", "kitchen_window_contact 在 07:28 和 19:18 两次报告 StateValue=False(窗户打开),全天日志中无关闭记录,入夜后仍处于开启状态", "入户门 16:06 开锁后至 22:32 才重新上锁,期间约 6.5 小时"], "recommended_actions": ["检查厨房温度传感器:确认其安装位置是否距灶具过近导致高温时读数异常,必要时更换传感器或调整安装位置", "关闭厨房窗户:当前厨房窗户仍处于开启状态,建议立即关闭,并考虑设置自动化规则在夜间(如 22:00 后)自动提醒关窗", "关注厨房漏水传感器:虽然本次为短暂触发,建议检查水槽及管道连接处是否有渗漏迹象,避免隐患积累", "建议设置入户门未锁提醒:可配置自动化规则,当入户门解锁超过一定时间(如 30 分钟)且无人进出时发送提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.99751901626587, "api_error": null} {"episode_id": "SQ4_FP_C_0907", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0907.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261536, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "living_room", "injection_time": "2026-06-09T08:27:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:27开锁进入后长时间未关闭/上锁,直到22:17才确认关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无活动,05:57主卧起床,06:28儿童房起床,07:07做早餐,07:48全家出门并自动上锁,16:27有人回家(孩子放学),18:08大人回家做晚饭,21:03孩子就寝,22:17大人就寝并锁门。这是典型的三口之家工作日作息。\",\n \"推理步骤2: 温度数据整体合理,夜间约23°C,白天逐步升至约25.9°C(中午峰值),傍晚回落,符合夏季自然温度变化曲线。18:08开启客厅空调(制冷模式SystemMode=3)后温度逐步下降,也符合预期。\",\n \"推理步骤3: 厨房温度传感器在07:08、07:12、18:26、19:30四次报告 MeasuredValue = None。这不是正常的温度读数,说明传感器在灶具使用前后出现数据丢失或通信中断。虽然07:30和19:30后恢复了正常读数,但反复出现None值表明设备不稳定。\",\n \"推理步骤4: 16:27入户门开锁进入,但日志中未见随后的关门(front_door_contact StateValue=True)和上锁事件,直到22:17才记录到关门上锁。这意味着入户门可能在16:27至22:17之间处于未锁定状态近6小时,存在安全隐患。\",\n \"推理步骤5: 厨房窗户在07:11:30和19:29:30两次打开(StateValue=False),但日志中未见对应的关闭事件,可能整夜处于开启状态。虽然通风是合理行为,但夜间无人时窗户未关存在一定风险。\",\n \"推理步骤6: 其余设备运行正常——烟雾报警器无告警、漏水传感器无告警、门锁操作均为合法手动/自动操作、无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:08、07:12、18:26、19:30 四次报告 MeasuredValue = None\",\n \"入户门 16:27 开锁进入后,直到 22:17 才记录到关门上锁(front_door_contact StateValue=True),中间约6小时无锁门记录\",\n \"厨房窗户 07:11:30 和 19:29:30 两次打开(StateValue=False),日志中未见关闭事件\",\n \"洗碗机 19:57 启动后日志中未见完成/关闭事件(可能仍在运行,属正常但需留意)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和电量,排查反复报告 None 值的原因,必要时更换设备\",\n \"检查入户门锁的自动上锁策略,建议设置开门后若干分钟未关闭则发送提醒通知\",\n \"确认厨房窗户当前状态,夜间无人时建议关闭窗户以保障安全\",\n \"确认洗碗机运行状态是否正常完成,避免长时间无人监控的用水设备异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:27开锁进入后长时间未关闭/上锁,直到22:17才确认关门上锁。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无活动,05:57主卧起床,06:28儿童房起床,07:07做早餐,07:48全家出门并自动上锁,16:27有人回家(孩子放学),18:08大人回家做晚饭,21:03孩子就寝,22:17大人就寝并锁门。这是典型的三口之家工作日作息。", "推理步骤2: 温度数据整体合理,夜间约23°C,白天逐步升至约25.9°C(中午峰值),傍晚回落,符合夏季自然温度变化曲线。18:08开启客厅空调(制冷模式SystemMode=3)后温度逐步下降,也符合预期。", "推理步骤3: 厨房温度传感器在07:08、07:12、18:26、19:30四次报告 MeasuredValue = None。这不是正常的温度读数,说明传感器在灶具使用前后出现数据丢失或通信中断。虽然07:30和19:30后恢复了正常读数,但反复出现None值表明设备不稳定。", "推理步骤4: 16:27入户门开锁进入,但日志中未见随后的关门(front_door_contact StateValue=True)和上锁事件,直到22:17才记录到关门上锁。这意味着入户门可能在16:27至22:17之间处于未锁定状态近6小时,存在安全隐患。", "推理步骤5: 厨房窗户在07:11:30和19:29:30两次打开(StateValue=False),但日志中未见对应的关闭事件,可能整夜处于开启状态。虽然通风是合理行为,但夜间无人时窗户未关存在一定风险。", "推理步骤6: 其余设备运行正常——烟雾报警器无告警、漏水传感器无告警、门锁操作均为合法手动/自动操作、无异常入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 07:08、07:12、18:26、19:30 四次报告 MeasuredValue = None", "入户门 16:27 开锁进入后,直到 22:17 才记录到关门上锁(front_door_contact StateValue=True),中间约6小时无锁门记录", "厨房窗户 07:11:30 和 19:29:30 两次打开(StateValue=False),日志中未见关闭事件", "洗碗机 19:57 启动后日志中未见完成/关闭事件(可能仍在运行,属正常但需留意)"], "recommended_actions": ["检查厨房温度传感器的连接状态和电量,排查反复报告 None 值的原因,必要时更换设备", "检查入户门锁的自动上锁策略,建议设置开门后若干分钟未关闭则发送提醒通知", "确认厨房窗户当前状态,夜间无人时建议关闭窗户以保障安全", "确认洗碗机运行状态是否正常完成,避免长时间无人监控的用水设备异常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.296161651611328, "api_error": null} {"episode_id": "SQ4_FP_C_0911", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0911.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261540, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "living_room", "injection_time": "2026-06-19T08:36:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时灶具关闭后未见厨房窗户关闭记录,通风管理存在疏漏。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:51、07:07、18:21、19:22 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。这表明该传感器存在间歇性故障。\",\n \"推理步骤2: 观察 None 值出现的时机——均紧跟在灶具状态变化(开启或关闭)之后。06:50 灶具关闭 → 06:51 None;07:06 灶具开启 → 07:07 None;18:20 灶具开启 → 18:21 None;19:21 灶具关闭 → 19:22 None。这可能是灶具操作产生的热冲击或电磁干扰导致传感器短暂失效。\",\n \"推理步骤3: 厨房窗户在 06:50:30 被打开(StateValue=False),但在整个上午出门前(07:28)没有关闭记录。同样 19:21:30 再次打开窗户后,直到日志结束也未见关闭。厨房窗户长时间开启本身不构成严重威胁,但在无人在家期间(07:28~16:07)窗户保持开启状态,增加了安全隐患。\",\n \"推理步骤4: 排除入侵风险——16:07 和 18:19 的两次入户均为手动开锁(OperationSource=Manual),且伴随正常的运动传感器触发和灯光操作,符合家庭成员回家的行为模式(16:07 孩子放学回家直奔儿童房,18:19 大人回家开灯开空调做饭)。\",\n \"推理步骤5: 排除火灾风险——灶具两次使用时长分别约 38 分钟(07:06~?,但 07:28 出门时灶具状态未见关闭记录,需确认)和约 61 分钟(18:20~19:21),烟雾报警器全天无触发。但需注意:07:06 开启灶具后 07:28 出门,日志中未见灶具关闭事件,这是一个潜在的安全隐患。\",\n \"推理步骤6: 复查灶具状态——06:50 灶具显示 OnOff=False(关闭),07:06:35 灶具 OnOff=True(开启),之后直到 18:20:30 再次 OnOff=True。中间没有关闭记录。如果灶具在 07:28 出门时仍处于开启状态且无人在家长达近 9 小时,这是严重的火灾隐患。但也可能是关闭事件未被日志捕获。\",\n \"推理步骤7: 其余设备状态正常——门锁在出门和睡前均自动上锁,漏水传感器和烟雾报警器全天无告警,温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C),空调开启后温度逐步下降,一切合理。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:51、07:07、18:21、19:22 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联\",\n \"厨房窗户 06:50:30 打开后无关闭记录,无人在家期间(07:28~16:07)窗户持续开启\",\n \"灶具 07:06:35 开启后,07:28 全家出门,日志中未记录灶具关闭事件,直到 18:20:30 再次出现开启记录\",\n \"次卫灯 06:42 开启后全天无关闭记录,属于小问题但说明存在设备状态遗漏的可能\"\n ],\n \"recommended_actions\": [\n \"优先确认灶具当前实际状态:检查灶具在 07:28 出门时是否确实已关闭,若日志存在漏报则需排查灶具设备的事件上报可靠性\",\n \"检修厨房温度传感器:该传感器在灶具操作时反复出现 None 值,可能是热干扰或电磁兼容问题,建议调整传感器安装位置使其远离灶具,或更换抗干扰型号\",\n \"为灶具添加离家自动关闭联动规则:当门锁上锁且全屋无人时,自动关闭灶具并发送通知\",\n \"为厨房窗户添加离家提醒:当检测到全家出门时,若厨房窗户仍处于打开状态,推送关窗提醒\",\n \"检查次卫灯状态,确认是否存在事件漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时灶具关闭后未见厨房窗户关闭记录,通风管理存在疏漏。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:51、07:07、18:21、19:22 四个时间点报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。这表明该传感器存在间歇性故障。", "推理步骤2: 观察 None 值出现的时机——均紧跟在灶具状态变化(开启或关闭)之后。06:50 灶具关闭 → 06:51 None;07:06 灶具开启 → 07:07 None;18:20 灶具开启 → 18:21 None;19:21 灶具关闭 → 19:22 None。这可能是灶具操作产生的热冲击或电磁干扰导致传感器短暂失效。", "推理步骤3: 厨房窗户在 06:50:30 被打开(StateValue=False),但在整个上午出门前(07:28)没有关闭记录。同样 19:21:30 再次打开窗户后,直到日志结束也未见关闭。厨房窗户长时间开启本身不构成严重威胁,但在无人在家期间(07:28~16:07)窗户保持开启状态,增加了安全隐患。", "推理步骤4: 排除入侵风险——16:07 和 18:19 的两次入户均为手动开锁(OperationSource=Manual),且伴随正常的运动传感器触发和灯光操作,符合家庭成员回家的行为模式(16:07 孩子放学回家直奔儿童房,18:19 大人回家开灯开空调做饭)。", "推理步骤5: 排除火灾风险——灶具两次使用时长分别约 38 分钟(07:06~?,但 07:28 出门时灶具状态未见关闭记录,需确认)和约 61 分钟(18:20~19:21),烟雾报警器全天无触发。但需注意:07:06 开启灶具后 07:28 出门,日志中未见灶具关闭事件,这是一个潜在的安全隐患。", "推理步骤6: 复查灶具状态——06:50 灶具显示 OnOff=False(关闭),07:06:35 灶具 OnOff=True(开启),之后直到 18:20:30 再次 OnOff=True。中间没有关闭记录。如果灶具在 07:28 出门时仍处于开启状态且无人在家长达近 9 小时,这是严重的火灾隐患。但也可能是关闭事件未被日志捕获。", "推理步骤7: 其余设备状态正常——门锁在出门和睡前均自动上锁,漏水传感器和烟雾报警器全天无告警,温度曲线符合夏季昼夜变化规律(夜间约 23°C,午间峰值约 25.9°C),空调开启后温度逐步下降,一切合理。"], "key_evidence": ["厨房温度传感器在 06:51、07:07、18:21、19:22 四次报告 MeasuredValue = None,均与灶具状态切换时间高度关联", "厨房窗户 06:50:30 打开后无关闭记录,无人在家期间(07:28~16:07)窗户持续开启", "灶具 07:06:35 开启后,07:28 全家出门,日志中未记录灶具关闭事件,直到 18:20:30 再次出现开启记录", "次卫灯 06:42 开启后全天无关闭记录,属于小问题但说明存在设备状态遗漏的可能"], "recommended_actions": ["优先确认灶具当前实际状态:检查灶具在 07:28 出门时是否确实已关闭,若日志存在漏报则需排查灶具设备的事件上报可靠性", "检修厨房温度传感器:该传感器在灶具操作时反复出现 None 值,可能是热干扰或电磁兼容问题,建议调整传感器安装位置使其远离灶具,或更换抗干扰型号", "为灶具添加离家自动关闭联动规则:当门锁上锁且全屋无人时,自动关闭灶具并发送通知", "为厨房窗户添加离家提醒:当检测到全家出门时,若厨房窗户仍处于打开状态,推送关窗提醒", "检查次卫灯状态,确认是否存在事件漏报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.77146029472351, "api_error": null} {"episode_id": "SQ4_FP_C_0913", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0913.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261542, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kitchen", "injection_time": "2026-06-29T12:49:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时 12:49 有未识别用户(UserIndex=5)通过远程方式开锁进入,需确认身份合法性。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:43、06:58、18:51、19:06 共四次报告 MeasuredValue = None。每次都发生在灶具开启后或关闭后不久,说明传感器可能受高温影响出现读数异常,或传感器本身存在间歇性故障。\",\n \"推理步骤2: 虽然灶具使用期间温度传感器短暂失效可能与高温干扰有关,但正常传感器不应返回 null。07:00 恢复读数后厨房温度为 2440(24.4°C),与其他房间一致,说明并非持续性高温环境,传感器硬件或固件可能存在缺陷。\",\n \"推理步骤3: 12:49 入户门锁事件显示 LockOperationType=1(开锁)、OperationSource=3(远程/PIN)、UserIndex=5。家庭早晨出门时全员离开(07:26),此时无人在家,由第5号用户远程开锁。如果该用户是已知的家政人员或亲属则正常,但需要确认 UserIndex=5 的身份是否经过授权。\",\n \"推理步骤4: 12:49 开锁后,玄关和客厅运动传感器依次触发、客厅灯打开,行为模式自然,没有多房间快速扫荡等入侵特征。但入户门锁日志中未见该用户离开和重新锁门的记录(直到 16:03 才有下一次手动开锁),存在门锁状态不明的窗口期。\",\n \"推理步骤5: 其余事件均符合正常家庭作息——凌晨安静、06:11 儿童起床、06:33 大人起床、做早餐、07:26 全家出门并自动锁门、16:03 孩子放学回家、18:20 大人下班回家做晚饭、20:46 孩子就寝、22:42 大人就寝并自动锁门。温度曲线呈现夏季典型日变化(夜间 23°C → 午间 25.9°C → 夜间 23.3°C),空调制冷模式(SystemMode=3)合理。\",\n \"推理步骤6: 厨房窗户在做饭后打开(06:57:30 和 19:05:30 BooleanState=False 表示窗户打开)用于通风,属正常行为。洗碗机晚餐后启动也正常。所有烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:43、06:58、18:51、19:06 四次返回 MeasuredValue = None,均与灶具使用时段关联\",\n \"12:49 入户门锁被 UserIndex=5 以 OperationSource=3(远程)方式开锁,该时段家中无人\",\n \"12:49 开锁后至 16:03 之间无门锁关闭/锁定记录,门锁状态存在约3小时的不确定窗口\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或升级固件\",\n \"确认门锁 UserIndex=5 对应的用户身份,如非授权用户应立即删除该凭证并审查门锁访问日志\",\n \"建议为远程开锁操作配置实时推送通知,确保户主能及时知晓非本人的开锁行为\",\n \"检查 12:49 至 16:03 期间门锁是否处于未锁状态,考虑设置无人在家时自动锁门策略\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;同时 12:49 有未识别用户(UserIndex=5)通过远程方式开锁进入,需确认身份合法性。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:43、06:58、18:51、19:06 共四次报告 MeasuredValue = None。每次都发生在灶具开启后或关闭后不久,说明传感器可能受高温影响出现读数异常,或传感器本身存在间歇性故障。", "推理步骤2: 虽然灶具使用期间温度传感器短暂失效可能与高温干扰有关,但正常传感器不应返回 null。07:00 恢复读数后厨房温度为 2440(24.4°C),与其他房间一致,说明并非持续性高温环境,传感器硬件或固件可能存在缺陷。", "推理步骤3: 12:49 入户门锁事件显示 LockOperationType=1(开锁)、OperationSource=3(远程/PIN)、UserIndex=5。家庭早晨出门时全员离开(07:26),此时无人在家,由第5号用户远程开锁。如果该用户是已知的家政人员或亲属则正常,但需要确认 UserIndex=5 的身份是否经过授权。", "推理步骤4: 12:49 开锁后,玄关和客厅运动传感器依次触发、客厅灯打开,行为模式自然,没有多房间快速扫荡等入侵特征。但入户门锁日志中未见该用户离开和重新锁门的记录(直到 16:03 才有下一次手动开锁),存在门锁状态不明的窗口期。", "推理步骤5: 其余事件均符合正常家庭作息——凌晨安静、06:11 儿童起床、06:33 大人起床、做早餐、07:26 全家出门并自动锁门、16:03 孩子放学回家、18:20 大人下班回家做晚饭、20:46 孩子就寝、22:42 大人就寝并自动锁门。温度曲线呈现夏季典型日变化(夜间 23°C → 午间 25.9°C → 夜间 23.3°C),空调制冷模式(SystemMode=3)合理。", "推理步骤6: 厨房窗户在做饭后打开(06:57:30 和 19:05:30 BooleanState=False 表示窗户打开)用于通风,属正常行为。洗碗机晚餐后启动也正常。所有烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["厨房温度传感器在 06:43、06:58、18:51、19:06 四次返回 MeasuredValue = None,均与灶具使用时段关联", "12:49 入户门锁被 UserIndex=5 以 OperationSource=3(远程)方式开锁,该时段家中无人", "12:49 开锁后至 16:03 之间无门锁关闭/锁定记录,门锁状态存在约3小时的不确定窗口"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如位置合理则考虑更换传感器或升级固件", "确认门锁 UserIndex=5 对应的用户身份,如非授权用户应立即删除该凭证并审查门锁访问日志", "建议为远程开锁操作配置实时推送通知,确保户主能及时知晓非本人的开锁行为", "检查 12:49 至 16:03 期间门锁是否处于未锁状态,考虑设置无人在家时自动锁门策略"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 35.92568612098694, "api_error": null} {"episode_id": "SQ4_FP_C_0921", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0921.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-04T00:00:00", "seed": 20261550, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "kids_room", "injection_time": "2026-06-04T18:35:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门在下午回家时未及时关闭/上锁,厨房窗户做饭后开启但未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——06:12 起床、07:36 出门上班/上学、15:59 孩子放学回家、18:04 大人下班回家、21:03 孩子就寝、22:31 大人就寝,属于典型三口之家作息。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,早晨 07:36 出门后门立即自动上锁(8秒内),晚间 22:31 同样自动上锁,安全闭环完整。但 15:59 和 18:04 两次进门后,日志中未出现 front_door_contact=True(关门)和 LockState=1(上锁)的记录,直到 22:31 才出现关门上锁事件,意味着入户门可能在 15:59~22:31 期间处于未锁定状态,存在安全隐患。\",\n \"推理步骤3: 厨房温度传感器在 06:44、07:24、18:51、19:24 四次报告 MeasuredValue=None。虽然两次与灶具开启/关闭时间吻合(可能是高温导致读数异常),但正常传感器不应返回 null,07:00 和 19:00 的整点读数又恢复正常,说明传感器间歇性故障,需要排查。\",\n \"推理步骤4: 厨房窗户在 07:23 和 19:23 做饭结束后打开通风(BooleanState=False 表示打开),但日志中始终未出现关闭记录(BooleanState=True)。如果窗户确实一直开着,夜间存在安全风险(入侵通道)和蚊虫/天气影响。\",\n \"推理步骤5: 温度趋势合理——夜间约 22.9~23.1°C,白天逐步升至 25.8°C 峰值(约 12:00-12:30),下午回落,符合夏季自然温度曲线。18:04 开启客厅空调(制冷模式 SystemMode=3)后,温度从 24.6°C 降至 22:31 关机时的 23.5°C,空调工作正常。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,无入侵、火灾、漏水等紧急威胁。所有灯光、窗帘操作与人员活动传感器吻合,无幽灵操作。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:44、07:24、18:51、19:24 四次报告 MeasuredValue=None,指示传感器间歇性故障\",\n \"15:59 和 18:04 两次进门后,入户门未出现关门上锁记录,直到 22:31 才记录关门+自动上锁,中间约 6.5 小时门锁状态不明\",\n \"厨房窗户在 07:23 和 19:23 两次打开,全天日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor):清洁探头、检查固件版本,必要时更换,避免在灶具使用时出现 null 读数影响安全监测\",\n \"检查入户门锁自动上锁策略:确认 15:59 和 18:04 进门后门锁是否确实未上锁,建议启用\"开门后 N 秒自动上锁\"功能,避免长时间未锁门\",\n \"养成关闭厨房窗户的习惯,或设置自动化规则:在就寝时(如 22:00)检查所有窗户状态,未关闭则发送提醒\",\n \"考虑为入户门添加\"未锁定超时告警\",例如门锁处于解锁状态超过 5 分钟即推送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门在下午回家时未及时关闭/上锁,厨房窗户做饭后开启但未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——06:12 起床、07:36 出门上班/上学、15:59 孩子放学回家、18:04 大人下班回家、21:03 孩子就寝、22:31 大人就寝,属于典型三口之家作息。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,早晨 07:36 出门后门立即自动上锁(8秒内),晚间 22:31 同样自动上锁,安全闭环完整。但 15:59 和 18:04 两次进门后,日志中未出现 front_door_contact=True(关门)和 LockState=1(上锁)的记录,直到 22:31 才出现关门上锁事件,意味着"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 28.550852298736572, "api_error": null} {"episode_id": "SQ4_FP_C_0926", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0926.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261555, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "master_bathroom", "injection_time": "2026-06-12T16:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;厨房窗户做饭后未关闭;入户门在16:35开锁进入后未及时关门上锁,直到22:23才自动锁定。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:48、07:10、18:17、18:54四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,可能是高温干扰导致读数异常,但传感器应当在灶具工作范围内正常工作,连续出现 None 值表明传感器可能存在故障或安装位置不当。\",\n \"推理步骤2: 厨房窗户在07:09:30做完早餐后打开通风(BooleanState=False表示打开),此后整个白天未见关闭事件。18:53:30晚餐后再次记录窗户打开,同样未见关闭。厨房窗户长时间敞开在无人在家期间(07:28~16:35)存在安全隐患。\",\n \"推理步骤3: 16:35入户门解锁、门打开(contact=False),有人进入后儿童房检测到占用,但日志中未记录该次进入后的关门和上锁事件。直到22:23才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在16:35~22:23之间近6小时处于未锁定或未完全关闭状态。\",\n \"推理步骤4: 16:53厨房漏水传感器短暂触发(True),2分钟后恢复(False)。这可能是洗碗或用水时的溅水,持续时间短且自行恢复,暂不构成严重威胁,但值得关注。\",\n \"推理步骤5: 其余行为模式正常——早晨06:17起床、07:28出门自动锁门、下午16:35/17:59分批回家、晚间22:23就寝锁门。温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。空调在傍晚开启制冷(SystemMode=3)合理。儿童房20:46关灯拉窗帘符合儿童就寝习惯。\",\n \"推理步骤6: 次卫灯在07:03开启后日志中未见关闭事件,可能存在忘关灯的情况,属于轻微能耗浪费。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:48、07:10、18:17、18:54 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:09:30 打开后全天未见关闭记录,无人在家期间窗户敞开\",\n \"front_door_contact 在 16:35:02 打开(False)后,直到 22:23:22 才记录关闭(True),期间约6小时无锁门记录\",\n \"kitchen_water_leak 在 16:53 短暂触发后2分钟自行恢复\",\n \"second_bathroom_light 在 07:03 开启后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认传感器是否安装在灶具热辐射范围内,清洁传感器探头,必要时更换或重新定位,确保烹饪期间仍能正常读数\",\n \"设置厨房窗户离家自动提醒:当入户门锁定(离家模式)时,若厨房窗户仍处于打开状态,应触发通知提醒住户关窗\",\n \"排查入户门16:35进入后未关门的原因:检查门磁传感器是否正常工作,确认是否门确实未关还是传感器漏报;建议设置入户门打开超过5分钟未关闭的告警规则\",\n \"关注厨房漏水传感器:虽然本次为短暂触发,建议检查厨房水管接口和洗碗机进出水管是否有渗漏迹象\",\n \"设置次卫灯无人超时自动关闭规则,避免长时间空耗电力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;厨房窗户做饭后未关闭;入户门在16:35开锁进入后未及时关门上锁,直到22:23才自动锁定。", "reasoning": ["推理步骤1: 厨房温度传感器在06:48、07:10、18:17、18:54四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,可能是高温干扰导致读数异常,但传感器应当在灶具工作范围内正常工作,连续出现 None 值表明传感器可能存在故障或安装位置不当。", "推理步骤2: 厨房窗户在07:09:30做完早餐后打开通风(BooleanState=False表示打开),此后整个白天未见关闭事件。18:53:30晚餐后再次记录窗户打开,同样未见关闭。厨房窗户长时间敞开在无人在家期间(07:28~16:35)存在安全隐患。", "推理步骤3: 16:35入户门解锁、门打开(contact=False),有人进入后儿童房检测到占用,但日志中未记录该次进入后的关门和上锁事件。直到22:23才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在16:35~22:23之间近6小时处于未锁定或未完全关闭状态。", "推理步骤4: 16:53厨房漏水传感器短暂触发(True),2分钟后恢复(False)。这可能是洗碗或用水时的溅水,持续时间短且自行恢复,暂不构成严重威胁,但值得关注。", "推理步骤5: 其余行为模式正常——早晨06:17起床、07:28出门自动锁门、下午16:35/17:59分批回家、晚间22:23就寝锁门。温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。空调在傍晚开启制冷(SystemMode=3)合理。儿童房20:46关灯拉窗帘符合儿童就寝习惯。", "推理步骤6: 次卫灯在07:03开启后日志中未见关闭事件,可能存在忘关灯的情况,属于轻微能耗浪费。"], "key_evidence": ["kitchen_temp_sensor 在 06:48、07:10、18:17、18:54 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:09:30 打开后全天未见关闭记录,无人在家期间窗户敞开", "front_door_contact 在 16:35:02 打开(False)后,直到 22:23:22 才记录关闭(True),期间约6小时无锁门记录", "kitchen_water_leak 在 16:53 短暂触发后2分钟自行恢复", "second_bathroom_light 在 07:03 开启后无关闭记录"], "recommended_actions": ["检查厨房温度传感器:确认传感器是否安装在灶具热辐射范围内,清洁传感器探头,必要时更换或重新定位,确保烹饪期间仍能正常读数", "设置厨房窗户离家自动提醒:当入户门锁定(离家模式)时,若厨房窗户仍处于打开状态,应触发通知提醒住户关窗", "排查入户门16:35进入后未关门的原因:检查门磁传感器是否正常工作,确认是否门确实未关还是传感器漏报;建议设置入户门打开超过5分钟未关闭的告警规则", "关注厨房漏水传感器:虽然本次为短暂触发,建议检查厨房水管接口和洗碗机进出水管是否有渗漏迹象", "设置次卫灯无人超时自动关闭规则,避免长时间空耗电力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.50165319442749, "api_error": null} {"episode_id": "SQ4_FP_C_0927", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0927.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261556, "scenario_id": "DF-03", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "kids_room", "injection_time": "2026-06-20T19:51:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,温度变化符合自然昼夜规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度数据——四个传感器(客厅、主卧、儿童房、厨房)在24小时内的变化趋势一致:凌晨最低约22.9°C,中午前后最高约25.9°C,傍晚逐步回落至23.3°C左右。这是典型的夏季(6月20日)昼夜温度曲线,各房间温差在合理范围内(±1°C),无局部异常升温。\",\n \"推理步骤2: 分析运动传感器事件——仅儿童房在19:51和19:56出现两次短暂的运动检测(每次持续不到1分钟),时间处于晚间正常活动时段,可能是家人进入儿童房查看或孩子短暂活动,属于正常生活行为。\",\n \"推理步骤3: 检查安全关键设备——整个日志中未出现任何门锁状态变化、门窗传感器开合事件、烟雾报警、漏水报警、灶具启动等安全相关事件,说明入户门锁、窗户、烟雾探测器、漏水传感器等均处于正常静默状态。\",\n \"推理步骤4: 排除入侵风险——无入户门锁解锁/上锁记录,无玄关运动传感器触发,无阳台门传感器变化,无深夜异常运动检测,不存在入侵迹象。\",\n \"推理步骤5: 排除火灾/燃气风险——厨房温度与其他房间同步变化,无异常升温;烟雾报警器未触发;灶具无启动记录。\",\n \"推理步骤6: 排除设备故障——所有温度传感器数据连续、平滑,无突变或缺失,传感器工作正常。\"\n ],\n \"key_evidence\": [\n \"四个房间温度在22.9°C~25.9°C之间平稳变化,符合6月夏季昼夜自然温度曲线\",\n \"儿童房运动传感器仅在19:51-19:57有两次短暂触发,处于正常晚间活动时段\",\n \"全天无门锁、门窗传感器、烟雾报警、漏水报警等安全事件触发\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"建议关注次日气温趋势,如持续升高可提前开启空调以保持室内舒适\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,温度变化符合自然昼夜规律,未发现安全威胁。", "reasoning": ["推理步骤1: 分析温度数据——四个传感器(客厅、主卧、儿童房、厨房)在24小时内的变化趋势一致:凌晨最低约22.9°C,中午前后最高约25.9°C,傍晚逐步回落至23.3°C左右。这是典型的夏季(6月20日)昼夜温度曲线,各房间温差在合理范围内(±1°C),无局部异常升温。", "推理步骤2: 分析运动传感器事件——仅儿童房在19:51和19:56出现两次短暂的运动检测(每次持续不到1分钟),时间处于晚间正常活动时段,可能是家人进入儿童房查看或孩子短暂活动,属于正常生活行为。", "推理步骤3: 检查安全关键设备——整个日志中未出现任何门锁状态变化、门窗传感器开合事件、烟雾报警、漏水报警、灶具启动等安全相关事件,说明入户门锁、窗户、烟雾探测器、漏水传感器等均处于正常静默状态。", "推理步骤4: 排除入侵风险——无入户门锁解锁/上锁记录,无玄关运动传感器触发,无阳台门传感器变化,无深夜异常运动检测,不存在入侵迹象。", "推理步骤5: 排除火灾/燃气风险——厨房温度与其他房间同步变化,无异常升温;烟雾报警器未触发;灶具无启动记录。", "推理步骤6: 排除设备故障——所有温度传感器数据连续、平滑,无突变或缺失,传感器工作正常。"], "key_evidence": ["四个房间温度在22.9°C~25.9°C之间平稳变化,符合6月夏季昼夜自然温度曲线", "儿童房运动传感器仅在19:51-19:57有两次短暂触发,处于正常晚间活动时段", "全天无门锁、门窗传感器、烟雾报警、漏水报警等安全事件触发"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "建议关注次日气温趋势,如持续升高可提前开启空调以保持室内舒适"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.67057180404663, "api_error": null} {"episode_id": "SQ4_FP_C_0929", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0929.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261558, "scenario_id": "CH-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01-FP", "scenario_name": "CH-01-FP: 孩子生病请假在家(家长陪护)", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "家长也在家(多个房间有活动),不只是儿童房,说明有成人陪护", "target_room": "master_bedroom", "injection_time": "2026-06-07T10:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,温度变化符合夏季昼夜自然规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度走势一致:凌晨最低约22.9°C,中午峰值约25.9°C,夜间回落至23.3°C。这是典型的6月夏季昼夜温差曲线,各房间温差始终在1°C以内,无局部异常升温。\",\n \"推理步骤2: 厨房温度未出现独立于其他房间的突然升高,烟雾报警器和CO报警器全天无触发记录,排除火灾或燃气泄漏风险。\",\n \"推理步骤3: 人员活动分析——10:19儿童房检测到有人并开灯,10:29主卧检测到有人,10:39客厅检测到有人。这符合周末(2026-06-07为周日)上午10点左右起床、从卧室逐步移动到客厅的正常生活模式。\",\n \"推理步骤4: 入侵检测——入户门锁和入户门传感器全天无触发事件,阳台门传感器无触发,所有窗户传感器无开合记录,排除非法入侵可能。\",\n \"推理步骤5: 水患检测——厨房、主卫、次卫的漏水传感器全天无报警,排除漏水风险。\",\n \"推理步骤6: 设备健康——所有传感器按预期间隔(30分钟)持续上报数据,无掉线或数据缺失,设备运行正常。\"\n ],\n \"key_evidence\": [\n \"四个房间温度全天同步变化,范围22.9°C~25.9°C,符合夏季自然昼夜温差规律\",\n \"人员活动仅出现在上午10:19-10:39,从儿童房→主卧→客厅的移动路径符合起床动线\",\n \"全天无门锁、门窗传感器、烟雾报警器、漏水传感器的异常触发事件\",\n \"所有温度传感器持续稳定上报,无设备离线或数据异常\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"建议关注室内温度已接近26°C的午间峰值,如持续升高可考虑开启空调降温\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,温度变化符合夏季昼夜自然规律,未发现安全威胁。", "reasoning": ["推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度走势一致:凌晨最低约22.9°C,中午峰值约25.9°C,夜间回落至23.3°C。这是典型的6月夏季昼夜温差曲线,各房间温差始终在1°C以内,无局部异常升温。", "推理步骤2: 厨房温度未出现独立于其他房间的突然升高,烟雾报警器和CO报警器全天无触发记录,排除火灾或燃气泄漏风险。", "推理步骤3: 人员活动分析——10:19儿童房检测到有人并开灯,10:29主卧检测到有人,10:39客厅检测到有人。这符合周末(2026-06-07为周日)上午10点左右起床、从卧室逐步移动到客厅的正常生活模式。", "推理步骤4: 入侵检测——入户门锁和入户门传感器全天无触发事件,阳台门传感器无触发,所有窗户传感器无开合记录,排除非法入侵可能。", "推理步骤5: 水患检测——厨房、主卫、次卫的漏水传感器全天无报警,排除漏水风险。", "推理步骤6: 设备健康——所有传感器按预期间隔(30分钟)持续上报数据,无掉线或数据缺失,设备运行正常。"], "key_evidence": ["四个房间温度全天同步变化,范围22.9°C~25.9°C,符合夏季自然昼夜温差规律", "人员活动仅出现在上午10:19-10:39,从儿童房→主卧→客厅的移动路径符合起床动线", "全天无门锁、门窗传感器、烟雾报警器、漏水传感器的异常触发事件", "所有温度传感器持续稳定上报,无设备离线或数据异常"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "建议关注室内温度已接近26°C的午间峰值,如持续升高可考虑开启空调降温"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.49182152748108, "api_error": null} {"episode_id": "SQ4_FP_C_0933", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0933.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261562, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "entrance", "injection_time": "2026-06-16T16:13:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午开锁后长时间未关闭/上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——06:30 起床、07:40 出门上锁、16:11 孩子放学回家、18:19 大人下班回家、21:07 孩子就寝、22:14 大人就寝,符合典型三口之家的日常节奏。\",\n \"推理步骤2: 厨房温度传感器在 07:08、07:16、18:24、19:13 四次报告 MeasuredValue = None。前两次发生在早晨灶具使用后,后两次发生在晚间灶具使用期间及关闭后。虽然灶具工作时温度升高可能导致传感器短暂异常,但连续出现 None 值(而非高温数值)更像是传感器通信故障或硬件问题,而非正常的高温保护行为。值得注意的是,每次 None 之后在下一个 30 分钟整点周期传感器又恢复了正常数值,说明故障是间歇性的。\",\n \"推理步骤3: 16:11 入户门被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但直到 22:14 才记录到门关闭(StateValue=True)并自动上锁。中间长达约 6 小时门处于开启/未锁状态。虽然 16:11 是孩子回家的时间点,大人 18:19 也通过此门进入,但从 18:19 之后到 22:14 之间门一直未关闭上锁,这是一个安全隐患。\",\n \"推理步骤4: 厨房窗户在 07:15:30 和 19:12:30 两次打开(StateValue=False),均发生在灶具关闭后,属于做饭后通风的正常行为。但日志中未记录窗户关闭事件,可能是窗户一直保持打开状态,夜间存在一定安全风险。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.9°C,傍晚逐渐回落,符合夏季自然温度变化曲线。客厅空调 18:19 开启制冷模式(SystemMode=3),22:14 关闭,期间温度从约 24.5°C 降至约 23.6°C,表现合理。\",\n \"推理步骤6: 所有烟雾报警器和漏水传感器在整个日志周期内均无触发记录,无火灾或水患风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:08、07:16、18:24、19:13 四次报告 MeasuredValue = None,指示间歇性设备故障\",\n \"入户门 16:11 开锁后,直到 22:14 才记录到关门上锁,中间约 6 小时门可能处于未锁定状态\",\n \"厨房窗户两次打开(07:15:30 和 19:12:30)但日志中无关闭记录,夜间可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,确认是否受灶具高温影响导致间歇性故障,必要时更换或重新定位传感器\",\n \"设置入户门未锁定超时提醒(如超过 10 分钟未上锁则推送告警),避免长时间门户大开\",\n \"确认厨房窗户当前状态,建议夜间关闭窗户或设置夜间自动提醒关窗的自动化规则\",\n \"考虑为入户门配置自动上锁策略(如关门后 N 秒自动上锁),提升日常安防水平\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午开锁后长时间未关闭/上锁。", "reasoning": ["推理步骤1: 整体生活作息正常——06:30 起床、07:40 出门上锁、16:11 孩子放学回家、18:19 大人下班回家、21:07 孩子就寝、22:14 大人就寝,符合典型三口之家的日常节奏。", "推理步骤2: 厨房温度传感器在 07:08、07:16、18:24、19:13 四次报告 MeasuredValue = None。前两次发生在早晨灶具使用后,后两次发生在晚间灶具使用期间及关闭后。虽然灶具工作时温度升高可能导致传感器短暂异常,但连续出现 None 值(而非高温数值)更像是传感器通信故障或硬件问题,而非正常的高温保护行为。值得注意的是,每次 None 之后在下一个 30 分钟整点周期传感器又恢复了正常数值,说明故障是间歇性的。", "推理步骤3: 16:11 入户门被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但直到 22:14 才记录到门关闭(StateValue=True)并自动上锁。中间长达约 6 小时门处于开启/未锁状态。虽然 16:11 是孩子回家的时间点,大人 18:19 也通过此门进入,但从 18:19 之后到 22:14 之间门一直未关闭上锁,这是一个安全隐患。", "推理步骤4: 厨房窗户在 07:15:30 和 19:12:30 两次打开(StateValue=False),均发生在灶具关闭后,属于做饭后通风的正常行为。但日志中未记录窗户关闭事件,可能是窗户一直保持打开状态,夜间存在一定安全风险。", "推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.9°C,傍晚逐渐回落,符合夏季自然温度变化曲线。客厅空调 18:19 开启制冷模式(SystemMode=3),22:14 关闭,期间温度从约 24.5°C 降至约 23.6°C,表现合理。", "推理步骤6: 所有烟雾报警器和漏水传感器在整个日志周期内均无触发记录,无火灾或水患风险。"], "key_evidence": ["厨房温度传感器在 07:08、07:16、18:24、19:13 四次报告 MeasuredValue = None,指示间歇性设备故障", "入户门 16:11 开锁后,直到 22:14 才记录到关门上锁,中间约 6 小时门可能处于未锁定状态", "厨房窗户两次打开(07:15:30 和 19:12:30)但日志中无关闭记录,夜间可能仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,确认是否受灶具高温影响导致间歇性故障,必要时更换或重新定位传感器", "设置入户门未锁定超时提醒(如超过 10 分钟未上锁则推送告警),避免长时间门户大开", "确认厨房窗户当前状态,建议夜间关闭窗户或设置夜间自动提醒关窗的自动化规则", "考虑为入户门配置自动上锁策略(如关门后 N 秒自动上锁),提升日常安防水平"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.19878101348877, "api_error": null} {"episode_id": "SQ4_FP_C_0935", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0935.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261564, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-22T18:01:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房窗户在做饭后未关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:01、07:04、18:14、19:19 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。这不是偶发现象,而是反复出现的故障模式。\",\n \"推理步骤2: None 值出现的时间点与厨房灶具开启/关闭高度相关——07:01 紧跟 07:00 灶具状态上报之后,18:14 紧跟 18:13:30 灶具开启之后,19:19 紧跟 19:18 灶具关闭之后。推测灶具工作时产生的高温或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 厨房窗户传感器在 07:00:30 报告 StateValue=False(窗户打开),之后日志中没有出现 StateValue=True 的关闭事件。到 19:18:30 再次报告 StateValue=False(再次打开或仍然打开)。整天厨房窗户处于开启状态,家中无人时段(07:33~15:55)窗户未关闭,存在安全风险。\",\n \"推理步骤4: 入侵风险排查——入户门锁操作均为正常模式:早晨 07:33 手动开锁出门后自动上锁,下午 15:55 和 17:49 手动开锁进门,18:01/18:06 有 UserIndex 1 和 2 的开锁记录(家庭成员),22:23 确认门关闭并自动上锁。所有门锁操作符合家庭日常出入规律。\",\n \"推理步骤5: 火灾风险排查——灶具两次使用(07:03~07:33 早餐、18:13~19:18 晚餐)时长合理,烟雾报警器全天无触发,厨房温度在灶具关闭后正常回落。无火灾风险迹象。\",\n \"推理步骤6: 漏水风险排查——厨房和卫生间的漏水传感器全天无报警事件,洗碗机 19:56 正常启动运行。无漏水风险。\",\n \"推理步骤7: 整体温度趋势正常——凌晨约 22.9°C,随日照升温至中午峰值约 25.9°C,傍晚逐步回落,符合夏季(6月)自然温度变化规律。客厅空调 17:49 开启制冷(SystemMode=3),温度从约 24.7°C 降至 22:00 的 23.6°C,效果合理。\",\n \"推理步骤8: 生活作息正常——06:06 主卧起床,06:44 儿童房活动,07:33 全家出门,15:55 有人回家(可能是孩子放学),17:49 大人回家,20:47 儿童房关灯就寝,22:23 大人就寝。符合有学龄儿童的家庭作息。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:01、07:04、18:14、19:19 四次报告 MeasuredValue = None,与灶具操作时间高度关联\",\n \"厨房窗户 07:00:30 打开后全天未见关闭记录,家中无人时段(07:33~15:55)窗户持续敞开\",\n \"19:18:30 厨房窗户再次报告打开状态,至日志结束(23:30)仍无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰,必要时重新定位或更换耐高温型号\",\n \"设置自动化规则:当入户门锁上锁且全屋无人时,检查厨房窗户状态并发送提醒关窗通知\",\n \"建议为厨房窗户添加自动关闭联动,或在离家模式激活时推送窗户未关警告\",\n \"观察厨房温度传感器后续表现,若 None 值持续出现,建议更换传感器或检查其 Matter 网络连接稳定性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房窗户在做饭后未关闭,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:01、07:04、18:14、19:19 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。这不是偶发现象,而是反复出现的故障模式。", "推理步骤2: None 值出现的时间点与厨房灶具开启/关闭高度相关——07:01 紧跟 07:00 灶具状态上报之后,18:14 紧跟 18:13:30 灶具开启之后,19:19 紧跟 19:18 灶具关闭之后。推测灶具工作时产生的高温或电磁干扰导致传感器读数异常。", "推理步骤3: 厨房窗户传感器在 07:00:30 报告 StateValue=False(窗户打开),之后日志中没有出现 StateValue=True 的关闭事件。到 19:18:30 再次报告 StateValue=False(再次打开或仍然打开)。整天厨房窗户处于开启状态,家中无人时段(07:33~15:55)窗户未关闭,存在安全风险。", "推理步骤4: 入侵风险排查——入户门锁操作均为正常模式:早晨 07:33 手动开锁出门后自动上锁,下午 15:55 和 17:49 手动开锁进门,18:01/18:06 有 UserIndex 1 和 2 的开锁记录(家庭成员),22:23 确认门关闭并自动上锁。所有门锁操作符合家庭日常出入规律。", "推理步骤5: 火灾风险排查——灶具两次使用(07:03~07:33 早餐、18:13~19:18 晚餐)时长合理,烟雾报警器全天无触发,厨房温度在灶具关闭后正常回落。无火灾风险迹象。", "推理步骤6: 漏水风险排查——厨房和卫生间的漏水传感器全天无报警事件,洗碗机 19:56 正常启动运行。无漏水风险。", "推理步骤7: 整体温度趋势正常——凌晨约 22.9°C,随日照升温至中午峰值约 25.9°C,傍晚逐步回落,符合夏季(6月)自然温度变化规律。客厅空调 17:49 开启制冷(SystemMode=3),温度从约 24.7°C 降至 22:00 的 23.6°C,效果合理。", "推理步骤8: 生活作息正常——06:06 主卧起床,06:44 儿童房活动,07:33 全家出门,15:55 有人回家(可能是孩子放学),17:49 大人回家,20:47 儿童房关灯就寝,22:23 大人就寝。符合有学龄儿童的家庭作息。"], "key_evidence": ["厨房温度传感器在 07:01、07:04、18:14、19:19 四次报告 MeasuredValue = None,与灶具操作时间高度关联", "厨房窗户 07:00:30 打开后全天未见关闭记录,家中无人时段(07:33~15:55)窗户持续敞开", "19:18:30 厨房窗户再次报告打开状态,至日志结束(23:30)仍无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰,必要时重新定位或更换耐高温型号", "设置自动化规则:当入户门锁上锁且全屋无人时,检查厨房窗户状态并发送提醒关窗通知", "建议为厨房窗户添加自动关闭联动,或在离家模式激活时推送窗户未关警告", "观察厨房温度传感器后续表现,若 None 值持续出现,建议更换传感器或检查其 Matter 网络连接稳定性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.9604389667511, "api_error": null} {"episode_id": "SQ4_FP_C_0936", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0936.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261565, "scenario_id": "BA-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "BA-01-FP", "scenario_name": "BA-01-FP: 住户失眠在家走动", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "活动从卧室开始(住户起床),路径合理(卧室→客厅→厨房→卧室),最终回到卧室", "target_room": "second_bathroom", "injection_time": "2026-06-18T10:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:14开锁后未关闭记录存在缺失。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:23、18:43、19:08 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器不应返回 None,这可能是传感器受高温干扰导致读数失效,或设备通信故障。\",\n \"推理步骤2: 16:14 入户门解锁并打开(contact=False),但日志中没有对应的关门(contact=True)和上锁记录,直到 22:14:35 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在 16:14 至 22:14 之间处于未锁定状态长达约6小时。\",\n \"推理步骤3: 其余行为模式正常——早晨6:23起床、7:21出门上锁、16:14有人回家(孩子放学)、18:03大人回家开空调做饭、21:19孩子关灯睡觉、22:14大人就寝锁门。温度曲线符合夏季白天升温夜间降温的自然规律。\",\n \"推理步骤4: 厨房窗户在 07:22:30 打开后,日志中未见关闭记录;19:07:30 再次出现 contact=False(打开),同样无关闭记录。虽然通风是正常行为,但长时间窗户开启在无人时段存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:52、07:23、18:43、19:08 四次报告 MeasuredValue = None\",\n \"16:14 front_door_contact = False(开门)后无对应关门记录,直到 22:14:35 才恢复 True\",\n \"厨房窗户 07:22:30 和 19:07:30 两次打开,均无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新定位传感器\",\n \"检查入户门锁的自动上锁策略,建议设置门未关闭超时提醒(如5分钟未关门则推送告警)\",\n \"确认厨房窗户传感器工作正常,建议在离家模式下对未关闭的窗户发出提醒\",\n \"考虑为入户门添加门未锁定超时自动告警规则,避免长时间处于未锁状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:14开锁后未关闭记录存在缺失。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:23、18:43、19:08 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。正常传感器不应返回 None,这可能是传感器受高温干扰导致读数失效,或设备通信故障。", "推理步骤2: 16:14 入户门解锁并打开(contact=False),但日志中没有对应的关门(contact=True)和上锁记录,直到 22:14:35 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在 16:14 至 22:14 之间处于未锁定状态长达约6小时。", "推理步骤3: 其余行为模式正常——早晨6:23起床、7:21出门上锁、16:14有人回家(孩子放学)、18:03大人回家开空调做饭、21:19孩子关灯睡觉、22:14大人就寝锁门。温度曲线符合夏季白天升温夜间降温的自然规律。", "推理步骤4: 厨房窗户在 07:22:30 打开后,日志中未见关闭记录;19:07:30 再次出现 contact=False(打开),同样无关闭记录。虽然通风是正常行为,但长时间窗户开启在无人时段存在一定安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在 06:52、07:23、18:43、19:08 四次报告 MeasuredValue = None", "16:14 front_door_contact = False(开门)后无对应关门记录,直到 22:14:35 才恢复 True", "厨房窗户 07:22:30 和 19:07:30 两次打开,均无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换或重新定位传感器", "检查入户门锁的自动上锁策略,建议设置门未关闭超时提醒(如5分钟未关门则推送告警)", "确认厨房窗户传感器工作正常,建议在离家模式下对未关闭的窗户发出提醒", "考虑为入户门添加门未锁定超时自动告警规则,避免长时间处于未锁状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.270679473876953, "api_error": null} {"episode_id": "SQ4_FP_C_0938", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0938.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261567, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-15T08:47:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;同时入户门锁出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、07:03、18:46、19:12 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久,说明传感器可能受高温或油烟影响出现间歇性故障。虽然后续半小时整点读数恢复了正常数值,但反复出现 None 值表明传感器工作不稳定。\",\n \"推理步骤2: 08:47 入户门锁报告了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式)。20秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是输入错误密码,但家中当时无人(07:13 全家已出门),需确认该操作是否为户主本人。结合随后成功开锁且无后续异常活动,判断为低风险但值得留意。\",\n \"推理步骤3: 温度趋势方面,凌晨各房间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.8-25.9°C,傍晚逐步回落,符合夏季自然温度曲线,无异常热源迹象。\",\n \"推理步骤4: 06:00 主卧有人起床 → 开灯 → 做早餐 → 06:33 儿童房有人活动 → 07:13 全家出门、门锁自动上锁;16:09 有人回家进入儿童房(推测孩子放学);17:44 另一人回家开灯开空调(制冷模式);18:45 做晚饭 → 19:11 关灶 → 餐厅用餐 → 洗碗机启动;21:02 儿童房关灯拉窗帘(孩子就寝);22:17 客厅关灯关空调 → 主卧就寝 → 门锁自动上锁。整体生活节奏完全正常。\",\n \"推理步骤5: 厨房窗户在 07:02:30 和 19:11:30 两次打开(BooleanState=False 表示开启),均在做饭结束后通风,属正常行为。但日志中未见对应的关闭事件,可能是日志未记录,也可能窗户仍处于打开状态,夜间开窗存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、07:03、18:46、19:12 四次报告 MeasuredValue = None,表明传感器间歇性失效\",\n \"front_door_lock 在 08:47 报告 LockOperationError(OperationError=1, OperationSource=3),家中无人时段出现远程开锁失败\",\n \"kitchen_window_contact 在 07:02:30 和 19:11:30 报告开启,但日志中无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其在高温环境下的工作稳定性;该传感器与烟雾报警联动时若失效可能延误火灾预警\",\n \"核实 08:47 的门锁开锁失败记录,确认是否为户主操作;如非本人操作,建议更换门锁密码并检查远程访问日志\",\n \"确认厨房窗户当前是否已关闭,夜间建议关闭窗户以保障安全\",\n \"建议为厨房温度传感器设置 None 值告警规则,出现异常读数时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;同时入户门锁出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、07:03、18:46、19:12 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久,说明传感器可能受高温或油烟影响出现间歇性故障。虽然后续半小时整点读数恢复了正常数值,但反复出现 None 值表明传感器工作不稳定。", "推理步骤2: 08:47 入户门锁报告了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式)。20秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是输入错误密码,但家中当时无人(07:13 全家已出门),需确认该操作是否为户主本人。结合随后成功开锁且无后续异常活动,判断为低风险但值得留意。", "推理步骤3: 温度趋势方面,凌晨各房间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.8-25.9°C,傍晚逐步回落,符合夏季自然温度曲线,无异常热源迹象。", "推理步骤4: 06:00 主卧有人起床 → 开灯 → 做早餐 → 06:33 儿童房有人活动 → 07:13 全家出门、门锁自动上锁;16:09 有人回家进入儿童房(推测孩子放学);17:44 另一人回家开灯开空调(制冷模式);18:45 做晚饭 → 19:11 关灶 → 餐厅用餐 → 洗碗机启动;21:02 儿童房关灯拉窗帘(孩子就寝);22:17 客厅关灯关空调 → 主卧就寝 → 门锁自动上锁。整体生活节奏完全正常。", "推理步骤5: 厨房窗户在 07:02:30 和 19:11:30 两次打开(BooleanState=False 表示开启),均在做饭结束后通风,属正常行为。但日志中未见对应的关闭事件,可能是日志未记录,也可能窗户仍处于打开状态,夜间开窗存在一定安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、07:03、18:46、19:12 四次报告 MeasuredValue = None,表明传感器间歇性失效", "front_door_lock 在 08:47 报告 LockOperationError(OperationError=1, OperationSource=3),家中无人时段出现远程开锁失败", "kitchen_window_contact 在 07:02:30 和 19:11:30 报告开启,但日志中无对应关闭记录"], "recommended_actions": ["检查或更换厨房温度传感器,确认其在高温环境下的工作稳定性;该传感器与烟雾报警联动时若失效可能延误火灾预警", "核实 08:47 的门锁开锁失败记录,确认是否为户主操作;如非本人操作,建议更换门锁密码并检查远程访问日志", "确认厨房窗户当前是否已关闭,夜间建议关闭窗户以保障安全", "建议为厨房温度传感器设置 None 值告警规则,出现异常读数时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.47679114341736, "api_error": null} {"episode_id": "SQ4_FP_C_0940", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0940.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261569, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-15T19:17:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门锁出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:35、07:30、18:51、19:21 共出现三次 MeasuredValue = None 的读数。其中 06:35 和 18:51 均紧跟灶具开启之后,07:30 的 None 紧接着又被正常值覆盖,19:21 的 None 出现在灶具关闭后一分钟。灶具工作时产生的高温或油烟可能干扰传感器,但连续多次报 None 表明传感器本身可能存在硬件故障或连接不稳定。\",\n \"推理步骤2: 厨房温度传感器是厨房安全监测链的重要一环,与烟雾报警器配合使用。如果传感器持续失效,在真正发生火灾或燃气泄漏导致温度异常升高时,系统将无法通过温度数据进行早期预警。\",\n \"推理步骤3: 19:17 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),20秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是输入错误,但结合 OperationSource=3(非手动)需要留意是否有未授权的远程开锁尝试。成功开锁后有正常的入户动线(玄关运动传感器触发),且后续家庭活动正常(做饭、用餐),判断为住户本人操作的可能性较大,威胁等级不高。\",\n \"推理步骤4: 整体生活动线合理——06:00 主卧起床 → 06:12 儿童房起床 → 06:34 厨房做早餐 → 07:11 全家出门并自动锁门 → 16:23 孩子放学回家 → 18:13 大人回家开空调 → 18:50 做晚饭 → 19:20 用餐 → 20:49 孩子就寝 → 22:47 大人就寝并锁门。门锁开关、运动传感器、灯光操作均与典型三口之家的作息吻合,无入侵迹象。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天逐步升至 25.8-25.9°C 峰值(约12:00-12:30),下午回落,18:13 开启客厅空调(制冷模式 SystemMode=3)后客厅温度从 24.7°C 降至 22:00 的 23.5°C,符合夏季日间升温、空调制冷的正常曲线。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警事件,洗碗机正常运行,阳台门传感器和各窗户传感器无异常开合记录(厨房窗户在做饭后开窗通风属正常行为)。整体安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:35:08、18:51:00、19:21:00 三个时间点报告 MeasuredValue = None(07:30 也出现一次 None 后立即被正常值覆盖),一天内多次失效\",\n \"19:17 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后以 UserIndex=1 成功开锁\",\n \"全天生活动线(起床、出门、回家、做饭、就寝)与三口之家作息高度吻合,无异常入侵模式\",\n \"烟雾报警器和漏水传感器全天无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;清洁传感器并测试连接稳定性,如问题持续建议更换传感器\",\n \"查看入户门锁 19:17 开锁失败的详细日志,确认 OperationSource=3 对应的具体操作方式(密码/远程/指纹),排查是否存在未授权访问尝试\",\n \"考虑为厨房温度传感器设置离线/异常告警规则,当连续报告 None 时自动通知住户,避免安全监测盲区\",\n \"建议在 16:23 孩子独自回家的时段启用入户门锁事件的实时推送通知,方便家长远程确认孩子安全到家\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门锁出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:35、07:30、18:51、19:21 共出现三次 MeasuredValue = None 的读数。其中 06:35 和 18:51 均紧跟灶具开启之后,07:30 的 None 紧接着又被正常值覆盖,19:21 的 None 出现在灶具关闭后一分钟。灶具工作时产生的高温或油烟可能干扰传感器,但连续多次报 None 表明传感器本身可能存在硬件故障或连接不稳定。", "推理步骤2: 厨房温度传感器是厨房安全监测链的重要一环,与烟雾报警器配合使用。如果传感器持续失效,在真正发生火灾或燃气泄漏导致温度异常升高时,系统将无法通过温度数据进行早期预警。", "推理步骤3: 19:17 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),20秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是输入错误,但结合 OperationSource=3(非手动)需要留意是否有未授权的远程开锁尝试。成功开锁后有正常的入户动线(玄关运动传感器触发),且后续家庭活动正常(做饭、用餐),判断为住户本人操作的可能性较大,威胁等级不高。", "推理步骤4: 整体生活动线合理——06:00 主卧起床 → 06:12 儿童房起床 → 06:34 厨房做早餐 → 07:11 全家出门并自动锁门 → 16:23 孩子放学回家 → 18:13 大人回家开空调 → 18:50 做晚饭 → 19:20 用餐 → 20:49 孩子就寝 → 22:47 大人就寝并锁门。门锁开关、运动传感器、灯光操作均与典型三口之家的作息吻合,无入侵迹象。", "推理步骤5: 温度趋势正常——夜间约 22.9-23.1°C,白天逐步升至 25.8-25.9°C 峰值(约12:00-12:30),下午回落,18:13 开启客厅空调(制冷模式 SystemMode=3)后客厅温度从 24.7°C 降至 22:00 的 23.5°C,符合夏季日间升温、空调制冷的正常曲线。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警事件,洗碗机正常运行,阳台门传感器和各窗户传感器无异常开合记录(厨房窗户在做饭后开窗通风属正常行为)。整体安防状态良好。"], "key_evidence": ["厨房温度传感器在 06:35:08、18:51:00、19:21:00 三个时间点报告 MeasuredValue = None(07:30 也出现一次 None 后立即被正常值覆盖),一天内多次失效", "19:17 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后以 UserIndex=1 成功开锁", "全天生活动线(起床、出门、回家、做饭、就寝)与三口之家作息高度吻合,无异常入侵模式", "烟雾报警器和漏水传感器全天无告警"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;清洁传感器并测试连接稳定性,如问题持续建议更换传感器", "查看入户门锁 19:17 开锁失败的详细日志,确认 OperationSource=3 对应的具体操作方式(密码/远程/指纹),排查是否存在未授权访问尝试", "考虑为厨房温度传感器设置离线/异常告警规则,当连续报告 None 时自动通知住户,避免安全监测盲区", "建议在 16:23 孩子独自回家的时段启用入户门锁事件的实时推送通知,方便家长远程确认孩子安全到家"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.25918745994568, "api_error": null} {"episode_id": "SQ4_FP_C_0942", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0942.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261571, "scenario_id": "DF-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "living_room", "injection_time": "2026-06-01T07:24:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——约06:00主卧起床、06:11儿童房起床、06:38-06:42洗漱做早餐、07:16全家出门并自动锁门,16:10孩子放学回家,18:03大人下班回家,22:35就寝锁门,符合典型三口之家工作日模式。\",\n \"推理步骤2: 入侵风险排除——入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件;出门后(07:16-16:10)家中无运动传感器触发(仅07:24和07:29客厅有短暂触发,可能是宠物或出门前最后活动的余波),门锁状态始终为 Locked(1)。\",\n \"推理步骤3: 火灾风险排除——厨房灶具两次使用(06:42-07:12早餐约30分钟,18:24-18:54晚餐约30分钟)时长合理,烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无告警事件。\",\n \"推理步骤4: 漏水风险排除——厨房、主卫、次卫的漏水传感器全天无告警事件。\",\n \"推理步骤5: 温度趋势正常——全屋温度从凌晨约22.9°C逐步升至中午峰值约25.8°C,午后回落至夜间约23.3°C,符合6月初夏季昼夜温差规律。厨房做饭期间温度略高于其他房间(07:00时24.37°C)也属正常。\",\n \"推理步骤6: 异常发现——厨房温度传感器在06:43、07:13、18:25、18:55四个时间点报告 MeasuredValue = None。这些时间点均与灶具开启或关闭时间高度吻合,可能是灶具运行产生的热量或蒸汽干扰了传感器,也可能是传感器本身存在间歇性故障。虽然在下一个整点读数中恢复了正常值,但反复出现 None 值不应被忽视。\",\n \"推理步骤7: 次要关注——厨房窗户传感器在07:12:30和18:54:30两次记录开启(BooleanState.StateValue = False),但日志中未见对应的关闭事件。如果窗户确实一直处于开启状态,在无人在家期间存在一定安全隐患(虽然风险较低,取决于楼层)。\",\n \"推理步骤8: 16:10入户门解锁后未见关门/锁门记录(front_door_contact 未恢复 True、DoorLock.LockState 未恢复 1),直到22:35才记录关门锁门。推测大人18:03回家时也是通过已开的门进入。这段时间入户门可能处于未锁状态,但考虑到家中有人,属于正常生活状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:43、07:13、18:25、18:55 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"kitchen_window_contact 在 07:12:30 和 18:54:30 记录开启(StateValue=False),但全天日志中无对应关闭事件\",\n \"全天烟雾报警器、漏水传感器均无告警\",\n \"入户门锁操作来源均为 Manual/Auto,无异常解锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰;如位置合理则考虑更换传感器\",\n \"确认厨房窗户当前状态,如确实处于开启状态建议关闭,尤其是夜间和外出期间\",\n \"建议设置自动化规则:当全家外出(入户门锁定)时,若检测到窗户仍处于开启状态则发送提醒通知\",\n \"持续观察厨房温度传感器在未使用灶具时是否也会出现 None 值,以区分是环境干扰还是硬件故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 整体生活作息正常——约06:00主卧起床、06:11儿童房起床、06:38-06:42洗漱做早餐、07:16全家出门并自动锁门,16:10孩子放学回家,18:03大人下班回家,22:35就寝锁门,符合典型三口之家工作日模式。", "推理步骤2: 入侵风险排除——入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件;出门后(07:16-16:10)家中无运动传感器触发(仅07:24和07:29客厅有短暂触发,可能是宠物或出门前最后活动的余波),门锁状态始终为 Locked(1)。", "推理步骤3: 火灾风险排除——厨房灶具两次使用(06:42-07:12早餐约30分钟,18:24-18:54晚餐约30分钟)时长合理,烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无告警事件。", "推理步骤4: 漏水风险排除——厨房、主卫、次卫的漏水传感器全天无告警事件。", "推理步骤5: 温度趋势正常——全屋温度从凌晨约22.9°C逐步升至中午峰值约25.8°C,午后回落至夜间约23.3°C,符合6月初夏季昼夜温差规律。厨房做饭期间温度略高于其他房间(07:00时24.37°C)也属正常。", "推理步骤6: 异常发现——厨房温度传感器在06:43、07:13、18:25、18:55四个时间点报告 MeasuredValue = None。这些时间点均与灶具开启或关闭时间高度吻合,可能是灶具运行产生的热量或蒸汽干扰了传感器,也可能是传感器本身存在间歇性故障。虽然在下一个整点读数中恢复了正常值,但反复出现 None 值不应被忽视。", "推理步骤7: 次要关注——厨房窗户传感器在07:12:30和18:54:30两次记录开启(BooleanState.StateValue = False),但日志中未见对应的关闭事件。如果窗户确实一直处于开启状态,在无人在家期间存在一定安全隐患(虽然风险较低,取决于楼层)。", "推理步骤8: 16:10入户门解锁后未见关门/锁门记录(front_door_contact 未恢复 True、DoorLock.LockState 未恢复 1),直到22:35才记录关门锁门。推测大人18:03回家时也是通过已开的门进入。这段时间入户门可能处于未锁状态,但考虑到家中有人,属于正常生活状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:43、07:13、18:25、18:55 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "kitchen_window_contact 在 07:12:30 和 18:54:30 记录开启(StateValue=False),但全天日志中无对应关闭事件", "全天烟雾报警器、漏水传感器均无告警", "入户门锁操作来源均为 Manual/Auto,无异常解锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或蒸汽干扰;如位置合理则考虑更换传感器", "确认厨房窗户当前状态,如确实处于开启状态建议关闭,尤其是夜间和外出期间", "建议设置自动化规则:当全家外出(入户门锁定)时,若检测到窗户仍处于开启状态则发送提醒通知", "持续观察厨房温度传感器在未使用灶具时是否也会出现 None 值,以区分是环境干扰还是硬件故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.99008345603943, "api_error": null} {"episode_id": "SQ4_FP_C_0944", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0944.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261573, "scenario_id": "WD-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-10T06:33:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后未关闭,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:38、06:53、18:19、19:12 共四次报告 MeasuredValue = None,且均发生在灶具开启期间或关闭后不久。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能因高温导致间歇性故障或通信异常。\",\n \"推理步骤2: 厨房窗户传感器在 06:52:30 报告 StateValue = False(窗户打开),之后在 19:11:30 再次报告 StateValue = False(窗户打开)。整个日志中没有出现窗户关闭(StateValue = True)的记录,说明厨房窗户从早晨起可能一直处于开启状态,或者晚餐后窗户仍未关闭。家中无人时窗户长时间开启存在安全隐患。\",\n \"推理步骤3: 厨房漏水传感器在 06:33 短暂触发(True),06:35 恢复(False),持续约2分钟。这可能是洗碗溅水等正常情况,但也可能是管道微漏的早期信号,值得留意。\",\n \"推理步骤4: 入侵风险排查——07:11 全家关灯、手动开锁出门、门自动上锁,符合早晨出门模式;16:04 开锁进门后儿童房有人活动,符合孩子放学回家;17:40 开锁进门后客厅活动、开灯开空调,符合大人下班回家;22:16 关灯关空调、确认门锁上锁后就寝。所有出入事件均为手动操作且伴随合理的活动链,无入侵迹象。\",\n \"推理步骤5: 温度趋势分析——各房间温度从凌晨约23°C逐步升至中午约25.8°C,下午回落,晚间降至约23.3°C,符合夏季自然温度变化曲线,无异常高温或火灾迹象。\",\n \"推理步骤6: 其他设备行为均正常——灶具使用时间合理(早餐约15分钟、晚餐约53分钟),洗碗机晚餐后启动,儿童房21:09关灯拉窗帘符合孩子就寝习惯,客厅空调制冷模式(SystemMode=3)在夏季傍晚合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38、06:53、18:19、19:12 四次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_window_contact 在 06:52:30 和 19:11:30 两次报告 StateValue = False(窗户打开),日志中无关闭记录\",\n \"kitchen_water_leak 在 06:33 短暂触发漏水报警,06:35 恢复\",\n \"front_door_lock 在 16:04 和 17:40 两次开门后均无上锁记录,直到 22:16 才确认上锁(家中有人期间门未锁属常见但需注意)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认其安装位置是否离灶具过近导致高温干扰,必要时更换传感器\",\n \"确认厨房窗户状态:当前窗户可能仍处于打开状态,就寝前应关闭以防夜间安全隐患\",\n \"关注厨房漏水传感器:虽然本次为短暂触发,建议检查水槽下方管道接口是否有渗漏迹象\",\n \"建议设置自动化规则:灶具关闭后若厨房温度传感器持续返回 None,自动发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后未关闭,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:38、06:53、18:19、19:12 共四次报告 MeasuredValue = None,且均发生在灶具开启期间或关闭后不久。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能因高温导致间歇性故障或通信异常。", "推理步骤2: 厨房窗户传感器在 06:52:30 报告 StateValue = False(窗户打开),之后在 19:11:30 再次报告 StateValue = False(窗户打开)。整个日志中没有出现窗户关闭(StateValue = True)的记录,说明厨房窗户从早晨起可能一直处于开启状态,或者晚餐后窗户仍未关闭。家中无人时窗户长时间开启存在安全隐患。", "推理步骤3: 厨房漏水传感器在 06:33 短暂触发(True),06:35 恢复(False),持续约2分钟。这可能是洗碗溅水等正常情况,但也可能是管道微漏的早期信号,值得留意。", "推理步骤4: 入侵风险排查——07:11 全家关灯、手动开锁出门、门自动上锁,符合早晨出门模式;16:04 开锁进门后儿童房有人活动,符合孩子放学回家;17:40 开锁进门后客厅活动、开灯开空调,符合大人下班回家;22:16 关灯关空调、确认门锁上锁后就寝。所有出入事件均为手动操作且伴随合理的活动链,无入侵迹象。", "推理步骤5: 温度趋势分析——各房间温度从凌晨约23°C逐步升至中午约25.8°C,下午回落,晚间降至约23.3°C,符合夏季自然温度变化曲线,无异常高温或火灾迹象。", "推理步骤6: 其他设备行为均正常——灶具使用时间合理(早餐约15分钟、晚餐约53分钟),洗碗机晚餐后启动,儿童房21:09关灯拉窗帘符合孩子就寝习惯,客厅空调制冷模式(SystemMode=3)在夏季傍晚合理。"], "key_evidence": ["kitchen_temp_sensor 在 06:38、06:53、18:19、19:12 四次报告 MeasuredValue = None,传感器工作异常", "kitchen_window_contact 在 06:52:30 和 19:11:30 两次报告 StateValue = False(窗户打开),日志中无关闭记录", "kitchen_water_leak 在 06:33 短暂触发漏水报警,06:35 恢复", "front_door_lock 在 16:04 和 17:40 两次开门后均无上锁记录,直到 22:16 才确认上锁(家中有人期间门未锁属常见但需注意)"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认其安装位置是否离灶具过近导致高温干扰,必要时更换传感器", "确认厨房窗户状态:当前窗户可能仍处于打开状态,就寝前应关闭以防夜间安全隐患", "关注厨房漏水传感器:虽然本次为短暂触发,建议检查水槽下方管道接口是否有渗漏迹象", "建议设置自动化规则:灶具关闭后若厨房温度传感器持续返回 None,自动发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.433419227600098, "api_error": null} {"episode_id": "SQ4_FP_C_0945", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0945.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261574, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kids_room", "injection_time": "2026-06-11T18:34:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现异常高温读数(27.0°C / 27.5°C),疑似传感器故障或存在局部过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:39、07:18、18:48、18:57 四次报告 MeasuredValue = None,表明传感器间歇性失联或数据采集失败,其他三个温度传感器在同一时段均正常上报。\",\n \"推理步骤2: 在 18:39 厨房温度传感器报告 2700(27.0°C),19:04 报告 2750(27.5°C),而同时段其他房间温度约为 24.3-24.5°C,厨房比其他房间高出约 2.5-3.2°C。虽然做饭时厨房温度偏高属正常,但该读数出现在灶具关闭(18:56)之后(19:04 仍为 27.5°C),且与正常半小时周期上报的 19:00 数据(2434 即 24.34°C)严重矛盾,同一传感器在 5 分钟内给出相差 3°C 以上的读数,高度怀疑传感器数据不可靠。\",\n \"推理步骤3: None 值与异常高温读数交替出现的模式,指向传感器硬件故障(接触不良、老化)或通信链路不稳定。如果传感器读数不可信,则无法依赖它来监测厨房真实温度,这会削弱火灾预警能力。\",\n \"推理步骤4: 除厨房温度传感器外,其余设备行为均属正常——早晨 6 点起床、7:43 出门上锁、16:35 孩子放学回家、17:44 大人回家开空调、21 点孩子就寝、22:26 大人就寝锁门,是典型的三口之家工作日作息。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。\",\n \"推理步骤5: 厨房窗户在做饭后打开(07:17:30 和 18:56:30 BooleanState=False 表示窗户打开),属于通风的正常操作,但日志中未见关窗记录,需注意夜间窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:39、07:18、18:48、18:57 四次报告 MeasuredValue = None\",\n \"kitchen_temp_sensor 在 18:39 报告 2700、19:04 报告 2750,与 19:00 正常周期上报的 2434 严重矛盾(同一传感器 4 分钟内温差超 3°C)\",\n \"其他三个房间的温度传感器全天数据连续、一致,无 None 值或异常跳变\",\n \"厨房窗户两次打开(07:17:30、18:56:30)后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态(电池电量、安装位置、是否靠近热源),必要时更换传感器\",\n \"在厨房温度传感器修复前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其工作正常\",\n \"确认厨房窗户当前状态,如已入夜且无人在家活动区域,建议关闭厨房窗户以保障安全\",\n \"考虑为厨房温度传感器设置 None 值告警规则,连续出现 None 时自动通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现异常高温读数(27.0°C / 27.5°C),疑似传感器故障或存在局部过热风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:39、07:18、18:48、18:57 四次报告 MeasuredValue = None,表明传感器间歇性失联或数据采集失败,其他三个温度传感器在同一时段均正常上报。", "推理步骤2: 在 18:39 厨房温度传感器报告 2700(27.0°C),19:04 报告 2750(27.5°C),而同时段其他房间温度约为 24.3-24.5°C,厨房比其他房间高出约 2.5-3.2°C。虽然做饭时厨房温度偏高属正常,但该读数出现在灶具关闭(18:56)之后(19:04 仍为 27.5°C),且与正常半小时周期上报的 19:00 数据(2434 即 24.34°C)严重矛盾,同一传感器在 5 分钟内给出相差 3°C 以上的读数,高度怀疑传感器数据不可靠。", "推理步骤3: None 值与异常高温读数交替出现的模式,指向传感器硬件故障(接触不良、老化)或通信链路不稳定。如果传感器读数不可信,则无法依赖它来监测厨房真实温度,这会削弱火灾预警能力。", "推理步骤4: 除厨房温度传感器外,其余设备行为均属正常——早晨 6 点起床、7:43 出门上锁、16:35 孩子放学回家、17:44 大人回家开空调、21 点孩子就寝、22:26 大人就寝锁门,是典型的三口之家工作日作息。入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件。", "推理步骤5: 厨房窗户在做饭后打开(07:17:30 和 18:56:30 BooleanState=False 表示窗户打开),属于通风的正常操作,但日志中未见关窗记录,需注意夜间窗户是否仍处于打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:39、07:18、18:48、18:57 四次报告 MeasuredValue = None", "kitchen_temp_sensor 在 18:39 报告 2700、19:04 报告 2750,与 19:00 正常周期上报的 2434 严重矛盾(同一传感器 4 分钟内温差超 3°C)", "其他三个房间的温度传感器全天数据连续、一致,无 None 值或异常跳变", "厨房窗户两次打开(07:17:30、18:56:30)后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态(电池电量、安装位置、是否靠近热源),必要时更换传感器", "在厨房温度传感器修复前,加强对厨房烟雾报警器(kitchen_smoke_alarm)的依赖,确保其工作正常", "确认厨房窗户当前状态,如已入夜且无人在家活动区域,建议关闭厨房窗户以保障安全", "考虑为厨房温度传感器设置 None 值告警规则,连续出现 None 时自动通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.971118450164795, "api_error": null} {"episode_id": "SQ4_FP_C_0952", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_C_0952.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261581, "scenario_id": "CH-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01-FP", "scenario_name": "CH-01-FP: 孩子生病请假在家(家长陪护)", "category": "child_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "家长也在家(多个房间有活动),不只是儿童房,说明有成人陪护", "target_room": "living_room", "injection_time": "2026-06-07T18:09:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁。温度变化符合夏季昼夜自然规律,傍晚活动符合住户正常归家模式。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度走势高度一致:凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~13:30达到峰值约25.7~25.9°C,午后逐步回落,夜间回到23.3°C左右。这是典型的夏季自然昼夜温度曲线,无任何房间出现异常温升或温差偏离。\",\n \"推理步骤2: 各房间温度之间差异始终在1°C以内,说明没有局部热源异常(如火灾隐患)或门窗异常敞开导致的温度突变。厨房温度也未出现独立飙升,排除灶具意外开启的可能。\",\n \"推理步骤3: 傍晚18:09儿童房检测到有人并开灯,18:19主卧检测到有人,18:29客厅检测到有人——这是典型的家庭成员下班/放学后陆续归家的模式,时间合理(傍晚6点左右),顺序合理(先进入各自房间再到公共区域)。\",\n \"推理步骤4: 全天无入户门锁异常解锁事件、无烟雾/CO报警、无漏水报警、无窗户/阳台门异常开启事件。所有安全类传感器均未触发告警。\",\n \"推理步骤5: 全天无空调运行记录,结合室内最高温约25.9°C,属于体感可接受范围,住户未开空调也合理。\"\n ],\n \"key_evidence\": [\n \"四个房间温度全天同步变化,凌晨~23°C → 正午~25.9°C → 夜间~23.3°C,符合夏季自然昼夜温度曲线\",\n \"18:09~18:29三个房间依次检测到人员活动,符合傍晚归家的正常生活模式\",\n \"全天无烟雾报警、漏水报警、门锁异常、门窗异常开启等安全事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁。温度变化符合夏季昼夜自然规律,傍晚活动符合住户正常归家模式。", "reasoning": ["推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度走势高度一致:凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~13:30达到峰值约25.7~25.9°C,午后逐步回落,夜间回到23.3°C左右。这是典型的夏季自然昼夜温度曲线,无任何房间出现异常温升或温差偏离。", "推理步骤2: 各房间温度之间差异始终在1°C以内,说明没有局部热源异常(如火灾隐患)或门窗异常敞开导致的温度突变。厨房温度也未出现独立飙升,排除灶具意外开启的可能。", "推理步骤3: 傍晚18:09儿童房检测到有人并开灯,18:19主卧检测到有人,18:29客厅检测到有人——这是典型的家庭成员下班/放学后陆续归家的模式,时间合理(傍晚6点左右),顺序合理(先进入各自房间再到公共区域)。", "推理步骤4: 全天无入户门锁异常解锁事件、无烟雾/CO报警、无漏水报警、无窗户/阳台门异常开启事件。所有安全类传感器均未触发告警。", "推理步骤5: 全天无空调运行记录,结合室内最高温约25.9°C,属于体感可接受范围,住户未开空调也合理。"], "key_evidence": ["四个房间温度全天同步变化,凌晨~23°C → 正午~25.9°C → 夜间~23.3°C,符合夏季自然昼夜温度曲线", "18:09~18:29三个房间依次检测到人员活动,符合傍晚归家的正常生活模式", "全天无烟雾报警、漏水报警、门锁异常、门窗异常开启等安全事件"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.586549520492554, "api_error": null} {"episode_id": "SQ4_FP_D_0851", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0851.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261480, "scenario_id": "EL-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "EL-02-FP", "scenario_name": "EL-02-FP: 正常午睡", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "发生在正常午睡时段(12:30-14:00),最后活动在卧室且灯已关/窗帘已关", "target_room": "kitchen", "injection_time": "2026-06-14T08:48:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:29起床、05:40如厕、06:06做早餐、06:51出门晨练/买菜、08:35回家,中午12:33午休、14:09起床,16:59做晚餐,20:36就寝。这是典型独居老人的规律作息,无异常。\",\n \"推理步骤2: 入户门操作均为手动开锁+自动回锁,全天仅在06:51出门和08:35回家时触发,无非授权开锁事件,入侵风险排除。\",\n \"推理步骤3: 三次使用灶具(06:06-06:26约20分钟、11:04-11:32约28分钟、16:59-17:22约23分钟),时长合理,使用后均正常关闭,烟雾报警器全天未触发,火灾风险低。\",\n \"推理步骤4: 但厨房温度传感器在每次灶具开启后约30秒至1分钟内报告 MeasuredValue = None(共出现6次:06:07、06:27、11:05、11:33、17:00、17:23),而灶具关闭后的下一个整点读数又恢复正常。这说明传感器在灶具工作产生的高温或蒸汽环境下反复失效。\",\n \"推理步骤5: 厨房温度传感器是灶具安全的关键监测手段之一。如果传感器在高温时失效,一旦发生灶具忘关或干烧等危险情况,系统将无法通过温度异常触发报警,对独居老人构成安全隐患。\",\n \"推理步骤6: 漏水传感器全天无报警,窗户传感器状态正常,烟雾报警器未触发,其余设备工作正常。\",\n \"推理步骤7: 08:35回家时入户门未关闭(front_door_contact 未报告 True),直到20:36才记录到门关闭并自动上锁。虽然老人白天在家,但入户门长时间未锁定对独居老人存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None(06:07、06:27、11:05、11:33、17:00、17:23),灶具关闭后恢复正常读数\",\n \"入户门在08:35开锁进入后,直到20:36才记录到关门上锁,中间约12小时门锁状态未更新\",\n \"三次灶具使用时长均在20-28分钟,时长合理,烟雾报警器未触发\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——当前传感器在高温/蒸汽环境下反复失效,无法在灶具异常时提供可靠的温度监测\",\n \"在传感器修复前,考虑为灶具增加独立的超时自动关闭规则(如连续运行超过30分钟自动断电),作为安全冗余\",\n \"检查入户门锁的自动上锁策略——建议设置入户门关闭后自动上锁,或在门未锁定超过一定时间后向老人或家属发送提醒\",\n \"建议家属定期远程查看设备状态日志,关注传感器 null 值等异常信号\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:29起床、05:40如厕、06:06做早餐、06:51出门晨练/买菜、08:35回家,中午12:33午休、14:09起床,16:59做晚餐,20:36就寝。这是典型独居老人的规律作息,无异常。", "推理步骤2: 入户门操作均为手动开锁+自动回锁,全天仅在06:51出门和08:35回家时触发,无非授权开锁事件,入侵风险排除。", "推理步骤3: 三次使用灶具(06:06-06:26约20分钟、11:04-11:32约28分钟、16:59-17:22约23分钟),时长合理,使用后均正常关闭,烟雾报警器全天未触发,火灾风险低。", "推理步骤4: 但厨房温度传感器在每次灶具开启后约30秒至1分钟内报告 MeasuredValue = None(共出现6次:06:07、06:27、11:05、11:33、17:00、17:23),而灶具关闭后的下一个整点读数又恢复正常。这说明传感器在灶具工作产生的高温或蒸汽环境下反复失效。", "推理步骤5: 厨房温度传感器是灶具安全的关键监测手段之一。如果传感器在高温时失效,一旦发生灶具忘关或干烧等危险情况,系统将无法通过温度异常触发报警,对独居老人构成安全隐患。", "推理步骤6: 漏水传感器全天无报警,窗户传感器状态正常,烟雾报警器未触发,其余设备工作正常。", "推理步骤7: 08:35回家时入户门未关闭(front_door_contact 未报告 True),直到20:36才记录到门关闭并自动上锁。虽然老人白天在家,但入户门长时间未锁定对独居老人存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None(06:07、06:27、11:05、11:33、17:00、17:23),灶具关闭后恢复正常读数", "入户门在08:35开锁进入后,直到20:36才记录到关门上锁,中间约12小时门锁状态未更新", "三次灶具使用时长均在20-28分钟,时长合理,烟雾报警器未触发"], "recommended_actions": ["检查或更换厨房温度传感器——当前传感器在高温/蒸汽环境下反复失效,无法在灶具异常时提供可靠的温度监测", "在传感器修复前,考虑为灶具增加独立的超时自动关闭规则(如连续运行超过30分钟自动断电),作为安全冗余", "检查入户门锁的自动上锁策略——建议设置入户门关闭后自动上锁,或在门未锁定超过一定时间后向老人或家属发送提醒", "建议家属定期远程查看设备状态日志,关注传感器 null 值等异常信号"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.688231945037842, "api_error": null} {"episode_id": "SQ4_FP_D_0850", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0850.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20261479, "scenario_id": "EL-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "EL-02-FP", "scenario_name": "EL-02-FP: 正常午睡", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "发生在正常午睡时段(12:30-14:00),最后活动在卧室且灯已关/窗帘已关", "target_room": "bathroom", "injection_time": "2026-06-09T10:03:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:34起床,06:08做早餐,06:54出门晨练/买菜,08:28回家,10:54做午饭,12:21午休,14:07起床,16:55做晚饭,20:34洗漱后约20:42就寝。这是一个典型的独居老人日常节奏,无异常。\",\n \"推理步骤2: 入户门的开锁/关锁操作均为 Manual 开锁 + Auto 自动上锁,且与运动传感器时间吻合,无未授权入侵迹象。08:28回家时门未重新上锁,但20:42就寝前系统确认门已锁定(LockState=1),安全闭环完整。\",\n \"推理步骤3: 厨房温度传感器在三次灶具使用期间(06:09、10:55、16:56)均报告 MeasuredValue = None,且在灶具关闭后(06:21、11:33、17:37)仍然报告 None。这意味着传感器在最需要监测温度的时刻(明火烹饪)反而失效了。正常的温度传感器在灶具开启时应报告升高的温度值,而非 None。\",\n \"推理步骤4: 每次灶具关闭后,到下一个整点半点的定时采集周期时,厨房温度传感器又恢复了正常数值(如06:30报告2405、11:00报告2557、17:00报告2485),说明传感器并非完全损坏,而是在灶具运行引起的高温或电磁环境下出现间歇性故障。\",\n \"推理步骤5: 对于独居老人家庭,厨房温度监测是防火安全的关键环节。如果灶具忘关或发生干烧,温度传感器无法提供有效读数,烟雾报警器虽然存在但属于最后一道防线,温度异常预警的缺失会显著延迟响应时间。\",\n \"推理步骤6: 其余方面均正常——室内温度随昼夜自然波动(夜间约22-23°C,午间峰值约25.9°C),无漏水报警,无烟雾报警,窗户传感器无异常开合,客厅窗帘和卧室窗帘操作合理。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间(06:09、10:55、16:56开始)均报告 MeasuredValue = None,灶具关闭后仍为 None,直到下一个定时采集周期才恢复正常值\",\n \"传感器在非烹饪时段读数正常(如00:00-06:00期间稳定在22.9-23.1°C),表明是间歇性故障而非永久损坏\",\n \"三次烹饪时长合理(早餐约12分钟、午餐约38分钟、晚餐约41分钟),灶具均正常关闭,老人操作习惯本身无异常\"\n ],\n \"recommended_actions\": [\n \"尽快检查或更换厨房温度传感器,重点排查高温环境下的工作稳定性(可能是传感器量程不足或受灶具热辐射/电磁干扰影响)\",\n \"在传感器修复前,建议将厨房烟雾报警器的灵敏度适当提高,作为补偿性安全措施\",\n \"考虑为灶具增加自动定时关闭功能(如超过60分钟未操作自动断气/断电),为独居老人提供额外的忘关保护\",\n \"建议在系统中增加传感器健康监测规则:当温度传感器在灶具开启期间报告 None 时,立即向家属或监护人发送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:34起床,06:08做早餐,06:54出门晨练/买菜,08:28回家,10:54做午饭,12:21午休,14:07起床,16:55做晚饭,20:34洗漱后约20:42就寝。这是一个典型的独居老人日常节奏,无异常。", "推理步骤2: 入户门的开锁/关锁操作均为 Manual 开锁 + Auto 自动上锁,且与运动传感器时间吻合,无未授权入侵迹象。08:28回家时门未重新上锁,但20:42就寝前系统确认门已锁定(LockState=1),安全闭环完整。", "推理步骤3: 厨房温度传感器在三次灶具使用期间(06:09、10:55、16:56)均报告 MeasuredValue = None,且在灶具关闭后(06:21、11:33、17:37)仍然报告 None。这意味着传感器在最需要监测温度的时刻(明火烹饪)反而失效了。正常的温度传感器在灶具开启时应报告升高的温度值,而非 None。", "推理步骤4: 每次灶具关闭后,到下一个整点半点的定时采集周期时,厨房温度传感器又恢复了正常数值(如06:30报告2405、11:00报告2557、17:00报告2485),说明传感器并非完全损坏,而是在灶具运行引起的高温或电磁环境下出现间歇性故障。", "推理步骤5: 对于独居老人家庭,厨房温度监测是防火安全的关键环节。如果灶具忘关或发生干烧,温度传感器无法提供有效读数,烟雾报警器虽然存在但属于最后一道防线,温度异常预警的缺失会显著延迟响应时间。", "推理步骤6: 其余方面均正常——室内温度随昼夜自然波动(夜间约22-23°C,午间峰值约25.9°C),无漏水报警,无烟雾报警,窗户传感器无异常开合,客厅窗帘和卧室窗帘操作合理。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间(06:09、10:55、16:56开始)均报告 MeasuredValue = None,灶具关闭后仍为 None,直到下一个定时采集周期才恢复正常值", "传感器在非烹饪时段读数正常(如00:00-06:00期间稳定在22.9-23.1°C),表明是间歇性故障而非永久损坏", "三次烹饪时长合理(早餐约12分钟、午餐约38分钟、晚餐约41分钟),灶具均正常关闭,老人操作习惯本身无异常"], "recommended_actions": ["尽快检查或更换厨房温度传感器,重点排查高温环境下的工作稳定性(可能是传感器量程不足或受灶具热辐射/电磁干扰影响)", "在传感器修复前,建议将厨房烟雾报警器的灵敏度适当提高,作为补偿性安全措施", "考虑为灶具增加自动定时关闭功能(如超过60分钟未操作自动断气/断电),为独居老人提供额外的忘关保护", "建议在系统中增加传感器健康监测规则:当温度传感器在灶具开启期间报告 None 时,立即向家属或监护人发送告警通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.68168759346008, "api_error": null} {"episode_id": "SQ4_FP_D_0856", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0856.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-25T00:00:00", "seed": 20261485, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-25T09:33:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在老人外出期间(08:32)未关闭/上锁存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:51、06:39、11:09、11:29、17:08、17:31),共出现6次。虽然部分可能与灶具高温导致传感器量程溢出有关,但灶具关闭后(06:39、11:29、17:31)仍报告 None,说明传感器存在延迟恢复或间歇性故障。\",\n \"推理步骤2: 08:32 老人回家时,入户门解锁并打开(front_door_contact = False),但日志中未记录门关闭(StateValue = True)和重新上锁的事件,直到 20:55 才出现门关闭和自动上锁记录。这意味着入户门可能在 08:32 至 20:55 期间处于未关闭或未上锁状态,对独居老人存在安全风险。\",\n \"推理步骤3: 09:33 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),随后20秒内通过 UserIndex=1 成功解锁。单次错误可能是输入密码/指纹失误,但结合门长时间未关闭的情况,需要关注是否有非授权人员尝试进入。\",\n \"推理步骤4: 老人整体生活作息正常——05:22起床、05:40洗漱、05:50做早餐、06:50出门、08:32回家、11:08做午餐、12:31午休、14:02起床、17:07做晚餐、20:25洗漱、20:55就寝。活动模式规律,无长时间无活动的健康异常信号。\",\n \"推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常高温或火灾迹象。烟雾报警器全天无触发。漏水传感器无报警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 MeasuredValue = None(05:51、06:39、11:09、11:29、17:08、17:31)\",\n \"入户门 08:32 开启后直到 20:55 才记录到关闭和上锁事件,中间约12小时无门状态变化记录\",\n \"09:33 出现一次门锁操作错误事件(LockOperationError)\",\n \"灶具关闭后温度传感器仍报 None,恢复存在延迟\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否需要更换或重新校准,排除灶具热辐射对传感器的干扰\",\n \"检查入户门传感器是否工作正常,确认门在 08:32 至 20:55 期间的真实物理状态(是否确实未关闭)\",\n \"建议为入户门设置「长时间未关闭/未上锁」自动提醒规则,特别是独居老人场景下\",\n \"关注 09:33 的门锁错误事件,查看是否为老人本人操作失误,必要时检查门锁电池和机械部件\",\n \"考虑为厨房温度传感器设置安装位置优化,远离灶具热源以减少量程溢出\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在老人外出期间(08:32)未关闭/上锁存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:51、06:39、11:09、11:29、17:08、17:31),共出现6次。虽然部分可能与灶具高温导致传感器量程溢出有关,但灶具关闭后(06:39、11:29、17:31)仍报告 None,说明传感器存在延迟恢复或间歇性故障。", "推理步骤2: 08:32 老人回家时,入户门解锁并打开(front_door_contact = False),但日志中未记录门关闭(StateValue = True)和重新上锁的事件,直到 20:55 才出现门关闭和自动上锁记录。这意味着入户门可能在 08:32 至 20:55 期间处于未关闭或未上锁状态,对独居老人存在安全风险。", "推理步骤3: 09:33 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),随后20秒内通过 UserIndex=1 成功解锁。单次错误可能是输入密码/指纹失误,但结合门长时间未关闭的情况,需要关注是否有非授权人员尝试进入。", "推理步骤4: 老人整体生活作息正常——05:22起床、05:40洗漱、05:50做早餐、06:50出门、08:32回家、11:08做午餐、12:31午休、14:02起床、17:07做晚餐、20:25洗漱、20:55就寝。活动模式规律,无长时间无活动的健康异常信号。", "推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常高温或火灾迹象。烟雾报警器全天无触发。漏水传感器无报警。"], "key_evidence": ["厨房温度传感器6次报告 MeasuredValue = None(05:51、06:39、11:09、11:29、17:08、17:31)", "入户门 08:32 开启后直到 20:55 才记录到关闭和上锁事件,中间约12小时无门状态变化记录", "09:33 出现一次门锁操作错误事件(LockOperationError)", "灶具关闭后温度传感器仍报 None,恢复存在延迟"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否需要更换或重新校准,排除灶具热辐射对传感器的干扰", "检查入户门传感器是否工作正常,确认门在 08:32 至 20:55 期间的真实物理状态(是否确实未关闭)", "建议为入户门设置「长时间未关闭/未上锁」自动提醒规则,特别是独居老人场景下", "关注 09:33 的门锁错误事件,查看是否为老人本人操作失误,必要时检查门锁电池和机械部件", "考虑为厨房温度传感器设置安装位置优化,远离灶具热源以减少量程溢出"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.334870100021362, "api_error": null} {"episode_id": "SQ4_FP_D_0860", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0860.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261489, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-10T21:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间未锁定约1.5小时,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:54、06:31、10:56、11:36、17:10、17:26),共6次。虽然灶具工作时传感器可能因高温超量程而报 None,但关闭后仍报 None(如06:31、11:36、17:26)不正常,提示传感器可能存在间歇性故障或通信问题。\",\n \"推理步骤2: 老人于06:50出门(手动开锁、开门、关门、自动上锁),08:22回家(手动开锁进入)。这段时间门锁状态正常。但在20:37,入户门确认关闭并自动上锁,而08:22进门时日志未显示门关闭和上锁事件,说明老人08:22进门后入户门可能一直处于未锁状态直到20:37才锁定,中间约12小时门未上锁。\",\n \"推理步骤3: 21:53 卧室窗户传感器报告 StateValue = False(窗户打开),之后卧室运动传感器报告 Occupancy = 0(无人),但老人已就寝(20:37关灯拉窗帘入睡)。窗户打开后无人检测为0可能是老人开窗通风后回到床上(传感器盲区),属正常行为,但结合独居老人场景需关注。\",\n \"推理步骤4: 整体生活模式正常——早起(05:21)、如厕、做早餐、出门、回家、午休(12:31-13:50拉窗帘)、做晚餐、洗漱、就寝(20:37),符合独居老人日常作息。\",\n \"推理步骤5: 温度变化趋势合理,夜间约22°C,白天升至25-26°C,傍晚回落,无异常温升提示火灾风险。烟雾报警器全天无触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 MeasuredValue = None,包括灶具关闭后仍报 None(06:31、11:36、17:26)\",\n \"08:22老人进门后日志未显示门关闭/上锁事件,直到20:37才记录门锁定,期间门锁状态不明确\",\n \"21:53卧室窗户打开(StateValue=False)后运动传感器报告无人(Occupancy=0),老人夜间状态需关注\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,确保灶具使用时仍能正常监测温度以防火灾\",\n \"检查入户门锁自动上锁策略,建议设置进门后延时自动上锁(如30秒),避免长时间未锁门\",\n \"考虑在卧室增加床垫压力传感器或睡眠监测设备,弥补运动传感器在老人静卧时的检测盲区\",\n \"建议为独居老人设置夜间窗户开启提醒,防止安全隐患(坠落、入侵)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间未锁定约1.5小时,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:54、06:31、10:56、11:36、17:10、17:26),共6次。虽然灶具工作时传感器可能因高温超量程而报 None,但关闭后仍报 None(如06:31、11:36、17:26)不正常,提示传感器可能存在间歇性故障或通信问题。", "推理步骤2: 老人于06:50出门(手动开锁、开门、关门、自动上锁),08:22回家(手动开锁进入)。这段时间门锁状态正常。但在20:37,入户门确认关闭并自动上锁,而08:22进门时日志未显示门关闭和上锁事件,说明老人08:22进门后入户门可能一直处于未锁状态直到20:37才锁定,中间约12小时门未上锁。", "推理步骤3: 21:53 卧室窗户传感器报告 StateValue = False(窗户打开),之后卧室运动传感器报告 Occupancy = 0(无人),但老人已就寝(20:37关灯拉窗帘入睡)。窗户打开后无人检测为0可能是老人开窗通风后回到床上(传感器盲区),属正常行为,但结合独居老人场景需关注。", "推理步骤4: 整体生活模式正常——早起(05:21)、如厕、做早餐、出门、回家、午休(12:31-13:50拉窗帘)、做晚餐、洗漱、就寝(20:37),符合独居老人日常作息。", "推理步骤5: 温度变化趋势合理,夜间约22°C,白天升至25-26°C,傍晚回落,无异常温升提示火灾风险。烟雾报警器全天无触发。"], "key_evidence": ["厨房温度传感器6次报告 MeasuredValue = None,包括灶具关闭后仍报 None(06:31、11:36、17:26)", "08:22老人进门后日志未显示门关闭/上锁事件,直到20:37才记录门锁定,期间门锁状态不明确", "21:53卧室窗户打开(StateValue=False)后运动传感器报告无人(Occupancy=0),老人夜间状态需关注"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,确保灶具使用时仍能正常监测温度以防火灾", "检查入户门锁自动上锁策略,建议设置进门后延时自动上锁(如30秒),避免长时间未锁门", "考虑在卧室增加床垫压力传感器或睡眠监测设备,弥补运动传感器在老人静卧时的检测盲区", "建议为独居老人设置夜间窗户开启提醒,防止安全隐患(坠落、入侵)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.623363733291626, "api_error": null} {"episode_id": "SQ4_FP_D_0876", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0876.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261505, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-28T11:18:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间(08:38)未关闭/未锁定,需关注安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None(06:00:08、06:33:00、11:09:00、11:34:00、17:08:00、17:32:00),共计6次。虽然每次都与灶具使用时间相关,但正常传感器不应返回 None,这表明传感器可能受高温干扰或自身存在故障。对于独居老人家庭,厨房温度监测是火灾预警的关键环节,传感器失效意味着安全盲区。\",\n \"推理步骤2: 老人于 06:50 手动开锁出门,门自动上锁。08:38 门再次被手动解锁打开,随后有人进入客厅并开灯,但日志中没有记录该次入户门关闭(BooleanState.StateValue = True)和重新上锁的事件。直到 20:45 才出现门关闭和自动上锁的记录。这意味着入户门可能在 08:38 至 20:45 之间长达约12小时处于未锁定或未完全关闭状态。对于独居老人,这是一个安全隐患。\",\n \"推理步骤3: 老人的日常作息模式本身是正常的——05:36起床、洗漱、做早餐、06:50出门、08:38回家、午间休息、做午晚餐、20:45就寝。卫生间漏水传感器在11:18短暂触发后11:20恢复,结合当时有人在卫生间(occupancy=1),判断为正常用水溅水,非真实漏水。\",\n \"推理步骤4: 温度数据整体呈现正常的昼夜变化曲线(夜间约22-23°C,午间峰值约25-26°C),各房间温差合理,未发现异常高温或局部过热迹象。客厅空调全天未启动,与夏季但温度尚可接受的情况一致。烟雾报警器全天无触发,排除火灾风险。\",\n \"推理步骤5: 所有门锁操作均为 Manual 或 Auto 来源,未出现远程或未知来源的解锁事件,排除入侵嫌疑。08:38的进入者结合后续在客厅活动的行为模式,判断为老人本人回家。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 MeasuredValue = None(06:00:08、06:33:00、11:09:00、11:34:00、17:08:00、17:32:00),均发生在灶具开关前后\",\n \"入户门在 08:38:02 被打开(StateValue=False)后,直到 20:45:10 才记录到关闭(StateValue=True),期间约12小时无门锁闭合记录\",\n \"卫生间漏水传感器 11:18 触发、11:20 恢复,持续仅2分钟,同时有人在场\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器:该传感器在灶具使用时反复失效,无法提供可靠的温度监测,建议检查其安装位置是否离灶具过近,或更换耐高温型号\",\n \"排查入户门锁与门磁传感器状态:确认 08:38 至 20:45 期间门是否确实未关闭,检查门磁传感器是否存在漏报,必要时维修或校准\",\n \"建议为独居老人设置门未关闭超时提醒:如入户门打开超过一定时间未关闭,自动推送通知给家属或护理人员\",\n \"卫生间漏水传感器本次为短暂触发,暂无需处理,但建议持续监测是否出现频繁触发的趋势\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间(08:38)未关闭/未锁定,需关注安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None(06:00:08、06:33:00、11:09:00、11:34:00、17:08:00、17:32:00),共计6次。虽然每次都与灶具使用时间相关,但正常传感器不应返回 None,这表明传感器可能受高温干扰或自身存在故障。对于独居老人家庭,厨房温度监测是火灾预警的关键环节,传感器失效意味着安全盲区。", "推理步骤2: 老人于 06:50 手动开锁出门,门自动上锁。08:38 门再次被手动解锁打开,随后有人进入客厅并开灯,但日志中没有记录该次入户门关闭(BooleanState.StateValue = True)和重新上锁的事件。直到 20:45 才出现门关闭和自动上锁的记录。这意味着入户门可能在 08:38 至 20:45 之间长达约12小时处于未锁定或未完全关闭状态。对于独居老人,这是一个安全隐患。", "推理步骤3: 老人的日常作息模式本身是正常的——05:36起床、洗漱、做早餐、06:50出门、08:38回家、午间休息、做午晚餐、20:45就寝。卫生间漏水传感器在11:18短暂触发后11:20恢复,结合当时有人在卫生间(occupancy=1),判断为正常用水溅水,非真实漏水。", "推理步骤4: 温度数据整体呈现正常的昼夜变化曲线(夜间约22-23°C,午间峰值约25-26°C),各房间温差合理,未发现异常高温或局部过热迹象。客厅空调全天未启动,与夏季但温度尚可接受的情况一致。烟雾报警器全天无触发,排除火灾风险。", "推理步骤5: 所有门锁操作均为 Manual 或 Auto 来源,未出现远程或未知来源的解锁事件,排除入侵嫌疑。08:38的进入者结合后续在客厅活动的行为模式,判断为老人本人回家。"], "key_evidence": ["厨房温度传感器6次报告 MeasuredValue = None(06:00:08、06:33:00、11:09:00、11:34:00、17:08:00、17:32:00),均发生在灶具开关前后", "入户门在 08:38:02 被打开(StateValue=False)后,直到 20:45:10 才记录到关闭(StateValue=True),期间约12小时无门锁闭合记录", "卫生间漏水传感器 11:18 触发、11:20 恢复,持续仅2分钟,同时有人在场"], "recommended_actions": ["检查或更换厨房温度传感器:该传感器在灶具使用时反复失效,无法提供可靠的温度监测,建议检查其安装位置是否离灶具过近,或更换耐高温型号", "排查入户门锁与门磁传感器状态:确认 08:38 至 20:45 期间门是否确实未关闭,检查门磁传感器是否存在漏报,必要时维修或校准", "建议为独居老人设置门未关闭超时提醒:如入户门打开超过一定时间未关闭,自动推送通知给家属或护理人员", "卫生间漏水传感器本次为短暂触发,暂无需处理,但建议持续监测是否出现频繁触发的趋势"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.380516529083252, "api_error": null} {"episode_id": "SQ4_FP_D_0874", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0874.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261503, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-11T10:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间未上锁长达约1小时15分钟,且有一次门锁操作错误记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(05:55、06:26、11:02、11:34、17:00、17:27),共出现6次。虽然灶具工作时高温可能导致传感器读数异常,但 None 值意味着传感器未能返回有效数据,这可能是传感器故障或通信中断的信号。对于独居老人家庭,厨房温度监控是火灾预警的关键环节,传感器失效会导致安全盲区。\",\n \"推理步骤2: 老人于 07:06 出门(手动开锁、开门、关门、自动上锁),但在 08:21 有人进入时,门锁状态显示为手动开锁(LockOperationType=1),且入户门传感器显示门打开(StateValue=False),但之后没有关门和上锁记录。直到 20:37 才出现门锁确认关闭(StateValue=True)和自动上锁(LockState=1)。这意味着从 08:21 到 20:37 长达约12小时,入户门可能处于未完全关闭或未上锁状态。\",\n \"推理步骤3: 10:53 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),随后20秒通过远程/密码方式(OperationSource=3, UserIndex=1)成功开锁。单次错误可能是输入密码错误,但结合独居老人场景,需关注是否有未授权的开锁尝试。不过随后成功开锁使用了已注册用户(UserIndex=1),更可能是老人自己操作失误。\",\n \"推理步骤4: 老人的日常作息模式基本正常——05:28起床、05:42洗漱、05:54做早餐、07:06外出、08:21回家、12:23午休、13:51起床、16:59做晚餐、20:26洗漱、20:37就寝。活动节奏合理,未发现长时间无活动的健康异常信号。\",\n \"推理步骤5: 灶具使用时间合理(早餐约30分钟、午餐约32分钟、晚餐约27分钟),每次使用后均正常关闭,烟雾报警器全天未触发,无火灾风险。温度整体走势符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.8°C)。\",\n \"推理步骤6: 19:40 客厅灯亮度被调至极低(CurrentLevel=12,约4.7%),这对独居老人而言可能增加跌倒风险,但也可能是看电视时的习惯性调暗,属于低风险观察项。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:55、06:26、11:02、11:34、17:00、17:27),传感器可能存在故障\",\n \"08:21 入户门开锁开门后无关门/上锁记录,直到 20:37 才确认门关闭并自动上锁,期间门可能未锁\",\n \"10:53 出现一次门锁操作错误(LockOperationError),20秒后通过 UserIndex=1 成功开锁\",\n \"19:40 客厅灯亮度调至极低(Level=12),独居老人环境下存在跌倒隐患\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:传感器在灶具工作时持续报告 None 值,建议检查传感器安装位置是否离灶具过近导致过热,或更换传感器以确保厨房火灾监控不中断\",\n \"检查入户门锁状态:确认门锁和门磁传感器工作正常,排查 08:21 至 20:37 期间门是否确实处于未锁状态;建议启用门未关闭超时告警(如超过5分钟未关门则推送提醒)\",\n \"审查门锁操作错误日志:虽然 10:53 的错误大概率是老人自己操作失误,但建议定期审查门锁错误日志,若频繁出现可考虑更换为更易操作的开锁方式(如指纹识别)\",\n \"优化夜间照明策略:建议为客厅和卧室设置夜间最低亮度阈值或夜灯联动,避免老人在过暗环境中活动时跌倒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在老人外出期间未上锁长达约1小时15分钟,且有一次门锁操作错误记录。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(05:55、06:26、11:02、11:34、17:00、17:27),共出现6次。虽然灶具工作时高温可能导致传感器读数异常,但 None 值意味着传感器未能返回有效数据,这可能是传感器故障或通信中断的信号。对于独居老人家庭,厨房温度监控是火灾预警的关键环节,传感器失效会导致安全盲区。", "推理步骤2: 老人于 07:06 出门(手动开锁、开门、关门、自动上锁),但在 08:21 有人进入时,门锁状态显示为手动开锁(LockOperationType=1),且入户门传感器显示门打开(StateValue=False),但之后没有关门和上锁记录。直到 20:37 才出现门锁确认关闭(StateValue=True)和自动上锁(LockState=1)。这意味着从 08:21 到 20:37 长达约12小时,入户门可能处于未完全关闭或未上锁状态。", "推理步骤3: 10:53 出现一次门锁操作错误(LockOperationError, OperationError=1, OperationSource=3),随后20秒通过远程/密码方式(OperationSource=3, UserIndex=1)成功开锁。单次错误可能是输入密码错误,但结合独居老人场景,需关注是否有未授权的开锁尝试。不过随后成功开锁使用了已注册用户(UserIndex=1),更可能是老人自己操作失误。", "推理步骤4: 老人的日常作息模式基本正常——05:28起床、05:42洗漱、05:54做早餐、07:06外出、08:21回家、12:23午休、13:51起床、16:59做晚餐、20:26洗漱、20:37就寝。活动节奏合理,未发现长时间无活动的健康异常信号。", "推理步骤5: 灶具使用时间合理(早餐约30分钟、午餐约32分钟、晚餐约27分钟),每次使用后均正常关闭,烟雾报警器全天未触发,无火灾风险。温度整体走势符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.8°C)。", "推理步骤6: 19:40 客厅灯亮度被调至极低(CurrentLevel=12,约4.7%),这对独居老人而言可能增加跌倒风险,但也可能是看电视时的习惯性调暗,属于低风险观察项。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:55、06:26、11:02、11:34、17:00、17:27),传感器可能存在故障", "08:21 入户门开锁开门后无关门/上锁记录,直到 20:37 才确认门关闭并自动上锁,期间门可能未锁", "10:53 出现一次门锁操作错误(LockOperationError),20秒后通过 UserIndex=1 成功开锁", "19:40 客厅灯亮度调至极低(Level=12),独居老人环境下存在跌倒隐患"], "recommended_actions": ["检查厨房温度传感器:传感器在灶具工作时持续报告 None 值,建议检查传感器安装位置是否离灶具过近导致过热,或更换传感器以确保厨房火灾监控不中断", "检查入户门锁状态:确认门锁和门磁传感器工作正常,排查 08:21 至 20:37 期间门是否确实处于未锁状态;建议启用门未关闭超时告警(如超过5分钟未关门则推送提醒)", "审查门锁操作错误日志:虽然 10:53 的错误大概率是老人自己操作失误,但建议定期审查门锁错误日志,若频繁出现可考虑更换为更易操作的开锁方式(如指纹识别)", "优化夜间照明策略:建议为客厅和卧室设置夜间最低亮度阈值或夜灯联动,避免老人在过暗环境中活动时跌倒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.49253726005554, "api_error": null} {"episode_id": "SQ4_FP_D_0878", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0878.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261507, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "bedroom", "injection_time": "2026-06-08T15:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能影响火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(05:51、06:37、10:53、17:00、17:33),共出现5次。这不是正常的温度读数,说明传感器在高温或灶具工作环境下出现读数丢失。\",\n \"推理步骤2: 该传感器在灶具关闭后也会报告一次 None,随后在下一个30分钟周期恢复正常读数。这种模式高度一致,指向传感器在灶具开关瞬间受到干扰或自身存在间歇性故障。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾早期预警的关键设备。如果传感器在灶具使用时恰好失效,将无法及时检测到异常高温,存在安全隐患。\",\n \"推理步骤4: 其余行为模式正常——老人05:30起床、早餐后06:58出门、08:25回家、12:37午休、13:56起床、20:47就寝,生活规律无异常。入户门锁操作均为手动开锁+自动上锁,无入侵迹象。\",\n \"推理步骤5: 15:11 卧室出现短暂活动(开灯→窗户传感器打开→关灯→离开),结合窗户传感器 StateValue=False 表示窗户被打开,这是正常的通风行为。但注意该窗户在就寝前未见关闭记录,夜间开窗对独居老人有一定安全风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具每次开启/关闭时报告 MeasuredValue = None(05:51、06:37、10:53、17:00、17:33),共5次异常读数\",\n \"卧室窗户传感器15:11显示窗户打开(StateValue=False),之后无关闭记录,夜间可能处于开启状态\",\n \"入户门在08:25老人回家后未重新上锁(LockState未变为1),直到20:47才自动上锁——白天长时间门锁处于解锁状态\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确保其在灶具工作时能正常报告温度,保障火灾预警能力\",\n \"确认卧室窗户夜间是否关闭,建议设置就寝模式自动提醒关窗\",\n \"建议设置入户门锁自动上锁策略(如进门后5分钟无操作自动上锁),避免白天长时间未锁门\",\n \"考虑为厨房温度传感器添加冗余监测,或在传感器报告 None 时触发告警通知家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能影响火灾预警能力。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(05:51、06:37、10:53、17:00、17:33),共出现5次。这不是正常的温度读数,说明传感器在高温或灶具工作环境下出现读数丢失。", "推理步骤2: 该传感器在灶具关闭后也会报告一次 None,随后在下一个30分钟周期恢复正常读数。这种模式高度一致,指向传感器在灶具开关瞬间受到干扰或自身存在间歇性故障。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾早期预警的关键设备。如果传感器在灶具使用时恰好失效,将无法及时检测到异常高温,存在安全隐患。", "推理步骤4: 其余行为模式正常——老人05:30起床、早餐后06:58出门、08:25回家、12:37午休、13:56起床、20:47就寝,生活规律无异常。入户门锁操作均为手动开锁+自动上锁,无入侵迹象。", "推理步骤5: 15:11 卧室出现短暂活动(开灯→窗户传感器打开→关灯→离开),结合窗户传感器 StateValue=False 表示窗户被打开,这是正常的通风行为。但注意该窗户在就寝前未见关闭记录,夜间开窗对独居老人有一定安全风险。"], "key_evidence": ["厨房温度传感器在灶具每次开启/关闭时报告 MeasuredValue = None(05:51、06:37、10:53、17:00、17:33),共5次异常读数", "卧室窗户传感器15:11显示窗户打开(StateValue=False),之后无关闭记录,夜间可能处于开启状态", "入户门在08:25老人回家后未重新上锁(LockState未变为1),直到20:47才自动上锁——白天长时间门锁处于解锁状态"], "recommended_actions": ["检查或更换厨房温度传感器,确保其在灶具工作时能正常报告温度,保障火灾预警能力", "确认卧室窗户夜间是否关闭,建议设置就寝模式自动提醒关窗", "建议设置入户门锁自动上锁策略(如进门后5分钟无操作自动上锁),避免白天长时间未锁门", "考虑为厨房温度传感器添加冗余监测,或在传感器报告 None 时触发告警通知家属"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.252023696899414, "api_error": null} {"episode_id": "SQ4_FP_D_0879", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0879.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261508, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "kitchen", "injection_time": "2026-06-05T10:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内多次报告 MeasuredValue = None(06:02、06:32、10:53、11:35、17:04、17:33),共出现6次。这与灶具开关操作高度相关,每次灶具 OnOff 状态变化后约30秒到1分钟内传感器就报告 None。\",\n \"推理步骤2: 温度传感器报告 None 意味着测量值不可用。在灶具正在使用的关键时段,温度监测失效是危险的——如果发生过热或火灾前兆,系统将无法通过温度异常来预警。对于独居老人家庭,这一安全冗余的缺失尤为严重。\",\n \"推理步骤3: 该传感器在非烹饪时段(每半小时的定期上报)工作正常,数值合理(22-26°C 范围),说明传感器本身未完全损坏,但可能在高温或灶具电磁干扰环境下出现间歇性故障。\",\n \"推理步骤4: 除此之外,老人的整体生活作息正常——05:40起床、06:01做早餐、06:54出门、08:31回家、12:35午休、14:10起床、17:03做晚餐、20:37就寝,活动模式规律,无健康异常迹象。\",\n \"推理步骤5: 入户门在08:31开门后未上锁(LockState=2 即 Unlocked),直到20:38才自动上锁。老人外出期间(06:54-08:31)门锁状态正常(出门后自动上锁),但08:31回家后门锁保持解锁状态长达约12小时。虽然老人在家中,但独居老人长时间不锁门存在一定安全隐患。\",\n \"推理步骤6: 客厅空调在10:58开启后,日志中未见关闭记录,可能持续运行至深夜,但这在夏季属于常见行为,不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:02、06:32、10:53、11:35、17:04、17:33),每次均与灶具开关操作时间高度吻合\",\n \"传感器在非烹饪时段正常工作,数值在合理范围内,表明故障为间歇性、与灶具运行环境相关\",\n \"入户门锁在08:31回家后保持解锁状态超过12小时,直到20:38就寝时才自动上锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数,必要时更换耐高温型传感器或调整安装位置\",\n \"在温度传感器报告 None 期间,增加对厨房烟雾报警器(kitchen_smoke_alarm)状态的主动轮询,确保至少有一道安全防线可用\",\n \"建议设置自动化规则:当灶具开启超过一定时长(如45分钟)且温度传感器无有效读数时,自动发出提醒通知\",\n \"建议为入户门锁设置自动化规则:回家后若超过一定时间(如30分钟)未手动上锁,自动上锁或发送提醒,保障独居老人的居家安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内多次报告 MeasuredValue = None(06:02、06:32、10:53、11:35、17:04、17:33),共出现6次。这与灶具开关操作高度相关,每次灶具 OnOff 状态变化后约30秒到1分钟内传感器就报告 None。", "推理步骤2: 温度传感器报告 None 意味着测量值不可用。在灶具正在使用的关键时段,温度监测失效是危险的——如果发生过热或火灾前兆,系统将无法通过温度异常来预警。对于独居老人家庭,这一安全冗余的缺失尤为严重。", "推理步骤3: 该传感器在非烹饪时段(每半小时的定期上报)工作正常,数值合理(22-26°C 范围),说明传感器本身未完全损坏,但可能在高温或灶具电磁干扰环境下出现间歇性故障。", "推理步骤4: 除此之外,老人的整体生活作息正常——05:40起床、06:01做早餐、06:54出门、08:31回家、12:35午休、14:10起床、17:03做晚餐、20:37就寝,活动模式规律,无健康异常迹象。", "推理步骤5: 入户门在08:31开门后未上锁(LockState=2 即 Unlocked),直到20:38才自动上锁。老人外出期间(06:54-08:31)门锁状态正常(出门后自动上锁),但08:31回家后门锁保持解锁状态长达约12小时。虽然老人在家中,但独居老人长时间不锁门存在一定安全隐患。", "推理步骤6: 客厅空调在10:58开启后,日志中未见关闭记录,可能持续运行至深夜,但这在夏季属于常见行为,不构成安全威胁。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:02、06:32、10:53、11:35、17:04、17:33),每次均与灶具开关操作时间高度吻合", "传感器在非烹饪时段正常工作,数值在合理范围内,表明故障为间歇性、与灶具运行环境相关", "入户门锁在08:31回家后保持解锁状态超过12小时,直到20:38就寝时才自动上锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰影响读数,必要时更换耐高温型传感器或调整安装位置", "在温度传感器报告 None 期间,增加对厨房烟雾报警器(kitchen_smoke_alarm)状态的主动轮询,确保至少有一道安全防线可用", "建议设置自动化规则:当灶具开启超过一定时长(如45分钟)且温度传感器无有效读数时,自动发出提醒通知", "建议为入户门锁设置自动化规则:回家后若超过一定时间(如30分钟)未手动上锁,自动上锁或发送提醒,保障独居老人的居家安全"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.14991784095764, "api_error": null} {"episode_id": "SQ4_FP_D_0886", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0886.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261515, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bedroom", "injection_time": "2026-06-08T07:31:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致火灾风险无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:02、11:01、16:54),且在灶具关闭后仍持续报告 None(06:40、11:35、17:29),说明传感器在高温环境下失效或通信中断。\",\n \"推理步骤2: 每次灶具使用期间传感器都出现相同故障模式(共3次),排除偶发性干扰,指向硬件问题或传感器量程被超出后的保护性断连。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。传感器在灶具使用时恰好失效,意味着最需要监测的时段反而没有数据,形成安全盲区。\",\n \"推理步骤4: 其余行为模式正常——老人05:27起床、06:01做早餐、07:06外出、08:39回家、12:40午休、16:53做晚餐、20:53就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启期间3次报告 MeasuredValue = None(06:02:10、11:01:00、16:54:00)\",\n \"灶具关闭后传感器仍报告 None(06:40、11:35、17:29),但在下一个整点周期恢复正常读数\",\n \"其他温度传感器(客厅、卧室)全天无 None 值,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或热保护断连\",\n \"考虑更换耐高温型温度传感器或将其重新定位到能监测环境温度但不直接受灶具热辐射影响的位置\",\n \"在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为替代性火灾预警手段\",\n \"可设置自动化规则:当灶具开启超过一定时长(如40分钟)且无人在厨房时自动关闭灶具并发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常,可能导致火灾风险无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:02、11:01、16:54),且在灶具关闭后仍持续报告 None(06:40、11:35、17:29),说明传感器在高温环境下失效或通信中断。", "推理步骤2: 每次灶具使用期间传感器都出现相同故障模式(共3次),排除偶发性干扰,指向硬件问题或传感器量程被超出后的保护性断连。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。传感器在灶具使用时恰好失效,意味着最需要监测的时段反而没有数据,形成安全盲区。", "推理步骤4: 其余行为模式正常——老人05:27起床、06:01做早餐、07:06外出、08:39回家、12:40午休、16:53做晚餐、20:53就寝,符合独居老人的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启期间3次报告 MeasuredValue = None(06:02:10、11:01:00、16:54:00)", "灶具关闭后传感器仍报告 None(06:40、11:35、17:29),但在下一个整点周期恢复正常读数", "其他温度传感器(客厅、卧室)全天无 None 值,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或热保护断连", "考虑更换耐高温型温度传感器或将其重新定位到能监测环境温度但不直接受灶具热辐射影响的位置", "在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为替代性火灾预警手段", "可设置自动化规则:当灶具开启超过一定时长(如40分钟)且无人在厨房时自动关闭灶具并发出提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.29884171485901, "api_error": null} {"episode_id": "SQ4_FP_D_0884", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0884.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261513, "scenario_id": "DF-03", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "DF-03-FP", "scenario_name": "DF-03-FP: 宠物活动", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "触发间隔不规律(不是周期性的),且频率较低(几分钟一次不是几十秒一次)", "target_room": "bathroom", "injection_time": "2026-06-07T10:25:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人 05:34 起床、06:06 进厨房做早餐、07:08 出门、08:21 回家、12:24 午休、14:05 起床、16:54 做晚餐、20:49 就寝,符合独居老人的典型日常节奏。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件;08:21 回家时门未关闭(日志中无 StateValue=True 的关门记录,直到 20:49 才出现),但结合老人在家活动,可能是门虚掩或传感器延迟,需关注但不构成入侵威胁。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间(06:07、10:55、16:55)以及关闭后(06:28、11:36、17:24)共 6 次报告 MeasuredValue = None。正常传感器在灶具使用时应能持续报告温度值(即使升高),返回 None 表明传感器可能因高温断连、通信故障或硬件异常。\",\n \"推理步骤4: 厨房温度传感器故障意味着在灶具使用期间无法监测厨房实际温度。对于独居老人,这是一个重要的安全盲区——如果忘记关火或发生干烧,系统将无法通过温度异常触发预警。\",\n \"推理步骤5: 烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无任何触发记录,漏水传感器也无报警,排除火灾和漏水的即时威胁。\",\n \"推理步骤6: 温度趋势正常——夜间约 22°C,午间峰值约 25.9°C,符合夏季自然温度变化曲线。卧室窗帘在午休时关闭、起床后打开,晚间再次关闭,行为合理。\",\n \"推理步骤7: 卫生间在 10:25-10:31 出现两次短暂的占用/离开循环(45秒和50秒),可能是老人短暂进出或传感器灵敏度问题,单次出现不构成健康警报,但值得持续观察。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(06:07、06:28、10:55、11:36、16:55、17:24),每次灶具开启/关闭前后均出现\",\n \"08:21 入户门开锁进入后,日志中未记录关门事件(BooleanState.StateValue = True),直到 20:49 才出现关门+上锁记录,存在长时间门未关闭的可能\",\n \"卫生间 10:25-10:31 出现两次短暂占用(各不足1分钟),模式略显异常\"\n ],\n \"recommended_actions\": [\n \"优先检查厨房温度传感器(kitchen_temp_sensor):检查其与灶具的距离是否过近导致高温断连,确认设备固件版本和电池电量,必要时更换或重新部署位置\",\n \"在厨房温度传感器修复前,建议为灶具设置自动关闭定时器(如超过 40 分钟未手动操作则自动断电),作为独居老人的安全兜底措施\",\n \"排查入户门传感器(front_door_contact):确认 08:21 至 20:49 期间门是否确实未关闭,如果是传感器漏报则需校准,如果门确实长时间未锁则需提醒老人注意关门习惯\",\n \"持续关注卫生间短暂占用模式,如频繁出现可能提示老人行动不便或健康状况变化,建议结合更多天数的数据进行趋势分析\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人 05:34 起床、06:06 进厨房做早餐、07:08 出门、08:21 回家、12:24 午休、14:05 起床、16:54 做晚餐、20:49 就寝,符合独居老人的典型日常节奏。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件;08:21 回家时门未关闭(日志中无 StateValue=True 的关门记录,直到 20:49 才出现),但结合老人在家活动,可能是门虚掩或传感器延迟,需关注但不构成入侵威胁。", "推理步骤3: 厨房温度传感器在灶具开启期间(06:07、10:55、16:55)以及关闭后(06:28、11:36、17:24)共 6 次报告 MeasuredValue = None。正常传感器在灶具使用时应能持续报告温度值(即使升高),返回 None 表明传感器可能因高温断连、通信故障或硬件异常。", "推理步骤4: 厨房温度传感器故障意味着在灶具使用期间无法监测厨房实际温度。对于独居老人,这是一个重要的安全盲区——如果忘记关火或发生干烧,系统将无法通过温度异常触发预警。", "推理步骤5: 烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无任何触发记录,漏水传感器也无报警,排除火灾和漏水的即时威胁。", "推理步骤6: 温度趋势正常——夜间约 22°C,午间峰值约 25.9°C,符合夏季自然温度变化曲线。卧室窗帘在午休时关闭、起床后打开,晚间再次关闭,行为合理。", "推理步骤7: 卫生间在 10:25-10:31 出现两次短暂的占用/离开循环(45秒和50秒),可能是老人短暂进出或传感器灵敏度问题,单次出现不构成健康警报,但值得持续观察。"], "key_evidence": ["厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None(06:07、06:28、10:55、11:36、16:55、17:24),每次灶具开启/关闭前后均出现", "08:21 入户门开锁进入后,日志中未记录关门事件(BooleanState.StateValue = True),直到 20:49 才出现关门+上锁记录,存在长时间门未关闭的可能", "卫生间 10:25-10:31 出现两次短暂占用(各不足1分钟),模式略显异常"], "recommended_actions": ["优先检查厨房温度传感器(kitchen_temp_sensor):检查其与灶具的距离是否过近导致高温断连,确认设备固件版本和电池电量,必要时更换或重新部署位置", "在厨房温度传感器修复前,建议为灶具设置自动关闭定时器(如超过 40 分钟未手动操作则自动断电),作为独居老人的安全兜底措施", "排查入户门传感器(front_door_contact):确认 08:21 至 20:49 期间门是否确实未关闭,如果是传感器漏报则需校准,如果门确实长时间未锁则需提醒老人注意关门习惯", "持续关注卫生间短暂占用模式,如频繁出现可能提示老人行动不便或健康状况变化,建议结合更多天数的数据进行趋势分析"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.239279985427856, "api_error": null} {"episode_id": "SQ4_FP_D_0906", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0906.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261535, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-24T12:15:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,共出现在三次做饭时段(05:54、06:37、11:02、11:30、16:59、17:29),说明这不是偶发现象而是可复现的故障模式。\",\n \"推理步骤2: 灶具使用期间恰恰是厨房最需要温度监控的时段。传感器在此关键时刻失效,意味着如果发生灶具过热或火灾前兆,系统将无法通过温度异常及时发出预警。对于独居老人家庭,这是一个显著的安全盲区。\",\n \"推理步骤3: 其余设备行为和住户活动模式均属正常——老人 05:23 起床、洗漱、做早餐、06:50 出门、08:31 回家(可能是晨练)、午休、晚餐、20:40 就寝,作息规律合理。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤4: 08:31 入户门开锁后未见关门上锁记录,直到 20:40 才出现门锁上锁和门传感器关闭状态。这意味着老人白天在家期间入户门可能长时间处于未锁状态,存在一定的入侵风险,但考虑到老人在家且客厅有人活动,风险等级不高。\",\n \"推理步骤5: 12:15 卧室窗户传感器报告 StateValue=False(窗户打开),之后未见关闭记录。卧室窗户在老人就寝时仍处于打开状态,结合独居老人场景需关注,但夏季通风属常见行为。\",\n \"推理步骤6: 温度数据整体呈现正常的夏季日间升温、夜间降温曲线(卧室 21.9°C~24.8°C,客厅 22.9°C~25.8°C,厨房 22.9°C~25.9°C),无异常高温,烟雾报警器全天无触发,排除火灾实际发生的可能。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:54、06:37、11:02、11:30、16:59、17:29),呈现与灶具开关强相关的故障模式\",\n \"08:31 入户门手动开锁进入后,直到 20:40 才记录到门锁上锁,白天门锁状态不明\",\n \"12:15 卧室窗户打开(StateValue=False)后全天无关闭记录,就寝时窗户仍开启\"\n ],\n \"recommended_actions\": [\n \"优先检修或更换厨房温度传感器,排查是否因灶具热辐射或蒸汽导致传感器读数异常(可能是传感器安装位置过近或设备老化)\",\n \"在厨房温度传感器修复前,建议加强对厨房烟雾报警器的依赖,并考虑增加灶具自动关闭定时器作为安全冗余\",\n \"建议设置入户门未锁定超时提醒(如开锁后15分钟未上锁则通知),提升独居老人的居家安全\",\n \"建议设置就寝时间窗户状态检查提醒,确保夜间窗户安全(或至少提醒老人注意)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,共出现在三次做饭时段(05:54、06:37、11:02、11:30、16:59、17:29),说明这不是偶发现象而是可复现的故障模式。", "推理步骤2: 灶具使用期间恰恰是厨房最需要温度监控的时段。传感器在此关键时刻失效,意味着如果发生灶具过热或火灾前兆,系统将无法通过温度异常及时发出预警。对于独居老人家庭,这是一个显著的安全盲区。", "推理步骤3: 其余设备行为和住户活动模式均属正常——老人 05:23 起床、洗漱、做早餐、06:50 出门、08:31 回家(可能是晨练)、午休、晚餐、20:40 就寝,作息规律合理。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤4: 08:31 入户门开锁后未见关门上锁记录,直到 20:40 才出现门锁上锁和门传感器关闭状态。这意味着老人白天在家期间入户门可能长时间处于未锁状态,存在一定的入侵风险,但考虑到老人在家且客厅有人活动,风险等级不高。", "推理步骤5: 12:15 卧室窗户传感器报告 StateValue=False(窗户打开),之后未见关闭记录。卧室窗户在老人就寝时仍处于打开状态,结合独居老人场景需关注,但夏季通风属常见行为。", "推理步骤6: 温度数据整体呈现正常的夏季日间升温、夜间降温曲线(卧室 21.9°C~24.8°C,客厅 22.9°C~25.8°C,厨房 22.9°C~25.9°C),无异常高温,烟雾报警器全天无触发,排除火灾实际发生的可能。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:54、06:37、11:02、11:30、16:59、17:29),呈现与灶具开关强相关的故障模式", "08:31 入户门手动开锁进入后,直到 20:40 才记录到门锁上锁,白天门锁状态不明", "12:15 卧室窗户打开(StateValue=False)后全天无关闭记录,就寝时窗户仍开启"], "recommended_actions": ["优先检修或更换厨房温度传感器,排查是否因灶具热辐射或蒸汽导致传感器读数异常(可能是传感器安装位置过近或设备老化)", "在厨房温度传感器修复前,建议加强对厨房烟雾报警器的依赖,并考虑增加灶具自动关闭定时器作为安全冗余", "建议设置入户门未锁定超时提醒(如开锁后15分钟未上锁则通知),提升独居老人的居家安全", "建议设置就寝时间窗户状态检查提醒,确保夜间窗户安全(或至少提醒老人注意)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.588419198989868, "api_error": null} {"episode_id": "SQ4_FP_D_0918", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0918.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-02T00:00:00", "seed": 20261547, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bedroom", "injection_time": "2026-06-02T11:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或被高温干扰,削弱了厨房火灾监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:24 起床、05:39 如厕、06:05 做早餐、06:58 出门、08:32 回家、12:22 午休、13:51 起床、16:52 做晚餐、20:21 洗漱、20:45 就寝。这是一个非常规律且合理的独居老人日常作息,无异常行为模式。\",\n \"推理步骤2: 入侵风险排查——06:58 手动开锁出门,门在 8 秒内关闭并自动上锁;08:32 手动开锁回家,门锁操作均为 Manual/Auto 来源,无异常远程或未授权开锁事件。20:45 就寝前系统确认门已关闭(StateValue=True)且已上锁(LockState=1)。全天无未授权入侵迹象。\",\n \"推理步骤3: 灶具使用安全分析——三次使用灶具:06:05-06:26(约 21 分钟)、10:57-11:37(约 40 分钟)、16:52-17:21(约 29 分钟),每次使用后均正常关闭,未出现长时间无人看管的情况(厨房运动传感器在开火前均检测到人)。烟雾报警器全天未触发,无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 均报告 MeasuredValue = None(06:06、06:27、10:58、11:38、16:53、17:22),共 6 次。而灶具关闭后的下一个整点/半点读数恢复正常。这说明传感器在灶具工作时无法正常采集温度,可能是高温超出量程、传感器通信中断或硬件故障。\",\n \"推理步骤5: 该故障的风险评估——厨房温度传感器是火灾早期预警的重要辅助手段。如果传感器在灶具使用(最容易发生火灾的时段)恰好失效,则无法通过温度异常升高来提前发现火情,只能依赖烟雾报警器作为最后防线。对独居老人而言,这降低了安全冗余度。\",\n \"推理步骤6: 其他设备状态正常——温度曲线符合夏季昼夜变化规律(夜间 22-23°C,午间峰值约 25.8°C);漏水传感器全天无报警;烟雾报警器全天无触发;所有门窗传感器工作正常;入户门就寝前已确认锁好。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启期间 6 次报告 MeasuredValue = None(06:06、06:27、10:58、11:38、16:53、17:22),灶具关闭后恢复正常读数\",\n \"故障仅在 kitchen_cook_surface OnOff=True 期间出现,具有明确的关联性,非随机丢失\",\n \"08:32 老人回家后入户门未及时关闭/上锁(日志中未见 front_door_contact=True 和 LockState=1),直到 20:45 就寝时才确认门锁状态——存在白天门锁状态不明的窗口期\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温超量程,建议将其移至距灶具较远但仍能监测厨房整体温度的位置\",\n \"对厨房温度传感器进行固件检查或更换,排除硬件故障可能\",\n \"考虑为灶具添加自动超时关闭规则(如持续开启超过 45 分钟自动断气/断电),为独居老人增加安全保障\",\n \"检查入户门锁的自动上锁策略——08:32 回家后日志中未记录关门上锁事件,建议配置入门后自动关门提醒或延时自动上锁功能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或被高温干扰,削弱了厨房火灾监测能力。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:24 起床、05:39 如厕、06:05 做早餐、06:58 出门、08:32 回家、12:22 午休、13:51 起床、16:52 做晚餐、20:21 洗漱、20:45 就寝。这是一个非常规律且合理的独居老人日常作息,无异常行为模式。", "推理步骤2: 入侵风险排查——06:58 手动开锁出门,门在 8 秒内关闭并自动上锁;08:32 手动开锁回家,门锁操作均为 Manual/Auto 来源,无异常远程或未授权开锁事件。20:45 就寝前系统确认门已关闭(StateValue=True)且已上锁(LockState=1)。全天无未授权入侵迹象。", "推理步骤3: 灶具使用安全分析——三次使用灶具:06:05-06:26(约 21 分钟)、10:57-11:37(约 40 分钟)、16:52-17:21(约 29 分钟),每次使用后均正常关闭,未出现长时间无人看管的情况(厨房运动传感器在开火前均检测到人)。烟雾报警器全天未触发,无火灾风险。", "推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 均报告 MeasuredValue = None(06:06、06:27、10:58、11:38、16:53、17:22),共 6 次。而灶具关闭后的下一个整点/半点读数恢复正常。这说明传感器在灶具工作时无法正常采集温度,可能是高温超出量程、传感器通信中断或硬件故障。", "推理步骤5: 该故障的风险评估——厨房温度传感器是火灾早期预警的重要辅助手段。如果传感器在灶具使用(最容易发生火灾的时段)恰好失效,则无法通过温度异常升高来提前发现火情,只能依赖烟雾报警器作为最后防线。对独居老人而言,这降低了安全冗余度。", "推理步骤6: 其他设备状态正常——温度曲线符合夏季昼夜变化规律(夜间 22-23°C,午间峰值约 25.8°C);漏水传感器全天无报警;烟雾报警器全天无触发;所有门窗传感器工作正常;入户门就寝前已确认锁好。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启期间 6 次报告 MeasuredValue = None(06:06、06:27、10:58、11:38、16:53、17:22),灶具关闭后恢复正常读数", "故障仅在 kitchen_cook_surface OnOff=True 期间出现,具有明确的关联性,非随机丢失", "08:32 老人回家后入户门未及时关闭/上锁(日志中未见 front_door_contact=True 和 LockState=1),直到 20:45 就寝时才确认门锁状态——存在白天门锁状态不明的窗口期"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温超量程,建议将其移至距灶具较远但仍能监测厨房整体温度的位置", "对厨房温度传感器进行固件检查或更换,排除硬件故障可能", "考虑为灶具添加自动超时关闭规则(如持续开启超过 45 分钟自动断气/断电),为独居老人增加安全保障", "检查入户门锁的自动上锁策略——08:32 回家后日志中未记录关门上锁事件,建议配置入门后自动关门提醒或延时自动上锁功能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.034072875976562, "api_error": null} {"episode_id": "SQ4_FP_D_0925", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0925.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261554, "scenario_id": "BA-03", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-03-FP", "scenario_name": "BA-03-FP: 小孩玩开关", "category": "behavioral_anomaly", "is_anomaly": false, "threat_type": "none", "key_difference": "只在儿童房一个房间内发生,kids_room_occupancy=1,有小孩在场", "target_room": "kitchen", "injection_time": "2026-06-08T14:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,客厅灯在 14:08 出现快速闪烁异常,同时 08:31 老人回家后入户门未重新上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:04、06:41、11:00、11:30、17:06、17:39),共出现 6 次。虽然灶具工作时热辐射可能干扰传感器,但正常传感器应报告数值而非 None,这表明传感器可能存在故障或通信异常。\",\n \"推理步骤2: 14:08 客厅灯在 6 秒内经历了 开→关→开→关 的快速切换(14:08:02 On → 14:08:04 Off → 14:08:06 On → 14:08:08 Off)。对于独居老人来说,这种快速反复操作不符合正常使用习惯,可能是设备故障、线路接触不良,或者老人操作困难的信号。此外该条日志的设备 ID 标记为 living_room_light 却上报了 OccupancySensing.Occupancy 属性,存在数据上报异常。\",\n \"推理步骤3: 08:31 老人回家时,门锁解锁(LockState=2)、门传感器检测到开门(StateValue=False),但之后没有关门(无 StateValue=True)和重新上锁的记录。直到 20:36 才出现门传感器 StateValue=True 和自动上锁。这意味着入户门可能从 08:31 到 20:36 长达约 12 小时处于未锁定甚至未关闭状态,对独居老人存在安全隐患。\",\n \"推理步骤4: 老人的整体生活作息基本正常——05:30 起床、06:03 做早餐、07:08 出门、08:31 回家、12:38 午休、14:06 起床、17:05 做晚餐、20:33 洗漱、20:36 就寝。卧室运动传感器在夜间(00:00-05:30)无活动记录属正常睡眠状态。\",\n \"推理步骤5: 温度数据整体合理,夜间约 22-23°C,午间峰值约 25.5-25.8°C,符合夏季室内温度变化规律。烟雾报警器和漏水传感器全天无告警,无火灾或漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 6 次报告 MeasuredValue = None(06:04、06:41、11:00、11:30、17:06、17:39)\",\n \"客厅灯 14:08:02-14:08:08 在 6 秒内快速开关 4 次,且 living_room_light 设备错误上报了 OccupancySensing.Occupancy 属性\",\n \"入户门 08:31 解锁开门后无关门和上锁记录,直到 20:36 才重新关门上锁,期间约 12 小时门锁处于开放状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热源干扰或传感器本身故障,必要时更换或重新定位\",\n \"检查客厅灯及其控制电路,排查快速闪烁是灯具故障、开关接触不良还是智能控制模块异常\",\n \"排查 living_room_light 设备上报 OccupancySensing 属性的数据通道异常,可能是 Matter 设备端点配置错误\",\n \"为入户门锁设置「长时间未锁定」自动提醒规则,例如解锁超过 5 分钟未重新上锁时向老人或家属推送通知\",\n \"建议家属关注老人操作灯具的行为,快速反复开关可能反映操作困难或身体不适\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,客厅灯在 14:08 出现快速闪烁异常,同时 08:31 老人回家后入户门未重新上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(06:04、06:41、11:00、11:30、17:06、17:39),共出现 6 次。虽然灶具工作时热辐射可能干扰传感器,但正常传感器应报告数值而非 None,这表明传感器可能存在故障或通信异常。", "推理步骤2: 14:08 客厅灯在 6 秒内经历了 开→关→开→关 的快速切换(14:08:02 On → 14:08:04 Off → 14:08:06 On → 14:08:08 Off)。对于独居老人来说,这种快速反复操作不符合正常使用习惯,可能是设备故障、线路接触不良,或者老人操作困难的信号。此外该条日志的设备 ID 标记为 living_room_light 却上报了 OccupancySensing.Occupancy 属性,存在数据上报异常。", "推理步骤3: 08:31 老人回家时,门锁解锁(LockState=2)、门传感器检测到开门(StateValue=False),但之后没有关门(无 StateValue=True)和重新上锁的记录。直到 20:36 才出现门传感器 StateValue=True 和自动上锁。这意味着入户门可能从 08:31 到 20:36 长达约 12 小时处于未锁定甚至未关闭状态,对独居老人存在安全隐患。", "推理步骤4: 老人的整体生活作息基本正常——05:30 起床、06:03 做早餐、07:08 出门、08:31 回家、12:38 午休、14:06 起床、17:05 做晚餐、20:33 洗漱、20:36 就寝。卧室运动传感器在夜间(00:00-05:30)无活动记录属正常睡眠状态。", "推理步骤5: 温度数据整体合理,夜间约 22-23°C,午间峰值约 25.5-25.8°C,符合夏季室内温度变化规律。烟雾报警器和漏水传感器全天无告警,无火灾或漏水风险。"], "key_evidence": ["厨房温度传感器 6 次报告 MeasuredValue = None(06:04、06:41、11:00、11:30、17:06、17:39)", "客厅灯 14:08:02-14:08:08 在 6 秒内快速开关 4 次,且 living_room_light 设备错误上报了 OccupancySensing.Occupancy 属性", "入户门 08:31 解锁开门后无关门和上锁记录,直到 20:36 才重新关门上锁,期间约 12 小时门锁处于开放状态"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具热源干扰或传感器本身故障,必要时更换或重新定位", "检查客厅灯及其控制电路,排查快速闪烁是灯具故障、开关接触不良还是智能控制模块异常", "排查 living_room_light 设备上报 OccupancySensing 属性的数据通道异常,可能是 Matter 设备端点配置错误", "为入户门锁设置「长时间未锁定」自动提醒规则,例如解锁超过 5 分钟未重新上锁时向老人或家属推送通知", "建议家属关注老人操作灯具的行为,快速反复开关可能反映操作困难或身体不适"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.617743253707886, "api_error": null} {"episode_id": "SQ4_FP_D_0931", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0931.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261560, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-10T18:55:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时客厅空调运行期间出现温度异常波动,需关注设备工作状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在三次烹饪期间(06:03、11:10、16:56)及灶具关闭后(06:25、11:21、17:33)均报告 MeasuredValue = None,共计6次。正常传感器在高温环境下应报告具体数值而非 None,这表明传感器可能因高温导致读数溢出或硬件故障。\",\n \"推理步骤2: 该故障对独居老人尤其危险——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具工作时失效,一旦发生干烧或过热,系统将无法通过温度异常及时发出预警,只能依赖烟雾报警器作为最后防线。\",\n \"推理步骤3: 客厅空调于 18:55 开启,但客厅温度出现锯齿状波动:18:55 报 2500 → 19:00 降至 2430 → 19:25 回升至 2502 → 19:30 降至 2425 → 19:55 又升至 2498 → 20:00 降至 2415 → 20:25 升至 2501 → 20:30 降至 2413。这种约每25-30分钟一次、幅度约 0.7-0.9°C 的规律性波动,可能是空调短循环(short cycling)或温度传感器受空调气流干扰所致,需要关注。\",\n \"推理步骤4: 入户门在 08:39 开锁进入后,直到 20:49 才记录到门锁上锁和门关闭状态。期间长达约12小时没有门锁上锁记录,说明老人外出回来后门可能一直未锁,存在一定安全隐患。但考虑到老人在家且无入侵迹象,风险等级不高。\",\n \"推理步骤5: 其余行为模式正常——老人 05:24 起床、05:45 如厕、06:02 做早餐、07:09 出门(门自动上锁)、08:39 回家、11:09 做午餐、12:27 午休拉窗帘、14:09 起床、16:55 做晚餐、20:21 洗漱、20:49 就寝,符合独居老人的典型日常作息。烟雾报警器和漏水传感器全天无告警,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:03、06:25、11:10、11:21、16:56、17:33),正常传感器不应在此场景下返回空值\",\n \"客厅空调开启后(18:55起),客厅温度在 2415-2502 之间呈现规律性锯齿波动,约每25-30分钟一个周期\",\n \"入户门 08:39 开锁后至 20:49 期间无上锁记录,门可能长时间未锁\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其在高温环境下能正常工作;在更换前可考虑降低烟雾报警器的告警阈值作为补偿\",\n \"检查客厅空调是否存在短循环问题(频繁启停),或调整客厅温度传感器位置使其远离空调出风口,以获得更稳定的温度读数\",\n \"为入户门锁设置自动提醒规则:若开锁后超过一定时间未上锁,向老人或家属发送提醒通知\",\n \"鉴于独居老人场景,建议为厨房灶具增加超时自动关闭规则(如超过30-40分钟未手动关闭则自动断电),防止忘记关火\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时客厅空调运行期间出现温度异常波动,需关注设备工作状态。", "reasoning": ["推理步骤1: 厨房温度传感器在三次烹饪期间(06:03、11:10、16:56)及灶具关闭后(06:25、11:21、17:33)均报告 MeasuredValue = None,共计6次。正常传感器在高温环境下应报告具体数值而非 None,这表明传感器可能因高温导致读数溢出或硬件故障。", "推理步骤2: 该故障对独居老人尤其危险——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具工作时失效,一旦发生干烧或过热,系统将无法通过温度异常及时发出预警,只能依赖烟雾报警器作为最后防线。", "推理步骤3: 客厅空调于 18:55 开启,但客厅温度出现锯齿状波动:18:55 报 2500 → 19:00 降至 2430 → 19:25 回升至 2502 → 19:30 降至 2425 → 19:55 又升至 2498 → 20:00 降至 2415 → 20:25 升至 2501 → 20:30 降至 2413。这种约每25-30分钟一次、幅度约 0.7-0.9°C 的规律性波动,可能是空调短循环(short cycling)或温度传感器受空调气流干扰所致,需要关注。", "推理步骤4: 入户门在 08:39 开锁进入后,直到 20:49 才记录到门锁上锁和门关闭状态。期间长达约12小时没有门锁上锁记录,说明老人外出回来后门可能一直未锁,存在一定安全隐患。但考虑到老人在家且无入侵迹象,风险等级不高。", "推理步骤5: 其余行为模式正常——老人 05:24 起床、05:45 如厕、06:02 做早餐、07:09 出门(门自动上锁)、08:39 回家、11:09 做午餐、12:27 午休拉窗帘、14:09 起床、16:55 做晚餐、20:21 洗漱、20:49 就寝,符合独居老人的典型日常作息。烟雾报警器和漏水传感器全天无告警,无入侵迹象。"], "key_evidence": ["厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:03、06:25、11:10、11:21、16:56、17:33),正常传感器不应在此场景下返回空值", "客厅空调开启后(18:55起),客厅温度在 2415-2502 之间呈现规律性锯齿波动,约每25-30分钟一个周期", "入户门 08:39 开锁后至 20:49 期间无上锁记录,门可能长时间未锁"], "recommended_actions": ["检查或更换厨房温度传感器,确认其在高温环境下能正常工作;在更换前可考虑降低烟雾报警器的告警阈值作为补偿", "检查客厅空调是否存在短循环问题(频繁启停),或调整客厅温度传感器位置使其远离空调出风口,以获得更稳定的温度读数", "为入户门锁设置自动提醒规则:若开锁后超过一定时间未上锁,向老人或家属发送提醒通知", "鉴于独居老人场景,建议为厨房灶具增加超时自动关闭规则(如超过30-40分钟未手动关闭则自动断电),防止忘记关火"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.2876877784729, "api_error": null} {"episode_id": "SQ4_FP_D_0934", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0934.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261563, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bathroom", "injection_time": "2026-06-06T21:58:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时老人入户门在外出后未及时上锁存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None(06:01、06:35、11:11、11:29、17:06、17:38),共出现6次。正常传感器在灶具工作时应报告升高的温度值而非空值,这说明传感器可能因高温干扰、通信故障或硬件问题导致读数丢失。\",\n \"推理步骤2: 该故障对独居老人构成间接安全风险——如果灶具忘关或发生火情,温度传感器无法提供有效数据,系统将无法基于温度异常触发报警,削弱了厨房火灾预警能力。\",\n \"推理步骤3: 老人 07:01 手动开锁出门,门关闭后自动上锁,这是正常的。08:25 老人回家开锁进门,但日志中未见该次开锁后的重新上锁记录,直到 20:54 才出现下一次自动上锁。这意味着入户门可能在 08:25 至 20:54 之间长时间处于未锁状态。\",\n \"推理步骤4: 22:28 老人已在卧室就寝(20:54 关灯入睡),但 22:28 客厅运动传感器检测到有人活动(Occupancy=1),而此时老人应在卧室睡觉。这可能是传感器误触发(宠物、窗帘飘动等),但对于独居老人场景需要关注。\",\n \"推理步骤5: 整体生活作息方面,老人 05:33 起床、06:00 做早餐、07:01 出门、08:25 回家、11:10 做午餐、12:40-13:59 午休、17:05 做晚餐、20:54 就寝,作息规律合理,未见长时间无活动的健康异常信号。\",\n \"推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室约 21.9°C~24.7°C,客厅约 23.0°C~25.8°C,厨房约 22.9°C~25.8°C),未见异常高温或骤变,排除火灾和暖通故障。\",\n \"推理步骤7: 烟雾报警器、漏水传感器全天无告警,门窗传感器状态正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(06:01、06:35、11:11、11:29、17:06、17:38),灶具关闭后恢复正常读数\",\n \"08:25 入户门手动开锁后,日志中无对应的上锁记录,直到 20:54 才出现自动上锁事件,门可能长时间未锁\",\n \"22:28 老人已就寝后客厅运动传感器触发 Occupancy=1,来源不明\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温干扰导致读数异常,必要时更换或重新定位传感器,确保灶具使用期间温度监控不中断\",\n \"检查入户门锁的自动上锁策略,建议配置开锁后超时自动上锁(如30秒),避免长时间未锁状态\",\n \"排查 22:28 客厅运动传感器触发原因,确认是否为误报;如频繁发生,调整传感器灵敏度或位置\",\n \"考虑为厨房灶具增加超时自动关闭功能(如超过40分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时老人入户门在外出后未及时上锁存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后反复报告 MeasuredValue = None(06:01、06:35、11:11、11:29、17:06、17:38),共出现6次。正常传感器在灶具工作时应报告升高的温度值而非空值,这说明传感器可能因高温干扰、通信故障或硬件问题导致读数丢失。", "推理步骤2: 该故障对独居老人构成间接安全风险——如果灶具忘关或发生火情,温度传感器无法提供有效数据,系统将无法基于温度异常触发报警,削弱了厨房火灾预警能力。", "推理步骤3: 老人 07:01 手动开锁出门,门关闭后自动上锁,这是正常的。08:25 老人回家开锁进门,但日志中未见该次开锁后的重新上锁记录,直到 20:54 才出现下一次自动上锁。这意味着入户门可能在 08:25 至 20:54 之间长时间处于未锁状态。", "推理步骤4: 22:28 老人已在卧室就寝(20:54 关灯入睡),但 22:28 客厅运动传感器检测到有人活动(Occupancy=1),而此时老人应在卧室睡觉。这可能是传感器误触发(宠物、窗帘飘动等),但对于独居老人场景需要关注。", "推理步骤5: 整体生活作息方面,老人 05:33 起床、06:00 做早餐、07:01 出门、08:25 回家、11:10 做午餐、12:40-13:59 午休、17:05 做晚餐、20:54 就寝,作息规律合理,未见长时间无活动的健康异常信号。", "推理步骤6: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室约 21.9°C~24.7°C,客厅约 23.0°C~25.8°C,厨房约 22.9°C~25.8°C),未见异常高温或骤变,排除火灾和暖通故障。", "推理步骤7: 烟雾报警器、漏水传感器全天无告警,门窗传感器状态正常,无入侵迹象。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(06:01、06:35、11:11、11:29、17:06、17:38),灶具关闭后恢复正常读数", "08:25 入户门手动开锁后,日志中无对应的上锁记录,直到 20:54 才出现自动上锁事件,门可能长时间未锁", "22:28 老人已就寝后客厅运动传感器触发 Occupancy=1,来源不明"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温干扰导致读数异常,必要时更换或重新定位传感器,确保灶具使用期间温度监控不中断", "检查入户门锁的自动上锁策略,建议配置开锁后超时自动上锁(如30秒),避免长时间未锁状态", "排查 22:28 客厅运动传感器触发原因,确认是否为误报;如频繁发生,调整传感器灵敏度或位置", "考虑为厨房灶具增加超时自动关闭功能(如超过40分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.01492428779602, "api_error": null} {"episode_id": "SQ4_FP_D_0937", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0937.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261566, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-18T09:00:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出期间未锁闭约1.5小时,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在三次做饭期间(06:06、10:53、16:52)以及灶具关闭后(06:23、11:27、17:33)均报告 MeasuredValue = None,共出现6次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在硬件故障、量程溢出或连接问题。\",\n \"推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果传感器无法正常读数,当厨房发生真正的高温异常(如忘关灶具导致温度持续升高)时,系统将无法及时发出预警。\",\n \"推理步骤3: 老人于 07:04 手动开锁出门,门自动上锁。但 08:35 老人回家时,门锁状态显示为手动开锁(LockState=2,即 Unlocked),说明入户门在 07:04 至 08:35 约 1.5 小时内处于可进入状态。虽然门传感器显示门本身是关闭的(07:04:17 StateValue=True),但门锁在 07:04:18 自动上锁后,08:35 的开锁操作是 Manual 而非远程,流程基本正常。\",\n \"推理步骤4: 09:00 出现一次门锁操作错误事件(LockOperationError, OperationError=1, OperationSource=3),20秒后通过 UserIndex=1 成功开锁。单次错误可能是密码输入错误或指纹识别失败,但需要关注是否有陌生人尝试开锁。OperationSource=3 通常表示远程或键盘操作。\",\n \"推理步骤5: 老人的日常作息模式基本正常——05:24起床、05:48洗漱、06:05做早餐、07:04外出、08:35回家、10:52做午饭前准备、12:26午休(拉窗帘)、13:56起床、16:51做晚餐、19:20看电视(客厅灯调暗至22/254)、20:34洗漱、20:43就寝。生活规律,未发现健康异常信号。\",\n \"推理步骤6: 温度数据整体合理,夜间卧室约21.9-22.1°C,白天峰值客厅约25.8°C、厨房约25.9°C,符合6月夏季气温变化规律。卧室始终比其他房间低约1°C,可能是朝向或通风原因,属正常范围。\",\n \"推理步骤7: 所有烟雾报警器、漏水传感器在整个日志周期内均无触发记录,水电安全状况良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:06、06:23、10:53、11:27、16:52、17:33),每次做饭都复现,高度一致\",\n \"09:00:00 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁\",\n \"老人全天作息规律,起居、做饭、午休、就寝时间合理,未出现长时间无活动的健康告警信号\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:该传感器在高温环境下反复失效,无法为独居老人提供可靠的厨房安全监测,建议尽快排查是否为传感器量程不足、接线松动或硬件老化问题\",\n \"排查 09:00 门锁操作错误来源:确认 OperationSource=3(键盘/远程)的操作是否为老人本人或授权家属所为,如非本人操作,建议更换门锁密码并检查是否有可疑访问记录\",\n \"考虑为厨房增加独立的高温报警机制:鉴于温度传感器在做饭时失效,可增加一个耐高温的独立温度监测设备作为冗余保护\",\n \"建议为独居老人启用长时间无活动告警:如卧室/卫生间/客厅运动传感器超过一定时间(如4小时白天)无任何触发,自动通知紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人外出期间未锁闭约1.5小时,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在三次做饭期间(06:06、10:53、16:52)以及灶具关闭后(06:23、11:27、17:33)均报告 MeasuredValue = None,共出现6次。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器可能存在硬件故障、量程溢出或连接问题。", "推理步骤2: 厨房温度传感器故障对独居老人尤其危险——如果传感器无法正常读数,当厨房发生真正的高温异常(如忘关灶具导致温度持续升高)时,系统将无法及时发出预警。", "推理步骤3: 老人于 07:04 手动开锁出门,门自动上锁。但 08:35 老人回家时,门锁状态显示为手动开锁(LockState=2,即 Unlocked),说明入户门在 07:04 至 08:35 约 1.5 小时内处于可进入状态。虽然门传感器显示门本身是关闭的(07:04:17 StateValue=True),但门锁在 07:04:18 自动上锁后,08:35 的开锁操作是 Manual 而非远程,流程基本正常。", "推理步骤4: 09:00 出现一次门锁操作错误事件(LockOperationError, OperationError=1, OperationSource=3),20秒后通过 UserIndex=1 成功开锁。单次错误可能是密码输入错误或指纹识别失败,但需要关注是否有陌生人尝试开锁。OperationSource=3 通常表示远程或键盘操作。", "推理步骤5: 老人的日常作息模式基本正常——05:24起床、05:48洗漱、06:05做早餐、07:04外出、08:35回家、10:52做午饭前准备、12:26午休(拉窗帘)、13:56起床、16:51做晚餐、19:20看电视(客厅灯调暗至22/254)、20:34洗漱、20:43就寝。生活规律,未发现健康异常信号。", "推理步骤6: 温度数据整体合理,夜间卧室约21.9-22.1°C,白天峰值客厅约25.8°C、厨房约25.9°C,符合6月夏季气温变化规律。卧室始终比其他房间低约1°C,可能是朝向或通风原因,属正常范围。", "推理步骤7: 所有烟雾报警器、漏水传感器在整个日志周期内均无触发记录,水电安全状况良好。"], "key_evidence": ["厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:06、06:23、10:53、11:27、16:52、17:33),每次做饭都复现,高度一致", "09:00:00 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后由 UserIndex=1 成功开锁", "老人全天作息规律,起居、做饭、午休、就寝时间合理,未出现长时间无活动的健康告警信号"], "recommended_actions": ["检修或更换厨房温度传感器:该传感器在高温环境下反复失效,无法为独居老人提供可靠的厨房安全监测,建议尽快排查是否为传感器量程不足、接线松动或硬件老化问题", "排查 09:00 门锁操作错误来源:确认 OperationSource=3(键盘/远程)的操作是否为老人本人或授权家属所为,如非本人操作,建议更换门锁密码并检查是否有可疑访问记录", "考虑为厨房增加独立的高温报警机制:鉴于温度传感器在做饭时失效,可增加一个耐高温的独立温度监测设备作为冗余保护", "建议为独居老人启用长时间无活动告警:如卧室/卫生间/客厅运动传感器超过一定时间(如4小时白天)无任何触发,自动通知紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.7210590839386, "api_error": null} {"episode_id": "SQ4_FP_D_0948", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0948.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261577, "scenario_id": "EL-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-01-FP", "scenario_name": "EL-01-FP: 老人泡澡/长时间如厕", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "最终有正常的离开动作(关灯+其他房间活动),虽然时间较长但有结束信号", "target_room": "bathroom", "injection_time": "2026-06-06T11:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:05、11:04、17:05),且在灶具关闭后仍报告 None(06:41、11:36、17:28),说明传感器在烹饪场景下持续失效。\",\n \"推理步骤2: 对于独居老人家庭,厨房温度监测是火灾早期预警的关键环节。传感器在灶具使用时恰好失效,意味着如果发生干烧或油温过高,系统无法通过温度异常及时发出警报。\",\n \"推理步骤3: 其余行为模式正常——老人05:35起床、06:53出门晨练、08:37回家、12:35午休、20:37就寝,作息规律;门锁操作均为手动开锁+自动回锁,无异常入侵迹象;漏水传感器和烟雾报警器未触发;室温随日照自然升降,无异常热源。\",\n \"推理步骤4: 08:37回家时门锁解锁但未见门关闭(front_door_contact 未恢复为 True),直到20:37才记录门关闭并上锁,存在入户门长时间未关闭/未上锁的可能,对独居老人有安全隐患。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次烹饪期间(06:05、11:04、17:05)及灶具关闭后(06:41、11:36、17:28)均报告 MeasuredValue = None\",\n \"08:37 门锁解锁、门打开(StateValue=False),但直到20:37才出现门关闭记录(StateValue=True),期间约12小时门可能处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其在高温环境下能正常工作,恢复厨房火灾早期预警能力\",\n \"为灶具设置无人看管超时自动关闭规则(如灶具开启超过30分钟且厨房无人活动则自动断气/断电)\",\n \"配置入户门长时间未锁定提醒,若门锁处于解锁状态超过设定时间(如10分钟)则推送通知给老人或紧急联系人\",\n \"确认烟雾报警器(kitchen_smoke_alarm)电池及功能正常,作为温度传感器失效时的备用火灾检测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾预警能力。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:05、11:04、17:05),且在灶具关闭后仍报告 None(06:41、11:36、17:28),说明传感器在烹饪场景下持续失效。", "推理步骤2: 对于独居老人家庭,厨房温度监测是火灾早期预警的关键环节。传感器在灶具使用时恰好失效,意味着如果发生干烧或油温过高,系统无法通过温度异常及时发出警报。", "推理步骤3: 其余行为模式正常——老人05:35起床、06:53出门晨练、08:37回家、12:35午休、20:37就寝,作息规律;门锁操作均为手动开锁+自动回锁,无异常入侵迹象;漏水传感器和烟雾报警器未触发;室温随日照自然升降,无异常热源。", "推理步骤4: 08:37回家时门锁解锁但未见门关闭(front_door_contact 未恢复为 True),直到20:37才记录门关闭并上锁,存在入户门长时间未关闭/未上锁的可能,对独居老人有安全隐患。"], "key_evidence": ["kitchen_temp_sensor 在三次烹饪期间(06:05、11:04、17:05)及灶具关闭后(06:41、11:36、17:28)均报告 MeasuredValue = None", "08:37 门锁解锁、门打开(StateValue=False),但直到20:37才出现门关闭记录(StateValue=True),期间约12小时门可能处于未锁定状态"], "recommended_actions": ["检查或更换厨房温度传感器,确认其在高温环境下能正常工作,恢复厨房火灾早期预警能力", "为灶具设置无人看管超时自动关闭规则(如灶具开启超过30分钟且厨房无人活动则自动断气/断电)", "配置入户门长时间未锁定提醒,若门锁处于解锁状态超过设定时间(如10分钟)则推送通知给老人或紧急联系人", "确认烟雾报警器(kitchen_smoke_alarm)电池及功能正常,作为温度传感器失效时的备用火灾检测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.664629220962524, "api_error": null} {"episode_id": "SQ4_FP_D_0954", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0954.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261583, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-06T17:16:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人看管状态下持续运行,且厨房温度传感器出现异常高温读数和多次 null 值,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 17:16 厨房灶具仍处于开启状态(OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,说明老人已离开厨房,灶具处于无人看管状态。\",\n \"推理步骤2: 17:21 厨房温度传感器报告 MeasuredValue = 2700(即 27.00°C),相比同时段客厅 24.79°C 和卧室 23.77°C 明显偏高;17:46 进一步升至 2750(27.50°C),而灶具已于 17:32 关闭,温度仍在上升属于异常滞后或传感器受热影响。\",\n \"推理步骤3: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:10、06:30、10:52、11:23、16:52、17:33),共出现 6 次空值。这可能表明传感器因高温或故障导致读数丢失,设备健康状态存疑。\",\n \"推理步骤4: 独居老人场景下,灶具无人看管是高危事件。从 17:16(人离开)到 17:32(灶具关闭)有约 16 分钟的无人看管窗口,期间若发生油锅起火等意外,无人能及时处置。\",\n \"推理步骤5: 17:36 老人重新回到厨房(Occupancy = 1),17:46 温度读数 2750 仍然偏高,说明厨房余温较高或存在局部过热。整个过程中厨房烟雾报警器未触发,排除了已发生明火的可能,但风险窗口确实存在。\",\n \"推理步骤6: 入户门在 08:21 开锁后直到日志结束未再上锁(20:44 的锁定事件是自动锁,对应的是门关闭后的自动上锁),08:21 至 20:44 期间门锁状态为 LockState=2(未锁定),独居老人外出期间门锁长时间未锁定也值得关注,但这属于次要风险。\"\n ],\n \"key_evidence\": [\n \"17:16 kitchen_cook_surface OnOff = True 且 kitchen_occupancy Occupancy = 0,灶具开启但厨房无人\",\n \"17:21 厨房温度 2700(27.0°C)、17:46 厨房温度 2750(27.5°C),显著高于其他房间同期温度约 3°C\",\n \"厨房温度传感器全天出现 6 次 MeasuredValue = None,传感器工作状态异常\",\n \"灶具无人看管窗口约 16 分钟(17:16 ~ 17:32)\",\n \"08:21 入户门解锁后至 20:44 期间门锁长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器是否正常工作,排查多次报告 null 值的原因,必要时更换传感器\",\n \"为厨房灶具配置自动化规则:当 kitchen_occupancy 检测到无人超过 5 分钟且灶具仍开启时,自动关闭灶具并发送告警通知\",\n \"为独居老人设置灶具使用时长上限(如 30 分钟),超时自动关闭并提醒\",\n \"配置入户门锁自动化规则:外出后门锁未上锁超过一定时间自动提醒或自动上锁\",\n \"建议在厨房增加燃气泄漏检测器,与烟雾报警器形成多重安全保障\",\n \"将灶具无人看管事件纳入紧急联系人通知流程,确保家属或社区能及时响应\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人看管状态下持续运行,且厨房温度传感器出现异常高温读数和多次 null 值,存在火灾风险。", "reasoning": ["推理步骤1: 17:16 厨房灶具仍处于开启状态(OnOff = True),但同一时刻厨房运动传感器显示 Occupancy = 0,说明老人已离开厨房,灶具处于无人看管状态。", "推理步骤2: 17:21 厨房温度传感器报告 MeasuredValue = 2700(即 27.00°C),相比同时段客厅 24.79°C 和卧室 23.77°C 明显偏高;17:46 进一步升至 2750(27.50°C),而灶具已于 17:32 关闭,温度仍在上升属于异常滞后或传感器受热影响。", "推理步骤3: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(06:10、06:30、10:52、11:23、16:52、17:33),共出现 6 次空值。这可能表明传感器因高温或故障导致读数丢失,设备健康状态存疑。", "推理步骤4: 独居老人场景下,灶具无人看管是高危事件。从 17:16(人离开)到 17:32(灶具关闭)有约 16 分钟的无人看管窗口,期间若发生油锅起火等意外,无人能及时处置。", "推理步骤5: 17:36 老人重新回到厨房(Occupancy = 1),17:46 温度读数 2750 仍然偏高,说明厨房余温较高或存在局部过热。整个过程中厨房烟雾报警器未触发,排除了已发生明火的可能,但风险窗口确实存在。", "推理步骤6: 入户门在 08:21 开锁后直到日志结束未再上锁(20:44 的锁定事件是自动锁,对应的是门关闭后的自动上锁),08:21 至 20:44 期间门锁状态为 LockState=2(未锁定),独居老人外出期间门锁长时间未锁定也值得关注,但这属于次要风险。"], "key_evidence": ["17:16 kitchen_cook_surface OnOff = True 且 kitchen_occupancy Occupancy = 0,灶具开启但厨房无人", "17:21 厨房温度 2700(27.0°C)、17:46 厨房温度 2750(27.5°C),显著高于其他房间同期温度约 3°C", "厨房温度传感器全天出现 6 次 MeasuredValue = None,传感器工作状态异常", "灶具无人看管窗口约 16 分钟(17:16 ~ 17:32)", "08:21 入户门解锁后至 20:44 期间门锁长时间处于未锁定状态"], "recommended_actions": ["立即检查厨房温度传感器是否正常工作,排查多次报告 null 值的原因,必要时更换传感器", "为厨房灶具配置自动化规则:当 kitchen_occupancy 检测到无人超过 5 分钟且灶具仍开启时,自动关闭灶具并发送告警通知", "为独居老人设置灶具使用时长上限(如 30 分钟),超时自动关闭并提醒", "配置入户门锁自动化规则:外出后门锁未上锁超过一定时间自动提醒或自动上锁", "建议在厨房增加燃气泄漏检测器,与烟雾报警器形成多重安全保障", "将灶具无人看管事件纳入紧急联系人通知流程,确保家属或社区能及时响应"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.305330991744995, "api_error": null} {"episode_id": "SQ4_FP_D_0953", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_FP_D_0953.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20261582, "scenario_id": "EL-05", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-05-FP", "scenario_name": "EL-05-FP: 偶尔一次起夜", "category": "elderly_specific", "is_anomaly": false, "threat_type": "none", "key_difference": "一晚只有1次卧室→卫生间,属于正常范围", "target_room": "kitchen", "injection_time": "2026-06-23T17:30:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约05:29起床,05:43如厕,06:10做早餐,07:01出门,08:40回家,12:37午休,13:55起床,16:57做晚餐,20:37就寝。作息规律,活动模式正常,无长时间无活动的健康异常信号。\",\n \"推理步骤2: 入侵检测分析——07:01出门时门锁手动解锁、开门、关门、自动上锁,流程完整;08:40回家同样流程正常。20:37就寝前门锁确认为已锁状态(LockState=1),入户门传感器显示关闭(StateValue=True)。全天无异常开锁事件,无未授权访问。\",\n \"推理步骤3: 厨房灶具使用分析——三次使用灶具(06:10-06:29约19分钟,10:54-11:23约29分钟,16:57-17:31约34分钟),每次均在合理时长内关闭,未出现遗忘关火的情况。烟雾报警器全天无触发,无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——每次灶具开启后约30秒,kitchen_temp_sensor 报告 MeasuredValue = None(06:11、10:55、16:58),灶具关闭后约1分钟再次报告 None(11:24、17:32),随后在下一个30分钟整点周期恢复正常数值。这表明传感器在灶具工作时受热源影响读数失效或传感器本身存在间歇性故障。\",\n \"推理步骤5: 该故障的风险评估——厨房温度传感器是监测厨房异常高温(如火灾初期)的关键设备。恰恰在灶具使用(最需要温度监控)时传感器失效,意味着如果发生灶具相关的温度异常,系统将无法及时检测和报警。对独居老人而言,这是一个需要关注的安全监控盲区。\",\n \"推理步骤6: 其他设备状态均正常——温度整体走势符合夏季昼夜变化(夜间约22°C,午间峰值约25.8°C);漏水传感器无触发;窗户传感器无异常;所有运动传感器与老人活动轨迹吻合。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间均报告 MeasuredValue = None(06:11、10:55、16:58开灶后;11:24、17:32关灶后),共出现5次null读数\",\n \"null值仅在灶具开关前后出现,灶具未使用时传感器读数正常,说明故障与灶具使用高度相关\",\n \"其余所有设备(门锁、烟雾报警器、漏水传感器、运动传感器、窗户传感器)全天工作正常,无安全告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新选址安装\",\n \"对厨房温度传感器进行硬件检测,排查是否存在元器件老化或固件缺陷,考虑更换为耐高温型号\",\n \"在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为灶具使用期间的替代安全监控手段\",\n \"考虑为灶具增加自动超时关闭功能(如超过45分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约05:29起床,05:43如厕,06:10做早餐,07:01出门,08:40回家,12:37午休,13:55起床,16:57做晚餐,20:37就寝。作息规律,活动模式正常,无长时间无活动的健康异常信号。", "推理步骤2: 入侵检测分析——07:01出门时门锁手动解锁、开门、关门、自动上锁,流程完整;08:40回家同样流程正常。20:37就寝前门锁确认为已锁状态(LockState=1),入户门传感器显示关闭(StateValue=True)。全天无异常开锁事件,无未授权访问。", "推理步骤3: 厨房灶具使用分析——三次使用灶具(06:10-06:29约19分钟,10:54-11:23约29分钟,16:57-17:31约34分钟),每次均在合理时长内关闭,未出现遗忘关火的情况。烟雾报警器全天无触发,无火灾风险。", "推理步骤4: 厨房温度传感器异常——每次灶具开启后约30秒,kitchen_temp_sensor 报告 MeasuredValue = None(06:11、10:55、16:58),灶具关闭后约1分钟再次报告 None(11:24、17:32),随后在下一个30分钟整点周期恢复正常数值。这表明传感器在灶具工作时受热源影响读数失效或传感器本身存在间歇性故障。", "推理步骤5: 该故障的风险评估——厨房温度传感器是监测厨房异常高温(如火灾初期)的关键设备。恰恰在灶具使用(最需要温度监控)时传感器失效,意味着如果发生灶具相关的温度异常,系统将无法及时检测和报警。对独居老人而言,这是一个需要关注的安全监控盲区。", "推理步骤6: 其他设备状态均正常——温度整体走势符合夏季昼夜变化(夜间约22°C,午间峰值约25.8°C);漏水传感器无触发;窗户传感器无异常;所有运动传感器与老人活动轨迹吻合。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间均报告 MeasuredValue = None(06:11、10:55、16:58开灶后;11:24、17:32关灶后),共出现5次null读数", "null值仅在灶具开关前后出现,灶具未使用时传感器读数正常,说明故障与灶具使用高度相关", "其余所有设备(门锁、烟雾报警器、漏水传感器、运动传感器、窗户传感器)全天工作正常,无安全告警"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新选址安装", "对厨房温度传感器进行硬件检测,排查是否存在元器件老化或固件缺陷,考虑更换为耐高温型号", "在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为灶具使用期间的替代安全监控手段", "考虑为灶具增加自动超时关闭功能(如超过45分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.425498723983765, "api_error": null} {"episode_id": "SQ4_TN_A_0968", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0968.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261597, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现两次异常:18:00 时无人使用灶具却突然飙升至 28.54°C,且在 18:55 和 19:41 两次报告 None(数据丢失),疑似传感器故障或通信异常。此外厨房窗户在做完饭后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 温度趋势分析——凌晨至清晨,三个区域温度稳定在 22-23°C 范围内,随日照升温至中午 12:00-12:30 达到峰值(客厅 ~25.9°C,厨房 ~25.8°C,卧室 ~24.9°C),午后逐步回落,符合夏季自然温度曲线,整体正常。\",\n \"推理步骤2: 厨房温度异常——18:00 厨房温度突然从 24.86°C(17:30)跳升至 28.54°C,而此时灶具尚未开启(灶具 18:54 才开),且同时段客厅和卧室温度仍在正常下降。18:30 厨房仍报 28.56°C。这一跳变幅度(约 3.7°C / 30 分钟)在灶具未使用的情况下不合理,可能是传感器读数漂移或受到局部热源干扰。\",\n \"推理步骤3: 厨房温度传感器两次报告 None——18:55(灶具刚开启后)和 19:41(灶具关闭、窗户打开后)各出现一次 MeasuredValue = None,说明传感器在这两个时刻未能正常采集数据。虽然 19:00 之后恢复了正常数值,但连续出现 None 值表明传感器可能存在间歇性故障或通信不稳定。\",\n \"推理步骤4: 住户行为模式分析——06:37 起床 → 06:53 进卫生间 → 07:09 去厨房 → 07:37 关灯锁门出门,属于典型晨间通勤流程。18:12 回家开门 → 开灯开空调 → 18:54 做饭 → 19:40 关灶开窗 → 19:53 开洗碗机 → 21:48 回卧室关灯拉窗帘 → 22:51 关灯睡觉,属于典型晚间居家流程。所有人员活动模式正常,无入侵迹象。\",\n \"推理步骤5: 安防状态分析——入户门全天仅两次开关(早出晚归),均为 Manual 解锁后自动上锁,门锁状态完整闭合。卧室窗户传感器和客厅窗户传感器全天无变化事件(保持关闭)。无烟雾报警、无漏水报警触发。\",\n \"推理步骤6: 厨房窗户状态——19:40:30 厨房窗户传感器报告 StateValue=False(窗户打开),此后日志中未见关闭记录。虽然做完饭后开窗通风合理,但截至日志结束(23:30)窗户仍处于打开状态,夜间无人区域窗户未关存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.86°C 骤升至 28.54°C,此时灶具未开启,客厅和卧室温度正常下降\",\n \"18:55 和 19:41 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)\",\n \"19:40 厨房窗户打开后至日志结束(23:30)未见关闭记录,夜间窗户持续敞开\",\n \"全天无烟雾报警、无漏水报警、无异常入侵事件,人员活动模式正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态和安装位置,排查 18:00 异常高温读数和两次 None 值的原因,必要时更换传感器或检查无线通信质量\",\n \"关闭厨房窗户或设置自动化规则:当住户进入睡眠模式(卧室灯关闭)时,检查并提醒关闭厨房窗户\",\n \"考虑为厨房温度传感器设置合理的告警阈值,当读数异常跳变或连续出现 None 时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现两次异常:18:00 时无人使用灶具却突然飙升至 28.54°C,且在 18:55 和 19:41 两次报告 None(数据丢失),疑似传感器故障或通信异常。此外厨房窗户在做完饭后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 温度趋势分析——凌晨至清晨,三个区域温度稳定在 22-23°C 范围内,随日照升温至中午 12:00-12:30 达到峰值(客厅 ~25.9°C,厨房 ~25.8°C,卧室 ~24.9°C),午后逐步回落,符合夏季自然温度曲线,整体正常。", "推理步骤2: 厨房温度异常——18:00 厨房温度突然从 24.86°C(17:30)跳升至 28.54°C,而此时灶具尚未开启(灶具 18:54 才开),且同时段客厅和卧室温度仍在正常下降。18:30 厨房仍报 28.56°C。这一跳变幅度(约 3.7°C / 30 分钟)在灶具未使用的情况下不合理,可能是传感器读数漂移或受到局部热源干扰。", "推理步骤3: 厨房温度传感器两次报告 None——18:55(灶具刚开启后)和 19:41(灶具关闭、窗户打开后)各出现一次 MeasuredValue = None,说明传感器在这两个时刻未能正常采集数据。虽然 19:00 之后恢复了正常数值,但连续出现 None 值表明传感器可能存在间歇性故障或通信不稳定。", "推理步骤4: 住户行为模式分析——06:37 起床 → 06:53 进卫生间 → 07:09 去厨房 → 07:37 关灯锁门出门,属于典型晨间通勤流程。18:12 回家开门 → 开灯开空调 → 18:54 做饭 → 19:40 关灶开窗 → 19:53 开洗碗机 → 21:48 回卧室关灯拉窗帘 → 22:51 关灯睡觉,属于典型晚间居家流程。所有人员活动模式正常,无入侵迹象。", "推理步骤5: 安防状态分析——入户门全天仅两次开关(早出晚归),均为 Manual 解锁后自动上锁,门锁状态完整闭合。卧室窗户传感器和客厅窗户传感器全天无变化事件(保持关闭)。无烟雾报警、无漏水报警触发。", "推理步骤6: 厨房窗户状态——19:40:30 厨房窗户传感器报告 StateValue=False(窗户打开),此后日志中未见关闭记录。虽然做完饭后开窗通风合理,但截至日志结束(23:30)窗户仍处于打开状态,夜间无人区域窗户未关存在一定安全隐患。"], "key_evidence": ["18:00 厨房温度从 ~24.86°C 骤升至 28.54°C,此时灶具未开启,客厅和卧室温度正常下降", "18:55 和 19:41 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)", "19:40 厨房窗户打开后至日志结束(23:30)未见关闭记录,夜间窗户持续敞开", "全天无烟雾报警、无漏水报警、无异常入侵事件,人员活动模式正常"], "recommended_actions": ["检查厨房温度传感器的工作状态和安装位置,排查 18:00 异常高温读数和两次 None 值的原因,必要时更换传感器或检查无线通信质量", "关闭厨房窗户或设置自动化规则:当住户进入睡眠模式(卧室灯关闭)时,检查并提醒关闭厨房窗户", "考虑为厨房温度传感器设置合理的告警阈值,当读数异常跳变或连续出现 None 时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.59099578857422, "api_error": null} {"episode_id": "SQ4_TN_A_0959", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0959.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261588, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时入户门在住户回家时未关闭即自动上锁,以及厨房窗户在做饭后开启至今未关闭,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:30 报告 2452(24.52°C),但 19:00 突然跳升至 2831(28.31°C),30 分钟内上升近 3.8°C,而此时灶具尚未开启(19:06:30 才开启),排除烹饪导致的正常升温。\",\n \"推理步骤2: 灶具在 19:06:30 开启后仅 30 秒,19:07:00 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应返回 None。19:30 恢复为 2843 后,19:32 灶具关闭,19:33 再次报告 None。两次 None 读数高度异常,指向传感器间歇性故障。\",\n \"推理步骤3: 19:00 的 2831 异常高温读数可能也是传感器故障的表现——在故障前后出现不合理的跳变值,而非真实环境温度。19:30 的 2843 同理。对比客厅和卧室同时段温度走势平稳下降,进一步排除了真实环境高温的可能。\",\n \"推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险。如果厨房真的在未开灶时就达到 28°C 以上,烟雾报警器和其他传感器应有联动反应,但均无异常。\",\n \"推理步骤5: 住户 18:08 回家开锁进门,但入户门传感器 BooleanState.StateValue = False(门开)后,直到 22:10:37 才报告 StateValue = True(门关)并自动上锁。期间约 4 小时入户门处于未关闭状态,这是一个安全隐患——不过也可能是住户习惯性不关门(在家期间),属于生活习惯范畴。\",\n \"推理步骤6: 厨房窗户在 19:32:30 打开(StateValue = False,做饭后通风),但直到日志结束(23:30)未见关闭记录。夜间窗户持续开启存在轻微入侵风险和蚊虫问题,但住户可能有意通风。\",\n \"推理步骤7: 其余设备行为均正常——住户 06:22 起床、06:25 洗漱、06:50 去厨房、07:39 出门并自动锁门、18:08 回家、19:06 做饭、22:10 回卧室睡觉、22:31 关灯就寝,符合典型的上班族一日作息。温度整体走势(夜间低、午间高、傍晚回落)符合夏季自然规律。空调制冷模式(SystemMode=3)在夏季合理。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器从 2452 跳升至 2831(+3.8°C/30min),此时灶具尚未开启\",\n \"19:07:00 和 19:33:00 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 厨房温度 2843 而同时段客厅 2438、卧室 2337,厨房与其他房间温差异常偏大(约 5°C)\",\n \"厨房窗户 19:32:30 打开后至日志结束未关闭\",\n \"烟雾报警器全天无触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换电池,必要时更换传感器,解决间歇性 None 读数和异常跳变问题\",\n \"在智能家居系统中添加规则:当温度传感器返回 None 值时自动发送设备故障告警\",\n \"建议睡前检查厨房窗户是否关闭,或设置自动化规则在就寝时提醒关窗\",\n \"确认入户门在住户回家后是否有意保持开启,如非有意,建议设置入户门超时未关提醒(如 10 分钟未关门则推送通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 空值,疑似传感器故障;同时入户门在住户回家时未关闭即自动上锁,以及厨房窗户在做饭后开启至今未关闭,存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:30 报告 2452(24.52°C),但 19:00 突然跳升至 2831(28.31°C),30 分钟内上升近 3.8°C,而此时灶具尚未开启(19:06:30 才开启),排除烹饪导致的正常升温。", "推理步骤2: 灶具在 19:06:30 开启后仅 30 秒,19:07:00 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应返回 None。19:30 恢复为 2843 后,19:32 灶具关闭,19:33 再次报告 None。两次 None 读数高度异常,指向传感器间歇性故障。", "推理步骤3: 19:00 的 2831 异常高温读数可能也是传感器故障的表现——在故障前后出现不合理的跳变值,而非真实环境温度。19:30 的 2843 同理。对比客厅和卧室同时段温度走势平稳下降,进一步排除了真实环境高温的可能。", "推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险。如果厨房真的在未开灶时就达到 28°C 以上,烟雾报警器和其他传感器应有联动反应,但均无异常。", "推理步骤5: 住户 18:08 回家开锁进门,但入户门传感器 BooleanState.StateValue = False(门开)后,直到 22:10:37 才报告 StateValue = True(门关)并自动上锁。期间约 4 小时入户门处于未关闭状态,这是一个安全隐患——不过也可能是住户习惯性不关门(在家期间),属于生活习惯范畴。", "推理步骤6: 厨房窗户在 19:32:30 打开(StateValue = False,做饭后通风),但直到日志结束(23:30)未见关闭记录。夜间窗户持续开启存在轻微入侵风险和蚊虫问题,但住户可能有意通风。", "推理步骤7: 其余设备行为均正常——住户 06:22 起床、06:25 洗漱、06:50 去厨房、07:39 出门并自动锁门、18:08 回家、19:06 做饭、22:10 回卧室睡觉、22:31 关灯就寝,符合典型的上班族一日作息。温度整体走势(夜间低、午间高、傍晚回落)符合夏季自然规律。空调制冷模式(SystemMode=3)在夏季合理。"], "key_evidence": ["19:00 厨房温度传感器从 2452 跳升至 2831(+3.8°C/30min),此时灶具尚未开启", "19:07:00 和 19:33:00 厨房温度传感器两次报告 MeasuredValue = None", "19:30 厨房温度 2843 而同时段客厅 2438、卧室 2337,厨房与其他房间温差异常偏大(约 5°C)", "厨房窗户 19:32:30 打开后至日志结束未关闭", "烟雾报警器全天无触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换电池,必要时更换传感器,解决间歇性 None 读数和异常跳变问题", "在智能家居系统中添加规则:当温度传感器返回 None 值时自动发送设备故障告警", "建议睡前检查厨房窗户是否关闭,或设置自动化规则在就寝时提醒关窗", "确认入户门在住户回家后是否有意保持开启,如非有意,建议设置入户门超时未关提醒(如 10 分钟未关门则推送通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.3383846282959, "api_error": null} {"episode_id": "SQ4_TN_A_0973", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0973.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261602, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度从前一时段的 24.56°C 突然跳升至 28.31°C(+3.75°C),而灶具直到 19:06 才开启,温度跳变发生在灶具启动之前,不符合正常烹饪升温逻辑。\",\n \"推理步骤2: 19:07 和 19:55 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失或超出量程,这是设备异常的典型表现。\",\n \"推理步骤3: 19:30 厨房温度仍为 28.34°C 的高值,但 20:00 灶具关闭后温度恢复至 24.10°C,说明传感器本身仍能工作,但在灶具运行期间出现了不稳定行为。\",\n \"推理步骤4: 其余所有设备行为均符合正常生活模式——住户约 06:43 起床、07:12 出门上班、18:23 回家、19:06 做饭、22:54 就寝,门锁/灯光/空调/窗帘操作逻辑自洽,无入侵或其他安全威胁迹象。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警;门锁操作均为手动/自动正常模式,无异常开锁事件。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至 2831(28.31°C),灶具 19:06 才开启,时序不匹配\",\n \"19:07 和 19:55 厨房温度传感器报告 MeasuredValue = None(读数丢失)\",\n \"19:30 厨房温度 2834(28.34°C)与客厅/卧室温差异常大(约 4-5°C 差距扩大至近 5°C)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致高温干扰\",\n \"检查传感器固件版本,考虑重置或更换该传感器\",\n \"如传感器位置合理,建议增加耐高温防护罩或将其移至远离灶具的位置\",\n \"持续监测后续几天该传感器是否仍出现 None 值,若频繁出现则确认硬件故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 None 值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 19:00 厨房温度从前一时段的 24.56°C 突然跳升至 28.31°C(+3.75°C),而灶具直到 19:06 才开启,温度跳变发生在灶具启动之前,不符合正常烹饪升温逻辑。", "推理步骤2: 19:07 和 19:55 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失或超出量程,这是设备异常的典型表现。", "推理步骤3: 19:30 厨房温度仍为 28.34°C 的高值,但 20:00 灶具关闭后温度恢复至 24.10°C,说明传感器本身仍能工作,但在灶具运行期间出现了不稳定行为。", "推理步骤4: 其余所有设备行为均符合正常生活模式——住户约 06:43 起床、07:12 出门上班、18:23 回家、19:06 做饭、22:54 就寝,门锁/灯光/空调/窗帘操作逻辑自洽,无入侵或其他安全威胁迹象。", "推理步骤5: 烟雾报警器全天未触发,排除火灾风险;漏水传感器无报警;门锁操作均为手动/自动正常模式,无异常开锁事件。"], "key_evidence": ["19:00 厨房温度突跳至 2831(28.31°C),灶具 19:06 才开启,时序不匹配", "19:07 和 19:55 厨房温度传感器报告 MeasuredValue = None(读数丢失)", "19:30 厨房温度 2834(28.34°C)与客厅/卧室温差异常大(约 4-5°C 差距扩大至近 5°C)"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否距灶具过近导致高温干扰", "检查传感器固件版本,考虑重置或更换该传感器", "如传感器位置合理,建议增加耐高温防护罩或将其移至远离灶具的位置", "持续监测后续几天该传感器是否仍出现 None 值,若频繁出现则确认硬件故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.844109535217285, "api_error": null} {"episode_id": "SQ4_TN_A_0983", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0983.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261612, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~24.7°C 跳升至 28.5°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.69°C / 23.57°C),排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度继续上升至 28.67°C,但此时灶具尚未开启(灶具 18:51 才开),且烟雾报警器全天无任何告警事件,说明并非明火或烟雾引起。\",\n \"推理步骤3: 18:52 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:25 灶具关闭后 19:26 再次报告 None。两次数据丢失集中在灶具使用前后,可能是高温环境导致传感器通信异常或采样失败。\",\n \"推理步骤4: 19:00 和 19:30 的定时采样中温度恢复正常(24.39°C / 24.43°C),说明异常是间歇性的,进一步指向传感器自身不稳定而非持续性环境问题。\",\n \"推理步骤5: 住户行为模式完全正常——早晨 6:36 起床、7:16 出门并自动锁门、18:03 回家开灯开空调、18:51 做饭、21:47 回卧室就寝、22:43 关灯睡觉,无入侵迹象。\",\n \"推理步骤6: 入户门全天仅两次开关(出门/回家),均为手动解锁且自动回锁,门锁状态一致,无异常开锁事件。\",\n \"推理步骤7: 19:25 厨房窗户打开(做完饭通风)后日志中未见关闭事件,截至日志结束(23:30)厨房窗户仍处于开启状态,存在轻微安全隐患但属于常见疏忽。\",\n \"推理步骤8: 漏水传感器、烟雾报警器全天无告警,卫生间和其他区域无异常事件。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.7°C 骤升至 28.5°C,18:30 达 28.67°C,而灶具 18:51 才开启,升温原因不明\",\n \"18:52 和 19:26 厨房温度传感器两次报告 MeasuredValue = None,数据采集中断\",\n \"19:00 温度恢复正常(24.39°C),异常为间歇性\",\n \"19:25 厨房窗户打开后至日志结束未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否靠近热源或存在硬件老化问题,必要时更换传感器\",\n \"排查 18:00 前后厨房是否有外部热源影响(如阳光直射、邻居排烟管道等),确认异常高温的来源\",\n \"关闭厨房窗户或设置自动提醒规则:当住户进入就寝模式时检查所有窗户是否关闭\",\n \"为厨房温度传感器设置数据丢失(None)告警规则,及时发现传感器离线或故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~24.7°C 跳升至 28.5°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.69°C / 23.57°C),排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度继续上升至 28.67°C,但此时灶具尚未开启(灶具 18:51 才开),且烟雾报警器全天无任何告警事件,说明并非明火或烟雾引起。", "推理步骤3: 18:52 灶具刚开启约1分钟后,厨房温度传感器报告 MeasuredValue = None(数据丢失);19:25 灶具关闭后 19:26 再次报告 None。两次数据丢失集中在灶具使用前后,可能是高温环境导致传感器通信异常或采样失败。", "推理步骤4: 19:00 和 19:30 的定时采样中温度恢复正常(24.39°C / 24.43°C),说明异常是间歇性的,进一步指向传感器自身不稳定而非持续性环境问题。", "推理步骤5: 住户行为模式完全正常——早晨 6:36 起床、7:16 出门并自动锁门、18:03 回家开灯开空调、18:51 做饭、21:47 回卧室就寝、22:43 关灯睡觉,无入侵迹象。", "推理步骤6: 入户门全天仅两次开关(出门/回家),均为手动解锁且自动回锁,门锁状态一致,无异常开锁事件。", "推理步骤7: 19:25 厨房窗户打开(做完饭通风)后日志中未见关闭事件,截至日志结束(23:30)厨房窗户仍处于开启状态,存在轻微安全隐患但属于常见疏忽。", "推理步骤8: 漏水传感器、烟雾报警器全天无告警,卫生间和其他区域无异常事件。"], "key_evidence": ["18:00 厨房温度从 ~24.7°C 骤升至 28.5°C,18:30 达 28.67°C,而灶具 18:51 才开启,升温原因不明", "18:52 和 19:26 厨房温度传感器两次报告 MeasuredValue = None,数据采集中断", "19:00 温度恢复正常(24.39°C),异常为间歇性", "19:25 厨房窗户打开后至日志结束未见关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否靠近热源或存在硬件老化问题,必要时更换传感器", "排查 18:00 前后厨房是否有外部热源影响(如阳光直射、邻居排烟管道等),确认异常高温的来源", "关闭厨房窗户或设置自动提醒规则:当住户进入就寝模式时检查所有窗户是否关闭", "为厨房温度传感器设置数据丢失(None)告警规则,及时发现传感器离线或故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.21004843711853, "api_error": null} {"episode_id": "SQ4_TN_A_0989", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0989.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261618, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间出现异常高温跳变及两次 None 读数,表明传感器可能存在故障或过热保护触发。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式完全正常——06:28 起床、07:30 出门上班、18:29 回家、22:38 就寝,属于典型单人一室一厅作息,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,全天仅早出(07:30)晚归(18:29)两次,门锁安全无异常。\",\n \"推理步骤3: 19:00 厨房温度从 24.59°C 突然跳升至 28.28°C(瞬间升高约 3.7°C),虽然灶具在 19:00:30 开启可以解释部分升温,但该跳变发生在灶具开启之前,且幅度异常大。\",\n \"推理步骤4: 19:01 和 19:52 厨房温度传感器连续两次报告 MeasuredValue = None,说明传感器在高温环境下读数丢失,可能是传感器超出量程、通信故障或过热保护导致。\",\n \"推理步骤5: 19:30 厨房温度仍高达 28.25°C,灶具关闭(19:51)后住户立即开窗通风(19:51:30),20:00 温度回落至 24.18°C,说明住户已注意到高温并采取了措施,排除持续火灾风险。\",\n \"推理步骤6: 烟雾报警器全天未触发,排除明火或烟雾事件;漏水传感器无报警,排除水患。\",\n \"推理步骤7: 厨房窗户在通风后未见关闭记录(无 StateValue=True),截至日志结束时厨房窗户仍处于打开状态,夜间存在轻微安全隐患。\",\n \"推理步骤8: 客厅和卧室温度全天呈现正常的日间升温、夜间降温曲线,空调开启后客厅温度平稳下降,设备工作正常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.59°C 瞬间跳升至 28.28°C,灶具尚未开启(19:00:30才开启),跳变时序和幅度异常\",\n \"19:01 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失\",\n \"厨房窗户 19:51:30 打开后至日志结束(23:30)未见关闭记录,夜间窗户持续敞开\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致过热,必要时重新定位或更换传感器\",\n \"排查厨房温度传感器的固件和通信状态,确认 None 读数的根因(超量程/通信丢包/硬件故障)\",\n \"提醒住户关闭厨房窗户,夜间无人区域窗户敞开存在安防隐患\",\n \"考虑为厨房温度传感器设置高温阈值告警,在异常高温时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间出现异常高温跳变及两次 None 读数,表明传感器可能存在故障或过热保护触发。", "reasoning": ["推理步骤1: 住户行为模式完全正常——06:28 起床、07:30 出门上班、18:29 回家、22:38 就寝,属于典型单人一室一厅作息,无入侵迹象。", "推理步骤2: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,全天仅早出(07:30)晚归(18:29)两次,门锁安全无异常。", "推理步骤3: 19:00 厨房温度从 24.59°C 突然跳升至 28.28°C(瞬间升高约 3.7°C),虽然灶具在 19:00:30 开启可以解释部分升温,但该跳变发生在灶具开启之前,且幅度异常大。", "推理步骤4: 19:01 和 19:52 厨房温度传感器连续两次报告 MeasuredValue = None,说明传感器在高温环境下读数丢失,可能是传感器超出量程、通信故障或过热保护导致。", "推理步骤5: 19:30 厨房温度仍高达 28.25°C,灶具关闭(19:51)后住户立即开窗通风(19:51:30),20:00 温度回落至 24.18°C,说明住户已注意到高温并采取了措施,排除持续火灾风险。", "推理步骤6: 烟雾报警器全天未触发,排除明火或烟雾事件;漏水传感器无报警,排除水患。", "推理步骤7: 厨房窗户在通风后未见关闭记录(无 StateValue=True),截至日志结束时厨房窗户仍处于打开状态,夜间存在轻微安全隐患。", "推理步骤8: 客厅和卧室温度全天呈现正常的日间升温、夜间降温曲线,空调开启后客厅温度平稳下降,设备工作正常。"], "key_evidence": ["19:00 厨房温度从 ~24.59°C 瞬间跳升至 28.28°C,灶具尚未开启(19:00:30才开启),跳变时序和幅度异常", "19:01 和 19:52 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失", "厨房窗户 19:51:30 打开后至日志结束(23:30)未见关闭记录,夜间窗户持续敞开"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致过热,必要时重新定位或更换传感器", "排查厨房温度传感器的固件和通信状态,确认 None 读数的根因(超量程/通信丢包/硬件故障)", "提醒住户关闭厨房窗户,夜间无人区域窗户敞开存在安防隐患", "考虑为厨房温度传感器设置高温阈值告警,在异常高温时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.583137273788452, "api_error": null} {"episode_id": "SQ4_TN_A_0991", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0991.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261620, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),且厨房窗户在做完饭后开启至今未关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2474(24.74°C)跳升至 2870(28.70°C),而此时灶具尚未开启(18:58 才开),客厅和卧室温度仍在正常下降趋势中。这一约 4°C 的突变与其他房间趋势不一致,属于异常尖峰。\",\n \"推理步骤2: 18:30 厨房温度仍高达 2853(28.53°C),进一步确认这不是瞬时噪声,而是持续性异常读数。直到 19:00 灶具已开启后,温度反而回落到 2432(24.32°C),说明 18:00-18:30 的高温并非烹饪导致,更可能是传感器故障或环境异常。\",\n \"推理步骤3: 厨房温度传感器在 18:59 和 19:31 两次报告 MeasuredValue = None,表示传感器读数丢失。这是设备故障的典型信号——正常传感器不应返回空值。两次 None 分别出现在灶具开启后和关闭后,时间间隔约 32 分钟。\",\n \"推理步骤4: 19:30:30 厨房窗户被打开(contact = False),可能是为了做饭后通风,但直到日志结束(23:30)窗户始终未关闭。住户 22:00 已回到卧室准备就寝,厨房窗户整夜开着存在安全风险(入侵通道、雨水等)。\",\n \"推理步骤5: 其余设备行为均正常——住户 06:25 起床、07:36 出门(门锁自动上锁)、18:24 回家、22:00 就寝的作息规律合理;入户门锁开关操作正常;洗碗机 19:57 启动但日志中未见其完成/关闭记录,属于轻微关注点但不构成威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.7°C 突升至 28.7°C,18:30 仍为 28.5°C,而灶具 18:58 才开启,排除烹饪因素\",\n \"18:59 和 19:31 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集异常\",\n \"19:30:30 厨房窗户打开(BooleanState.StateValue = False)后至日志结束 23:30 未关闭,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排查 None 读数的根因(电池电量、通信干扰、传感器老化)\",\n \"关闭厨房窗户,或设置自动化规则:当住户进入就寝模式时检查并提醒关闭所有窗户\",\n \"为厨房温度传感器设置异常值告警阈值(如短时间内变化超过 3°C 或出现 None 值时立即通知),以便及时发现传感器故障\",\n \"确认洗碗机运行状态,日志中仅有启动记录未见完成记录,建议下次检查其是否正常结束\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),且厨房窗户在做完饭后开启至今未关闭,存在安全隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2474(24.74°C)跳升至 2870(28.70°C),而此时灶具尚未开启(18:58 才开),客厅和卧室温度仍在正常下降趋势中。这一约 4°C 的突变与其他房间趋势不一致,属于异常尖峰。", "推理步骤2: 18:30 厨房温度仍高达 2853(28.53°C),进一步确认这不是瞬时噪声,而是持续性异常读数。直到 19:00 灶具已开启后,温度反而回落到 2432(24.32°C),说明 18:00-18:30 的高温并非烹饪导致,更可能是传感器故障或环境异常。", "推理步骤3: 厨房温度传感器在 18:59 和 19:31 两次报告 MeasuredValue = None,表示传感器读数丢失。这是设备故障的典型信号——正常传感器不应返回空值。两次 None 分别出现在灶具开启后和关闭后,时间间隔约 32 分钟。", "推理步骤4: 19:30:30 厨房窗户被打开(contact = False),可能是为了做饭后通风,但直到日志结束(23:30)窗户始终未关闭。住户 22:00 已回到卧室准备就寝,厨房窗户整夜开着存在安全风险(入侵通道、雨水等)。", "推理步骤5: 其余设备行为均正常——住户 06:25 起床、07:36 出门(门锁自动上锁)、18:24 回家、22:00 就寝的作息规律合理;入户门锁开关操作正常;洗碗机 19:57 启动但日志中未见其完成/关闭记录,属于轻微关注点但不构成威胁。"], "key_evidence": ["18:00 厨房温度从 ~24.7°C 突升至 28.7°C,18:30 仍为 28.5°C,而灶具 18:58 才开启,排除烹饪因素", "18:59 和 19:31 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集异常", "19:30:30 厨房窗户打开(BooleanState.StateValue = False)后至日志结束 23:30 未关闭,住户已就寝"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,排查 None 读数的根因(电池电量、通信干扰、传感器老化)", "关闭厨房窗户,或设置自动化规则:当住户进入就寝模式时检查并提醒关闭所有窗户", "为厨房温度传感器设置异常值告警阈值(如短时间内变化超过 3°C 或出现 None 值时立即通知),以便及时发现传感器故障", "确认洗碗机运行状态,日志中仅有启动记录未见完成记录,建议下次检查其是否正常结束"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.304940700531006, "api_error": null} {"episode_id": "SQ4_TN_A_0993", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0993.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261622, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:22 起床、07:35 出门、18:25 回家、22:30 就寝,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式,无入侵迹象。\",\n \"推理步骤2: 19:00 厨房温度传感器突然从前一读数 2467(约 24.67°C)跳升至 2835(约 28.35°C),升幅约 3.7°C,远超同时段客厅和卧室的变化幅度。虽然灶具在 19:04 才开启,但温度跳变发生在灶具开启之前,时间上无法用烹饪解释。\",\n \"推理步骤3: 19:05 和 19:34 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在这两个时刻未能正常采集数据。正常传感器不应返回 null。\",\n \"推理步骤4: 19:30 厨房温度再次读到 2831,与 19:00 的异常值几乎一致;而 20:00 灶具关闭、窗户打开通风后温度回落至 2402,说明实际环境温度并不高,进一步佐证 19:00-19:30 的高温读数可能是传感器漂移或故障。\",\n \"推理步骤5: 烟雾报警器全天无触发,灶具使用时间约 29 分钟(19:04-19:33)属正常烹饪时长,排除火灾风险。漏水传感器无报警,门窗状态合理,无其他安全威胁。\",\n \"推理步骤6: 入户门在 18:25 开锁进门后,直到 22:06 才由自动锁上锁(门传感器确认关闭),中间约 3 小时 40 分钟门处于未明确上锁状态,但住户在家,属于正常行为,不构成安全风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.67°C 骤升至 ~28.35°C,灶具尚未开启(19:04 才开),跳变无合理热源解释\",\n \"19:05 和 19:34 厨房温度传感器两次返回 MeasuredValue = None,表明数据采集中断\",\n \"19:30 厨房温度仍为 2831(异常高位),20:00 回落至 2402,与灶具关闭和开窗通风时间吻合,说明异常高值并非真实环境温度\",\n \"烟雾报警器全天未触发,排除火灾关联\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否靠近热源或存在接线松动,必要时更换传感器\",\n \"在传感器修复前,可设置规则:当厨房温度传感器返回 null 或单次跳变超过 3°C 时,发送设备故障告警而非温度告警,避免误报\",\n \"建议为厨房温度传感器启用诊断日志(如 Matter Diagnostics Cluster),持续监测其通信质量和采样稳定性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:22 起床、07:35 出门、18:25 回家、22:30 就寝,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式,无入侵迹象。", "推理步骤2: 19:00 厨房温度传感器突然从前一读数 2467(约 24.67°C)跳升至 2835(约 28.35°C),升幅约 3.7°C,远超同时段客厅和卧室的变化幅度。虽然灶具在 19:04 才开启,但温度跳变发生在灶具开启之前,时间上无法用烹饪解释。", "推理步骤3: 19:05 和 19:34 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在这两个时刻未能正常采集数据。正常传感器不应返回 null。", "推理步骤4: 19:30 厨房温度再次读到 2831,与 19:00 的异常值几乎一致;而 20:00 灶具关闭、窗户打开通风后温度回落至 2402,说明实际环境温度并不高,进一步佐证 19:00-19:30 的高温读数可能是传感器漂移或故障。", "推理步骤5: 烟雾报警器全天无触发,灶具使用时间约 29 分钟(19:04-19:33)属正常烹饪时长,排除火灾风险。漏水传感器无报警,门窗状态合理,无其他安全威胁。", "推理步骤6: 入户门在 18:25 开锁进门后,直到 22:06 才由自动锁上锁(门传感器确认关闭),中间约 3 小时 40 分钟门处于未明确上锁状态,但住户在家,属于正常行为,不构成安全风险。"], "key_evidence": ["19:00 厨房温度从 ~24.67°C 骤升至 ~28.35°C,灶具尚未开启(19:04 才开),跳变无合理热源解释", "19:05 和 19:34 厨房温度传感器两次返回 MeasuredValue = None,表明数据采集中断", "19:30 厨房温度仍为 2831(异常高位),20:00 回落至 2402,与灶具关闭和开窗通风时间吻合,说明异常高值并非真实环境温度", "烟雾报警器全天未触发,排除火灾关联"], "recommended_actions": ["检查厨房温度传感器的硬件状态和安装位置,确认是否靠近热源或存在接线松动,必要时更换传感器", "在传感器修复前,可设置规则:当厨房温度传感器返回 null 或单次跳变超过 3°C 时,发送设备故障告警而非温度告警,避免误报", "建议为厨房温度传感器启用诊断日志(如 Matter Diagnostics Cluster),持续监测其通信质量和采样稳定性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.828330755233765, "api_error": null} {"episode_id": "SQ4_TN_A_0997", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_0997.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261626, "scenario_id": null, "total_events": 184, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且 12:00 出现异常高温读数(29.70°C),疑似传感器故障或灶具散热异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内反复报告 MeasuredValue = None(09:01、12:15、18:01、18:52),共出现4次。虽然灶具工作时传感器可能因高温超量程而返回 None,但这说明传感器安装位置可能过于靠近灶具,或传感器本身存在故障。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2970(29.70°C),而同一时刻客厅为 25.83°C、卧室为 24.85°C。厨房比其他房间高出约4-5°C,且灶具此时并未开启(灶具在 09:34 已关闭,12:14 才再次开启)。这意味着在无明显热源的情况下厨房出现了异常高温读数。12:30 灶具刚关闭时读数为 2982(29.82°C),随后传感器再次报告 None。这一异常高温可能是传感器漂移/故障,也可能提示厨房存在未被记录的余热源。\",\n \"推理步骤3: 除厨房传感器异常外,其余设备行为均符合正常生活模式——住户约 08:40 起床、09:00 做早餐、12:14 做午餐、18:00 做晚餐、23:15 就寝,灶具每次使用后都有关闭记录,烟雾报警器全天未触发,门锁在就寝时自动上锁,漏水传感器无报警,入侵相关传感器无异常。\",\n \"推理步骤4: 厨房窗户在每次烹饪结束后都被打开(09:34、12:30、18:51 的 BooleanState.StateValue = False 表示窗户打开),说明住户有通风习惯,这是正常行为。但窗户日志中没有关闭记录,无法确认窗户最终是否关好,存在轻微安全隐患。\",\n \"推理步骤5: 客厅空调在 10:07 开启制冷模式(SystemMode=3),23:15 关闭,与白天高温时段吻合,属正常使用。整体温度曲线呈现夏季典型的日间升温、夜间降温趋势,卧室始终比客厅低约1°C,符合朝向或窗帘遮挡差异。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:01、12:15、18:01、18:52 四次报告 MeasuredValue = None\",\n \"12:00 厨房温度异常飙升至 29.70°C(灶具当时处于关闭状态,09:34 已关),比客厅高近 4°C\",\n \"12:30 灶具刚关闭时厨房温度达 29.82°C,随后传感器再次返回 None\",\n \"厨房窗户三次被打开但日志中无关闭记录,无法确认是否已关好\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程返回 None;如有必要,将传感器迁移至远离热源的位置\",\n \"对厨房温度传感器进行校准或更换,排除硬件故障导致的异常读数(如 12:00 无热源时的 29.70°C)\",\n \"确认厨房窗户当前是否已关闭;建议为厨房窗户传感器增加「长时间未关闭」的自动提醒规则,避免夜间窗户敞开带来的安全风险\",\n \"考虑为灶具增加「开启超时未关闭」的安全联动规则,与烟雾报警器形成双重保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且 12:00 出现异常高温读数(29.70°C),疑似传感器故障或灶具散热异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内反复报告 MeasuredValue = None(09:01、12:15、18:01、18:52),共出现4次。虽然灶具工作时传感器可能因高温超量程而返回 None,但这说明传感器安装位置可能过于靠近灶具,或传感器本身存在故障。", "推理步骤2: 12:00 厨房温度传感器报告 2970(29.70°C),而同一时刻客厅为 25.83°C、卧室为 24.85°C。厨房比其他房间高出约4-5°C,且灶具此时并未开启(灶具在 09:34 已关闭,12:14 才再次开启)。这意味着在无明显热源的情况下厨房出现了异常高温读数。12:30 灶具刚关闭时读数为 2982(29.82°C),随后传感器再次报告 None。这一异常高温可能是传感器漂移/故障,也可能提示厨房存在未被记录的余热源。", "推理步骤3: 除厨房传感器异常外,其余设备行为均符合正常生活模式——住户约 08:40 起床、09:00 做早餐、12:14 做午餐、18:00 做晚餐、23:15 就寝,灶具每次使用后都有关闭记录,烟雾报警器全天未触发,门锁在就寝时自动上锁,漏水传感器无报警,入侵相关传感器无异常。", "推理步骤4: 厨房窗户在每次烹饪结束后都被打开(09:34、12:30、18:51 的 BooleanState.StateValue = False 表示窗户打开),说明住户有通风习惯,这是正常行为。但窗户日志中没有关闭记录,无法确认窗户最终是否关好,存在轻微安全隐患。", "推理步骤5: 客厅空调在 10:07 开启制冷模式(SystemMode=3),23:15 关闭,与白天高温时段吻合,属正常使用。整体温度曲线呈现夏季典型的日间升温、夜间降温趋势,卧室始终比客厅低约1°C,符合朝向或窗帘遮挡差异。"], "key_evidence": ["厨房温度传感器在 09:01、12:15、18:01、18:52 四次报告 MeasuredValue = None", "12:00 厨房温度异常飙升至 29.70°C(灶具当时处于关闭状态,09:34 已关),比客厅高近 4°C", "12:30 灶具刚关闭时厨房温度达 29.82°C,随后传感器再次返回 None", "厨房窗户三次被打开但日志中无关闭记录,无法确认是否已关好"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超量程返回 None;如有必要,将传感器迁移至远离热源的位置", "对厨房温度传感器进行校准或更换,排除硬件故障导致的异常读数(如 12:00 无热源时的 29.70°C)", "确认厨房窗户当前是否已关闭;建议为厨房窗户传感器增加「长时间未关闭」的自动提醒规则,避免夜间窗户敞开带来的安全风险", "考虑为灶具增加「开启超时未关闭」的安全联动规则,与烟雾报警器形成双重保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.232738971710205, "api_error": null} {"episode_id": "SQ4_TN_A_1005", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_A_1005.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261634, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次 None 值,疑似传感器故障或短暂过热事件\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2489(24.89°C)跳升至 2865(28.65°C),升幅近 4°C,而此时灶具尚未开启(18:46 才开),且客厅和卧室温度同期在正常下降\",\n \"推理步骤2: 18:30 厨房温度仍维持在 2854(28.54°C)的异常高位,进一步确认这不是单次采样噪声\",\n \"推理步骤3: 18:47 和 19:29 厨房温度传感器报告 MeasuredValue = None,表明传感器读数丢失或超出量程,这在正常运行中不应出现\",\n \"推理步骤4: 19:00 之后厨房温度恢复正常(2429),说明异常是暂时性的,更符合传感器故障或局部热源影响的特征,而非持续性火灾风险\",\n \"推理步骤5: 烟雾报警器全天未触发,排除了实际火灾的可能性,但传感器的不稳定行为本身构成监控盲区风险\"\n ],\n \"key_evidence\": [\n \"18:00 kitchen_temp_sensor 从 ~2489 骤升至 2865(+3.76°C),灶具当时未开启\",\n \"18:30 kitchen_temp_sensor 仍为 2854,异常持续\",\n \"18:47 和 19:29 kitchen_temp_sensor 报告 MeasuredValue = None(读数丢失)\",\n \"同时段客厅和卧室温度正常下降,排除全屋环境因素\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)\",\n \"对厨房温度传感器进行校准或更换,None 值表明设备可能存在硬件问题\",\n \"检查传感器固件版本,考虑升级以修复可能的读数溢出问题\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次 None 值,疑似传感器故障或短暂过热事件", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2489(24.89°C)跳升至 2865(28.65°C),升幅近 4°C,而此时灶具尚未开启(18:46 才开),且客厅和卧室温度同期在正常下降", "推理步骤2: 18:30 厨房温度仍维持在 2854(28.54°C)的异常高位,进一步确认这不是单次采样噪声", "推理步骤3: 18:47 和 19:29 厨房温度传感器报告 MeasuredValue = None,表明传感器读数丢失或超出量程,这在正常运行中不应出现", "推理步骤4: 19:00 之后厨房温度恢复正常(2429),说明异常是暂时性的,更符合传感器故障或局部热源影响的特征,而非持续性火灾风险", "推理步骤5: 烟雾报警器全天未触发,排除了实际火灾的可能性,但传感器的不稳定行为本身构成监控盲区风险"], "key_evidence": ["18:00 kitchen_temp_sensor 从 ~2489 骤升至 2865(+3.76°C),灶具当时未开启", "18:30 kitchen_temp_sensor 仍为 2854,异常持续", "18:47 和 19:29 kitchen_temp_sensor 报告 MeasuredValue = None(读数丢失)", "同时段客厅和卧室温度正常下降,排除全屋环境因素"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否靠近热源(如冰箱散热口、阳光直射区域)", "对厨房温度传感器进行校准或更换,None 值表明设备可能存在硬件问题", "检查传感器固件版本,考虑升级以修复可能的读数溢出问题", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.97972583770752, "api_error": null} {"episode_id": "SQ4_TN_B_0955", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0955.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261584, "scenario_id": null, "total_events": 226, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在故障:多次报告 None 值,且在 11:00-11:30 出现异常高温读数(29.56°C),与其他房间温度严重偏离。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(08:58、09:32、11:46、12:44、17:58、18:55),说明传感器在灶具工作期间反复失联或读数溢出。虽然单次 None 可能是灶具热辐射干扰的正常现象,但一天内出现 6 次值得关注。\",\n \"推理步骤2: 更关键的是,11:00 和 11:30 厨房温度传感器报告 2956(即 29.56°C),而同一时刻客厅、主卧、次卧温度均在 25.49-25.59°C 范围内。厨房温度比其他房间高出约 4°C,且此时灶具并未开启(灶具在 09:31 已关闭,11:45 才重新开启)。这一异常高温读数无法用正常烹饪解释。\",\n \"推理步骤3: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,且异常温度值(29.56°C)虽偏高但未达到危险水平。更合理的解释是传感器本身存在故障,导致读数漂移或卡在错误值上。\",\n \"推理步骤4: 其他设备行为均属正常——入户门在 23:07 关闭并自动上锁,符合晚间回家习惯;灶具三次使用(早餐、午餐、晚餐)时间合理;洗碗机晚餐后启动;客厅空调白天制冷模式运行(SystemMode=3);全天温度曲线呈现正常的日间升温、夜间降温趋势。\"\n ],\n \"key_evidence\": [\n \"11:00 和 11:30 厨房温度传感器读数 2956(29.56°C),同时段其他房间温度约 25.5°C,偏差约 4°C,且灶具处于关闭状态\",\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(08:58、09:32、11:46、12:44、17:58、18:55),均发生在灶具开关前后,表明传感器对热源环境适应性差或硬件老化\",\n \"厨房烟雾报警器全天未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰,必要时重新选址安装\",\n \"对厨房温度传感器进行校准或固件更新,若问题持续则更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在故障:多次报告 None 值,且在 11:00-11:30 出现异常高温读数(29.56°C),与其他房间温度严重偏离。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(08:58、09:32、11:46、12:44、17:58、18:55),说明传感器在灶具工作期间反复失联或读数溢出。虽然单次 None 可能是灶具热辐射干扰的正常现象,但一天内出现 6 次值得关注。", "推理步骤2: 更关键的是,11:00 和 11:30 厨房温度传感器报告 2956(即 29.56°C),而同一时刻客厅、主卧、次卧温度均在 25.49-25.59°C 范围内。厨房温度比其他房间高出约 4°C,且此时灶具并未开启(灶具在 09:31 已关闭,11:45 才重新开启)。这一异常高温读数无法用正常烹饪解释。", "推理步骤3: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,且异常温度值(29.56°C)虽偏高但未达到危险水平。更合理的解释是传感器本身存在故障,导致读数漂移或卡在错误值上。", "推理步骤4: 其他设备行为均属正常——入户门在 23:07 关闭并自动上锁,符合晚间回家习惯;灶具三次使用(早餐、午餐、晚餐)时间合理;洗碗机晚餐后启动;客厅空调白天制冷模式运行(SystemMode=3);全天温度曲线呈现正常的日间升温、夜间降温趋势。"], "key_evidence": ["11:00 和 11:30 厨房温度传感器读数 2956(29.56°C),同时段其他房间温度约 25.5°C,偏差约 4°C,且灶具处于关闭状态", "厨房温度传感器一天内 6 次报告 MeasuredValue = None(08:58、09:32、11:46、12:44、17:58、18:55),均发生在灶具开关前后,表明传感器对热源环境适应性差或硬件老化", "厨房烟雾报警器全天未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰,必要时重新选址安装", "对厨房温度传感器进行校准或固件更新,若问题持续则更换传感器", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.052836179733276, "api_error": null} {"episode_id": "SQ4_TN_B_0956", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0956.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261585, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.25°C,而同一时刻其他房间温度均在 24.2-24.3°C 范围内,温差高达约 4°C,远超正常室内房间间差异。\",\n \"推理步骤2: 19:13 灶具开启前(19:00)温度就已飙升至 28.25°C,说明这不是烹饪导致的正常升温,而是传感器在灶具启动前就出现了异常读数。\",\n \"推理步骤3: 19:14 和 19:50 两次出现 MeasuredValue = None,表示传感器数据完全丢失,这是典型的传感器故障或通信中断表现。\",\n \"推理步骤4: 19:30 传感器恢复报告时仍然锁定在 28.25°C(与 19:00 完全相同),没有随灶具运行而进一步变化,进一步印证传感器卡死/故障而非真实温度反映。\",\n \"推理步骤5: 20:00 灶具关闭后传感器恢复正常值 24.00°C,与其他房间温度一致,说明传感器在故障期间的读数不可信。\",\n \"推理步骤6: 厨房是高火灾风险区域,温度传感器与烟雾报警器配合是关键安全防线。传感器间歇性故障意味着在烹饪期间无法可靠监测厨房温度异常,削弱了火灾预警能力。\",\n \"推理步骤7: 其余家庭行为模式正常——早晨 06:45 起床洗漱、07:04 厨房早餐、07:26 出门上班并自动锁门、18:08 回家开灯开空调、19:13 做饭、21:49 关灯锁门休息,均符合单人上班族的典型作息。\",\n \"推理步骤8: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;无漏水报警、无烟雾报警触发,其他设备运行正常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器从约 24.6°C 突跳至 28.25°C,灶具尚未开启,其他房间温度正常\",\n \"19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None,数据完全丢失\",\n \"19:30 传感器恢复后读数仍为 28.25°C(与 19:00 完全相同),未反映灶具运行的真实温度变化\",\n \"20:00 灶具关闭后传感器恢复正常值 24.00°C,与其他房间一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和供电状态,确认是否受到灶具热辐射干扰或存在硬件故障\",\n \"对厨房温度传感器进行重置或固件更新,观察后续是否仍出现 None 值和异常跳变\",\n \"如传感器持续故障,建议尽快更换,避免在烹饪场景下丧失温度异常监测能力\",\n \"考虑将厨房温度传感器安装位置远离灶具热源,减少热辐射对读数的干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 24.6°C 跳升至 28.25°C,而同一时刻其他房间温度均在 24.2-24.3°C 范围内,温差高达约 4°C,远超正常室内房间间差异。", "推理步骤2: 19:13 灶具开启前(19:00)温度就已飙升至 28.25°C,说明这不是烹饪导致的正常升温,而是传感器在灶具启动前就出现了异常读数。", "推理步骤3: 19:14 和 19:50 两次出现 MeasuredValue = None,表示传感器数据完全丢失,这是典型的传感器故障或通信中断表现。", "推理步骤4: 19:30 传感器恢复报告时仍然锁定在 28.25°C(与 19:00 完全相同),没有随灶具运行而进一步变化,进一步印证传感器卡死/故障而非真实温度反映。", "推理步骤5: 20:00 灶具关闭后传感器恢复正常值 24.00°C,与其他房间温度一致,说明传感器在故障期间的读数不可信。", "推理步骤6: 厨房是高火灾风险区域,温度传感器与烟雾报警器配合是关键安全防线。传感器间歇性故障意味着在烹饪期间无法可靠监测厨房温度异常,削弱了火灾预警能力。", "推理步骤7: 其余家庭行为模式正常——早晨 06:45 起床洗漱、07:04 厨房早餐、07:26 出门上班并自动锁门、18:08 回家开灯开空调、19:13 做饭、21:49 关灯锁门休息,均符合单人上班族的典型作息。", "推理步骤8: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;无漏水报警、无烟雾报警触发,其他设备运行正常。"], "key_evidence": ["19:00 厨房温度传感器从约 24.6°C 突跳至 28.25°C,灶具尚未开启,其他房间温度正常", "19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None,数据完全丢失", "19:30 传感器恢复后读数仍为 28.25°C(与 19:00 完全相同),未反映灶具运行的真实温度变化", "20:00 灶具关闭后传感器恢复正常值 24.00°C,与其他房间一致"], "recommended_actions": ["检查厨房温度传感器的安装位置和供电状态,确认是否受到灶具热辐射干扰或存在硬件故障", "对厨房温度传感器进行重置或固件更新,观察后续是否仍出现 None 值和异常跳变", "如传感器持续故障,建议尽快更换,避免在烹饪场景下丧失温度异常监测能力", "考虑将厨房温度传感器安装位置远离灶具热源,减少热辐射对读数的干扰"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.514243841171265, "api_error": null} {"episode_id": "SQ4_TN_B_0964", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0964.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261593, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受到干扰。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.5-25.9°C,下午逐步回落,符合夏季自然温度曲线,各传感器之间差异很小(通常 <0.5°C),整体正常。\",\n \"推理步骤2: 19:00 厨房温度传感器突然报告 2835(28.35°C),而同一时刻客厅 24.35°C、主卧 24.45°C、次卧 24.25°C。厨房与其他房间温差瞬间达到约 4°C,且此时灶具尚未开启(灶具 19:15 才开),这个跳变缺乏合理热源解释。\",\n \"推理步骤3: 19:16 灶具刚开启 1 分钟后,厨房温度传感器报告 None(null),正常传感器不应因灶具开启就丢失读数。19:30 传感器恢复报告 2827(28.27°C),19:47 灶具关闭后 19:48 再次报告 None。两次 null 读数高度异常。\",\n \"推理步骤4: 20:00 厨房温度恢复到 24.16°C,与其他房间重新对齐,说明传感器并非永久损坏,而是间歇性故障——这种模式更像是传感器接触不良、供电不稳或受到灶具电磁干扰。\",\n \"推理步骤5: 住户行为链完全正常——早晨 06:35 起床洗漱,07:16 出门上班(手动开锁→开门→关门→自动上锁),18:08 回家(开锁→进门→开灯→开空调),19:15 做饭,19:47 做完饭开窗通风,19:59 开洗碗机,22:12 关灯关空调就寝,门锁自动上锁。无入侵迹象。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,门窗传感器状态变化均与住户操作吻合,排除火灾、漏水和入侵风险。\",\n \"推理步骤7: 厨房窗户在做完饭后打开(19:47:30),但日志中未见关闭记录。住户已就寝且入户门已锁,窗户持续开启存在轻微安全隐患(虽非高层可忽略,但仍值得提醒)。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2835(28.35°C),灶具尚未开启,与其他房间温差达 ~4°C,无合理热源\",\n \"19:16 和 19:48 厨房温度传感器两次报告 None(null 值),间歇性丢失读数\",\n \"19:30 厨房温度 2827(28.27°C)仍显著偏高,20:00 恢复正常 2416(24.16°C),呈间歇性故障模式\",\n \"厨房窗户 19:47:30 打开后至日志结束(23:30)未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近或受到热辐射/电磁干扰影响\",\n \"检查厨房温度传感器的供电状态(电池电量或供电线路),间歇性 null 值可能是供电不稳所致\",\n \"如传感器持续出现异常读数或 null 值,建议更换传感器或重新校准\",\n \"提醒住户就寝前关闭厨房窗户,避免夜间安全隐患\",\n \"可考虑设置自动化规则:当温度传感器报告 null 值时立即推送告警,以便及时发现传感器故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或受到干扰。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.5-25.9°C,下午逐步回落,符合夏季自然温度曲线,各传感器之间差异很小(通常 <0.5°C),整体正常。", "推理步骤2: 19:00 厨房温度传感器突然报告 2835(28.35°C),而同一时刻客厅 24.35°C、主卧 24.45°C、次卧 24.25°C。厨房与其他房间温差瞬间达到约 4°C,且此时灶具尚未开启(灶具 19:15 才开),这个跳变缺乏合理热源解释。", "推理步骤3: 19:16 灶具刚开启 1 分钟后,厨房温度传感器报告 None(null),正常传感器不应因灶具开启就丢失读数。19:30 传感器恢复报告 2827(28.27°C),19:47 灶具关闭后 19:48 再次报告 None。两次 null 读数高度异常。", "推理步骤4: 20:00 厨房温度恢复到 24.16°C,与其他房间重新对齐,说明传感器并非永久损坏,而是间歇性故障——这种模式更像是传感器接触不良、供电不稳或受到灶具电磁干扰。", "推理步骤5: 住户行为链完全正常——早晨 06:35 起床洗漱,07:16 出门上班(手动开锁→开门→关门→自动上锁),18:08 回家(开锁→进门→开灯→开空调),19:15 做饭,19:47 做完饭开窗通风,19:59 开洗碗机,22:12 关灯关空调就寝,门锁自动上锁。无入侵迹象。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,门窗传感器状态变化均与住户操作吻合,排除火灾、漏水和入侵风险。", "推理步骤7: 厨房窗户在做完饭后打开(19:47:30),但日志中未见关闭记录。住户已就寝且入户门已锁,窗户持续开启存在轻微安全隐患(虽非高层可忽略,但仍值得提醒)。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2835(28.35°C),灶具尚未开启,与其他房间温差达 ~4°C,无合理热源", "19:16 和 19:48 厨房温度传感器两次报告 None(null 值),间歇性丢失读数", "19:30 厨房温度 2827(28.27°C)仍显著偏高,20:00 恢复正常 2416(24.16°C),呈间歇性故障模式", "厨房窗户 19:47:30 打开后至日志结束(23:30)未见关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近或受到热辐射/电磁干扰影响", "检查厨房温度传感器的供电状态(电池电量或供电线路),间歇性 null 值可能是供电不稳所致", "如传感器持续出现异常读数或 null 值,建议更换传感器或重新校准", "提醒住户就寝前关闭厨房窗户,避免夜间安全隐患", "可考虑设置自动化规则:当温度传感器报告 null 值时立即推送告警,以便及时发现传感器故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.78996706008911, "api_error": null} {"episode_id": "SQ4_TN_B_0966", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0966.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261595, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房窗户在关灶后开启但日志中无关闭记录;入户门在16:22开锁进入后长时间未关门/未上锁,直到22:24才关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:45、07:09、18:11、19:16四个时间点报告 MeasuredValue = None。前两次与早晨灶具使用时间重合,后两次与晚间灶具使用重合。虽然灶具工作时温度升高可能导致传感器超量程,但正常传感器应报告上限值而非 None,这表明传感器可能存在故障或兼容性问题。\",\n \"推理步骤2: 厨房窗户在07:08:30被打开(BooleanState=False),19:15:30再次被打开,但整个日志中没有任何关闭记录(BooleanState=True)。这意味着厨房窗户可能从早上7点起就一直处于开启状态,住户外出期间(07:16-16:22)窗户敞开存在一定安全隐患,但考虑到厨房窗户通风的合理性以及入户门已上锁,风险等级不高。\",\n \"推理步骤3: 16:22入户门被手动开锁(LockOperationType=1),门被打开(contact=False),但之后没有关门和上锁记录,直到22:24才出现关门(contact=True)和自动上锁(LockState=1)。这意味着入户门敞开了约6小时。结合18:13又有一次开门记录(第二人回家),说明家中可能有人在,但长时间不关入户门仍然是安全隐患。\",\n \"推理步骤4: 温度趋势方面,全屋温度从凌晨约23°C逐步升至中午约25.9°C,下午回落,符合夏季自然温度变化规律。18:13开启客厅空调(制冷模式SystemMode=3)后温度持续下降,至23:30回到约23.3°C,属于正常制冷效果。\",\n \"推理步骤5: 住户行为模式合理——约06:00起床,06:44做早餐,07:16出门并自动上锁,16:22/18:13分两次回家,22:24就寝前关灯关空调锁门。门锁操作均为手动开锁+自动上锁,无异常开锁方式(如暴力、远程非授权等),不存在入侵迹象。\",\n \"推理步骤6: 烟雾报警器、漏水传感器、阳台门传感器等安全设备全天无告警,无火灾或水患风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:45、07:09、18:11、19:16 四次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_window_contact 在 07:08:30 和 19:15:30 两次打开(False),全天无关闭(True)记录\",\n \"front_door_contact 在 16:22:02 打开后直到 22:24:23 才关闭,入户门敞开约6小时\",\n \"所有门锁操作均为正常方式(手动开锁/自动上锁),无异常入侵迹象\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:多次报告 None 值可能是传感器故障、灶具高温导致超量程或通信异常,建议检查传感器位置是否离灶具过近,必要时更换传感器\",\n \"设置入户门未关提醒:建议配置自动化规则,当入户门打开超过一定时间(如10分钟)未关闭时发送提醒通知\",\n \"确认厨房窗户状态:日志中窗户只有打开记录无关闭记录,建议检查窗户传感器是否正常工作,并在外出时确保窗户关闭\",\n \"考虑为外出模式添加自动化检查:出门上锁时自动检测所有窗户/门的关闭状态,如有未关闭的及时提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房窗户在关灶后开启但日志中无关闭记录;入户门在16:22开锁进入后长时间未关门/未上锁,直到22:24才关门上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在06:45、07:09、18:11、19:16四个时间点报告 MeasuredValue = None。前两次与早晨灶具使用时间重合,后两次与晚间灶具使用重合。虽然灶具工作时温度升高可能导致传感器超量程,但正常传感器应报告上限值而非 None,这表明传感器可能存在故障或兼容性问题。", "推理步骤2: 厨房窗户在07:08:30被打开(BooleanState=False),19:15:30再次被打开,但整个日志中没有任何关闭记录(BooleanState=True)。这意味着厨房窗户可能从早上7点起就一直处于开启状态,住户外出期间(07:16-16:22)窗户敞开存在一定安全隐患,但考虑到厨房窗户通风的合理性以及入户门已上锁,风险等级不高。", "推理步骤3: 16:22入户门被手动开锁(LockOperationType=1),门被打开(contact=False),但之后没有关门和上锁记录,直到22:24才出现关门(contact=True)和自动上锁(LockState=1)。这意味着入户门敞开了约6小时。结合18:13又有一次开门记录(第二人回家),说明家中可能有人在,但长时间不关入户门仍然是安全隐患。", "推理步骤4: 温度趋势方面,全屋温度从凌晨约23°C逐步升至中午约25.9°C,下午回落,符合夏季自然温度变化规律。18:13开启客厅空调(制冷模式SystemMode=3)后温度持续下降,至23:30回到约23.3°C,属于正常制冷效果。", "推理步骤5: 住户行为模式合理——约06:00起床,06:44做早餐,07:16出门并自动上锁,16:22/18:13分两次回家,22:24就寝前关灯关空调锁门。门锁操作均为手动开锁+自动上锁,无异常开锁方式(如暴力、远程非授权等),不存在入侵迹象。", "推理步骤6: 烟雾报警器、漏水传感器、阳台门传感器等安全设备全天无告警,无火灾或水患风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:45、07:09、18:11、19:16 四次报告 MeasuredValue = None,传感器工作异常", "kitchen_window_contact 在 07:08:30 和 19:15:30 两次打开(False),全天无关闭(True)记录", "front_door_contact 在 16:22:02 打开后直到 22:24:23 才关闭,入户门敞开约6小时", "所有门锁操作均为正常方式(手动开锁/自动上锁),无异常入侵迹象"], "recommended_actions": ["检查厨房温度传感器:多次报告 None 值可能是传感器故障、灶具高温导致超量程或通信异常,建议检查传感器位置是否离灶具过近,必要时更换传感器", "设置入户门未关提醒:建议配置自动化规则,当入户门打开超过一定时间(如10分钟)未关闭时发送提醒通知", "确认厨房窗户状态:日志中窗户只有打开记录无关闭记录,建议检查窗户传感器是否正常工作,并在外出时确保窗户关闭", "考虑为外出模式添加自动化检查:出门上锁时自动检测所有窗户/门的关闭状态,如有未关闭的及时提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.75343942642212, "api_error": null} {"episode_id": "SQ4_TN_B_0969", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0969.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261598, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在做饭结束后开启但日志中未见关闭记录,存在设备故障与安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从约 2450(24.5°C)跳升至 2845(28.45°C),升幅近 4°C,远超其他房间同时段的变化幅度。虽然 19:01 灶具开启可部分解释升温,但 2845 的读数出现在灶具开启之前(19:00 vs 19:01),时间顺序不合理。\",\n \"推理步骤2: 厨房温度传感器在 19:02 和 19:44 两次报告 MeasuredValue = None(空值),这是明确的设备异常信号。正常传感器不应返回 null,说明传感器可能存在故障、通信中断或过热保护触发。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2833(28.33°C),仍然异常偏高,但到 20:00 突然回落至 2412(24.12°C),降幅超过 4°C,这种剧烈波动进一步佐证传感器工作状态不稳定。\",\n \"推理步骤4: 厨房窗户在 19:43:30 被打开(StateValue=False),但在整个日志剩余时段(直到 23:30)未见关闭记录。夜间窗户持续开启存在安全隐患(入侵风险、雨水进入等)。\",\n \"推理步骤5: 其余设备行为均属正常——早晨 06:25 起床如厕、07:31 出门上班(门锁手动开锁→自动回锁)、18:17 下班回家、19:01-19:43 做饭、21:48 关灯就寝,符合单人居住的日常作息模式。入户门锁操作均为合法方式(Manual/Auto),无异常入侵迹象。\",\n \"推理步骤6: 全屋温度整体走势合理——夜间约 23°C,白天升至约 25-26°C,傍晚回落,客厅空调开启后温度下降,均为正常环境变化。唯独厨房传感器的异常读数和 null 值是例外。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2845(28.45°C),在灶具尚未开启时已出现异常高温\",\n \"19:02 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,表明设备故障或通信异常\",\n \"19:30 厨房温度仍为 2833(28.33°C),20:00 骤降至 2412(24.12°C),波动幅度异常\",\n \"19:43:30 厨房窗户打开后至日志结束(23:30)未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,排查 null 值和异常跳变的根因,必要时更换传感器\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间应关闭以防安全隐患\",\n \"考虑为厨房温度传感器设置异常值告警规则(如读数突变超过 2°C/30min 或出现 null 值时立即通知)\",\n \"烟雾报警器在整个做饭期间未触发,可顺便检查其工作状态以确保消防安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,同时厨房窗户在做饭结束后开启但日志中未见关闭记录,存在设备故障与安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从约 2450(24.5°C)跳升至 2845(28.45°C),升幅近 4°C,远超其他房间同时段的变化幅度。虽然 19:01 灶具开启可部分解释升温,但 2845 的读数出现在灶具开启之前(19:00 vs 19:01),时间顺序不合理。", "推理步骤2: 厨房温度传感器在 19:02 和 19:44 两次报告 MeasuredValue = None(空值),这是明确的设备异常信号。正常传感器不应返回 null,说明传感器可能存在故障、通信中断或过热保护触发。", "推理步骤3: 19:30 传感器恢复后读数为 2833(28.33°C),仍然异常偏高,但到 20:00 突然回落至 2412(24.12°C),降幅超过 4°C,这种剧烈波动进一步佐证传感器工作状态不稳定。", "推理步骤4: 厨房窗户在 19:43:30 被打开(StateValue=False),但在整个日志剩余时段(直到 23:30)未见关闭记录。夜间窗户持续开启存在安全隐患(入侵风险、雨水进入等)。", "推理步骤5: 其余设备行为均属正常——早晨 06:25 起床如厕、07:31 出门上班(门锁手动开锁→自动回锁)、18:17 下班回家、19:01-19:43 做饭、21:48 关灯就寝,符合单人居住的日常作息模式。入户门锁操作均为合法方式(Manual/Auto),无异常入侵迹象。", "推理步骤6: 全屋温度整体走势合理——夜间约 23°C,白天升至约 25-26°C,傍晚回落,客厅空调开启后温度下降,均为正常环境变化。唯独厨房传感器的异常读数和 null 值是例外。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2845(28.45°C),在灶具尚未开启时已出现异常高温", "19:02 和 19:44 厨房温度传感器两次报告 MeasuredValue = None,表明设备故障或通信异常", "19:30 厨房温度仍为 2833(28.33°C),20:00 骤降至 2412(24.12°C),波动幅度异常", "19:43:30 厨房窗户打开后至日志结束(23:30)未见关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,排查 null 值和异常跳变的根因,必要时更换传感器", "确认厨房窗户当前是否仍处于打开状态,夜间应关闭以防安全隐患", "考虑为厨房温度传感器设置异常值告警规则(如读数突变超过 2°C/30min 或出现 null 值时立即通知)", "烟雾报警器在整个做饭期间未触发,可顺便检查其工作状态以确保消防安全"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.051838636398315, "api_error": null} {"episode_id": "SQ4_TN_B_0970", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0970.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261599, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一段长时间未关闭/未上锁的记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——凌晨无人活动,06:09 主卧起床,06:30 厨房做早餐,07:21 出门并自动上锁,16:06 和 17:57 分两次回家,22:23 关灯就寝并自动锁门,符合单人或双人上班族的日常作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:31、07:17、18:29、19:20),共出现 4 次。正常传感器即使在高温环境下也应返回数值而非 None。这表明传感器可能因高温导致读数溢出、通信中断或硬件故障。\",\n \"推理步骤3: 16:06 入户门解锁并开门(contact=False),但直到 22:23 才记录到门关闭(contact=True)并自动上锁。中间长达约 6 小时 17 分钟门处于开启或未关闭状态。虽然 17:57 有第二次开门记录(说明住户回来),但从 16:06 到 17:57 之间约 2 小时门未关闭,存在安全隐患。\",\n \"推理步骤4: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:30),傍晚逐步回落,各房间温度一致,无异常热源。\",\n \"推理步骤5: 烟雾报警器和漏水传感器全天无告警,无入侵迹象(所有开门事件均伴随正常的手动解锁操作),洗碗机和洗衣机运行正常。\",\n \"推理步骤6: 厨房窗户在做完饭后打开通风(07:16、19:19),但日志中未见关闭记录,窗户可能一直处于开启状态,夜间存在一定安全风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:31、07:17、18:29、19:20 四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"入户门 16:06 开启后,直到 22:23 才记录到关闭(BooleanState.StateValue = True),中间超过 6 小时无关门记录\",\n \"厨房窗户在 07:16:30 和 19:19:30 两次打开(StateValue=False),但全天日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认其耐温范围是否满足灶具附近的工作环境,必要时更换或重新定位传感器\",\n \"检查入户门磁传感器是否工作正常,确认门是否确实长时间未关闭;如果是传感器问题则校准或更换,如果确实未关门则建议设置「门未关超过 5 分钟」的自动提醒\",\n \"为厨房窗户设置夜间未关闭提醒,避免夜间窗户长时间敞开带来的安全隐患\",\n \"考虑为灶具区域增加独立的耐高温温度传感器,确保烹饪期间温度监控不中断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一段长时间未关闭/未上锁的记录。", "reasoning": ["推理步骤1: 整体生活模式正常——凌晨无人活动,06:09 主卧起床,06:30 厨房做早餐,07:21 出门并自动上锁,16:06 和 17:57 分两次回家,22:23 关灯就寝并自动锁门,符合单人或双人上班族的日常作息。", "推理步骤2: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:31、07:17、18:29、19:20),共出现 4 次。正常传感器即使在高温环境下也应返回数值而非 None。这表明传感器可能因高温导致读数溢出、通信中断或硬件故障。", "推理步骤3: 16:06 入户门解锁并开门(contact=False),但直到 22:23 才记录到门关闭(contact=True)并自动上锁。中间长达约 6 小时 17 分钟门处于开启或未关闭状态。虽然 17:57 有第二次开门记录(说明住户回来),但从 16:06 到 17:57 之间约 2 小时门未关闭,存在安全隐患。", "推理步骤4: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:30),傍晚逐步回落,各房间温度一致,无异常热源。", "推理步骤5: 烟雾报警器和漏水传感器全天无告警,无入侵迹象(所有开门事件均伴随正常的手动解锁操作),洗碗机和洗衣机运行正常。", "推理步骤6: 厨房窗户在做完饭后打开通风(07:16、19:19),但日志中未见关闭记录,窗户可能一直处于开启状态,夜间存在一定安全风险。"], "key_evidence": ["厨房温度传感器在 06:31、07:17、18:29、19:20 四次报告 MeasuredValue = None,均与灶具使用时段相关", "入户门 16:06 开启后,直到 22:23 才记录到关闭(BooleanState.StateValue = True),中间超过 6 小时无关门记录", "厨房窗户在 07:16:30 和 19:19:30 两次打开(StateValue=False),但全天日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认其耐温范围是否满足灶具附近的工作环境,必要时更换或重新定位传感器", "检查入户门磁传感器是否工作正常,确认门是否确实长时间未关闭;如果是传感器问题则校准或更换,如果确实未关门则建议设置「门未关超过 5 分钟」的自动提醒", "为厨房窗户设置夜间未关闭提醒,避免夜间窗户长时间敞开带来的安全隐患", "考虑为灶具区域增加独立的耐高温温度传感器,确保烹饪期间温度监控不中断"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.95463538169861, "api_error": null} {"episode_id": "SQ4_TN_B_0971", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0971.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261600, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——各房间温度从凌晨约23.0°C平稳上升至中午约25.8°C,再缓慢回落,符合夏季自然昼夜温差规律,整体正常。\",\n \"推理步骤2: 厨房温度在19:00突然从约24.6°C跳升至28.25°C,涨幅约3.6°C,而同一时刻其他房间温度仅约24.3°C。虽然19:14灶具开启可以解释部分升温,但跳变发生在灶具开启前14分钟,且幅度异常大,说明传感器可能在此前已出现读数漂移。\",\n \"推理步骤3: 厨房温度传感器在19:15和19:49两次报告 MeasuredValue = None(空值),表明传感器在灶具使用期间发生了数据丢失或通信中断。到20:00恢复为24.10°C,与其他房间一致,说明传感器间歇性故障。\",\n \"推理步骤4: 烟雾报警器全天无触发记录,排除火灾风险;漏水传感器无报警,排除水患。\",\n \"推理步骤5: 入侵分析——07:28住户出门:手动开锁→开门→关门→自动上锁,流程完整。18:20住户回家:手动开锁→开门→进入→开灯开空调,行为连贯合理。22:01关灯关空调后门锁自动上锁,属于正常就寝流程。全天无未授权开锁或异常入侵迹象。\",\n \"推理步骤6: 厨房窗户在19:48:30被打开(做饭结束后通风),但直到日志结束(23:30)未见关闭记录。夜间窗户持续开启存在一定安全隐患(入侵风险及夜间降温)。\",\n \"推理步骤7: 入户门在18:20开启后,直到22:01:32才记录到关闭(StateValue=True),中间近4小时门传感器未报告关闭状态。结合住户进门后的正常活动轨迹,最可能的解释是门在进入后很快关闭但传感器延迟上报,或者门确实长时间未关——后者存在安全隐患,但考虑到住户在家且无异常运动事件,判定为低风险。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至2825(28.25°C),较其他房间高出约4°C,且发生在灶具开启前\",\n \"19:15 和 19:49 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:48:30 厨房窗户打开后至日志结束未见关闭记录\",\n \"入户门 18:20:02 打开后至 22:01:32 才记录关闭(约3小时40分钟间隔)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和电量,必要时重新配对或更换传感器\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间建议关闭以保障安全\",\n \"检查入户门磁传感器是否存在上报延迟问题,确认门在住户进入后是否正常关闭\",\n \"考虑为厨房温度传感器设置异常值告警规则(如温差超过3°C或出现null值时自动通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时厨房窗户在做饭结束后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 全天温度趋势分析——各房间温度从凌晨约23.0°C平稳上升至中午约25.8°C,再缓慢回落,符合夏季自然昼夜温差规律,整体正常。", "推理步骤2: 厨房温度在19:00突然从约24.6°C跳升至28.25°C,涨幅约3.6°C,而同一时刻其他房间温度仅约24.3°C。虽然19:14灶具开启可以解释部分升温,但跳变发生在灶具开启前14分钟,且幅度异常大,说明传感器可能在此前已出现读数漂移。", "推理步骤3: 厨房温度传感器在19:15和19:49两次报告 MeasuredValue = None(空值),表明传感器在灶具使用期间发生了数据丢失或通信中断。到20:00恢复为24.10°C,与其他房间一致,说明传感器间歇性故障。", "推理步骤4: 烟雾报警器全天无触发记录,排除火灾风险;漏水传感器无报警,排除水患。", "推理步骤5: 入侵分析——07:28住户出门:手动开锁→开门→关门→自动上锁,流程完整。18:20住户回家:手动开锁→开门→进入→开灯开空调,行为连贯合理。22:01关灯关空调后门锁自动上锁,属于正常就寝流程。全天无未授权开锁或异常入侵迹象。", "推理步骤6: 厨房窗户在19:48:30被打开(做饭结束后通风),但直到日志结束(23:30)未见关闭记录。夜间窗户持续开启存在一定安全隐患(入侵风险及夜间降温)。", "推理步骤7: 入户门在18:20开启后,直到22:01:32才记录到关闭(StateValue=True),中间近4小时门传感器未报告关闭状态。结合住户进门后的正常活动轨迹,最可能的解释是门在进入后很快关闭但传感器延迟上报,或者门确实长时间未关——后者存在安全隐患,但考虑到住户在家且无异常运动事件,判定为低风险。"], "key_evidence": ["19:00 厨房温度突跳至2825(28.25°C),较其他房间高出约4°C,且发生在灶具开启前", "19:15 和 19:49 厨房温度传感器两次报告 MeasuredValue = None", "19:48:30 厨房窗户打开后至日志结束未见关闭记录", "入户门 18:20:02 打开后至 22:01:32 才记录关闭(约3小时40分钟间隔)"], "recommended_actions": ["检查厨房温度传感器的连接状态和电量,必要时重新配对或更换传感器", "确认厨房窗户当前是否仍处于打开状态,夜间建议关闭以保障安全", "检查入户门磁传感器是否存在上报延迟问题,确认门在住户进入后是否正常关闭", "考虑为厨房温度传感器设置异常值告警规则(如温差超过3°C或出现null值时自动通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.29613494873047, "api_error": null} {"episode_id": "SQ4_TN_B_0972", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0972.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261601, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,且入户门在16:02开锁后长时间未关闭/未上锁,直到22:22才重新关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:24起床,06:37做早餐,07:10出门并自动上锁,18:18回家,22:22就寝,符合单人上班族的典型作息。\",\n \"推理步骤2: 厨房温度传感器在06:37灶具开启后的06:38和06:53两次报告 MeasuredValue = None,晚间18:36灶具开启后的18:37和18:55同样报告 None。灶具关闭、厨房温度恢复正常后传感器才重新上报有效数值。这说明传感器在高温环境下可能超出量程或存在故障,无法正常监测厨房温度,存在安全隐患——若发生火灾相关的异常高温,该传感器将无法提供有效预警。\",\n \"推理步骤3: 16:02入户门被手动开锁(LockOperationType=1)且门被打开(StateValue=False),但日志中直到22:22才出现门关闭(StateValue=True)和自动上锁事件。期间超过6小时门处于开启/未锁状态。结合18:18住户回家时玄关和客厅同时检测到人体存在,说明16:02的开门事件可能是住户短暂回家或有人来访,但门长时间未关闭是一个安全风险点。\",\n \"推理步骤4: 温度趋势方面,凌晨约23°C,06:00起全屋温度同步上升约1°C(从约22.9°C到约24°C),之后持续升温至中午12:00-12:30达到峰值约25.9°C,下午逐步回落,晚间空调开启后加速降温。这是夏季正常的室外温度日变化传导到室内的表现,无异常。\",\n \"推理步骤5: 其他设备行为均正常:烟雾报警器未触发、漏水传感器未报警、门窗开关与生活场景匹配(做饭后开窗通风)、洗碗机晚餐后启动、就寝前关灯关空调拉窗帘锁门,均为合理操作。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间4次报告 MeasuredValue = None(06:38、06:53、18:37、18:55),灶具关闭后恢复正常\",\n \"入户门16:02:02开启(BooleanState.StateValue=False),直到22:22:26才关闭(BooleanState.StateValue=True),中间超过6小时无关门记录\",\n \"16:02开门事件仅有玄关运动传感器触发,无后续室内活动痕迹,18:18住户回家时门仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器:该传感器在灶具使用时持续失效,无法在烹饪场景下提供温度监测,建议选用耐高温型号或调整安装位置远离灶具热源\",\n \"设置入户门未关闭超时告警:建议配置自动化规则,当入户门打开超过10-15分钟未关闭时推送提醒,避免长时间门户大开的安全风险\",\n \"确认16:02的开门事件身份:回顾当时是否有家庭成员或预期访客到来,排除非授权进入的可能性\",\n \"厨房烟雾报警器作为灶具使用期间的备用安全保障,建议定期测试其工作状态,确保在温度传感器失效时仍有火灾预警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,且入户门在16:02开锁后长时间未关闭/未上锁,直到22:22才重新关门上锁。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:24起床,06:37做早餐,07:10出门并自动上锁,18:18回家,22:22就寝,符合单人上班族的典型作息。", "推理步骤2: 厨房温度传感器在06:37灶具开启后的06:38和06:53两次报告 MeasuredValue = None,晚间18:36灶具开启后的18:37和18:55同样报告 None。灶具关闭、厨房温度恢复正常后传感器才重新上报有效数值。这说明传感器在高温环境下可能超出量程或存在故障,无法正常监测厨房温度,存在安全隐患——若发生火灾相关的异常高温,该传感器将无法提供有效预警。", "推理步骤3: 16:02入户门被手动开锁(LockOperationType=1)且门被打开(StateValue=False),但日志中直到22:22才出现门关闭(StateValue=True)和自动上锁事件。期间超过6小时门处于开启/未锁状态。结合18:18住户回家时玄关和客厅同时检测到人体存在,说明16:02的开门事件可能是住户短暂回家或有人来访,但门长时间未关闭是一个安全风险点。", "推理步骤4: 温度趋势方面,凌晨约23°C,06:00起全屋温度同步上升约1°C(从约22.9°C到约24°C),之后持续升温至中午12:00-12:30达到峰值约25.9°C,下午逐步回落,晚间空调开启后加速降温。这是夏季正常的室外温度日变化传导到室内的表现,无异常。", "推理步骤5: 其他设备行为均正常:烟雾报警器未触发、漏水传感器未报警、门窗开关与生活场景匹配(做饭后开窗通风)、洗碗机晚餐后启动、就寝前关灯关空调拉窗帘锁门,均为合理操作。"], "key_evidence": ["厨房温度传感器在灶具运行期间4次报告 MeasuredValue = None(06:38、06:53、18:37、18:55),灶具关闭后恢复正常", "入户门16:02:02开启(BooleanState.StateValue=False),直到22:22:26才关闭(BooleanState.StateValue=True),中间超过6小时无关门记录", "16:02开门事件仅有玄关运动传感器触发,无后续室内活动痕迹,18:18住户回家时门仍处于开启状态"], "recommended_actions": ["检查或更换厨房温度传感器:该传感器在灶具使用时持续失效,无法在烹饪场景下提供温度监测,建议选用耐高温型号或调整安装位置远离灶具热源", "设置入户门未关闭超时告警:建议配置自动化规则,当入户门打开超过10-15分钟未关闭时推送提醒,避免长时间门户大开的安全风险", "确认16:02的开门事件身份:回顾当时是否有家庭成员或预期访客到来,排除非授权进入的可能性", "厨房烟雾报警器作为灶具使用期间的备用安全保障,建议定期测试其工作状态,确保在温度传感器失效时仍有火灾预警能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.94304060935974, "api_error": null} {"episode_id": "SQ4_TN_B_0984", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0984.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261613, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合自然昼夜规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器每30分钟一次的温度上报,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。\",\n \"推理步骤2: 凌晨00:00-05:30,全屋温度稳定在22.9°C-23.1°C之间,属于夏季夜间正常室温范围。\",\n \"推理步骤3: 06:00起温度开始上升,至12:00-12:30达到峰值约25.7°C-25.9°C,随后逐步回落,至23:30降回约23.3°C-23.4°C。这完全符合夏季日出后升温、午后达峰、傍晚降温的自然昼夜温度曲线。\",\n \"推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度走势高度一致,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或设备故障导致的异常发热。\",\n \"推理步骤5: 全天温度范围约22.9°C-25.9°C,波动幅度约3°C,未出现突变或尖峰,无需触发任何安全告警。\"\n ],\n \"key_evidence\": [\n \"全天温度范围22.9°C-25.9°C,四个传感器走势一致,符合自然昼夜温度变化规律\",\n \"无任何门锁、门窗、运动、烟雾、漏水等安全传感器的异常事件上报\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合自然昼夜规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器每30分钟一次的温度上报,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安全相关设备的异常事件。", "推理步骤2: 凌晨00:00-05:30,全屋温度稳定在22.9°C-23.1°C之间,属于夏季夜间正常室温范围。", "推理步骤3: 06:00起温度开始上升,至12:00-12:30达到峰值约25.7°C-25.9°C,随后逐步回落,至23:30降回约23.3°C-23.4°C。这完全符合夏季日出后升温、午后达峰、傍晚降温的自然昼夜温度曲线。", "推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度走势高度一致,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或设备故障导致的异常发热。", "推理步骤5: 全天温度范围约22.9°C-25.9°C,波动幅度约3°C,未出现突变或尖峰,无需触发任何安全告警。"], "key_evidence": ["全天温度范围22.9°C-25.9°C,四个传感器走势一致,符合自然昼夜温度变化规律", "无任何门锁、门窗、运动、烟雾、漏水等安全传感器的异常事件上报"], "recommended_actions": ["当前无需采取任何措施,家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 13.677601337432861, "api_error": null} {"episode_id": "SQ4_TN_B_0975", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0975.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261604, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常:18:00 突然飙升至 28.51°C 并持续,随后两次报告 None(空值),疑似传感器故障;同时厨房窗户在做完饭后处于打开状态未关闭,存在夜间安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.7-25.9°C,午后逐步回落,各传感器走势高度一致,属正常昼夜温度曲线。\",\n \"推理步骤2: 厨房温度异常跳变——17:30 厨房温度为 24.75°C,与其他房间一致;18:00 突然跳至 28.51°C,比同时刻其他房间(约 24.5-24.7°C)高出约 4°C。此时灶具尚未开启(18:51 才开),无合理热源解释这一跳变。18:30 仍为 28.55°C,持续异常高。\",\n \"推理步骤3: 传感器空值异常——18:52 和 19:32 厨房温度传感器报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器可能出现硬件故障、通信中断或读数溢出。\",\n \"推理步骤4: 19:00 之后厨房温度恢复正常(24.27°C),与其他房间重新一致,说明 18:00-18:52 期间的异常高温读数很可能是传感器故障导致的虚假数据,而非真实环境温度。\",\n \"推理步骤5: 厨房窗户在 19:31:30 被打开(做完饭通风),但直到日志结束(23:30)仍未关闭。住户 21:51 已进入睡眠准备状态(关灯、关空调、锁门),厨房窗户整夜敞开存在安全和天气风险。\",\n \"推理步骤6: 住户行为模式正常——06:30 起床如厕,07:15-07:35 早餐后出门(手动开锁、门开关、自动上锁),18:04 回家(开锁进门、开灯开空调),18:51 做饭,19:31 关灶,21:51 关灯就寝。入户门锁操作均为正常的手动/自动模式,无异常入侵迹象。\",\n \"推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,门锁无异常操作记录,排除火灾、水漏和入侵威胁。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 24.75°C 骤升至 28.51°C,比同时刻其他房间高约 4°C,且此时灶具未开启\",\n \"18:30 厨房温度仍为 28.55°C,持续异常偏高\",\n \"18:52 和 19:32 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应出现此情况\",\n \"19:00 之后厨房温度恢复正常并与其他房间一致,说明此前高温为虚假读数\",\n \"19:31:30 厨房窗户打开后至日志结束(23:30)未关闭,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或重启设备,必要时更换传感器\",\n \"关闭厨房窗户,或设置自动化规则:就寝模式启动时检查并提醒关闭所有窗户\",\n \"建议为厨房温度传感器设置异常值告警阈值(如与其他房间偏差超过 3°C 或出现空值时立即通知)\",\n \"考虑增加自动化联动:灶具关闭一定时间后若窗户仍开启,发送提醒通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常:18:00 突然飙升至 28.51°C 并持续,随后两次报告 None(空值),疑似传感器故障;同时厨房窗户在做完饭后处于打开状态未关闭,存在夜间安全隐患。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约 22.9-23.1°C,随日照升温至中午 25.7-25.9°C,午后逐步回落,各传感器走势高度一致,属正常昼夜温度曲线。", "推理步骤2: 厨房温度异常跳变——17:30 厨房温度为 24.75°C,与其他房间一致;18:00 突然跳至 28.51°C,比同时刻其他房间(约 24.5-24.7°C)高出约 4°C。此时灶具尚未开启(18:51 才开),无合理热源解释这一跳变。18:30 仍为 28.55°C,持续异常高。", "推理步骤3: 传感器空值异常——18:52 和 19:32 厨房温度传感器报告 MeasuredValue = None。正常传感器不应返回空值,这表明传感器可能出现硬件故障、通信中断或读数溢出。", "推理步骤4: 19:00 之后厨房温度恢复正常(24.27°C),与其他房间重新一致,说明 18:00-18:52 期间的异常高温读数很可能是传感器故障导致的虚假数据,而非真实环境温度。", "推理步骤5: 厨房窗户在 19:31:30 被打开(做完饭通风),但直到日志结束(23:30)仍未关闭。住户 21:51 已进入睡眠准备状态(关灯、关空调、锁门),厨房窗户整夜敞开存在安全和天气风险。", "推理步骤6: 住户行为模式正常——06:30 起床如厕,07:15-07:35 早餐后出门(手动开锁、门开关、自动上锁),18:04 回家(开锁进门、开灯开空调),18:51 做饭,19:31 关灶,21:51 关灯就寝。入户门锁操作均为正常的手动/自动模式,无异常入侵迹象。", "推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,门锁无异常操作记录,排除火灾、水漏和入侵威胁。"], "key_evidence": ["18:00 厨房温度从 24.75°C 骤升至 28.51°C,比同时刻其他房间高约 4°C,且此时灶具未开启", "18:30 厨房温度仍为 28.55°C,持续异常偏高", "18:52 和 19:32 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应出现此情况", "19:00 之后厨房温度恢复正常并与其他房间一致,说明此前高温为虚假读数", "19:31:30 厨房窗户打开后至日志结束(23:30)未关闭,住户已就寝"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或重启设备,必要时更换传感器", "关闭厨房窗户,或设置自动化规则:就寝模式启动时检查并提醒关闭所有窗户", "建议为厨房温度传感器设置异常值告警阈值(如与其他房间偏差超过 3°C 或出现空值时立即通知)", "考虑增加自动化联动:灶具关闭一定时间后若窗户仍开启,发送提醒通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.050503969192505, "api_error": null} {"episode_id": "SQ4_TN_B_0990", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0990.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261619, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报。\",\n \"推理步骤2: 温度值(Matter 协议以 0.01°C 为单位)换算后,凌晨 00:00-05:30 各房间温度约 22.9-23.1°C,清晨 06:00 起逐步升高,中午 12:00 左右达到峰值约 25.8°C,午后缓慢回落,至 23:30 降回约 23.3°C。这是典型的夏季(6月21日为夏至)自然昼夜温度曲线。\",\n \"推理步骤3: 四个房间的温度走势高度一致,彼此差异始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或空调故障等异常。\",\n \"推理步骤4: 全天温度范围 22.9-25.9°C,处于正常室内舒适区间,未出现任何突变、尖峰或骤降,不存在设备故障或传感器异常的迹象。\"\n ],\n \"key_evidence\": [\n \"全天温度范围约 22.9°C ~ 25.9°C,符合夏季室内正常波动\",\n \"四个房间温度走势同步,无单点异常偏离\",\n \"无任何安防类设备(门锁、运动传感器、烟雾报警器、漏水传感器)的告警事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报。", "推理步骤2: 温度值(Matter 协议以 0.01°C 为单位)换算后,凌晨 00:00-05:30 各房间温度约 22.9-23.1°C,清晨 06:00 起逐步升高,中午 12:00 左右达到峰值约 25.8°C,午后缓慢回落,至 23:30 降回约 23.3°C。这是典型的夏季(6月21日为夏至)自然昼夜温度曲线。", "推理步骤3: 四个房间的温度走势高度一致,彼此差异始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或空调故障等异常。", "推理步骤4: 全天温度范围 22.9-25.9°C,处于正常室内舒适区间,未出现任何突变、尖峰或骤降,不存在设备故障或传感器异常的迹象。"], "key_evidence": ["全天温度范围约 22.9°C ~ 25.9°C,符合夏季室内正常波动", "四个房间温度走势同步,无单点异常偏离", "无任何安防类设备(门锁、运动传感器、烟雾报警器、漏水传感器)的告警事件"], "recommended_actions": ["当前无需采取任何措施,家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 14.510475397109985, "api_error": null} {"episode_id": "SQ4_TN_B_0994", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0994.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261623, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一次开门后长时间未关闭的记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无活动,06:08 主卧起床,06:49 厨房做早餐,07:42 出门并自动上锁,18:17 回家开灯开空调做晚餐,22:49 关灯锁门就寝,符合单人居住的工作日模式。\",\n \"推理步骤2: 厨房温度传感器在 06:50、07:00、18:22、19:17 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明灶具工作时的高温或蒸汽可能导致传感器读数异常。虽然 07:00 和 19:30 的定时读数恢复了正常数值,但频繁出现 None 值表明传感器在高温环境下工作不稳定,存在故障隐患。\",\n \"推理步骤3: 16:27 入户门解锁并开门(contact=False),玄关检测到人体,但日志中直到 22:49 才记录 front_door_contact = True(门关闭)。中间没有关门记录。如果这是住户短暂回家取物后又出门(18:17 再次开锁进门),则门可能在 16:27 至 18:17 之间处于未关闭状态,约 110 分钟无人看管且门未关,存在安全隐患。\",\n \"推理步骤4: 温度趋势正常——夜间约 23°C,白天逐步升至 25.8°C 峰值(12:00-12:30),下午回落,晚间开空调后降至 23°C 左右,符合夏季自然温度曲线。\",\n \"推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门锁操作均为 Manual/Auto 合法来源,无入侵迹象。\",\n \"推理步骤6: 厨房窗户在做完饭后打开(06:59、19:16),属于通风的正常操作,但日志中未见关闭记录,需注意夜间窗户是否仍处于开启状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:50、07:00、18:22、19:17 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"16:27 入户门开锁开门后,日志中直到 22:49 才出现门关闭(contact=True)记录,中间约 6 小时无关门事件\",\n \"厨房窗户在 06:59 和 19:16 打开后,日志中无对应的关闭记录(StateValue 恢复为 True)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换耐高温型号或调整安装位置\",\n \"检查入户门传感器是否存在漏报问题,确认 16:27 至 18:17 期间门是否确实处于未关闭状态;如确认,建议设置门未关闭超时告警(如 5 分钟未关门则推送通知)\",\n \"为厨房窗户设置夜间未关闭提醒,避免夜间窗户长时间敞开带来的安全风险\",\n \"建议为独居场景增加离家模式自动化:出门后自动检查所有门窗状态并推送未关闭提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一次开门后长时间未关闭的记录。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无活动,06:08 主卧起床,06:49 厨房做早餐,07:42 出门并自动上锁,18:17 回家开灯开空调做晚餐,22:49 关灯锁门就寝,符合单人居住的工作日模式。", "推理步骤2: 厨房温度传感器在 06:50、07:00、18:22、19:17 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明灶具工作时的高温或蒸汽可能导致传感器读数异常。虽然 07:00 和 19:30 的定时读数恢复了正常数值,但频繁出现 None 值表明传感器在高温环境下工作不稳定,存在故障隐患。", "推理步骤3: 16:27 入户门解锁并开门(contact=False),玄关检测到人体,但日志中直到 22:49 才记录 front_door_contact = True(门关闭)。中间没有关门记录。如果这是住户短暂回家取物后又出门(18:17 再次开锁进门),则门可能在 16:27 至 18:17 之间处于未关闭状态,约 110 分钟无人看管且门未关,存在安全隐患。", "推理步骤4: 温度趋势正常——夜间约 23°C,白天逐步升至 25.8°C 峰值(12:00-12:30),下午回落,晚间开空调后降至 23°C 左右,符合夏季自然温度曲线。", "推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门锁操作均为 Manual/Auto 合法来源,无入侵迹象。", "推理步骤6: 厨房窗户在做完饭后打开(06:59、19:16),属于通风的正常操作,但日志中未见关闭记录,需注意夜间窗户是否仍处于开启状态。"], "key_evidence": ["厨房温度传感器在 06:50、07:00、18:22、19:17 四次报告 MeasuredValue = None,均与灶具使用时段重合", "16:27 入户门开锁开门后,日志中直到 22:49 才出现门关闭(contact=True)记录,中间约 6 小时无关门事件", "厨房窗户在 06:59 和 19:16 打开后,日志中无对应的关闭记录(StateValue 恢复为 True)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,考虑更换耐高温型号或调整安装位置", "检查入户门传感器是否存在漏报问题,确认 16:27 至 18:17 期间门是否确实处于未关闭状态;如确认,建议设置门未关闭超时告警(如 5 分钟未关门则推送通知)", "为厨房窗户设置夜间未关闭提醒,避免夜间窗户长时间敞开带来的安全风险", "建议为独居场景增加离家模式自动化:出门后自动检查所有门窗状态并推送未关闭提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.51675271987915, "api_error": null} {"episode_id": "SQ4_TN_B_0998", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_0998.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261627, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时住户外出期间入户门和厨房窗户存在未完全确认关闭的状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:00:00、07:01:02、18:23:00、19:11:00 共四次报告 MeasuredValue = None。每次都发生在灶具开关操作前后,说明灶具运行产生的热量或电磁干扰可能导致传感器读数异常,也可能是传感器本身存在间歇性故障。\",\n \"推理步骤2: 分析住户作息——凌晨无活动,06:02 主卧检测到人起床开灯,07:00 进厨房做早餐,07:34 关灯出门上锁(自动锁门),15:57 有人回来但未触发客厅活动(可能短暂停留),17:45 正式回家开灯开空调,18:22 做晚饭,22:36 关灯回卧室睡觉并确认锁门。整体作息模式合理,无入侵迹象。\",\n \"推理步骤3: 温度趋势正常——凌晨约 22.9°C,随日出逐步升高,中午 12:30 达到峰值约 25.8°C,之后逐步下降,17:45 开空调后客厅温度加速下降,晚间回落至约 23.3°C。各房间温度走势一致,无异常热源。\",\n \"推理步骤4: 入户门在 07:34 出门时自动上锁(LockState=1),15:57 手动开锁进入但日志中未记录随后的关门/锁门事件,直到 22:36 才记录到门关闭(StateValue=True)并自动上锁。这意味着 15:57~17:45 期间门锁状态不明确,存在一定安全隐患,但 17:45 住户正常回家的行为链说明这更可能是短暂开门取物后未被传感器完整捕获。\",\n \"推理步骤5: 厨房窗户在 06:59 和 19:10 两次打开(StateValue=False),均发生在灶具关闭后,符合做饭后开窗通风的习惯。但日志中未记录窗户关闭事件,若窗户在夜间仍处于打开状态,存在安全和天气风险。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,无火灾或水灾风险。洗碗机 19:25 启动运行,属正常使用。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:00、07:01:02、18:23:00、19:11:00 四次报告 MeasuredValue = None,与灶具开关操作时间高度关联\",\n \"15:57 入户门开锁开门后,日志中未记录关门/锁门事件,直到 22:36 才出现门关闭并自动上锁的记录\",\n \"厨房窗户在 06:59:30 和 19:10:30 两次打开,日志中无对应的关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:该传感器在灶具操作前后多次返回 None,建议检查其安装位置是否离灶具过近,或进行固件更新/更换传感器\",\n \"确认厨房窗户当前状态:日志中窗户两次打开后均无关闭记录,建议确认窗户是否已关好,夜间开窗可能带来安全和天气风险\",\n \"检查入户门传感器灵敏度:15:57 开门后长时间无关门记录,建议排查门磁传感器是否存在漏报情况\",\n \"考虑为灶具添加自动关闭规则:住户 07:00 开灶后 07:34 出门,灶具在出门前已关闭,但建议设置离家自动检查灶具状态的安全规则以防遗忘\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时住户外出期间入户门和厨房窗户存在未完全确认关闭的状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:00:00、07:01:02、18:23:00、19:11:00 共四次报告 MeasuredValue = None。每次都发生在灶具开关操作前后,说明灶具运行产生的热量或电磁干扰可能导致传感器读数异常,也可能是传感器本身存在间歇性故障。", "推理步骤2: 分析住户作息——凌晨无活动,06:02 主卧检测到人起床开灯,07:00 进厨房做早餐,07:34 关灯出门上锁(自动锁门),15:57 有人回来但未触发客厅活动(可能短暂停留),17:45 正式回家开灯开空调,18:22 做晚饭,22:36 关灯回卧室睡觉并确认锁门。整体作息模式合理,无入侵迹象。", "推理步骤3: 温度趋势正常——凌晨约 22.9°C,随日出逐步升高,中午 12:30 达到峰值约 25.8°C,之后逐步下降,17:45 开空调后客厅温度加速下降,晚间回落至约 23.3°C。各房间温度走势一致,无异常热源。", "推理步骤4: 入户门在 07:34 出门时自动上锁(LockState=1),15:57 手动开锁进入但日志中未记录随后的关门/锁门事件,直到 22:36 才记录到门关闭(StateValue=True)并自动上锁。这意味着 15:57~17:45 期间门锁状态不明确,存在一定安全隐患,但 17:45 住户正常回家的行为链说明这更可能是短暂开门取物后未被传感器完整捕获。", "推理步骤5: 厨房窗户在 06:59 和 19:10 两次打开(StateValue=False),均发生在灶具关闭后,符合做饭后开窗通风的习惯。但日志中未记录窗户关闭事件,若窗户在夜间仍处于打开状态,存在安全和天气风险。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无触发,无火灾或水灾风险。洗碗机 19:25 启动运行,属正常使用。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:00、07:01:02、18:23:00、19:11:00 四次报告 MeasuredValue = None,与灶具开关操作时间高度关联", "15:57 入户门开锁开门后,日志中未记录关门/锁门事件,直到 22:36 才出现门关闭并自动上锁的记录", "厨房窗户在 06:59:30 和 19:10:30 两次打开,日志中无对应的关闭记录"], "recommended_actions": ["检查厨房温度传感器:该传感器在灶具操作前后多次返回 None,建议检查其安装位置是否离灶具过近,或进行固件更新/更换传感器", "确认厨房窗户当前状态:日志中窗户两次打开后均无关闭记录,建议确认窗户是否已关好,夜间开窗可能带来安全和天气风险", "检查入户门传感器灵敏度:15:57 开门后长时间无关门记录,建议排查门磁传感器是否存在漏报情况", "考虑为灶具添加自动关闭规则:住户 07:00 开灶后 07:34 出门,灶具在出门前已关闭,但建议设置离家自动检查灶具状态的安全规则以防遗忘"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.662266731262207, "api_error": null} {"episode_id": "SQ4_TN_B_1003", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_1003.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261632, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;同时 16:11 入户门开锁后未观察到关门/上锁记录,存在门未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57、07:28、18:21、19:16 四次报告 MeasuredValue = None,每次都紧跟灶具开启或关闭事件,说明传感器可能受热源干扰或自身存在故障。\",\n \"推理步骤2: 16:11 入户门锁解锁(LockOperationType=1)、门传感器报告开启(StateValue=False)、玄关检测到人,但之后没有关门(StateValue=True)和重新上锁的记录,直到 22:38 才出现关门上锁事件。这意味着入户门可能在 16:11 至 22:38 之间处于未关闭/未上锁状态长达约 6.5 小时。\",\n \"推理步骤3: 17:48 第二次开门进入时同样只有开门记录无关门记录,与 22:38 的关门上锁对应,说明住户可能习惯进门后不立即关门,或门传感器漏报了关门事件。但从安全角度看,长时间门未锁定是风险。\",\n \"推理步骤4: 其余行为模式正常——早晨起床开灯做饭、出门上锁、傍晚回家开空调做饭、晚间关灯就寝,温度曲线符合夏季昼夜变化规律(夜间约 22.9°C,午间峰值约 25.8°C),无入侵、火灾或漏水迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:57、07:28、18:21、19:16 报告 MeasuredValue = None\",\n \"16:11 front_door_lock 解锁、front_door_contact = False(门开),之后无关门/上锁记录直到 22:38\",\n \"厨房窗户在灶具关闭后打开(07:27:30 和 19:15:30)属于通风行为,但未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否距灶具过近导致读数异常,必要时更换或重新校准传感器\",\n \"确认入户门传感器是否存在漏报问题(可能关门事件未被记录),若传感器正常则建议设置\"门未关闭超过 5 分钟\"自动提醒\",\n \"建议为厨房窗户传感器增加长时间未关闭告警,避免夜间窗户敞开带来的安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": null, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;同时 16:11 入户门开锁后未观察到关门/上锁记录,存在门未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:57、07:28、18:21、19:16 四次报告 MeasuredValue = None,每次都紧跟灶具开启或关闭事件,说明传感器可能受热源干扰或自身存在故障。\",\n \"推理步骤2: 16:11 入户门锁解锁(LockOperationType=1)、门传感器报告开启(StateValue=False)、玄关检测到人,但之后没有关门(StateValue=True)和重新上锁的记录,直到 22:38 才出现关门上锁事件。这意味着入户门可能在 16:11 至 22:38 之间处于未关闭/未上锁状态长达约 6.5 小时。\",\n "], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 20.440706729888916, "api_error": null} {"episode_id": "SQ4_TN_B_1006", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_1006.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261635, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——各房间温度从凌晨约 22.9°C 平稳上升至中午约 25.8°C,再缓慢回落,符合夏季自然温度曲线,整体正常。\",\n \"推理步骤2: 厨房温度在 19:00 突然从约 24.5°C 跳升至 28.33°C,而此时灶具尚未开启(19:15 才开),其他房间同时段温度仅约 24.3°C,温差近 4°C 不合理。这说明该跳变并非烹饪导致,更像传感器读数异常。\",\n \"推理步骤3: 19:16 和 19:38 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在灶具使用前后出现数据丢失,进一步印证传感器自身存在故障。\",\n \"推理步骤4: 19:30 厨房温度仍为 28.37°C(灶具 19:15 开启仅 15 分钟),而 19:37 灶具关闭、19:37:30 开窗通风后,20:00 温度骤降回 24.03°C,降幅超过 4°C 仅用约 23 分钟,降速异常快,可能是传感器恢复正常读数而非真实降温。\",\n \"推理步骤5: 住户行为模式完全正常——早晨 6:26 起床如厕、6:54 去厨房做早餐、7:40 出门上班并自动锁门、18:24 回家开灯开空调、19:15 做晚饭、22:14 关灯睡觉,属于典型单人上班族作息。\",\n \"推理步骤6: 入侵风险排除——两次开关门均伴随正常的手动解锁/自动上锁流程,运动传感器与门锁事件时序吻合,22:14 确认门已关闭并自动上锁。\",\n \"推理步骤7: 火灾风险排除——灶具使用时间约 22 分钟(19:15-19:37),时长合理;烟雾报警器全天无触发;做完饭后开窗通风,操作规范。\",\n \"推理步骤8: 漏水风险排除——卫生间漏水传感器全天无报警。洗碗机 20:13 启动运行,属正常使用。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度突跳至 2833(28.33°C),此时灶具未开,其他房间仅约 24.3-24.4°C,温差异常\",\n \"19:16 和 19:38 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失\",\n \"19:00 的异常高温出现在灶具 19:15 开启之前,无法用烹饪解释\",\n \"20:00 温度从 28.37°C 骤降至 24.03°C,降速不符合物理规律,更像传感器读数恢复\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置、供电和通信状态,排查是否存在硬件故障或接触不良\",\n \"观察未来几天厨房温度传感器是否再次出现 null 值或异常跳变,确认是否为间歇性故障\",\n \"如故障持续,建议更换厨房温度传感器或重新校准\",\n \"厨房窗户(19:37 打开)在日志中未见关闭记录,建议确认睡前是否已关窗,避免夜间安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和两次 null 读数,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 全天温度趋势分析——各房间温度从凌晨约 22.9°C 平稳上升至中午约 25.8°C,再缓慢回落,符合夏季自然温度曲线,整体正常。", "推理步骤2: 厨房温度在 19:00 突然从约 24.5°C 跳升至 28.33°C,而此时灶具尚未开启(19:15 才开),其他房间同时段温度仅约 24.3°C,温差近 4°C 不合理。这说明该跳变并非烹饪导致,更像传感器读数异常。", "推理步骤3: 19:16 和 19:38 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在灶具使用前后出现数据丢失,进一步印证传感器自身存在故障。", "推理步骤4: 19:30 厨房温度仍为 28.37°C(灶具 19:15 开启仅 15 分钟),而 19:37 灶具关闭、19:37:30 开窗通风后,20:00 温度骤降回 24.03°C,降幅超过 4°C 仅用约 23 分钟,降速异常快,可能是传感器恢复正常读数而非真实降温。", "推理步骤5: 住户行为模式完全正常——早晨 6:26 起床如厕、6:54 去厨房做早餐、7:40 出门上班并自动锁门、18:24 回家开灯开空调、19:15 做晚饭、22:14 关灯睡觉,属于典型单人上班族作息。", "推理步骤6: 入侵风险排除——两次开关门均伴随正常的手动解锁/自动上锁流程,运动传感器与门锁事件时序吻合,22:14 确认门已关闭并自动上锁。", "推理步骤7: 火灾风险排除——灶具使用时间约 22 分钟(19:15-19:37),时长合理;烟雾报警器全天无触发;做完饭后开窗通风,操作规范。", "推理步骤8: 漏水风险排除——卫生间漏水传感器全天无报警。洗碗机 20:13 启动运行,属正常使用。"], "key_evidence": ["19:00 厨房温度突跳至 2833(28.33°C),此时灶具未开,其他房间仅约 24.3-24.4°C,温差异常", "19:16 和 19:38 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失", "19:00 的异常高温出现在灶具 19:15 开启之前,无法用烹饪解释", "20:00 温度从 28.37°C 骤降至 24.03°C,降速不符合物理规律,更像传感器读数恢复"], "recommended_actions": ["检查厨房温度传感器的安装位置、供电和通信状态,排查是否存在硬件故障或接触不良", "观察未来几天厨房温度传感器是否再次出现 null 值或异常跳变,确认是否为间歇性故障", "如故障持续,建议更换厨房温度传感器或重新校准", "厨房窗户(19:37 打开)在日志中未见关闭记录,建议确认睡前是否已关窗,避免夜间安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.78535509109497, "api_error": null} {"episode_id": "SQ4_TN_B_1008", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_B_1008.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261637, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一次未关闭/未锁定的时段,且厨房窗户做饭后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、07:25、18:43、19:10 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭之后,说明灶具运行产生的热量可能导致传感器读数异常或传感器本身存在故障。\",\n \"推理步骤2: 全屋温度变化趋势合理——凌晨约 23°C,随日照升温至中午约 25.8°C,傍晚逐步回落,符合夏季自然温度曲线,无异常高温或火灾迹象。\",\n \"推理步骤3: 入户门在 15:57 被手动开锁并打开(contact=False),但直到 22:18:28 才关闭(contact=True)并自动上锁。中间超过 6 小时入户门处于未关闭状态。虽然 17:50 有人回家(运动传感器触发、开灯、开空调),说明家中有人,但长时间门未关存在安全隐患。\",\n \"推理步骤4: 厨房窗户在 07:24:30 做完早餐后打开通风,19:09:30 晚餐后再次打开,但日志中均无关闭记录。窗户长时间敞开在无人时段(白天外出期间 07:43~15:57)存在入侵风险。\",\n \"推理步骤5: 住户行为模式整体正常——早晨 06:10 起床、06:45 做早餐、07:43 出门并自动锁门、17:50 回家开灯开空调、18:42 做晚餐、22:18 关灯就寝。门锁操作均为 Manual/Auto,无异常开锁方式。\",\n \"推理步骤6: 烟雾报警器、漏水传感器、阳台门传感器等安全设备在整个日志周期内均无告警事件,排除火灾和漏水风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 MeasuredValue = None(06:46、07:25、18:43、19:10),均与灶具操作时间高度关联\",\n \"入户门 15:57 开启后直到 22:18 才关闭,中间约 6 小时未锁(其中 15:57~17:50 约 2 小时家中可能无人)\",\n \"厨房窗户 07:24 打开后无关闭记录,白天外出期间窗户持续敞开\",\n \"15:57 入户门开锁并打开,但无对应的关门和上锁记录,直到晚间 22:18 才恢复\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号\",\n \"设置自动化规则:入户门打开超过一定时间(如 5 分钟)未关闭时发送提醒通知\",\n \"设置自动化规则:外出模式下(门锁上锁且无人在家)如有窗户处于打开状态,发送告警\",\n \"建议在出门时增加一个离家场景检查,确认所有窗户已关闭、门已上锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午有一次未关闭/未锁定的时段,且厨房窗户做饭后未关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、07:25、18:43、19:10 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭之后,说明灶具运行产生的热量可能导致传感器读数异常或传感器本身存在故障。", "推理步骤2: 全屋温度变化趋势合理——凌晨约 23°C,随日照升温至中午约 25.8°C,傍晚逐步回落,符合夏季自然温度曲线,无异常高温或火灾迹象。", "推理步骤3: 入户门在 15:57 被手动开锁并打开(contact=False),但直到 22:18:28 才关闭(contact=True)并自动上锁。中间超过 6 小时入户门处于未关闭状态。虽然 17:50 有人回家(运动传感器触发、开灯、开空调),说明家中有人,但长时间门未关存在安全隐患。", "推理步骤4: 厨房窗户在 07:24:30 做完早餐后打开通风,19:09:30 晚餐后再次打开,但日志中均无关闭记录。窗户长时间敞开在无人时段(白天外出期间 07:43~15:57)存在入侵风险。", "推理步骤5: 住户行为模式整体正常——早晨 06:10 起床、06:45 做早餐、07:43 出门并自动锁门、17:50 回家开灯开空调、18:42 做晚餐、22:18 关灯就寝。门锁操作均为 Manual/Auto,无异常开锁方式。", "推理步骤6: 烟雾报警器、漏水传感器、阳台门传感器等安全设备在整个日志周期内均无告警事件,排除火灾和漏水风险。"], "key_evidence": ["厨房温度传感器 4 次报告 MeasuredValue = None(06:46、07:25、18:43、19:10),均与灶具操作时间高度关联", "入户门 15:57 开启后直到 22:18 才关闭,中间约 6 小时未锁(其中 15:57~17:50 约 2 小时家中可能无人)", "厨房窗户 07:24 打开后无关闭记录,白天外出期间窗户持续敞开", "15:57 入户门开锁并打开,但无对应的关门和上锁记录,直到晚间 22:18 才恢复"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,考虑重新定位或更换耐高温型号", "设置自动化规则:入户门打开超过一定时间(如 5 分钟)未关闭时发送提醒通知", "设置自动化规则:外出模式下(门锁上锁且无人在家)如有窗户处于打开状态,发送告警", "建议在出门时增加一个离家场景检查,确认所有窗户已关闭、门已上锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.716984272003174, "api_error": null} {"episode_id": "SQ4_TN_C_0957", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0957.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261586, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房灶具使用后厨房窗户未关闭,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:09、07:11、18:22、18:55 四个时间点报告 MeasuredValue = None,均发生在灶具开启或刚关闭前后。正常传感器不应返回 None,这说明传感器可能受高温干扰导致读数失效,或者设备本身存在固件/硬件故障。\",\n \"推理步骤2: 厨房窗户在 07:08:30 被打开(StateValue=False),之后日志中再未出现关闭事件。到 18:54:30 又一次打开记录出现,但始终没有对应的关闭(StateValue=True)记录。这意味着厨房窗户可能整天处于开启状态,家人外出期间(07:28~16:33)窗户敞开存在安全隐患。\",\n \"推理步骤3: 入户门在 16:33 开锁进入后,日志中没有关门(front_door_contact StateValue=True)和上锁记录,直到 22:41:32 才出现关门上锁。这段近6小时的时间里入户门可能未关闭或未上锁,存在入侵风险。不过考虑到家中有人活动(客厅、厨房、餐厅均有占用),实际风险较低,但仍属于不良习惯。\",\n \"推理步骤4: 其余行为模式均属正常——凌晨全屋安静,05:58 主卧起床、06:25 儿童房起床、07:08 做早餐、07:28 全家出门并自动上锁、16:33 孩子放学回家、18:06 大人回家开空调做晚饭、21:04 孩子睡觉、22:41 大人睡觉并锁门,符合典型三口之家的作息规律。\",\n \"推理步骤5: 温度趋势正常——夜间约 22.9°C,白天随气温升高至峰值约 25.8°C(12:30),下午逐渐回落,晚间空调开启后从 24.6°C 降至 23.3°C,符合夏季自然温度曲线。无异常温升,排除火灾风险。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为手动开锁+自动上锁的正常模式,无异常开锁尝试。次卫灯 06:51 开启后未见关闭记录,属于小问题(可能忘关灯)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:09、07:11、18:22、18:55 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:08:30 打开后全天无关闭记录,家人外出期间窗户敞开\",\n \"front_door_contact 在 16:33:02 打开后直到 22:41:32 才关闭,近6小时入户门可能未关\",\n \"second_bathroom_light 在 06:51 开启后全天无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器、检查固件版本,必要时更换设备。传感器靠近灶具可能导致高温时读数异常,建议调整安装位置。\",\n \"设置厨房窗户离家自动提醒:当门锁上锁且全屋无人时,若厨房窗户仍处于打开状态,触发手机通知提醒关窗。\",\n \"设置入户门未关提醒:入户门打开超过一定时间(如5分钟)未关闭时,推送告警通知。\",\n \"检查次卫灯是否忘关,可考虑添加运动传感器实现无人自动关灯。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备故障或通信异常;同时厨房灶具使用后厨房窗户未关闭,存在轻微安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:09、07:11、18:22、18:55 四个时间点报告 MeasuredValue = None,均发生在灶具开启或刚关闭前后。正常传感器不应返回 None,这说明传感器可能受高温干扰导致读数失效,或者设备本身存在固件/硬件故障。", "推理步骤2: 厨房窗户在 07:08:30 被打开(StateValue=False),之后日志中再未出现关闭事件。到 18:54:30 又一次打开记录出现,但始终没有对应的关闭(StateValue=True)记录。这意味着厨房窗户可能整天处于开启状态,家人外出期间(07:28~16:33)窗户敞开存在安全隐患。", "推理步骤3: 入户门在 16:33 开锁进入后,日志中没有关门(front_door_contact StateValue=True)和上锁记录,直到 22:41:32 才出现关门上锁。这段近6小时的时间里入户门可能未关闭或未上锁,存在入侵风险。不过考虑到家中有人活动(客厅、厨房、餐厅均有占用),实际风险较低,但仍属于不良习惯。", "推理步骤4: 其余行为模式均属正常——凌晨全屋安静,05:58 主卧起床、06:25 儿童房起床、07:08 做早餐、07:28 全家出门并自动上锁、16:33 孩子放学回家、18:06 大人回家开空调做晚饭、21:04 孩子睡觉、22:41 大人睡觉并锁门,符合典型三口之家的作息规律。", "推理步骤5: 温度趋势正常——夜间约 22.9°C,白天随气温升高至峰值约 25.8°C(12:30),下午逐渐回落,晚间空调开启后从 24.6°C 降至 23.3°C,符合夏季自然温度曲线。无异常温升,排除火灾风险。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁操作均为手动开锁+自动上锁的正常模式,无异常开锁尝试。次卫灯 06:51 开启后未见关闭记录,属于小问题(可能忘关灯)。"], "key_evidence": ["kitchen_temp_sensor 在 07:09、07:11、18:22、18:55 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:08:30 打开后全天无关闭记录,家人外出期间窗户敞开", "front_door_contact 在 16:33:02 打开后直到 22:41:32 才关闭,近6小时入户门可能未关", "second_bathroom_light 在 06:51 开启后全天无关闭记录"], "recommended_actions": ["检查厨房温度传感器:清洁传感器、检查固件版本,必要时更换设备。传感器靠近灶具可能导致高温时读数异常,建议调整安装位置。", "设置厨房窗户离家自动提醒:当门锁上锁且全屋无人时,若厨房窗户仍处于打开状态,触发手机通知提醒关窗。", "设置入户门未关提醒:入户门打开超过一定时间(如5分钟)未关闭时,推送告警通知。", "检查次卫灯是否忘关,可考虑添加运动传感器实现无人自动关灯。"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.548064708709717, "api_error": null} {"episode_id": "SQ4_TN_C_0962", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0962.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261591, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:17开锁后长时间未关闭/上锁,直到22:20才重新关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:38、07:20、18:36、19:07四个时间点报告 MeasuredValue = None,均发生在灶具开启或关闭前后。虽然灶具使用时热辐射可能干扰传感器,但正常传感器应报告数值而非 None,这表明传感器可能存在故障或通信异常。\",\n \"推理步骤2: 16:17入户门通过手动方式开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但此后没有关门和上锁的记录,直到22:20才出现门关闭(StateValue=True)和自动上锁事件。这意味着入户门在约6小时内处于未关闭/未上锁状态,存在安全隐患。\",\n \"推理步骤3: 18:00有第二次开锁记录,有人进入后开灯、开空调,生活行为正常。结合16:17有人(可能是孩子放学回家)进入后直接去儿童房的行为模式,推测是家庭成员正常出入,但门长时间未关是不正常的。\",\n \"推理步骤4: 厨房窗户在07:19:30打开后,日志中没有关闭记录。虽然白天通风是正常行为,但如果夜间仍未关闭则存在安全风险。19:06:30有第二次开窗记录(或窗户一直保持打开状态),同样没有关闭记录。\",\n \"推理步骤5: 其余设备行为均符合正常家庭作息模式——早晨6点起床、7:40出门、下午回家、晚间做饭用餐、22点就寝。温度变化符合夏季昼夜规律(夜间约23°C,午间峰值约25.9°C)。烟雾报警器、漏水传感器均无告警,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38、07:20、18:36、19:07 四次报告 MeasuredValue = None\",\n \"16:17 入户门开锁开门后,直到 22:20 才有关门上锁记录,中间约6小时门处于开启/未锁状态\",\n \"厨房窗户 07:19:30 打开后无关闭记录,19:06:30 再次触发开启事件,全天无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具热辐射导致传感器异常,必要时更换或重新定位传感器\",\n \"设置入户门长时间未关闭/未上锁的自动提醒规则(如超过5分钟未关门则推送告警),避免门户大开的安全隐患\",\n \"确认厨房窗户当前状态,夜间应关闭窗户;建议设置夜间模式自动检查窗户关闭状态\",\n \"考虑为入户门配置自动关门器或设置离家/就寝场景时自动检查门锁状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:17开锁后长时间未关闭/上锁,直到22:20才重新关门上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在06:38、07:20、18:36、19:07四个时间点报告 MeasuredValue = None,均发生在灶具开启或关闭前后。虽然灶具使用时热辐射可能干扰传感器,但正常传感器应报告数值而非 None,这表明传感器可能存在故障或通信异常。", "推理步骤2: 16:17入户门通过手动方式开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),但此后没有关门和上锁的记录,直到22:20才出现门关闭(StateValue=True)和自动上锁事件。这意味着入户门在约6小时内处于未关闭/未上锁状态,存在安全隐患。", "推理步骤3: 18:00有第二次开锁记录,有人进入后开灯、开空调,生活行为正常。结合16:17有人(可能是孩子放学回家)进入后直接去儿童房的行为模式,推测是家庭成员正常出入,但门长时间未关是不正常的。", "推理步骤4: 厨房窗户在07:19:30打开后,日志中没有关闭记录。虽然白天通风是正常行为,但如果夜间仍未关闭则存在安全风险。19:06:30有第二次开窗记录(或窗户一直保持打开状态),同样没有关闭记录。", "推理步骤5: 其余设备行为均符合正常家庭作息模式——早晨6点起床、7:40出门、下午回家、晚间做饭用餐、22点就寝。温度变化符合夏季昼夜规律(夜间约23°C,午间峰值约25.9°C)。烟雾报警器、漏水传感器均无告警,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:38、07:20、18:36、19:07 四次报告 MeasuredValue = None", "16:17 入户门开锁开门后,直到 22:20 才有关门上锁记录,中间约6小时门处于开启/未锁状态", "厨房窗户 07:19:30 打开后无关闭记录,19:06:30 再次触发开启事件,全天无关闭记录"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具热辐射导致传感器异常,必要时更换或重新定位传感器", "设置入户门长时间未关闭/未上锁的自动提醒规则(如超过5分钟未关门则推送告警),避免门户大开的安全隐患", "确认厨房窗户当前状态,夜间应关闭窗户;建议设置夜间模式自动检查窗户关闭状态", "考虑为入户门配置自动关门器或设置离家/就寝场景时自动检查门锁状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.09182643890381, "api_error": null} {"episode_id": "SQ4_TN_C_0965", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0965.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261594, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:04、07:15、18:50、19:29 四次报告 MeasuredValue = None,而其他房间传感器在同一时刻均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点均与灶具开启(07:03:36 和 18:49:30)高度相关,可能是灶具工作时产生的热辐射或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 虽然传感器在后续整点(07:30、19:30)恢复了正常读数,但间歇性失效意味着在灶具使用期间无法可靠监测厨房温度,存在火灾风险盲区。\",\n \"推理步骤4: 其余家庭行为模式正常——早晨 06:21 起床、07:44 出门上锁、16:15 孩子放学回家、18:10 大人回家、22:45 就寝锁门,均符合典型三口之家作息。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;所有运动传感器触发与灯光/门锁事件时序一致,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:04、07:15、18:50、19:29 报告 MeasuredValue = None\",\n \"None 值均出现在 kitchen_cook_surface 开启期间,其他传感器同时段正常\",\n \"传感器在灶具关闭后的下一个整点恢复正常读数\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰\",\n \"考虑将传感器迁移至远离灶具但仍能有效监测厨房温度的位置\",\n \"如传感器位置合理,建议更换传感器或检查其固件版本是否需要更新\",\n \"在传感器问题解决前,可设置灶具使用超时自动关闭的安全规则作为补偿措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:04、07:15、18:50、19:29 四次报告 MeasuredValue = None,而其他房间传感器在同一时刻均正常上报数值。", "推理步骤2: None 值出现的时间点均与灶具开启(07:03:36 和 18:49:30)高度相关,可能是灶具工作时产生的热辐射或电磁干扰导致传感器读数异常。", "推理步骤3: 虽然传感器在后续整点(07:30、19:30)恢复了正常读数,但间歇性失效意味着在灶具使用期间无法可靠监测厨房温度,存在火灾风险盲区。", "推理步骤4: 其余家庭行为模式正常——早晨 06:21 起床、07:44 出门上锁、16:15 孩子放学回家、18:10 大人回家、22:45 就寝锁门,均符合典型三口之家作息。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;所有运动传感器触发与灯光/门锁事件时序一致,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 07:04、07:15、18:50、19:29 报告 MeasuredValue = None", "None 值均出现在 kitchen_cook_surface 开启期间,其他传感器同时段正常", "传感器在灶具关闭后的下一个整点恢复正常读数"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰", "考虑将传感器迁移至远离灶具但仍能有效监测厨房温度的位置", "如传感器位置合理,建议更换传感器或检查其固件版本是否需要更新", "在传感器问题解决前,可设置灶具使用超时自动关闭的安全规则作为补偿措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.173637628555298, "api_error": null} {"episode_id": "SQ4_TN_C_0967", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0967.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261596, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报\",\n \"推理步骤2: 温度值采用 Matter 标准单位(1/100 °C)。凌晨 00:00-05:30 各房间温度在 22.90-23.10°C 之间,属于夏季夜间正常室温\",\n \"推理步骤3: 从 06:00 起温度开始上升,至 12:00-12:30 达到全天峰值约 25.85°C,随后逐步回落,至 23:30 降回约 23.3°C。这是典型的夏季昼夜温度曲线\",\n \"推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 1°C 以内,不存在某个房间温度异常偏高(如火灾隐患)或异常偏低的情况\",\n \"推理步骤5: 全天温度范围 22.9-25.9°C,未触及任何高温或低温告警阈值,厨房温度也未出现与灶具使用相关的异常尖峰\",\n \"推理步骤6: 无任何安防类设备(烟雾、漏水、门窗开合、运动检测、门锁)产生事件日志,说明这些设备在整个观测周期内均处于正常静默状态\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9-25.9°C,四个房间走势一致,符合 6 月夏季自然昼夜温差\",\n \"无任何安防传感器(烟雾、漏水、门窗、运动、门锁)触发事件\",\n \"房间间温差始终小于 1°C,不存在局部异常热源\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"午间峰值接近 26°C,如有舒适度需求可考虑在中午时段开启空调\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报", "推理步骤2: 温度值采用 Matter 标准单位(1/100 °C)。凌晨 00:00-05:30 各房间温度在 22.90-23.10°C 之间,属于夏季夜间正常室温", "推理步骤3: 从 06:00 起温度开始上升,至 12:00-12:30 达到全天峰值约 25.85°C,随后逐步回落,至 23:30 降回约 23.3°C。这是典型的夏季昼夜温度曲线", "推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 1°C 以内,不存在某个房间温度异常偏高(如火灾隐患)或异常偏低的情况", "推理步骤5: 全天温度范围 22.9-25.9°C,未触及任何高温或低温告警阈值,厨房温度也未出现与灶具使用相关的异常尖峰", "推理步骤6: 无任何安防类设备(烟雾、漏水、门窗开合、运动检测、门锁)产生事件日志,说明这些设备在整个观测周期内均处于正常静默状态"], "key_evidence": ["全天温度范围 22.9-25.9°C,四个房间走势一致,符合 6 月夏季自然昼夜温差", "无任何安防传感器(烟雾、漏水、门窗、运动、门锁)触发事件", "房间间温差始终小于 1°C,不存在局部异常热源"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "午间峰值接近 26°C,如有舒适度需求可考虑在中午时段开启空调"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.94211459159851, "api_error": null} {"episode_id": "SQ4_TN_C_0977", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0977.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261606, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:55、07:09、18:25、19:11 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温或油烟环境可能导致传感器读数异常或通信中断。\",\n \"推理步骤2: 虽然传感器在后续的整点/半点周期性采集中恢复了数值(如 07:00 报告 2428、18:30 报告 2454),但反复出现 None 值说明该传感器在厨房工作环境下稳定性不足,存在间歇性故障风险。\",\n \"推理步骤3: 厨房窗户传感器在 07:08:30 报告 StateValue=False(窗户打开),之后整天日志中未见对应的 True(关闭)事件。19:10:30 再次报告 False(仍为打开或再次打开),同样未见关闭。家庭 07:28 全员出门后厨房窗户持续处于打开状态,虽然通风有益,但无人在家时窗户长时间敞开存在安全隐患(入侵风险、突发天气等)。\",\n \"推理步骤4: 入户门锁行为正常——07:28 手动开锁出门后自动上锁,16:25 有人回来(孩子放学进儿童房),17:41 另一人回来(进客厅开空调),22:26 确认门已关闭并自动上锁,入侵风险低。\",\n \"推理步骤5: 各房间温度变化符合夏季昼夜规律:凌晨约 22.9-23.1°C,午间峰值约 25.8-25.9°C,傍晚逐步回落。客厅空调 17:41 开启制冷(SystemMode=3)后客厅温度从约 24.7°C 降至 23.5°C,22:26 关闭,均属正常。\",\n \"推理步骤6: 其余设备行为均正常:灯光随人员活动开关、儿童房窗帘早开晚关、洗碗机晚餐后运行、次卫灯早晨使用等,未发现烟雾报警、漏水报警触发,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:55:05、07:09:00、18:25:00、19:11:00 四次报告 MeasuredValue = None\",\n \"厨房窗户传感器 07:08:30 报告打开(StateValue=False),全天日志中未见关闭事件,家庭 07:28-16:25 无人期间窗户持续敞开\",\n \"19:10:30 厨房窗户再次报告打开,至日志结束(23:30)仍未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;考虑更换耐高温型号或调整安装位置\",\n \"建立自动化规则:当全员离家(入户门上锁且无室内运动检测)时,检查并提醒关闭厨房窗户\",\n \"在离家模式中加入厨房窗户状态检查,若窗户处于打开状态则发送通知提醒住户\",\n \"持续监控厨房温度传感器的 None 值出现频率,若频繁发生建议更换设备以确保厨房火灾预警能力不受影响\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:55、07:09、18:25、19:11 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温或油烟环境可能导致传感器读数异常或通信中断。", "推理步骤2: 虽然传感器在后续的整点/半点周期性采集中恢复了数值(如 07:00 报告 2428、18:30 报告 2454),但反复出现 None 值说明该传感器在厨房工作环境下稳定性不足,存在间歇性故障风险。", "推理步骤3: 厨房窗户传感器在 07:08:30 报告 StateValue=False(窗户打开),之后整天日志中未见对应的 True(关闭)事件。19:10:30 再次报告 False(仍为打开或再次打开),同样未见关闭。家庭 07:28 全员出门后厨房窗户持续处于打开状态,虽然通风有益,但无人在家时窗户长时间敞开存在安全隐患(入侵风险、突发天气等)。", "推理步骤4: 入户门锁行为正常——07:28 手动开锁出门后自动上锁,16:25 有人回来(孩子放学进儿童房),17:41 另一人回来(进客厅开空调),22:26 确认门已关闭并自动上锁,入侵风险低。", "推理步骤5: 各房间温度变化符合夏季昼夜规律:凌晨约 22.9-23.1°C,午间峰值约 25.8-25.9°C,傍晚逐步回落。客厅空调 17:41 开启制冷(SystemMode=3)后客厅温度从约 24.7°C 降至 23.5°C,22:26 关闭,均属正常。", "推理步骤6: 其余设备行为均正常:灯光随人员活动开关、儿童房窗帘早开晚关、洗碗机晚餐后运行、次卫灯早晨使用等,未发现烟雾报警、漏水报警触发,无异常入侵迹象。"], "key_evidence": ["厨房温度传感器在 06:55:05、07:09:00、18:25:00、19:11:00 四次报告 MeasuredValue = None", "厨房窗户传感器 07:08:30 报告打开(StateValue=False),全天日志中未见关闭事件,家庭 07:28-16:25 无人期间窗户持续敞开", "19:10:30 厨房窗户再次报告打开,至日志结束(23:30)仍未见关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;考虑更换耐高温型号或调整安装位置", "建立自动化规则:当全员离家(入户门上锁且无室内运动检测)时,检查并提醒关闭厨房窗户", "在离家模式中加入厨房窗户状态检查,若窗户处于打开状态则发送通知提醒住户", "持续监控厨房温度传感器的 None 值出现频率,若频繁发生建议更换设备以确保厨房火灾预警能力不受影响"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.676973342895508, "api_error": null} {"episode_id": "SQ4_TN_C_0980", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0980.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261609, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,表明设备可能存在故障或通信异常;同时入户门在16:14开锁进入后未及时关闭/上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:33、06:51、18:39、19:18四个时间点报告 MeasuredValue = None。这些时间点均与灶具使用相关(06:32灶具开启后1分钟、06:50灶具关闭后1分钟、18:38灶具开启后1分钟、19:17灶具关闭后1分钟),说明灶具运行或状态切换时传感器出现读数丢失,可能是高温干扰、传感器故障或通信中断。\",\n \"推理步骤2: 虽然在下一个整点周期(07:00、19:00)传感器恢复了正常读数,但反复出现 null 值意味着在灶具使用的关键时段恰恰无法监测厨房温度,这会削弱火灾预警能力。\",\n \"推理步骤3: 16:14入户门开锁进入后,日志中没有记录 front_door_contact 恢复为 True(关门)或门锁重新上锁的事件,直到22:21才出现关门和自动上锁记录。这意味着从16:14到22:21约6小时内,入户门可能处于未关闭/未上锁状态,存在安全隐患。\",\n \"推理步骤4: 其余设备行为均属正常——早晨06:26-07:31的起床、做饭、出门流程合理;下午16:14孩子放学回家直奔儿童房、17:44大人回家开灯开空调、18:38做晚饭、20:54孩子关灯拉窗帘睡觉、22:21大人关灯锁门就寝,均符合三口之家的日常作息。\",\n \"推理步骤5: 温度趋势正常:夜间约23°C,白天随气温升高至中午峰值约25.8°C,下午逐渐回落,无异常温升。烟雾报警器和漏水传感器全天无告警,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:33、06:51、18:39、19:18 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"16:14:02 front_door_contact = False(开门)后,直到 22:21:18 才记录 front_door_contact = True(关门),期间约6小时无关门/上锁记录\",\n \"16:14 开锁事件后无对应的 LockOperationType=0(上锁)事件,17:44 第二次开锁同样无后续上锁,直到 22:21:19 才自动上锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温或电磁干扰影响导致读数丢失,必要时更换或重新定位传感器\",\n \"设置入户门未关闭/未上锁超时告警(建议阈值5-10分钟),避免长时间门户大开的安全风险\",\n \"考虑为入户门配置自动关门器或添加自动化规则:进门后若超过一定时间未关门则推送提醒\",\n \"确认厨房烟雾报警器工作正常,在温度传感器失效期间它是厨房安全的唯一防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,表明设备可能存在故障或通信异常;同时入户门在16:14开锁进入后未及时关闭/上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在06:33、06:51、18:39、19:18四个时间点报告 MeasuredValue = None。这些时间点均与灶具使用相关(06:32灶具开启后1分钟、06:50灶具关闭后1分钟、18:38灶具开启后1分钟、19:17灶具关闭后1分钟),说明灶具运行或状态切换时传感器出现读数丢失,可能是高温干扰、传感器故障或通信中断。", "推理步骤2: 虽然在下一个整点周期(07:00、19:00)传感器恢复了正常读数,但反复出现 null 值意味着在灶具使用的关键时段恰恰无法监测厨房温度,这会削弱火灾预警能力。", "推理步骤3: 16:14入户门开锁进入后,日志中没有记录 front_door_contact 恢复为 True(关门)或门锁重新上锁的事件,直到22:21才出现关门和自动上锁记录。这意味着从16:14到22:21约6小时内,入户门可能处于未关闭/未上锁状态,存在安全隐患。", "推理步骤4: 其余设备行为均属正常——早晨06:26-07:31的起床、做饭、出门流程合理;下午16:14孩子放学回家直奔儿童房、17:44大人回家开灯开空调、18:38做晚饭、20:54孩子关灯拉窗帘睡觉、22:21大人关灯锁门就寝,均符合三口之家的日常作息。", "推理步骤5: 温度趋势正常:夜间约23°C,白天随气温升高至中午峰值约25.8°C,下午逐渐回落,无异常温升。烟雾报警器和漏水传感器全天无告警,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:33、06:51、18:39、19:18 四次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "16:14:02 front_door_contact = False(开门)后,直到 22:21:18 才记录 front_door_contact = True(关门),期间约6小时无关门/上锁记录", "16:14 开锁事件后无对应的 LockOperationType=0(上锁)事件,17:44 第二次开锁同样无后续上锁,直到 22:21:19 才自动上锁"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否受灶具高温或电磁干扰影响导致读数丢失,必要时更换或重新定位传感器", "设置入户门未关闭/未上锁超时告警(建议阈值5-10分钟),避免长时间门户大开的安全风险", "考虑为入户门配置自动关门器或添加自动化规则:进门后若超过一定时间未关门则推送提醒", "确认厨房烟雾报警器工作正常,在温度传感器失效期间它是厨房安全的唯一防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.008469820022583, "api_error": null} {"episode_id": "SQ4_TN_C_0985", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0985.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261614, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:50、07:08、18:38、18:54 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点与灶具开启/关闭时间高度相关(06:49 灶具开启→06:50 None;07:07 灶具关闭→07:08 None;18:37 灶具开启→18:38 None;18:53 灶具关闭→18:54 None),可能是灶具运行时产生的电磁干扰或高温导致传感器暂时失效。\",\n \"推理步骤3: 温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合检测火灾风险。如果传感器在灶具使用期间持续失效,将形成安全监控盲区。\",\n \"推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间休息,入户门锁开关与人员进出一致,无入侵迹象。\",\n \"推理步骤5: 厨房窗户在做完饭后打开(07:07:30 和 18:53:30)属于正常通风行为,烟雾报警器未触发,无火灾风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:50、07:08、18:38、18:54 四次报告 MeasuredValue = None\",\n \"None 值每次都紧跟灶具状态变化(开启或关闭后约1分钟内出现)\",\n \"其他房间温度传感器在相同时段均正常工作\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温或电磁干扰影响\",\n \"考虑将传感器重新定位到远离灶具但仍能有效监测厨房温度的位置\",\n \"如问题持续,更换传感器或增加一个冗余传感器以消除灶具使用期间的监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:50、07:08、18:38、18:54 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: None 值出现的时间点与灶具开启/关闭时间高度相关(06:49 灶具开启→06:50 None;07:07 灶具关闭→07:08 None;18:37 灶具开启→18:38 None;18:53 灶具关闭→18:54 None),可能是灶具运行时产生的电磁干扰或高温导致传感器暂时失效。", "推理步骤3: 温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合检测火灾风险。如果传感器在灶具使用期间持续失效,将形成安全监控盲区。", "推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间休息,入户门锁开关与人员进出一致,无入侵迹象。", "推理步骤5: 厨房窗户在做完饭后打开(07:07:30 和 18:53:30)属于正常通风行为,烟雾报警器未触发,无火灾风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:50、07:08、18:38、18:54 四次报告 MeasuredValue = None", "None 值每次都紧跟灶具状态变化(开启或关闭后约1分钟内出现)", "其他房间温度传感器在相同时段均正常工作"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近,受到高温或电磁干扰影响", "考虑将传感器重新定位到远离灶具但仍能有效监测厨房温度的位置", "如问题持续,更换传感器或增加一个冗余传感器以消除灶具使用期间的监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 15.909443855285645, "api_error": null} {"episode_id": "SQ4_TN_C_0987", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0987.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261616, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、07:10、18:40、19:02 四次报告 MeasuredValue = None,而其他时间点均正常上报数值,说明该传感器间歇性失效。\",\n \"推理步骤2: None 值出现的时间点均与灶具开启/关闭操作高度相关(06:55 灶具开启→06:56 None;18:39 灶具开启→18:40 None;19:01 灶具关闭→19:02 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 厨房是火灾高风险区域,温度传感器失效意味着无法及时检测异常升温,存在安全监控盲区。\",\n \"推理步骤4: 其余家庭活动模式正常——早晨起床、出门上班/上学、下午放学回家、晚间做饭就餐、睡前锁门关灯,均符合三口之家的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:56、07:10、18:40、19:02 四次报告 MeasuredValue = None\",\n \"None 值均出现在灶具 (kitchen_cook_surface) 开启或刚关闭的时间窗口内\",\n \"其他三个温度传感器在相同时段均正常上报数据,排除系统性网络故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰\",\n \"对该传感器进行固件更新或硬件检测,排除设备老化故障\",\n \"在传感器修复前,可考虑依赖厨房烟雾报警器作为备用安全监测手段\",\n \"如问题持续,建议更换传感器或增加冗余温度监测设备\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、07:10、18:40、19:02 四次报告 MeasuredValue = None,而其他时间点均正常上报数值,说明该传感器间歇性失效。", "推理步骤2: None 值出现的时间点均与灶具开启/关闭操作高度相关(06:55 灶具开启→06:56 None;18:39 灶具开启→18:40 None;19:01 灶具关闭→19:02 None),可能是灶具工作时的高温或电磁干扰导致传感器读数异常。", "推理步骤3: 厨房是火灾高风险区域,温度传感器失效意味着无法及时检测异常升温,存在安全监控盲区。", "推理步骤4: 其余家庭活动模式正常——早晨起床、出门上班/上学、下午放学回家、晚间做饭就餐、睡前锁门关灯,均符合三口之家的典型作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:56、07:10、18:40、19:02 四次报告 MeasuredValue = None", "None 值均出现在灶具 (kitchen_cook_surface) 开启或刚关闭的时间窗口内", "其他三个温度传感器在相同时段均正常上报数据,排除系统性网络故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或电磁干扰", "对该传感器进行固件更新或硬件检测,排除设备老化故障", "在传感器修复前,可考虑依赖厨房烟雾报警器作为备用安全监测手段", "如问题持续,建议更换传感器或增加冗余温度监测设备"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 16.28281569480896, "api_error": null} {"episode_id": "SQ4_TN_C_0992", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0992.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261621, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报。\",\n \"推理步骤2: 温度数据(Matter 协议单位为 0.01°C)显示全天范围约 22.9°C(凌晨低点)至 25.9°C(午间高点),四个房间走势高度一致,符合 6 月夏季典型的昼夜温差曲线——凌晨最低、正午至下午最高、傍晚后逐步回落。\",\n \"推理步骤3: 06:00 前后各房间温度从约 23.0°C 跳升至约 23.9°C(约 +0.9°C/30min),这是日出后太阳辐射导致的正常升温,并非设备故障或火灾迹象。此后升温速率趋缓,完全符合自然规律。\",\n \"推理步骤4: 各房间之间同一时刻温差始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或空调故障导致的异常温差。\",\n \"推理步骤5: 全天最高温约 25.9°C,未触及任何高温警戒阈值,且无烟雾报警器、漏水传感器等触发记录,整体安全状态良好。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C ~ 25.9°C,四个房间走势一致,符合夏季昼夜自然温差\",\n \"无任何安防类设备(门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器)的异常事件上报\",\n \"各房间同一时刻温差始终 < 1°C,不存在局部异常热源\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态正常\",\n \"午间室温接近 26°C,如有人在家可考虑开启空调保持舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个房间温度传感器的半小时间隔读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报。", "推理步骤2: 温度数据(Matter 协议单位为 0.01°C)显示全天范围约 22.9°C(凌晨低点)至 25.9°C(午间高点),四个房间走势高度一致,符合 6 月夏季典型的昼夜温差曲线——凌晨最低、正午至下午最高、傍晚后逐步回落。", "推理步骤3: 06:00 前后各房间温度从约 23.0°C 跳升至约 23.9°C(约 +0.9°C/30min),这是日出后太阳辐射导致的正常升温,并非设备故障或火灾迹象。此后升温速率趋缓,完全符合自然规律。", "推理步骤4: 各房间之间同一时刻温差始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除局部火灾风险或空调故障导致的异常温差。", "推理步骤5: 全天最高温约 25.9°C,未触及任何高温警戒阈值,且无烟雾报警器、漏水传感器等触发记录,整体安全状态良好。"], "key_evidence": ["全天温度范围 22.9°C ~ 25.9°C,四个房间走势一致,符合夏季昼夜自然温差", "无任何安防类设备(门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器)的异常事件上报", "各房间同一时刻温差始终 < 1°C,不存在局部异常热源"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态正常", "午间室温接近 26°C,如有人在家可考虑开启空调保持舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.97546100616455, "api_error": null} {"episode_id": "SQ4_TN_C_0995", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0995.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261624, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:50、07:10、18:34、19:26 共四次报告 MeasuredValue = None,而其他三个温度传感器全天均正常上报数值,说明问题局限于该设备。\",\n \"推理步骤2: 四次 None 值均出现在灶具开启期间或刚关闭后(06:49 灶具开→06:50 None、07:09 灶具关→07:10 None;18:33 灶具开→18:34 None、19:25 灶具关→19:26 None),高度关联灶具使用,可能是灶具产生的高温或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 厨房温度传感器是厨房烟雾报警器之外的重要辅助安全监测手段。如果传感器在烹饪时失效,恰恰是最需要温度监控的时段,存在安全监控盲区。\",\n \"推理步骤4: 除此之外,整体家庭活动模式正常——早晨 06:00 起床、07:28 出门上锁、16:32 孩子放学回家、18:19 大人回家、21:13 孩子就寝、22:14 大人就寝并锁门,符合典型三口之家的作息规律。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;所有运动传感器触发与灯光、门锁事件在时间和空间上一致,无入侵迹象。\",\n \"推理步骤6: 厨房窗户在做完饭后打开(07:09 关灶→07:09:30 开窗;19:25 关灶→19:25:30 开窗)属于正常通风行为,但日志中未见关窗记录,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:50、07:10、18:34、19:26 四次报告 MeasuredValue = None,均与灶具使用时段强相关\",\n \"其他三个温度传感器(客厅、主卧、儿童房)全天48个读数均正常,排除系统性故障\",\n \"厨房窗户传感器两次记录开窗(07:09:30 和 19:25:30),但日志中无对应的关窗事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数,必要时重新选址安装\",\n \"对厨房温度传感器进行固件检查或设备更换,确保其在烹饪高温场景下仍能正常工作\",\n \"确认厨房窗户当前状态,如已入夜且无人在厨房,建议关闭窗户以保障夜间安全\",\n \"考虑为厨房温度传感器设置 None 值告警规则,一旦出现读数丢失立即通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:50、07:10、18:34、19:26 共四次报告 MeasuredValue = None,而其他三个温度传感器全天均正常上报数值,说明问题局限于该设备。", "推理步骤2: 四次 None 值均出现在灶具开启期间或刚关闭后(06:49 灶具开→06:50 None、07:09 灶具关→07:10 None;18:33 灶具开→18:34 None、19:25 灶具关→19:26 None),高度关联灶具使用,可能是灶具产生的高温或电磁干扰导致传感器读数异常。", "推理步骤3: 厨房温度传感器是厨房烟雾报警器之外的重要辅助安全监测手段。如果传感器在烹饪时失效,恰恰是最需要温度监控的时段,存在安全监控盲区。", "推理步骤4: 除此之外,整体家庭活动模式正常——早晨 06:00 起床、07:28 出门上锁、16:32 孩子放学回家、18:19 大人回家、21:13 孩子就寝、22:14 大人就寝并锁门,符合典型三口之家的作息规律。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件;所有运动传感器触发与灯光、门锁事件在时间和空间上一致,无入侵迹象。", "推理步骤6: 厨房窗户在做完饭后打开(07:09 关灶→07:09:30 开窗;19:25 关灶→19:25:30 开窗)属于正常通风行为,但日志中未见关窗记录,需确认窗户是否仍处于打开状态。"], "key_evidence": ["kitchen_temp_sensor 在 06:50、07:10、18:34、19:26 四次报告 MeasuredValue = None,均与灶具使用时段强相关", "其他三个温度传感器(客厅、主卧、儿童房)全天48个读数均正常,排除系统性故障", "厨房窗户传感器两次记录开窗(07:09:30 和 19:25:30),但日志中无对应的关窗事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰影响读数,必要时重新选址安装", "对厨房温度传感器进行固件检查或设备更换,确保其在烹饪高温场景下仍能正常工作", "确认厨房窗户当前状态,如已入夜且无人在厨房,建议关闭窗户以保障夜间安全", "考虑为厨房温度传感器设置 None 值告警规则,一旦出现读数丢失立即通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.809998989105225, "api_error": null} {"episode_id": "SQ4_TN_C_0996", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_0996.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261625, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报\",\n \"推理步骤2: 温度值采用 Matter 标准单位(百分之一摄氏度),凌晨 00:00-05:30 各房间温度在 22.9°C-23.1°C 之间,属于夏季夜间正常室温\",\n \"推理步骤3: 06:00 起温度开始上升,至 12:00-12:30 达到全天峰值约 25.7°C-25.9°C,随后逐步回落,至 23:30 降回约 23.3°C,完全吻合夏季日出升温、午后峰值、傍晚降温的自然昼夜温差曲线\",\n \"推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 0.2°C 以内,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾隐患或设备故障导致的异常发热\",\n \"推理步骤5: 全天温度范围 22.9°C-25.9°C,未出现任何突变(如短时间内上升超过 5°C),也未触发烟雾报警器或其他安防传感器,无需关注\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C-25.9°C,四个房间走势一致,符合夏季自然昼夜温差\",\n \"无任何门锁、门窗、运动、烟雾、漏水等安防传感器的异常事件上报\",\n \"温度变化平缓,无突变或单点异常,不存在局部过热迹象\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态正常\",\n \"如午间室温接近 26°C 感觉偏热,可考虑在 10:00-15:00 时段开启空调降温\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报", "推理步骤2: 温度值采用 Matter 标准单位(百分之一摄氏度),凌晨 00:00-05:30 各房间温度在 22.9°C-23.1°C 之间,属于夏季夜间正常室温", "推理步骤3: 06:00 起温度开始上升,至 12:00-12:30 达到全天峰值约 25.7°C-25.9°C,随后逐步回落,至 23:30 降回约 23.3°C,完全吻合夏季日出升温、午后峰值、傍晚降温的自然昼夜温差曲线", "推理步骤4: 四个房间的温度走势高度一致,房间间温差始终在 0.2°C 以内,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾隐患或设备故障导致的异常发热", "推理步骤5: 全天温度范围 22.9°C-25.9°C,未出现任何突变(如短时间内上升超过 5°C),也未触发烟雾报警器或其他安防传感器,无需关注"], "key_evidence": ["全天温度范围 22.9°C-25.9°C,四个房间走势一致,符合夏季自然昼夜温差", "无任何门锁、门窗、运动、烟雾、漏水等安防传感器的异常事件上报", "温度变化平缓,无突变或单点异常,不存在局部过热迹象"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态正常", "如午间室温接近 26°C 感觉偏热,可考虑在 10:00-15:00 时段开启空调降温"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.171039819717407, "api_error": null} {"episode_id": "SQ4_TN_C_1000", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_1000.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261629, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障,可能影响厨房安全监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47:09、07:28:00、18:24:00、18:58:00 共四次报告 MeasuredValue = None,且均发生在灶具使用前后(06:46:39 灶具开启、07:27:00 灶具关闭、18:23:30 灶具开启、18:57:00 灶具关闭),说明传感器在厨房高温环境下出现间歇性读数丢失。\",\n \"推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在同一时段均正常上报数据,排除系统级通信故障,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房是火灾高风险区域,温度传感器与烟雾报警器共同构成安全防线。温度传感器在灶具工作期间恰好失效,意味着在最需要温度监测的时刻反而丧失了监测能力,这是一个显著的安全隐患。\",\n \"推理步骤4: 其余家庭活动模式均属正常——早晨约06:00起床、07:26出门上班/上学、16:31孩子回家、18:13大人回家、21:07孩子就寝、22:14大人就寝,符合典型三口之家的作息规律。\",\n \"推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件(如远程、未知PIN等)。门在出入后均正常关闭并上锁,无入侵迹象。\",\n \"推理步骤6: 全天温度变化呈现合理的日间升温(午间峰值约25.9°C)、夜间降温(凌晨低谷约22.9°C)曲线,无异常温度突变,烟雾报警器未触发,无火灾风险。\",\n \"推理步骤7: 所有漏水传感器(厨房、主卫、次卫)全天无报警,无水患风险。厨房窗户在灶具关闭后打开属于正常通风行为。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47:09、07:28:00、18:24:00、18:58:00 四次报告 MeasuredValue = None\",\n \"四次 None 值均紧邻灶具开关操作时间(灶具开启后约30秒内或关闭后约1分钟内),表明故障与灶具使用高度相关\",\n \"同时段其他三个温度传感器均正常上报,排除系统性通信问题\",\n \"烟雾报警器全天未触发,漏水传感器全天未报警,门锁操作均正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新选址安装\",\n \"对厨房温度传感器进行固件更新或硬件检测,排查间歇性读数丢失的根本原因\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能状态正常\",\n \"考虑增加一个冗余温度传感器作为厨房安全监测的备份\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障,可能影响厨房安全监测能力。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47:09、07:28:00、18:24:00、18:58:00 共四次报告 MeasuredValue = None,且均发生在灶具使用前后(06:46:39 灶具开启、07:27:00 灶具关闭、18:23:30 灶具开启、18:57:00 灶具关闭),说明传感器在厨房高温环境下出现间歇性读数丢失。", "推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)在同一时段均正常上报数据,排除系统级通信故障,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房是火灾高风险区域,温度传感器与烟雾报警器共同构成安全防线。温度传感器在灶具工作期间恰好失效,意味着在最需要温度监测的时刻反而丧失了监测能力,这是一个显著的安全隐患。", "推理步骤4: 其余家庭活动模式均属正常——早晨约06:00起床、07:26出门上班/上学、16:31孩子回家、18:13大人回家、21:07孩子就寝、22:14大人就寝,符合典型三口之家的作息规律。", "推理步骤5: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁事件(如远程、未知PIN等)。门在出入后均正常关闭并上锁,无入侵迹象。", "推理步骤6: 全天温度变化呈现合理的日间升温(午间峰值约25.9°C)、夜间降温(凌晨低谷约22.9°C)曲线,无异常温度突变,烟雾报警器未触发,无火灾风险。", "推理步骤7: 所有漏水传感器(厨房、主卫、次卫)全天无报警,无水患风险。厨房窗户在灶具关闭后打开属于正常通风行为。"], "key_evidence": ["kitchen_temp_sensor 在 06:47:09、07:28:00、18:24:00、18:58:00 四次报告 MeasuredValue = None", "四次 None 值均紧邻灶具开关操作时间(灶具开启后约30秒内或关闭后约1分钟内),表明故障与灶具使用高度相关", "同时段其他三个温度传感器均正常上报,排除系统性通信问题", "烟雾报警器全天未触发,漏水传感器全天未报警,门锁操作均正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新选址安装", "对厨房温度传感器进行固件更新或硬件检测,排查间歇性读数丢失的根本原因", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能状态正常", "考虑增加一个冗余温度传感器作为厨房安全监测的备份"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.170757293701172, "api_error": null} {"episode_id": "SQ4_TN_C_1009", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_C_1009.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261638, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,可能处于长时间敞开状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:52、07:21、18:11、19:17 四次报告 MeasuredValue = None,均发生在灶具使用前后。其他三个温度传感器全天无 None 值,说明这不是系统性问题,而是该传感器个体异常。\",\n \"推理步骤2: 灶具使用时温度传感器失效可能意味着传感器受高温影响出现故障或通信中断。这会导致在真正发生厨房火灾或过热时无法及时检测温度异常,削弱安全监控能力。\",\n \"推理步骤3: 厨房窗户传感器在 07:20:30 报告 StateValue=False(窗户打开),之后在 19:16:30 再次报告 StateValue=False(仍然打开或再次打开),但全天日志中没有出现 StateValue=True(窗户关闭)的记录。早晨全家 07:21 出门后厨房窗户一直处于开启状态,存在安全隐患。\",\n \"推理步骤4: 入户门在 16:07 开锁时,kids_room_occupancy 几乎同时触发(16:07:02),但 front_door_contact 关闭事件缺失(日志中未见 StateValue=True)。不过结合后续 17:46 的正常开门-进入流程以及 22:48 的关门上锁记录,16:07 的门锁事件更可能是家人(孩子)放学回家,遗漏关门记录属于日志采样问题而非入侵。\",\n \"推理步骤5: 整体生活模式正常——06:13 起床、06:51 做早餐、07:21 出门上锁、16:07 孩子回家、17:46 大人回家开空调、18:10 做晚餐、21:03 孩子就寝、22:48 大人就寝并锁门。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式。烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤6: 温度趋势合理——夜间约 22.9°C,白天逐步升至 25.9°C 峰值(12:00 左右),傍晚回落,符合夏季自然温度变化。17:46 开启客厅空调(制冷模式 SystemMode=3)后温度稳步下降,也属正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:52、07:21、18:11、19:17 四次报告 MeasuredValue = None,均与灶具使用时段相关\",\n \"厨房窗户 07:20:30 开启后全天未见关闭记录(无 StateValue=True),家人外出期间窗户持续敞开\",\n \"16:07 入户门开锁后未见 front_door_contact 恢复为 True 的关门记录(直到 22:48 才出现关门事件)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor):清洁传感器、检查其与灶具的距离是否过近导致高温干扰,必要时更换或重新定位\",\n \"确认厨房窗户当前状态:如窗户确实未关闭,建议立即关闭,尤其是夜间和外出时段应确保窗户关好\",\n \"检查入户门传感器(front_door_contact)是否存在漏报问题,确认 16:07 至 22:48 期间门是否确实处于关闭状态\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当传感器失效时及时通知住户,避免安全监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,可能处于长时间敞开状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:52、07:21、18:11、19:17 四次报告 MeasuredValue = None,均发生在灶具使用前后。其他三个温度传感器全天无 None 值,说明这不是系统性问题,而是该传感器个体异常。", "推理步骤2: 灶具使用时温度传感器失效可能意味着传感器受高温影响出现故障或通信中断。这会导致在真正发生厨房火灾或过热时无法及时检测温度异常,削弱安全监控能力。", "推理步骤3: 厨房窗户传感器在 07:20:30 报告 StateValue=False(窗户打开),之后在 19:16:30 再次报告 StateValue=False(仍然打开或再次打开),但全天日志中没有出现 StateValue=True(窗户关闭)的记录。早晨全家 07:21 出门后厨房窗户一直处于开启状态,存在安全隐患。", "推理步骤4: 入户门在 16:07 开锁时,kids_room_occupancy 几乎同时触发(16:07:02),但 front_door_contact 关闭事件缺失(日志中未见 StateValue=True)。不过结合后续 17:46 的正常开门-进入流程以及 22:48 的关门上锁记录,16:07 的门锁事件更可能是家人(孩子)放学回家,遗漏关门记录属于日志采样问题而非入侵。", "推理步骤5: 整体生活模式正常——06:13 起床、06:51 做早餐、07:21 出门上锁、16:07 孩子回家、17:46 大人回家开空调、18:10 做晚餐、21:03 孩子就寝、22:48 大人就寝并锁门。门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式。烟雾报警器和漏水传感器全天无告警。", "推理步骤6: 温度趋势合理——夜间约 22.9°C,白天逐步升至 25.9°C 峰值(12:00 左右),傍晚回落,符合夏季自然温度变化。17:46 开启客厅空调(制冷模式 SystemMode=3)后温度稳步下降,也属正常。"], "key_evidence": ["厨房温度传感器在 06:52、07:21、18:11、19:17 四次报告 MeasuredValue = None,均与灶具使用时段相关", "厨房窗户 07:20:30 开启后全天未见关闭记录(无 StateValue=True),家人外出期间窗户持续敞开", "16:07 入户门开锁后未见 front_door_contact 恢复为 True 的关门记录(直到 22:48 才出现关门事件)"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor):清洁传感器、检查其与灶具的距离是否过近导致高温干扰,必要时更换或重新定位", "确认厨房窗户当前状态:如窗户确实未关闭,建议立即关闭,尤其是夜间和外出时段应确保窗户关好", "检查入户门传感器(front_door_contact)是否存在漏报问题,确认 16:07 至 22:48 期间门是否确实处于关闭状态", "考虑为厨房温度传感器设置 None 值告警规则,当传感器失效时及时通知住户,避免安全监控盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.78382182121277, "api_error": null} {"episode_id": "SQ4_TN_D_0958", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0958.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-09T00:00:00", "seed": 20261587, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:33起床,05:53做早餐,07:07出门,08:26回家,12:38午休,13:54起床,16:53做晚餐,20:21洗漱,20:49就寝。这是一个规律的独居老人日常模式,无异常行为。\",\n \"推理步骤2: 入侵风险排查——入户门在07:07手动开锁出门后自动上锁,08:26回家开锁后门传感器在20:49确认关闭并自动上锁。全天无未授权开锁事件,无深夜异常运动检测,无入侵迹象。\",\n \"推理步骤3: 灶具使用安全排查——三次做饭(05:53-06:20约27分钟,10:56-11:38约42分钟,16:53-17:23约30分钟),每次均有人在厨房(kitchen_occupancy=1),使用时长合理,且均正常关闭,烟雾报警器全天未触发。灶具使用本身无异常。\",\n \"推理步骤4: 厨房温度传感器异常——在灶具开启后约30秒至1分钟,kitchen_temp_sensor 连续报告 MeasuredValue = None(共出现4次:05:54、06:21、10:57、16:54及17:24)。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能在高温时出现故障或通信中断。灶具关闭后,传感器在下一个30分钟周期恢复正常读数。\",\n \"推理步骤5: 风险评估——厨房温度传感器是独居老人厨房安全的重要防线之一。如果传感器在高温时失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常及时发出预警。结合老人独居的场景,这个隐患值得关注。\",\n \"推理步骤6: 其他设备状态正常——漏水传感器、烟雾报警器、门窗传感器全天无告警;各房间温度随昼夜自然波动(夜间约22-23°C,午间峰值约25-26°C),属正常范围;客厅空调全天未开启,与温度未超过舒适阈值一致。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具运行期间4次报告 MeasuredValue = None(05:54、06:21、10:57、16:54/17:24),灶具关闭后恢复正常\",\n \"故障模式高度一致:每次灶具开启后约30-60秒传感器即输出 None,说明并非偶发通信丢包,而是与高温环境强相关的可复现故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或热保护断连\",\n \"对厨房温度传感器进行固件更新或更换,确保其在灶具使用的高温环境下仍能正常报告数值\",\n \"在传感器修复前,考虑增加一条自动化规则:若灶具开启超过45分钟且温度传感器无有效读数,则触发告警通知家属或社区看护人员\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:33起床,05:53做早餐,07:07出门,08:26回家,12:38午休,13:54起床,16:53做晚餐,20:21洗漱,20:49就寝。这是一个规律的独居老人日常模式,无异常行为。", "推理步骤2: 入侵风险排查——入户门在07:07手动开锁出门后自动上锁,08:26回家开锁后门传感器在20:49确认关闭并自动上锁。全天无未授权开锁事件,无深夜异常运动检测,无入侵迹象。", "推理步骤3: 灶具使用安全排查——三次做饭(05:53-06:20约27分钟,10:56-11:38约42分钟,16:53-17:23约30分钟),每次均有人在厨房(kitchen_occupancy=1),使用时长合理,且均正常关闭,烟雾报警器全天未触发。灶具使用本身无异常。", "推理步骤4: 厨房温度传感器异常——在灶具开启后约30秒至1分钟,kitchen_temp_sensor 连续报告 MeasuredValue = None(共出现4次:05:54、06:21、10:57、16:54及17:24)。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能在高温时出现故障或通信中断。灶具关闭后,传感器在下一个30分钟周期恢复正常读数。", "推理步骤5: 风险评估——厨房温度传感器是独居老人厨房安全的重要防线之一。如果传感器在高温时失效,一旦发生灶具忘关或油锅起火等情况,系统将无法通过温度异常及时发出预警。结合老人独居的场景,这个隐患值得关注。", "推理步骤6: 其他设备状态正常——漏水传感器、烟雾报警器、门窗传感器全天无告警;各房间温度随昼夜自然波动(夜间约22-23°C,午间峰值约25-26°C),属正常范围;客厅空调全天未开启,与温度未超过舒适阈值一致。"], "key_evidence": ["kitchen_temp_sensor 在灶具运行期间4次报告 MeasuredValue = None(05:54、06:21、10:57、16:54/17:24),灶具关闭后恢复正常", "故障模式高度一致:每次灶具开启后约30-60秒传感器即输出 None,说明并非偶发通信丢包,而是与高温环境强相关的可复现故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或热保护断连", "对厨房温度传感器进行固件更新或更换,确保其在灶具使用的高温环境下仍能正常报告数值", "在传感器修复前,考虑增加一条自动化规则:若灶具开启超过45分钟且温度传感器无有效读数,则触发告警通知家属或社区看护人员", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.801128149032593, "api_error": null} {"episode_id": "SQ4_TN_D_0960", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0960.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261589, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这发生在三次烹饪期间(05:52、10:55、17:07),且灶具关闭后约1分钟再次报告 None(06:29、11:28、17:41),随后在下一个整点/半点周期才恢复正常数值。\",\n \"推理步骤2: 正常的温度传感器在灶具使用时应报告升高的温度值,而非 None。None 值通常表示传感器读数无效或通信中断。这可能是灶具产生的热量超出传感器量程,或传感器受热干扰导致暂时失效。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,一旦发生干烧或油锅起火,温度异常将无法被系统捕获,只能依赖烟雾报警器作为最后防线,安全冗余降低。\",\n \"推理步骤4: 其余行为模式均属正常——老人约05:38起床,05:48洗漱,05:51做早餐,07:07出门并自动锁门,08:27回家,12:32午休拉窗帘,13:54起床,17:06做晚餐,20:37洗漱后20:42就寝关灯拉窗帘。作息规律,门锁操作正常,无入侵或漏水迹象。\",\n \"推理步骤5: 入户门在07:07出门后自动上锁(LockState=1),08:27回家时手动开锁,20:42就寝时确认门已关闭并自动上锁,安全状态良好。所有房间温度变化符合夏季昼夜规律(夜间约22°C,午间峰值约25.8°C),无异常热源。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值:05:52:08、10:55:00、17:07:00(灶具开启后),以及 06:29:00、11:28:00、17:41:00(灶具关闭后)\",\n \"同一传感器在非烹饪时段读数完全正常,说明故障与灶具使用存在强关联\",\n \"老人日常作息规律正常,门锁状态安全,无入侵、漏水或烟雾报警触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热超量程或电磁干扰,必要时重新定位传感器\",\n \"对厨房温度传感器进行硬件检测或固件更新,排除传感器本身故障\",\n \"在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为备用安全防线\",\n \"考虑为灶具增加自动关火定时功能(如超过30分钟未操作自动断气/断电),降低独居老人忘关灶具的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒~1分钟)连续报告 MeasuredValue = None,这发生在三次烹饪期间(05:52、10:55、17:07),且灶具关闭后约1分钟再次报告 None(06:29、11:28、17:41),随后在下一个整点/半点周期才恢复正常数值。", "推理步骤2: 正常的温度传感器在灶具使用时应报告升高的温度值,而非 None。None 值通常表示传感器读数无效或通信中断。这可能是灶具产生的热量超出传感器量程,或传感器受热干扰导致暂时失效。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在灶具使用时恰好失效,一旦发生干烧或油锅起火,温度异常将无法被系统捕获,只能依赖烟雾报警器作为最后防线,安全冗余降低。", "推理步骤4: 其余行为模式均属正常——老人约05:38起床,05:48洗漱,05:51做早餐,07:07出门并自动锁门,08:27回家,12:32午休拉窗帘,13:54起床,17:06做晚餐,20:37洗漱后20:42就寝关灯拉窗帘。作息规律,门锁操作正常,无入侵或漏水迹象。", "推理步骤5: 入户门在07:07出门后自动上锁(LockState=1),08:27回家时手动开锁,20:42就寝时确认门已关闭并自动上锁,安全状态良好。所有房间温度变化符合夏季昼夜规律(夜间约22°C,午间峰值约25.8°C),无异常热源。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值:05:52:08、10:55:00、17:07:00(灶具开启后),以及 06:29:00、11:28:00、17:41:00(灶具关闭后)", "同一传感器在非烹饪时段读数完全正常,说明故障与灶具使用存在强关联", "老人日常作息规律正常,门锁状态安全,无入侵、漏水或烟雾报警触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热超量程或电磁干扰,必要时重新定位传感器", "对厨房温度传感器进行硬件检测或固件更新,排除传感器本身故障", "在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为备用安全防线", "考虑为灶具增加自动关火定时功能(如超过30分钟未操作自动断气/断电),降低独居老人忘关灶具的风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.003959894180298, "api_error": null} {"episode_id": "SQ4_TN_D_0961", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0961.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261590, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致火灾风险无法被及时感知。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:28起床、05:45如厕、06:08做早餐、07:03出门、08:28回家、12:40午休、16:55做晚餐、20:31洗漱、20:53就寝,符合独居老人的典型日常模式。\",\n \"推理步骤2: 入侵风险排除——入户门在07:03出门时手动开锁并自动回锁,08:28回家同理,20:53就寝前门锁确认为已锁状态(LockState=1),全天门窗传感器无异常开启记录。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:09、06:35、11:05、11:27、16:56、17:25),kitchen_temp_sensor 均报告 MeasuredValue = None,共出现6次。灶具关闭后传感器恢复正常读数。这说明传感器在高温环境下无法正常工作。\",\n \"推理步骤4: 该故障的安全隐患在于:如果灶具忘关或发生明火,温度传感器恰好在此时失效,将无法通过温度异常升高来辅助预警。虽然有独立的烟雾报警器(kitchen_smoke_alarm)作为后备,但多层防护中缺失一层对独居老人而言风险较高。\",\n \"推理步骤5: 其余设备状态正常——温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.8°C),烟雾报警器未触发,漏水传感器未触发,客厅空调未见异常启停。\",\n \"推理步骤6: 老人08:28回家后入户门未再上锁(直到20:53才确认锁定),存在约12.5小时门锁状态为解锁(LockState=2)的窗口期,虽然老人在家中,但对独居老人而言建议回家后及时锁门。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启期间6次报告 MeasuredValue = None(06:09、06:35、11:05、11:27、16:56、17:25),灶具关闭后恢复正常\",\n \"08:28开锁进门后至20:53期间,front_door_lock 处于解锁状态(LockState=2)长达约12.5小时\",\n \"三次灶具使用时长分别约26分钟、22分钟、29分钟,均在合理范围内,烟雾报警器未触发\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其耐高温性能是否满足灶具附近的安装要求,必要时调整安装位置远离灶具直接热源\",\n \"设置入户门自动上锁规则:进门关门后若超过一定时间(如2分钟)未手动锁门,则自动执行上锁操作\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常并定期测试,在温度传感器修复前它是灶具区域的唯一主动预警手段\",\n \"考虑为灶具添加超时自动关闭规则(如持续开启超过30分钟未操作则自动断电),防止独居老人忘关灶具\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致火灾风险无法被及时感知。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:28起床、05:45如厕、06:08做早餐、07:03出门、08:28回家、12:40午休、16:55做晚餐、20:31洗漱、20:53就寝,符合独居老人的典型日常模式。", "推理步骤2: 入侵风险排除——入户门在07:03出门时手动开锁并自动回锁,08:28回家同理,20:53就寝前门锁确认为已锁状态(LockState=1),全天门窗传感器无异常开启记录。", "推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:09、06:35、11:05、11:27、16:56、17:25),kitchen_temp_sensor 均报告 MeasuredValue = None,共出现6次。灶具关闭后传感器恢复正常读数。这说明传感器在高温环境下无法正常工作。", "推理步骤4: 该故障的安全隐患在于:如果灶具忘关或发生明火,温度传感器恰好在此时失效,将无法通过温度异常升高来辅助预警。虽然有独立的烟雾报警器(kitchen_smoke_alarm)作为后备,但多层防护中缺失一层对独居老人而言风险较高。", "推理步骤5: 其余设备状态正常——温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.8°C),烟雾报警器未触发,漏水传感器未触发,客厅空调未见异常启停。", "推理步骤6: 老人08:28回家后入户门未再上锁(直到20:53才确认锁定),存在约12.5小时门锁状态为解锁(LockState=2)的窗口期,虽然老人在家中,但对独居老人而言建议回家后及时锁门。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启期间6次报告 MeasuredValue = None(06:09、06:35、11:05、11:27、16:56、17:25),灶具关闭后恢复正常", "08:28开锁进门后至20:53期间,front_door_lock 处于解锁状态(LockState=2)长达约12.5小时", "三次灶具使用时长分别约26分钟、22分钟、29分钟,均在合理范围内,烟雾报警器未触发"], "recommended_actions": ["检查或更换厨房温度传感器,确认其耐高温性能是否满足灶具附近的安装要求,必要时调整安装位置远离灶具直接热源", "设置入户门自动上锁规则:进门关门后若超过一定时间(如2分钟)未手动锁门,则自动执行上锁操作", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常并定期测试,在温度传感器修复前它是灶具区域的唯一主动预警手段", "考虑为灶具添加超时自动关闭规则(如持续开启超过30分钟未操作则自动断电),防止独居老人忘关灶具"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.569896697998047, "api_error": null} {"episode_id": "SQ4_TN_D_0963", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0963.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261592, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(05:54、10:52、16:53),灶具关闭后约1分钟也报告 None(06:41、11:22、17:38),一天内共出现6次。这表明传感器在灶具工作前后存在系统性读数丢失。\",\n \"推理步骤2: 厨房灶具是独居老人家庭中最主要的火灾风险源。温度传感器的核心职责之一是在灶具使用期间监测异常高温。传感器在此关键时段反复失效,意味着如果发生干烧或油温过高,系统将无法及时发出预警。\",\n \"推理步骤3: 排除正常行为的可能性——Matter 协议中 MeasuredValue = None 表示传感器无法提供有效读数,而非正常的温度波动。正常传感器即使在高温环境下也应报告具体数值(只要在量程内)。三次灶具使用均复现此问题,说明这是一个稳定的故障模式,而非偶发干扰。\",\n \"推理步骤4: 其余家庭活动模式正常——老人约05:33起床,05:53做早餐,07:07外出并自动锁门,08:31回家,12:25午休,14:00起床,16:52做晚餐,20:23洗漱,20:38就寝。作息规律,门锁操作正常(手动开锁、自动上锁),无入侵迹象。\",\n \"推理步骤5: 入户门在老人外出期间(07:07-08:31)保持锁定状态(LockState=1),无异常开锁事件,排除入侵风险。所有烟雾报警器、漏水传感器均未触发,无火灾或漏水事件。\",\n \"推理步骤6: 20:38 的门锁确认上锁事件(BooleanState.StateValue = True 表示门关闭,随后自动上锁)发生在老人从卫生间回卧室就寝时,属于睡前自动安全检查/自动锁门,行为合理。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:54、06:41、10:52、11:22、16:53、17:38),呈现与灶具使用强相关的系统性故障模式\",\n \"除温度传感器异常外,其余设备状态均正常:烟雾报警器未触发、门锁状态正确、运动传感器与老人作息吻合、漏水传感器无报警\"\n ],\n \"recommended_actions\": [\n \"尽快检查或更换厨房温度传感器,确认是否为硬件故障(如高温环境下传感器超量程或连接不稳定)\",\n \"在传感器修复前,建议为厨房灶具设置使用时长上限自动关断规则(如超过60分钟未手动操作则自动关闭),作为补偿性安全措施\",\n \"检查厨房烟雾报警器是否工作正常,确保在温度传感器失效期间仍有独立的火灾预警手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(05:54、10:52、16:53),灶具关闭后约1分钟也报告 None(06:41、11:22、17:38),一天内共出现6次。这表明传感器在灶具工作前后存在系统性读数丢失。", "推理步骤2: 厨房灶具是独居老人家庭中最主要的火灾风险源。温度传感器的核心职责之一是在灶具使用期间监测异常高温。传感器在此关键时段反复失效,意味着如果发生干烧或油温过高,系统将无法及时发出预警。", "推理步骤3: 排除正常行为的可能性——Matter 协议中 MeasuredValue = None 表示传感器无法提供有效读数,而非正常的温度波动。正常传感器即使在高温环境下也应报告具体数值(只要在量程内)。三次灶具使用均复现此问题,说明这是一个稳定的故障模式,而非偶发干扰。", "推理步骤4: 其余家庭活动模式正常——老人约05:33起床,05:53做早餐,07:07外出并自动锁门,08:31回家,12:25午休,14:00起床,16:52做晚餐,20:23洗漱,20:38就寝。作息规律,门锁操作正常(手动开锁、自动上锁),无入侵迹象。", "推理步骤5: 入户门在老人外出期间(07:07-08:31)保持锁定状态(LockState=1),无异常开锁事件,排除入侵风险。所有烟雾报警器、漏水传感器均未触发,无火灾或漏水事件。", "推理步骤6: 20:38 的门锁确认上锁事件(BooleanState.StateValue = True 表示门关闭,随后自动上锁)发生在老人从卫生间回卧室就寝时,属于睡前自动安全检查/自动锁门,行为合理。"], "key_evidence": ["厨房温度传感器在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:54、06:41、10:52、11:22、16:53、17:38),呈现与灶具使用强相关的系统性故障模式", "除温度传感器异常外,其余设备状态均正常:烟雾报警器未触发、门锁状态正确、运动传感器与老人作息吻合、漏水传感器无报警"], "recommended_actions": ["尽快检查或更换厨房温度传感器,确认是否为硬件故障(如高温环境下传感器超量程或连接不稳定)", "在传感器修复前,建议为厨房灶具设置使用时长上限自动关断规则(如超过60分钟未手动操作则自动关闭),作为补偿性安全措施", "检查厨房烟雾报警器是否工作正常,确保在温度传感器失效期间仍有独立的火灾预警手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.720228672027588, "api_error": null} {"episode_id": "SQ4_TN_D_0976", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0976.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261605, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:04、10:56、17:08),灶具关闭后同样报告 None(06:41、11:23、17:35),说明传感器在灶具工作前后均无法正常读数。\",\n \"推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(可能超量程),而非返回 None。多次重复出现 None 表明传感器可能存在硬件故障、通信中断或安装位置不当导致被灶具热量直接影响。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪时失效,一旦发生灶具忘关或油温过高等情况,系统将无法通过温度异常及时发出预警。\",\n \"推理步骤4: 其余行为模式正常——老人05:31起床、06:53出门晨练、08:28回家、12:27午休、14:04起床、20:35就寝,作息规律;门锁操作均为手动开锁+自动上锁,无异常入侵迹象;烟雾报警器和漏水传感器全天无触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(06:04、06:41、10:56、11:23、17:08、17:35)\",\n \"同时段其他房间温度传感器均正常报告数值,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位\",\n \"对厨房温度传感器进行硬件诊断或更换,确保其在烹饪场景下能正常工作\",\n \"在传感器修复前,考虑增加灶具使用时长自动提醒规则(如超过45分钟未关闭则告警),作为补偿性安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(06:04、10:56、17:08),灶具关闭后同样报告 None(06:41、11:23、17:35),说明传感器在灶具工作前后均无法正常读数。", "推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(可能超量程),而非返回 None。多次重复出现 None 表明传感器可能存在硬件故障、通信中断或安装位置不当导致被灶具热量直接影响。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在烹饪时失效,一旦发生灶具忘关或油温过高等情况,系统将无法通过温度异常及时发出预警。", "推理步骤4: 其余行为模式正常——老人05:31起床、06:53出门晨练、08:28回家、12:27午休、14:04起床、20:35就寝,作息规律;门锁操作均为手动开锁+自动上锁,无异常入侵迹象;烟雾报警器和漏水传感器全天无触发。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(06:04、06:41、10:56、11:23、17:08、17:35)", "同时段其他房间温度传感器均正常报告数值,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位", "对厨房温度传感器进行硬件诊断或更换,确保其在烹饪场景下能正常工作", "在传感器修复前,考虑增加灶具使用时长自动提醒规则(如超过45分钟未关闭则告警),作为补偿性安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 17.83177423477173, "api_error": null} {"episode_id": "SQ4_TN_D_0974", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0974.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261603, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人 05:22 起床、05:47 如厕、06:09 进厨房做早餐、07:00 出门、08:28 回家,12:20 午休、14:06 起床,17:07 做晚餐,20:44 就寝。作息规律,活动模式完全符合独居老人的正常日常。\",\n \"推理步骤2: 安防状态分析——入户门在 07:00 手动开锁出门后自动上锁,08:28 回家开锁进入,20:44 就寝前确认门锁已锁(LockState=1)且门已关闭(StateValue=True)。全天无异常开锁事件,无未授权入侵迹象。\",\n \"推理步骤3: 厨房灶具使用分析——三次使用灶具(06:09-06:29 约20分钟,10:55-11:21 约26分钟,17:07-17:23 约16分钟),每次使用时长合理,均正常关闭,烟雾报警器全天无触发,无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 均报告 MeasuredValue = None(06:10、06:30 第一次;10:56 第一次;11:22 第一次;17:08、17:24)。灶具关闭后传感器恢复正常读数。这表明传感器在灶具工作时受热源影响超出量程或发生通信故障。\",\n \"推理步骤5: 该故障的安全影响——厨房温度传感器是检测厨房异常高温(如忘关灶具、火灾初期)的关键设备。恰恰在灶具使用时失效,意味着如果发生灶具相关的温度异常,系统将无法及时检测和报警。对独居老人而言,这是一个需要关注的安全监控盲区。\",\n \"推理步骤6: 其他设备状态正常——温度整体走势符合夏季昼夜变化(夜间约22°C,午间峰值约25.8°C);漏水传感器、烟雾报警器、窗户传感器全天无异常事件;客厅窗户和卧室窗户传感器无异常开合记录。\",\n \"推理步骤7: 老人健康状态间接评估——老人全天活动轨迹连贯,房间转换合理,无长时间滞留卫生间或异常不活动时段,未发现健康异常信号。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间共报告 6 次 MeasuredValue = None(06:10、06:30、10:56、11:22、17:08、17:24),灶具关闭后恢复正常\",\n \"故障模式高度一致:每次 kitchen_cook_surface OnOff=True 后约30秒至1分钟内传感器即报 None,说明与灶具热源存在因果关系\",\n \"其余所有安防设备(门锁、烟雾报警器、漏水传感器、门窗传感器)全天无异常事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热超出工作温度范围,必要时重新选址安装\",\n \"检查传感器固件版本,确认是否存在已知的高温环境下通信中断问题,考虑更换耐高温型号\",\n \"在传感器修复前,建议增加灶具使用超时自动断气/断电的安全联动规则(如灶具连续开启超过30分钟自动关闭并通知)\",\n \"考虑为厨房烟雾报警器增加定期自检机制,确保在温度传感器失效期间仍有可靠的安全监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 整体生活作息分析——老人 05:22 起床、05:47 如厕、06:09 进厨房做早餐、07:00 出门、08:28 回家,12:20 午休、14:06 起床,17:07 做晚餐,20:44 就寝。作息规律,活动模式完全符合独居老人的正常日常。", "推理步骤2: 安防状态分析——入户门在 07:00 手动开锁出门后自动上锁,08:28 回家开锁进入,20:44 就寝前确认门锁已锁(LockState=1)且门已关闭(StateValue=True)。全天无异常开锁事件,无未授权入侵迹象。", "推理步骤3: 厨房灶具使用分析——三次使用灶具(06:09-06:29 约20分钟,10:55-11:21 约26分钟,17:07-17:23 约16分钟),每次使用时长合理,均正常关闭,烟雾报警器全天无触发,无火灾风险。", "推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 均报告 MeasuredValue = None(06:10、06:30 第一次;10:56 第一次;11:22 第一次;17:08、17:24)。灶具关闭后传感器恢复正常读数。这表明传感器在灶具工作时受热源影响超出量程或发生通信故障。", "推理步骤5: 该故障的安全影响——厨房温度传感器是检测厨房异常高温(如忘关灶具、火灾初期)的关键设备。恰恰在灶具使用时失效,意味着如果发生灶具相关的温度异常,系统将无法及时检测和报警。对独居老人而言,这是一个需要关注的安全监控盲区。", "推理步骤6: 其他设备状态正常——温度整体走势符合夏季昼夜变化(夜间约22°C,午间峰值约25.8°C);漏水传感器、烟雾报警器、窗户传感器全天无异常事件;客厅窗户和卧室窗户传感器无异常开合记录。", "推理步骤7: 老人健康状态间接评估——老人全天活动轨迹连贯,房间转换合理,无长时间滞留卫生间或异常不活动时段,未发现健康异常信号。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间共报告 6 次 MeasuredValue = None(06:10、06:30、10:56、11:22、17:08、17:24),灶具关闭后恢复正常", "故障模式高度一致:每次 kitchen_cook_surface OnOff=True 后约30秒至1分钟内传感器即报 None,说明与灶具热源存在因果关系", "其余所有安防设备(门锁、烟雾报警器、漏水传感器、门窗传感器)全天无异常事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致受热超出工作温度范围,必要时重新选址安装", "检查传感器固件版本,确认是否存在已知的高温环境下通信中断问题,考虑更换耐高温型号", "在传感器修复前,建议增加灶具使用超时自动断气/断电的安全联动规则(如灶具连续开启超过30分钟自动关闭并通知)", "考虑为厨房烟雾报警器增加定期自检机制,确保在温度传感器失效期间仍有可靠的安全监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.64627504348755, "api_error": null} {"episode_id": "SQ4_TN_D_0978", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0978.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261607, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰,可能导致厨房火灾风险无法被及时监测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(05:59:07、10:59:00、17:02:00),灶具关闭后也再次报告 None(06:22:00、11:34:00、17:28:00),一天内共出现6次,呈现与灶具使用强相关的规律性故障。\",\n \"推理步骤2: 正常温度传感器不应因灶具工作而返回 None。可能原因包括:传感器安装位置过近导致高温超量程、传感器硬件老化、或通信链路受热干扰。无论哪种原因,这意味着恰恰在最需要温度监测的烹饪时段,传感器处于失效状态。\",\n \"推理步骤3: 对于独居老人家庭,厨房是火灾高风险区域。虽然有烟雾报警器作为后备,但温度传感器失效会削弱早期预警能力——烟雾报警器通常在火情已经发展到产生烟雾时才触发,而温度异常升高可以更早发现隐患。\",\n \"推理步骤4: 其余方面整体正常——老人作息规律(05:29起床、20:50就寝),三餐烹饪时间合理(早06:00、午11:00、晚17:00),出门/回家门锁操作正常(07:10出门自动上锁、08:37回家),午休12:24-14:05合理,入户门始终处于锁定状态,无入侵迹象,无漏水报警,烟雾报警器未触发,各房间温度变化符合夏季昼夜规律。\",\n \"推理步骤5: 入户门在20:50:13报告 StateValue=True(关闭)并自动上锁,但此前日志中未见对应的开门事件(老人08:37回家后未再出门),这可能是门锁系统的定时检查/确认上锁操作,属于正常安全行为,不构成异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(05:59:07、06:22:00、10:59:00、11:34:00、17:02:00、17:28:00)\",\n \"故障模式与灶具使用高度相关:每次灶具 OnOff=True 后约30秒出现 None,灶具 OnOff=False 后约1分钟再次出现 None\",\n \"在非烹饪时段,厨房温度传感器正常工作,读数与其他房间一致且合理(22.9°C ~ 25.8°C)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确保其与灶具保持足够距离,避免高温直接影响传感器\",\n \"对厨房温度传感器进行硬件检测,确认是否存在老化或量程不足的问题,必要时更换为耐高温型号\",\n \"在传感器修复前,建议老人烹饪时保持厨房门窗适度通风,并确保烟雾报警器处于正常工作状态\",\n \"考虑为厨房灶具增加自动定时关闭功能(如超过30分钟未操作自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,疑似传感器故障或被高温干扰,可能导致厨房火灾风险无法被及时监测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内即报告 MeasuredValue = None(05:59:07、10:59:00、17:02:00),灶具关闭后也再次报告 None(06:22:00、11:34:00、17:28:00),一天内共出现6次,呈现与灶具使用强相关的规律性故障。", "推理步骤2: 正常温度传感器不应因灶具工作而返回 None。可能原因包括:传感器安装位置过近导致高温超量程、传感器硬件老化、或通信链路受热干扰。无论哪种原因,这意味着恰恰在最需要温度监测的烹饪时段,传感器处于失效状态。", "推理步骤3: 对于独居老人家庭,厨房是火灾高风险区域。虽然有烟雾报警器作为后备,但温度传感器失效会削弱早期预警能力——烟雾报警器通常在火情已经发展到产生烟雾时才触发,而温度异常升高可以更早发现隐患。", "推理步骤4: 其余方面整体正常——老人作息规律(05:29起床、20:50就寝),三餐烹饪时间合理(早06:00、午11:00、晚17:00),出门/回家门锁操作正常(07:10出门自动上锁、08:37回家),午休12:24-14:05合理,入户门始终处于锁定状态,无入侵迹象,无漏水报警,烟雾报警器未触发,各房间温度变化符合夏季昼夜规律。", "推理步骤5: 入户门在20:50:13报告 StateValue=True(关闭)并自动上锁,但此前日志中未见对应的开门事件(老人08:37回家后未再出门),这可能是门锁系统的定时检查/确认上锁操作,属于正常安全行为,不构成异常。"], "key_evidence": ["厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(05:59:07、06:22:00、10:59:00、11:34:00、17:02:00、17:28:00)", "故障模式与灶具使用高度相关:每次灶具 OnOff=True 后约30秒出现 None,灶具 OnOff=False 后约1分钟再次出现 None", "在非烹饪时段,厨房温度传感器正常工作,读数与其他房间一致且合理(22.9°C ~ 25.8°C)"], "recommended_actions": ["检查厨房温度传感器的安装位置,确保其与灶具保持足够距离,避免高温直接影响传感器", "对厨房温度传感器进行硬件检测,确认是否存在老化或量程不足的问题,必要时更换为耐高温型号", "在传感器修复前,建议老人烹饪时保持厨房门窗适度通风,并确保烟雾报警器处于正常工作状态", "考虑为厨房灶具增加自动定时关闭功能(如超过30分钟未操作自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.190675258636475, "api_error": null} {"episode_id": "SQ4_TN_D_0979", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0979.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261608, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人回家后未确认关闭,以及老人就寝流程存在细微异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后持续报告 MeasuredValue = None(06:10、06:23、10:56、11:27、17:05、17:39),共出现6次。每次都精确对应灶具 OnOff=True 或刚关闭后的时间窗口,说明传感器在高温环境下无法正常读数。这是一个设备故障信号——对于独居老人家庭,厨房温度监控失效意味着火灾预警能力下降。\",\n \"推理步骤2: 老人 07:05 出门时,门锁手动解锁(LockOperationType=1)→开门→关门→自动上锁,流程正常。08:33 回家时,门锁手动解锁→开门,但日志中没有 front_door_contact StateValue=True(关门)和重新上锁的记录,直到 20:44:18 才出现关门和自动上锁。这意味着从 08:33 到 20:44,长达约12小时入户门可能处于未锁定状态。虽然老人在家中活动,但对独居老人而言,长时间门未锁存在安全隐患。\",\n \"推理步骤3: 20:44 的就寝流程中,老人从浴室出来后进入卧室,卧室灯短暂开启后立即关闭(20:44:20 开 → 20:44:36 关,仅16秒),同时窗帘完全关闭。16秒内完成开灯-关窗帘-关灯的操作虽然偏快,但可能是自动化场景联动(检测到入卧室后自动关窗帘、关灯),属于合理范围。\",\n \"推理步骤4: 整体生活作息分析——05:31起床→05:45洗漱→06:09做早餐→07:05出门→08:33回家→10:55做午餐→12:24午休→13:50起床→17:04做晚餐→19:31客厅活动→20:24洗漱→20:44就寝。作息规律,符合独居老人的典型生活模式,无异常活动时间段。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约22°C,午间峰值约24.8°C;客厅峰值约25.9°C),未出现异常高温,烟雾报警器全天无触发,无漏水报警,排除火灾和水灾风险。\",\n \"推理步骤6: 全天无任何未授权的门锁操作、无深夜异常运动检测、无窗户异常开启,排除入侵威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:23、10:56、11:27、17:05、17:39),传感器在高温下失效\",\n \"08:33 入户门手动解锁开门后,日志中缺少关门(StateValue=True)和上锁记录,直到 20:44:18 才记录到关门上锁,门可能长时间未锁\",\n \"老人全天生活作息规律,三餐时间正常,烟雾报警器和漏水传感器均未触发\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:当前传感器在灶具工作时无法提供有效读数,削弱了厨房火灾早期预警能力。建议将传感器安装位置远离灶具热源,或更换耐高温型号。\",\n \"检查入户门锁与门磁传感器的联动配置:确认 08:33 回家后门是否确实未关闭/未上锁,还是门磁传感器漏报。如果是传感器问题需要维修;如果老人确实忘记锁门,建议设置「开门超过N分钟未关闭」的自动提醒。\",\n \"为独居老人增加「长时间无活动」告警规则:虽然本日未触发,但建议配置如卧室/浴室超过一定时间无运动检测时自动通知紧急联系人,防范跌倒等健康风险。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰;同时入户门在老人回家后未确认关闭,以及老人就寝流程存在细微异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后持续报告 MeasuredValue = None(06:10、06:23、10:56、11:27、17:05、17:39),共出现6次。每次都精确对应灶具 OnOff=True 或刚关闭后的时间窗口,说明传感器在高温环境下无法正常读数。这是一个设备故障信号——对于独居老人家庭,厨房温度监控失效意味着火灾预警能力下降。", "推理步骤2: 老人 07:05 出门时,门锁手动解锁(LockOperationType=1)→开门→关门→自动上锁,流程正常。08:33 回家时,门锁手动解锁→开门,但日志中没有 front_door_contact StateValue=True(关门)和重新上锁的记录,直到 20:44:18 才出现关门和自动上锁。这意味着从 08:33 到 20:44,长达约12小时入户门可能处于未锁定状态。虽然老人在家中活动,但对独居老人而言,长时间门未锁存在安全隐患。", "推理步骤3: 20:44 的就寝流程中,老人从浴室出来后进入卧室,卧室灯短暂开启后立即关闭(20:44:20 开 → 20:44:36 关,仅16秒),同时窗帘完全关闭。16秒内完成开灯-关窗帘-关灯的操作虽然偏快,但可能是自动化场景联动(检测到入卧室后自动关窗帘、关灯),属于合理范围。", "推理步骤4: 整体生活作息分析——05:31起床→05:45洗漱→06:09做早餐→07:05出门→08:33回家→10:55做午餐→12:24午休→13:50起床→17:04做晚餐→19:31客厅活动→20:24洗漱→20:44就寝。作息规律,符合独居老人的典型生活模式,无异常活动时间段。", "推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约22°C,午间峰值约24.8°C;客厅峰值约25.9°C),未出现异常高温,烟雾报警器全天无触发,无漏水报警,排除火灾和水灾风险。", "推理步骤6: 全天无任何未授权的门锁操作、无深夜异常运动检测、无窗户异常开启,排除入侵威胁。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:23、10:56、11:27、17:05、17:39),传感器在高温下失效", "08:33 入户门手动解锁开门后,日志中缺少关门(StateValue=True)和上锁记录,直到 20:44:18 才记录到关门上锁,门可能长时间未锁", "老人全天生活作息规律,三餐时间正常,烟雾报警器和漏水传感器均未触发"], "recommended_actions": ["检修或更换厨房温度传感器:当前传感器在灶具工作时无法提供有效读数,削弱了厨房火灾早期预警能力。建议将传感器安装位置远离灶具热源,或更换耐高温型号。", "检查入户门锁与门磁传感器的联动配置:确认 08:33 回家后门是否确实未关闭/未上锁,还是门磁传感器漏报。如果是传感器问题需要维修;如果老人确实忘记锁门,建议设置「开门超过N分钟未关闭」的自动提醒。", "为独居老人增加「长时间无活动」告警规则:虽然本日未触发,但建议配置如卧室/浴室超过一定时间无运动检测时自动通知紧急联系人,防范跌倒等健康风险。"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.041075468063354, "api_error": null} {"episode_id": "SQ4_TN_D_0981", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0981.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20261610, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 梳理全天活动时间线——老人约05:30起床,06:09做早餐,07:10出门,08:27回家,12:27午休,13:53起床,16:56做晚餐,20:28洗漱,20:53就寝。整体作息规律,符合独居老人的正常生活模式。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后均出现 MeasuredValue = None 的异常读数。具体发生在06:10(早餐灶具开启后1分钟)、10:54(午餐)、16:57(晚餐),且灶具关闭后仍报告 None(06:38、11:22、17:38),直到下一个整点周期才恢复正常数值。这一模式在三次烹饪中完全重复,说明不是偶发故障。\",\n \"推理步骤3: 温度传感器报告 None 意味着在灶具使用期间及关闭后短时间内,系统无法获取厨房温度数据。如果发生灶具忘关或厨房起火等紧急情况,温度异常升高将无法被检测到,烟雾报警器虽然存在但温度监控作为早期预警手段已失效。\",\n \"推理步骤4: 入户门在08:27开锁后,直到20:53才重新上锁(自动锁定),期间约12.5小时门锁处于未锁状态。虽然门传感器显示门是关闭的(StateValue=True),但对独居老人而言,长时间未锁门存在一定安全隐患。不过这也可能是老人在家时的正常习惯,风险等级较低。\",\n \"推理步骤5: 其他方面均正常——全天温度变化符合夏季昼夜规律(夜间约22°C,午间峰值约25.8°C);烟雾报警器和漏水传感器无告警;门锁操作均为手动/自动,无异常远程解锁;各房间运动传感器与灯光、活动轨迹一致,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:10、06:38、10:54、11:22、16:57、17:38),共6次异常读数\",\n \"异常模式高度一致:灶具 OnOff=True 后约30秒至1分钟传感器失效,灶具 OnOff=False 后1分钟再次报告 None,直到下一个30分钟周期才恢复\",\n \"入户门从08:27解锁到20:53才自动锁定,中间约12.5小时未上锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时传感器超量程或自我保护断连,必要时重新定位或更换耐高温型号\",\n \"在传感器修复前,建议为灶具设置自动关闭规则(如开启超过45分钟未手动操作则自动断电),作为温度监控失效期间的安全兜底\",\n \"考虑为入户门锁配置回家后定时自动上锁策略(如门关闭后5分钟自动锁定),提升独居老人的居家安全性\",\n \"确认烟雾报警器 kitchen_smoke_alarm 工作正常并定期测试,在温度传感器不可靠期间它是厨房安全的唯一防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 梳理全天活动时间线——老人约05:30起床,06:09做早餐,07:10出门,08:27回家,12:27午休,13:53起床,16:56做晚餐,20:28洗漱,20:53就寝。整体作息规律,符合独居老人的正常生活模式。", "推理步骤2: 厨房温度传感器在灶具开启后均出现 MeasuredValue = None 的异常读数。具体发生在06:10(早餐灶具开启后1分钟)、10:54(午餐)、16:57(晚餐),且灶具关闭后仍报告 None(06:38、11:22、17:38),直到下一个整点周期才恢复正常数值。这一模式在三次烹饪中完全重复,说明不是偶发故障。", "推理步骤3: 温度传感器报告 None 意味着在灶具使用期间及关闭后短时间内,系统无法获取厨房温度数据。如果发生灶具忘关或厨房起火等紧急情况,温度异常升高将无法被检测到,烟雾报警器虽然存在但温度监控作为早期预警手段已失效。", "推理步骤4: 入户门在08:27开锁后,直到20:53才重新上锁(自动锁定),期间约12.5小时门锁处于未锁状态。虽然门传感器显示门是关闭的(StateValue=True),但对独居老人而言,长时间未锁门存在一定安全隐患。不过这也可能是老人在家时的正常习惯,风险等级较低。", "推理步骤5: 其他方面均正常——全天温度变化符合夏季昼夜规律(夜间约22°C,午间峰值约25.8°C);烟雾报警器和漏水传感器无告警;门锁操作均为手动/自动,无异常远程解锁;各房间运动传感器与灯光、活动轨迹一致,无入侵迹象。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:10、06:38、10:54、11:22、16:57、17:38),共6次异常读数", "异常模式高度一致:灶具 OnOff=True 后约30秒至1分钟传感器失效,灶具 OnOff=False 后1分钟再次报告 None,直到下一个30分钟周期才恢复", "入户门从08:27解锁到20:53才自动锁定,中间约12.5小时未上锁"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时传感器超量程或自我保护断连,必要时重新定位或更换耐高温型号", "在传感器修复前,建议为灶具设置自动关闭规则(如开启超过45分钟未手动操作则自动断电),作为温度监控失效期间的安全兜底", "考虑为入户门锁配置回家后定时自动上锁策略(如门关闭后5分钟自动锁定),提升独居老人的居家安全性", "确认烟雾报警器 kitchen_smoke_alarm 工作正常并定期测试,在温度传感器不可靠期间它是厨房安全的唯一防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.76267170906067, "api_error": null} {"episode_id": "SQ4_TN_D_0982", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0982.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261611, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:51、11:03、16:54),灶具关闭后约1分钟也报告 None(06:36、11:23、17:35),三次做饭周期均复现此现象,说明这不是偶发故障而是系统性问题。\",\n \"推理步骤2: 在 None 值出现的时间窗口之外,厨房温度传感器能正常恢复读数(如 06:00 报 2405、11:30 报 2560、17:00 报 2473),说明传感器并非完全损坏,而是在灶具运行前后的特定时段失效,可能是高温或电磁干扰导致传感器暂时超量程或通信中断。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具过热或干烧,系统将无法通过温度异常及时发出预警,仅能依赖烟雾报警器作为最后防线,安全冗余降低。\",\n \"推理步骤4: 其余行为模式均属正常——老人 05:31 起床、05:50 如厕后做早餐、07:07 出门(门锁手动开锁后自动上锁)、08:26 回家、12:33 午休拉窗帘、14:03 起床、16:53 做晚餐、20:39 洗漱后 20:43 就寝关窗帘关灯,作息规律且符合独居老人的典型生活节奏。\",\n \"推理步骤5: 入户门锁操作正常(手动开锁出门、自动上锁),20:43 就寝前门锁确认为锁定状态(LockState=1),无入侵迹象。所有温度读数在合理范围内(夜间约22°C,午间峰值约25.8°C),无漏水或烟雾报警触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用周期中共报告6次 MeasuredValue = None(05:51:10、06:36:00、11:03:00、11:23:00、16:54:00、17:35:00),均发生在灶具开启后或关闭后约1分钟内\",\n \"传感器在非灶具使用时段读数正常,说明故障与灶具运行存在强关联性\",\n \"烟雾报警器全天未触发,无火灾实际发生,但传感器失效降低了预警能力\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距灶具过近导致高温超量程,建议将传感器移至距灶具较远但仍能监测厨房整体温度的位置\",\n \"检查传感器固件版本并更新,排除软件层面的量程处理缺陷(正常应报告极限值而非 None)\",\n \"在传感器问题修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态并定期测试,作为灶具安全的主要防线\",\n \"考虑为灶具增加自动关闭规则(如开启超过45分钟未手动操作则自动断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:51、11:03、16:54),灶具关闭后约1分钟也报告 None(06:36、11:23、17:35),三次做饭周期均复现此现象,说明这不是偶发故障而是系统性问题。", "推理步骤2: 在 None 值出现的时间窗口之外,厨房温度传感器能正常恢复读数(如 06:00 报 2405、11:30 报 2560、17:00 报 2473),说明传感器并非完全损坏,而是在灶具运行前后的特定时段失效,可能是高温或电磁干扰导致传感器暂时超量程或通信中断。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用时恰好失效,一旦发生灶具过热或干烧,系统将无法通过温度异常及时发出预警,仅能依赖烟雾报警器作为最后防线,安全冗余降低。", "推理步骤4: 其余行为模式均属正常——老人 05:31 起床、05:50 如厕后做早餐、07:07 出门(门锁手动开锁后自动上锁)、08:26 回家、12:33 午休拉窗帘、14:03 起床、16:53 做晚餐、20:39 洗漱后 20:43 就寝关窗帘关灯,作息规律且符合独居老人的典型生活节奏。", "推理步骤5: 入户门锁操作正常(手动开锁出门、自动上锁),20:43 就寝前门锁确认为锁定状态(LockState=1),无入侵迹象。所有温度读数在合理范围内(夜间约22°C,午间峰值约25.8°C),无漏水或烟雾报警触发。"], "key_evidence": ["厨房温度传感器在三次灶具使用周期中共报告6次 MeasuredValue = None(05:51:10、06:36:00、11:03:00、11:23:00、16:54:00、17:35:00),均发生在灶具开启后或关闭后约1分钟内", "传感器在非灶具使用时段读数正常,说明故障与灶具运行存在强关联性", "烟雾报警器全天未触发,无火灾实际发生,但传感器失效降低了预警能力"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距灶具过近导致高温超量程,建议将传感器移至距灶具较远但仍能监测厨房整体温度的位置", "检查传感器固件版本并更新,排除软件层面的量程处理缺陷(正常应报告极限值而非 None)", "在传感器问题修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态并定期测试,作为灶具安全的主要防线", "考虑为灶具增加自动关闭规则(如开启超过45分钟未手动操作则自动断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.44935703277588, "api_error": null} {"episode_id": "SQ4_TN_D_0986", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0986.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261615, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时老人 08:37 回家后入户门未重新上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:00:02、06:39:00、11:08:00、11:32:00、17:06:00、17:28:00),共出现 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能受灶具热量干扰或自身存在硬件故障。\",\n \"推理步骤2: 该传感器故障对独居老人尤其危险——如果灶具忘关导致厨房温度异常升高,故障的温度传感器将无法提供有效数据来触发高温报警,削弱了火灾预警能力。\",\n \"推理步骤3: 08:37 老人回家时,门锁解锁(LockState=2)、门打开又关闭,但日志中没有后续的上锁事件(LockOperationType=0)。直到 20:38:11 睡前才自动上锁。这意味着入户门在白天约 12 小时处于未锁状态。对独居老人而言这是入侵风险。\",\n \"推理步骤4: 老人的整体生活作息正常——05:33 起床、05:44 如厕、05:59 做早餐、07:01 出门并自动上锁、08:37 回家、11:07 做午餐、12:36 午休拉窗帘、14:07 起床、17:05 做晚餐、20:31 洗漱、20:38 就寝。活动节奏合理,无健康异常迹象。\",\n \"推理步骤5: 温度趋势正常,符合夏季昼夜变化规律:夜间约 22-23°C,午间峰值约 25.8°C,傍晚逐步回落。各房间温差合理,无异常热源。\",\n \"推理步骤6: 门锁、窗户传感器、烟雾报警器、漏水传感器均未触发报警,灶具每次使用时长合理(早餐约 39 分钟、午餐约 24 分钟、晚餐约 22 分钟),无忘关灶具的情况。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:00:02、06:39:00、11:08:00、11:32:00、17:06:00、17:28:00 共 6 次报告 MeasuredValue = None,均与灶具开关操作时间高度关联\",\n \"08:37 入户门解锁进入后,直到 20:38:11 才重新上锁,中间约 12 小时门处于未锁定状态\",\n \"老人日常作息(起床、三餐、午休、就寝)节奏规律,未发现健康异常信号\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:当前传感器在灶具使用期间频繁失效,无法可靠监测厨房温度,存在火灾预警盲区\",\n \"配置入户门自动上锁规则:建议设置门关闭后 N 分钟内未手动上锁则自动锁定,避免长时间处于未锁状态\",\n \"考虑为灶具添加超时自动关闭功能:虽然本次日志中灶具使用时长正常,但独居老人存在忘关灶具的风险,建议设置 30-45 分钟无操作自动断气/断电保护\",\n \"定期检查温度传感器与灶具的安装距离,确保传感器不会因灶具辐射热而频繁进入保护模式或故障状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时老人 08:37 回家后入户门未重新上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:00:02、06:39:00、11:08:00、11:32:00、17:06:00、17:28:00),共出现 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能受灶具热量干扰或自身存在硬件故障。", "推理步骤2: 该传感器故障对独居老人尤其危险——如果灶具忘关导致厨房温度异常升高,故障的温度传感器将无法提供有效数据来触发高温报警,削弱了火灾预警能力。", "推理步骤3: 08:37 老人回家时,门锁解锁(LockState=2)、门打开又关闭,但日志中没有后续的上锁事件(LockOperationType=0)。直到 20:38:11 睡前才自动上锁。这意味着入户门在白天约 12 小时处于未锁状态。对独居老人而言这是入侵风险。", "推理步骤4: 老人的整体生活作息正常——05:33 起床、05:44 如厕、05:59 做早餐、07:01 出门并自动上锁、08:37 回家、11:07 做午餐、12:36 午休拉窗帘、14:07 起床、17:05 做晚餐、20:31 洗漱、20:38 就寝。活动节奏合理,无健康异常迹象。", "推理步骤5: 温度趋势正常,符合夏季昼夜变化规律:夜间约 22-23°C,午间峰值约 25.8°C,傍晚逐步回落。各房间温差合理,无异常热源。", "推理步骤6: 门锁、窗户传感器、烟雾报警器、漏水传感器均未触发报警,灶具每次使用时长合理(早餐约 39 分钟、午餐约 24 分钟、晚餐约 22 分钟),无忘关灶具的情况。"], "key_evidence": ["厨房温度传感器在 06:00:02、06:39:00、11:08:00、11:32:00、17:06:00、17:28:00 共 6 次报告 MeasuredValue = None,均与灶具开关操作时间高度关联", "08:37 入户门解锁进入后,直到 20:38:11 才重新上锁,中间约 12 小时门处于未锁定状态", "老人日常作息(起床、三餐、午休、就寝)节奏规律,未发现健康异常信号"], "recommended_actions": ["检修或更换厨房温度传感器:当前传感器在灶具使用期间频繁失效,无法可靠监测厨房温度,存在火灾预警盲区", "配置入户门自动上锁规则:建议设置门关闭后 N 分钟内未手动上锁则自动锁定,避免长时间处于未锁状态", "考虑为灶具添加超时自动关闭功能:虽然本次日志中灶具使用时长正常,但独居老人存在忘关灶具的风险,建议设置 30-45 分钟无操作自动断气/断电保护", "定期检查温度传感器与灶具的安装距离,确保传感器不会因灶具辐射热而频繁进入保护模式或故障状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.843987226486206, "api_error": null} {"episode_id": "SQ4_TN_D_0988", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0988.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261617, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开关前后多次报告 None 值,存在设备故障或受灶具热干扰的问题;同时 08:37 入户门解锁后未关门/未重新上锁,老人外出期间门锁状态存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人作息规律正常——05:28 起床、05:46 如厕、05:52 进厨房做早餐、06:59 出门、08:37 回家、12:29 午休、13:54 起床、16:55 做晚餐、20:37 洗漱、20:49 就寝,符合独居老人的典型生活节奏。\",\n \"推理步骤2: 厨房温度传感器在三次灶具使用周期中(05:52-06:32、11:05-11:36、16:55-17:30),每次灶具开启后约30秒以及关闭后约1分钟都报告 MeasuredValue = None。一天内出现6次 None 读数,说明传感器在灶具工作产生的热量变化下无法正常采样,可能是传感器量程被超出、通信中断或硬件故障。\",\n \"推理步骤3: 08:37 老人回家时,入户门锁被手动解锁(LockOperationType=1),门被打开(StateValue=False),但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到 20:49 就寝时才出现门关闭和自动上锁记录。这意味着从 08:37 到 20:49 长达约12小时,入户门可能处于未关闭或未上锁状态。\",\n \"推理步骤4: 温度数据整体合理,各房间温度随日间升温、夜间降温自然波动(卧室 21.9°C~24.9°C,客厅 22.9°C~25.8°C,厨房 22.9°C~25.9°C),无火灾或异常高温迹象。烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤5: 无入侵迹象——所有运动传感器触发都与老人的活动轨迹吻合,门锁操作均为手动或自动,无异常远程解锁事件。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:53、06:33、11:06、11:37、16:56、17:31 共6次报告 MeasuredValue = None,均与灶具开关操作高度关联\",\n \"08:37 入户门手动解锁并打开(BooleanState.StateValue=False),但直到 20:49 才记录到门关闭(StateValue=True)和自动上锁(LockState=1),中间约12小时无门状态变化记录\",\n \"06:59 出门时门锁正常执行了开门-关门-自动上锁的完整流程,但 08:37 回家时缺少关门和上锁步骤,形成对比\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认其量程是否适合灶具附近的高温环境,检查传感器固件版本和通信链路,必要时更换为耐高温型号或调整安装位置\",\n \"排查入户门锁和门磁传感器:确认 08:37 回家后门是否确实未关闭,还是门磁传感器漏报了关门事件;检查门锁自动上锁策略是否正常工作\",\n \"建议为入户门增加「长时间未关门/未上锁」的告警规则,特别是对独居老人场景,超过5分钟未关门应推送提醒\",\n \"厨房温度传感器 None 值期间存在监控盲区,建议增加备用监测手段(如烟雾报警器灵敏度提升),确保灶具使用期间的安全覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开关前后多次报告 None 值,存在设备故障或受灶具热干扰的问题;同时 08:37 入户门解锁后未关门/未重新上锁,老人外出期间门锁状态存在安全隐患。", "reasoning": ["推理步骤1: 老人作息规律正常——05:28 起床、05:46 如厕、05:52 进厨房做早餐、06:59 出门、08:37 回家、12:29 午休、13:54 起床、16:55 做晚餐、20:37 洗漱、20:49 就寝,符合独居老人的典型生活节奏。", "推理步骤2: 厨房温度传感器在三次灶具使用周期中(05:52-06:32、11:05-11:36、16:55-17:30),每次灶具开启后约30秒以及关闭后约1分钟都报告 MeasuredValue = None。一天内出现6次 None 读数,说明传感器在灶具工作产生的热量变化下无法正常采样,可能是传感器量程被超出、通信中断或硬件故障。", "推理步骤3: 08:37 老人回家时,入户门锁被手动解锁(LockOperationType=1),门被打开(StateValue=False),但日志中没有记录门关闭(StateValue=True)和重新上锁的事件。直到 20:49 就寝时才出现门关闭和自动上锁记录。这意味着从 08:37 到 20:49 长达约12小时,入户门可能处于未关闭或未上锁状态。", "推理步骤4: 温度数据整体合理,各房间温度随日间升温、夜间降温自然波动(卧室 21.9°C~24.9°C,客厅 22.9°C~25.8°C,厨房 22.9°C~25.9°C),无火灾或异常高温迹象。烟雾报警器和漏水传感器全天无告警。", "推理步骤5: 无入侵迹象——所有运动传感器触发都与老人的活动轨迹吻合,门锁操作均为手动或自动,无异常远程解锁事件。"], "key_evidence": ["厨房温度传感器在 05:53、06:33、11:06、11:37、16:56、17:31 共6次报告 MeasuredValue = None,均与灶具开关操作高度关联", "08:37 入户门手动解锁并打开(BooleanState.StateValue=False),但直到 20:49 才记录到门关闭(StateValue=True)和自动上锁(LockState=1),中间约12小时无门状态变化记录", "06:59 出门时门锁正常执行了开门-关门-自动上锁的完整流程,但 08:37 回家时缺少关门和上锁步骤,形成对比"], "recommended_actions": ["检查厨房温度传感器:确认其量程是否适合灶具附近的高温环境,检查传感器固件版本和通信链路,必要时更换为耐高温型号或调整安装位置", "排查入户门锁和门磁传感器:确认 08:37 回家后门是否确实未关闭,还是门磁传感器漏报了关门事件;检查门锁自动上锁策略是否正常工作", "建议为入户门增加「长时间未关门/未上锁」的告警规则,特别是对独居老人场景,超过5分钟未关门应推送提醒", "厨房温度传感器 None 值期间存在监控盲区,建议增加备用监测手段(如烟雾报警器灵敏度提升),确保灶具使用期间的安全覆盖"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.197269678115845, "api_error": null} {"episode_id": "SQ4_TN_D_0999", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_0999.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261628, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时老人外出近2小时期间入户门未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间及关闭后多次报告 MeasuredValue = None(05:59、06:31、11:01、11:29、16:54、17:40),共出现6次。虽然灶具工作时高温可能导致传感器暂时超量程,但灶具关闭后(06:31、11:29、17:40)仍然报告 None,说明传感器恢复异常缓慢或存在硬件故障。\",\n \"推理步骤2: 老人于 06:51 手动开锁出门,门关闭后自动上锁,这是正常的。08:27 老人回家,手动开锁进门,但日志中没有后续的上锁记录——直到 20:44 才出现门锁自动上锁事件。这意味着从 08:27 到 20:44 长达约12小时入户门处于未锁状态。对于独居老人,这是一个安全隐患。\",\n \"推理步骤3: 老人的日常作息模式基本正常——05:21 起床、05:35 洗漱、05:58 做早餐、06:51 外出、08:27 回家、11:00 做午饭、12:21 午休(关窗帘)、13:57 起床、16:53 做晚饭、19:28 客厅活动(调暗灯光)、20:39 洗漱、20:44 就寝。活动节奏合理,未发现长时间无活动的健康异常。\",\n \"推理步骤4: 温度趋势正常,符合夏季昼夜温差规律:夜间约22-23°C,午间峰值约25.8°C,傍晚逐步回落。各房间温差合理,卧室因窗帘遮挡略低。无异常温升,烟雾报警器全天未触发,排除火灾风险。\",\n \"推理步骤5: 漏水传感器全天无报警,窗户传感器无异常开合,入侵相关传感器(玄关运动传感器)仅在老人出入时触发,排除入侵和水患风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:59、06:31、11:01、11:29、16:54、17:40 共6次报告 MeasuredValue = None,其中灶具关闭后仍出现 None 值,提示传感器可能存在故障\",\n \"08:27 老人回家开锁后,直到 20:44 就寝时才出现自动上锁记录,期间约12小时入户门可能处于未锁定状态\",\n \"老人全天活动轨迹完整,起居、做饭、午休、就寝节奏正常,未出现长时间无活动的异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因长期高温环境导致传感器老化或损坏,必要时更换传感器\",\n \"为入户门锁配置自动上锁策略(如进门后5分钟无操作自动上锁),避免长时间未锁门的安全隐患\",\n \"考虑为独居老人设置门锁未上锁提醒,超过设定时间未锁门时向家属或老人推送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时老人外出近2小时期间入户门未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间及关闭后多次报告 MeasuredValue = None(05:59、06:31、11:01、11:29、16:54、17:40),共出现6次。虽然灶具工作时高温可能导致传感器暂时超量程,但灶具关闭后(06:31、11:29、17:40)仍然报告 None,说明传感器恢复异常缓慢或存在硬件故障。", "推理步骤2: 老人于 06:51 手动开锁出门,门关闭后自动上锁,这是正常的。08:27 老人回家,手动开锁进门,但日志中没有后续的上锁记录——直到 20:44 才出现门锁自动上锁事件。这意味着从 08:27 到 20:44 长达约12小时入户门处于未锁状态。对于独居老人,这是一个安全隐患。", "推理步骤3: 老人的日常作息模式基本正常——05:21 起床、05:35 洗漱、05:58 做早餐、06:51 外出、08:27 回家、11:00 做午饭、12:21 午休(关窗帘)、13:57 起床、16:53 做晚饭、19:28 客厅活动(调暗灯光)、20:39 洗漱、20:44 就寝。活动节奏合理,未发现长时间无活动的健康异常。", "推理步骤4: 温度趋势正常,符合夏季昼夜温差规律:夜间约22-23°C,午间峰值约25.8°C,傍晚逐步回落。各房间温差合理,卧室因窗帘遮挡略低。无异常温升,烟雾报警器全天未触发,排除火灾风险。", "推理步骤5: 漏水传感器全天无报警,窗户传感器无异常开合,入侵相关传感器(玄关运动传感器)仅在老人出入时触发,排除入侵和水患风险。"], "key_evidence": ["厨房温度传感器在 05:59、06:31、11:01、11:29、16:54、17:40 共6次报告 MeasuredValue = None,其中灶具关闭后仍出现 None 值,提示传感器可能存在故障", "08:27 老人回家开锁后,直到 20:44 就寝时才出现自动上锁记录,期间约12小时入户门可能处于未锁定状态", "老人全天活动轨迹完整,起居、做饭、午休、就寝节奏正常,未出现长时间无活动的异常"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因长期高温环境导致传感器老化或损坏,必要时更换传感器", "为入户门锁配置自动上锁策略(如进门后5分钟无操作自动上锁),避免长时间未锁门的安全隐患", "考虑为独居老人设置门锁未上锁提醒,超过设定时间未锁门时向家属或老人推送通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.388975620269775, "api_error": null} {"episode_id": "SQ4_TN_D_1001", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_1001.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261630, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受热干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在三次烹饪期间(06:06、11:05、16:59)均出现 MeasuredValue = None 的情况,且在灶具关闭后仍持续报告 None(06:30 出现两条记录、11:28、17:35),说明传感器在高温环境下反复失效。\",\n \"推理步骤2: 对比客厅和卧室温度传感器全天持续正常上报数据,厨房传感器是唯一出现 null 值的设备,排除系统性通信故障,指向该传感器自身问题(可能是耐热性不足或硬件老化)。\",\n \"推理步骤3: 厨房温度传感器的核心职责之一是配合烟雾报警器监测烹饪安全。传感器在灶具工作时恰好失效,意味着在最需要温度监控的时段反而丧失了监测能力,这对独居老人尤其危险——若发生干烧或过热,系统无法通过温度异常提前预警。\",\n \"推理步骤4: 除传感器故障外,老人的整体生活模式正常——05:30 起床、06:05 做早餐、06:50 出门晨练、08:35 回家、12:31 午休、14:05 起床、16:58 做晚餐、20:49 就寝,作息规律,活动轨迹连贯,无入侵或健康异常迹象。\",\n \"推理步骤5: 入户门锁操作均为手动开锁+自动回锁,老人外出期间(06:50-08:35)家中无任何运动传感器触发,安防状态正常。\"\n ],\n \"key_evidence\": [\n \"06:06:08 kitchen_temp_sensor MeasuredValue = None(早餐灶具开启后30秒)\",\n \"06:30:00 kitchen_temp_sensor 连续出现两条记录:一条 None,一条正常值 2404(灶具已于06:29关闭,传感器恢复滞后)\",\n \"11:05:00 和 11:28:00 kitchen_temp_sensor MeasuredValue = None(午餐烹饪期间及关灶后)\",\n \"16:59:00 和 17:35:00 kitchen_temp_sensor MeasuredValue = None(晚餐烹饪期间及关灶后)\",\n \"客厅和卧室温度传感器全天48个采样点均正常上报,无任何 null 值\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其工作温度范围是否满足灶具附近的环境要求\",\n \"将厨房温度传感器安装位置适当远离灶具热源,避免直接受热导致测量失效\",\n \"在传感器修复前,建议为厨房灶具设置自动定时关闭规则(如连续开启超过30分钟自动断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,在温度传感器失效期间它是厨房安全的唯一防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 null 值,表明传感器存在故障或受热干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在三次烹饪期间(06:06、11:05、16:59)均出现 MeasuredValue = None 的情况,且在灶具关闭后仍持续报告 None(06:30 出现两条记录、11:28、17:35),说明传感器在高温环境下反复失效。", "推理步骤2: 对比客厅和卧室温度传感器全天持续正常上报数据,厨房传感器是唯一出现 null 值的设备,排除系统性通信故障,指向该传感器自身问题(可能是耐热性不足或硬件老化)。", "推理步骤3: 厨房温度传感器的核心职责之一是配合烟雾报警器监测烹饪安全。传感器在灶具工作时恰好失效,意味着在最需要温度监控的时段反而丧失了监测能力,这对独居老人尤其危险——若发生干烧或过热,系统无法通过温度异常提前预警。", "推理步骤4: 除传感器故障外,老人的整体生活模式正常——05:30 起床、06:05 做早餐、06:50 出门晨练、08:35 回家、12:31 午休、14:05 起床、16:58 做晚餐、20:49 就寝,作息规律,活动轨迹连贯,无入侵或健康异常迹象。", "推理步骤5: 入户门锁操作均为手动开锁+自动回锁,老人外出期间(06:50-08:35)家中无任何运动传感器触发,安防状态正常。"], "key_evidence": ["06:06:08 kitchen_temp_sensor MeasuredValue = None(早餐灶具开启后30秒)", "06:30:00 kitchen_temp_sensor 连续出现两条记录:一条 None,一条正常值 2404(灶具已于06:29关闭,传感器恢复滞后)", "11:05:00 和 11:28:00 kitchen_temp_sensor MeasuredValue = None(午餐烹饪期间及关灶后)", "16:59:00 和 17:35:00 kitchen_temp_sensor MeasuredValue = None(晚餐烹饪期间及关灶后)", "客厅和卧室温度传感器全天48个采样点均正常上报,无任何 null 值"], "recommended_actions": ["检查或更换厨房温度传感器,确认其工作温度范围是否满足灶具附近的环境要求", "将厨房温度传感器安装位置适当远离灶具热源,避免直接受热导致测量失效", "在传感器修复前,建议为厨房灶具设置自动定时关闭规则(如连续开启超过30分钟自动断电),作为补偿性安全措施", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,在温度传感器失效期间它是厨房安全的唯一防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.263890266418457, "api_error": null} {"episode_id": "SQ4_TN_D_1002", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_1002.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261631, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:07、06:29、10:53、11:25、17:06、17:31 共6次报告 MeasuredValue = None,而其他时间段正常报告数值。\",\n \"推理步骤2: None 值出现的时间与灶具开启/关闭时间高度相关(灶具开启后约30秒报告 None,关闭后约1分钟也报告 None),可能是灶具运行时产生的热量或电磁干扰导致传感器读数异常。\",\n \"推理步骤3: 老人的日常作息模式正常——05:30起床、06:06做早餐、06:59出门晨练、08:36回家、12:38午休、17:05做晚餐、20:41就寝,符合独居老人的典型生活规律。\",\n \"推理步骤4: 入户门在08:36开锁后未再上锁(直到20:41自动上锁),中间有约12小时门锁处于未锁定状态,但考虑到老人在家且无异常入侵迹象(无陌生运动触发),属于生活习惯问题而非安全威胁。\",\n \"推理步骤5: 温度变化趋势合理,夜间约22°C,白天升至25-26°C,符合夏季自然温度波动,无火灾或异常热源迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None\",\n \"传感器异常与 kitchen_cook_surface 开关时间强相关(开启后~30秒、关闭后~1分钟出现 None)\",\n \"08:36至20:41期间入户门锁处于未锁定状态约12小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或干扰影响读数\",\n \"考虑更换或重新校准厨房温度传感器,确保在灶具使用时仍能正常监测厨房温度(对独居老人的用火安全至关重要)\",\n \"建议设置入户门锁定提醒:当老人在家且门锁超过一定时间未锁定时发送提醒,提升居家安全性\",\n \"确认厨房烟雾报警器工作正常,在温度传感器不可靠期间作为用火安全的备用保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:07、06:29、10:53、11:25、17:06、17:31 共6次报告 MeasuredValue = None,而其他时间段正常报告数值。", "推理步骤2: None 值出现的时间与灶具开启/关闭时间高度相关(灶具开启后约30秒报告 None,关闭后约1分钟也报告 None),可能是灶具运行时产生的热量或电磁干扰导致传感器读数异常。", "推理步骤3: 老人的日常作息模式正常——05:30起床、06:06做早餐、06:59出门晨练、08:36回家、12:38午休、17:05做晚餐、20:41就寝,符合独居老人的典型生活规律。", "推理步骤4: 入户门在08:36开锁后未再上锁(直到20:41自动上锁),中间有约12小时门锁处于未锁定状态,但考虑到老人在家且无异常入侵迹象(无陌生运动触发),属于生活习惯问题而非安全威胁。", "推理步骤5: 温度变化趋势合理,夜间约22°C,白天升至25-26°C,符合夏季自然温度波动,无火灾或异常热源迹象。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间6次报告 MeasuredValue = None", "传感器异常与 kitchen_cook_surface 开关时间强相关(开启后~30秒、关闭后~1分钟出现 None)", "08:36至20:41期间入户门锁处于未锁定状态约12小时"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温或干扰影响读数", "考虑更换或重新校准厨房温度传感器,确保在灶具使用时仍能正常监测厨房温度(对独居老人的用火安全至关重要)", "建议设置入户门锁定提醒:当老人在家且门锁超过一定时间未锁定时发送提醒,提升居家安全性", "确认厨房烟雾报警器工作正常,在温度传感器不可靠期间作为用火安全的备用保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.60587763786316, "api_error": null} {"episode_id": "SQ4_TN_D_1004", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_1004.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261633, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后立即报告 MeasuredValue = None(06:04、06:27、10:58、11:22、17:05、17:21),共出现6次,且每次都与 cook_surface 开关时间高度吻合。\",\n \"推理步骤2: 其他房间的温度传感器全天持续正常报告数值,说明这不是系统性通信故障,而是厨房传感器的特定问题。\",\n \"推理步骤3: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器在灶具使用时恰好失效,意味着在最需要温度监测的时刻反而失去了监测能力,这是一个安全隐患。\",\n \"推理步骤4: 除传感器问题外,老人的整体生活模式正常——早起(05:30)、规律三餐(06:03/10:57/17:04)、午休(12:26-14:02)、晚间就寝(20:41),门锁使用正常,无入侵迹象。\",\n \"推理步骤5: 入户门在08:37开锁进入后未再上锁(直到20:41才自动上锁),老人外出期间(07:03-08:37)门锁操作正常,回家后门锁状态需关注但属于生活习惯范畴。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:04、06:27、10:58、11:22、17:05、17:21)\",\n \"其他房间温度传感器全天正常工作,排除系统性故障\",\n \"烟雾报警器未触发任何告警,说明当天未发生实际火灾事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或热保护断连\",\n \"考虑更换或重新校准厨房温度传感器,确保其在灶具使用时仍能正常工作\",\n \"在传感器修复前,可设置灶具使用超时提醒(如超过30分钟未关闭则告警),作为补偿性安全措施\",\n \"确认烟雾报警器 kitchen_smoke_alarm 电池及功能正常,作为厨房安全的最后防线\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾监测能力。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后立即报告 MeasuredValue = None(06:04、06:27、10:58、11:22、17:05、17:21),共出现6次,且每次都与 cook_surface 开关时间高度吻合。", "推理步骤2: 其他房间的温度传感器全天持续正常报告数值,说明这不是系统性通信故障,而是厨房传感器的特定问题。", "推理步骤3: 对于独居老人家庭,厨房是火灾高风险区域。温度传感器在灶具使用时恰好失效,意味着在最需要温度监测的时刻反而失去了监测能力,这是一个安全隐患。", "推理步骤4: 除传感器问题外,老人的整体生活模式正常——早起(05:30)、规律三餐(06:03/10:57/17:04)、午休(12:26-14:02)、晚间就寝(20:41),门锁使用正常,无入侵迹象。", "推理步骤5: 入户门在08:37开锁进入后未再上锁(直到20:41才自动上锁),老人外出期间(07:03-08:37)门锁操作正常,回家后门锁状态需关注但属于生活习惯范畴。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:04、06:27、10:58、11:22、17:05、17:21)", "其他房间温度传感器全天正常工作,排除系统性故障", "烟雾报警器未触发任何告警,说明当天未发生实际火灾事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温时超出量程或热保护断连", "考虑更换或重新校准厨房温度传感器,确保其在灶具使用时仍能正常工作", "在传感器修复前,可设置灶具使用超时提醒(如超过30分钟未关闭则告警),作为补偿性安全措施", "确认烟雾报警器 kitchen_smoke_alarm 电池及功能正常,作为厨房安全的最后防线"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.681286573410034, "api_error": null} {"episode_id": "SQ4_TN_D_1007", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TN_D_1007.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-23T00:00:00", "seed": 20261636, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,导致烹饪期间无法监测厨房温度,对独居老人构成安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人的日常作息正常——05:21起床、05:50洗漱、06:08做早餐、06:58出门、08:23回家、11:07做午餐、12:29午休、14:09起床、16:52做晚餐、20:21洗漱、20:41就寝,符合独居老人的典型生活规律。\",\n \"推理步骤2: 入户门的开锁/关锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。08:23 回家时门锁未重新上锁(LockState 未回到1),但日志显示 20:41 就寝前门锁自动上锁,说明白天在家期间门未锁但晚间已锁,属于可接受行为。\",\n \"推理步骤3: 厨房温度传感器在三次烹饪期间(06:09、11:08、16:53)均报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(06:26、11:26、17:38),直到下一个整点周期才恢复正常数值。这不是正常的高温读数,而是传感器返回空值,说明传感器在灶具工作时出现故障或通信中断。\",\n \"推理步骤4: 厨房温度传感器故障意味着在烹饪期间——恰恰是最需要温度监控的时段——系统无法检测异常高温或火灾前兆。对于独居老人,这是一个显著的安全盲区。\",\n \"推理步骤5: 烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无任何触发记录,漏水传感器也无报警,排除火灾和漏水的即时威胁。各房间温度变化符合夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),无异常温升。\",\n \"推理步骤6: 卧室窗帘操作合理(早起打开=0%,午休关闭=100%,起床后打开,就寝关闭),窗户传感器无异常开合记录。整体设备行为与住户活动一致,除厨房温度传感器外未发现其他异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间(06:09、11:08、16:53)均报告 MeasuredValue = None\",\n \"灶具关闭后传感器仍报告 None(06:26、11:26、17:38),直到下一个30分钟周期才恢复正常值\",\n \"该故障模式可重复出现,与灶具开启高度相关,表明是系统性问题而非偶发通信丢失\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"在传感器修复前,为烹饪时段设置额外的安全提醒机制(如灶具开启超过30分钟自动提醒)\",\n \"检查厨房烟雾报警器电池及功能状态,确保在温度传感器失效期间仍有可靠的火灾预警手段\",\n \"建议为08:23回家后的入户门增加自动上锁策略(如关门后5分钟自动上锁),避免白天长时间未锁门\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,导致烹饪期间无法监测厨房温度,对独居老人构成安全隐患。", "reasoning": ["推理步骤1: 老人的日常作息正常——05:21起床、05:50洗漱、06:08做早餐、06:58出门、08:23回家、11:07做午餐、12:29午休、14:09起床、16:52做晚餐、20:21洗漱、20:41就寝,符合独居老人的典型生活规律。", "推理步骤2: 入户门的开锁/关锁操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。08:23 回家时门锁未重新上锁(LockState 未回到1),但日志显示 20:41 就寝前门锁自动上锁,说明白天在家期间门未锁但晚间已锁,属于可接受行为。", "推理步骤3: 厨房温度传感器在三次烹饪期间(06:09、11:08、16:53)均报告 MeasuredValue = None,且在灶具关闭后仍持续报告 None(06:26、11:26、17:38),直到下一个整点周期才恢复正常数值。这不是正常的高温读数,而是传感器返回空值,说明传感器在灶具工作时出现故障或通信中断。", "推理步骤4: 厨房温度传感器故障意味着在烹饪期间——恰恰是最需要温度监控的时段——系统无法检测异常高温或火灾前兆。对于独居老人,这是一个显著的安全盲区。", "推理步骤5: 烟雾报警器(kitchen_smoke_alarm、living_room_smoke_alarm)全天无任何触发记录,漏水传感器也无报警,排除火灾和漏水的即时威胁。各房间温度变化符合夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),无异常温升。", "推理步骤6: 卧室窗帘操作合理(早起打开=0%,午休关闭=100%,起床后打开,就寝关闭),窗户传感器无异常开合记录。整体设备行为与住户活动一致,除厨房温度传感器外未发现其他异常。"], "key_evidence": ["厨房温度传感器在三次烹饪期间(06:09、11:08、16:53)均报告 MeasuredValue = None", "灶具关闭后传感器仍报告 None(06:26、11:26、17:38),直到下一个30分钟周期才恢复正常值", "该故障模式可重复出现,与灶具开启高度相关,表明是系统性问题而非偶发通信丢失"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "在传感器修复前,为烹饪时段设置额外的安全提醒机制(如灶具开启超过30分钟自动提醒)", "检查厨房烟雾报警器电池及功能状态,确保在温度传感器失效期间仍有可靠的火灾预警手段", "建议为08:23回家后的入户门增加自动上锁策略(如关门后5分钟自动上锁),避免白天长时间未锁门"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.303875207901, "api_error": null} {"episode_id": "SQ4_TP_A_0726", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0726.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261355, "scenario_id": "BA-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-08T09:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2482(24.82°C)跳升至 2867(28.67°C),升幅近 4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度仍为 2863(28.63°C),但此时灶具尚未开启(灶具 18:53 才开),因此该高温不能用烹饪解释。这一异常持续了至少 30 分钟。\",\n \"推理步骤3: 18:54 和 19:37 厨房温度传感器两次报告 MeasuredValue = None,表示传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回 None。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到 2426(24.26°C)并回归正常趋势,说明异常是暂时性的,但传感器的可靠性已受到质疑。\",\n \"推理步骤5: 凌晨 02:30-02:40 客厅和卫生间出现短暂活动(起夜),随后 02:35 客厅灯和 02:37 厨房灯被打开但日志中未见关闭记录直到早晨 06:54/07:37,属于起夜忘关灯的常见行为,不构成安全威胁。\",\n \"推理步骤6: 其余事件均符合正常生活模式:06:39 起床、07:37 出门上锁、18:27 回家开门开空调、18:53 做饭、19:36 关灶开窗通风、19:50 洗碗机运行、21:59 睡前关灯锁门、22:52 熄灯就寝。门锁操作均为手动开锁+自动回锁,无异常入侵迹象。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.8°C 骤升至 28.67°C,而灶具 18:53 才开启,客厅/卧室温度同期正常下降\",\n \"18:30 厨房温度仍高达 28.63°C,进一步排除瞬时噪声\",\n \"18:54 和 19:37 厨房温度传感器两次返回 None(数据丢失),正常传感器不应出现此情况\",\n \"19:00 之后厨房温度恢复正常(24.26°C),异常为暂时性\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否存在硬件故障、接触不良或受到外部热源(如阳光直射)干扰\",\n \"关注传感器返回 None 的问题,检查传感器固件版本并考虑更新或更换\",\n \"如果厨房温度传感器与烟雾报警或灶具安全联动,需优先修复以避免安全联动失效\",\n \"凌晨起夜后客厅灯和厨房灯未及时关闭,建议设置无人自动关灯的自动化规则以节能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障或短暂的环境异常。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2482(24.82°C)跳升至 2867(28.67°C),升幅近 4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度仍为 2863(28.63°C),但此时灶具尚未开启(灶具 18:53 才开),因此该高温不能用烹饪解释。这一异常持续了至少 30 分钟。", "推理步骤3: 18:54 和 19:37 厨房温度传感器两次报告 MeasuredValue = None,表示传感器读数丢失。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。正常传感器不应返回 None。", "推理步骤4: 19:00 之后厨房温度恢复到 2426(24.26°C)并回归正常趋势,说明异常是暂时性的,但传感器的可靠性已受到质疑。", "推理步骤5: 凌晨 02:30-02:40 客厅和卫生间出现短暂活动(起夜),随后 02:35 客厅灯和 02:37 厨房灯被打开但日志中未见关闭记录直到早晨 06:54/07:37,属于起夜忘关灯的常见行为,不构成安全威胁。", "推理步骤6: 其余事件均符合正常生活模式:06:39 起床、07:37 出门上锁、18:27 回家开门开空调、18:53 做饭、19:36 关灶开窗通风、19:50 洗碗机运行、21:59 睡前关灯锁门、22:52 熄灯就寝。门锁操作均为手动开锁+自动回锁,无异常入侵迹象。"], "key_evidence": ["18:00 厨房温度从 ~24.8°C 骤升至 28.67°C,而灶具 18:53 才开启,客厅/卧室温度同期正常下降", "18:30 厨房温度仍高达 28.63°C,进一步排除瞬时噪声", "18:54 和 19:37 厨房温度传感器两次返回 None(数据丢失),正常传感器不应出现此情况", "19:00 之后厨房温度恢复正常(24.26°C),异常为暂时性"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否存在硬件故障、接触不良或受到外部热源(如阳光直射)干扰", "关注传感器返回 None 的问题,检查传感器固件版本并考虑更新或更换", "如果厨房温度传感器与烟雾报警或灶具安全联动,需优先修复以避免安全联动失效", "凌晨起夜后客厅灯和厨房灯未及时关闭,建议设置无人自动关灯的自动化规则以节能"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.28975200653076, "api_error": null} {"episode_id": "SQ4_TP_A_0735", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0735.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261364, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-29T01:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"卧室温度传感器在凌晨出现异常飙升读数,厨房温度传感器多次报告 None 值且出现异常高温读数,同时厨房烟雾报警器曾短暂触发,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 卧室温度传感器在 00:00-01:30 期间稳定在 ~22°C(2191-2206),但在 01:45 突然跳升至 35.15°C(3515),01:50 为 32.00°C(3200),随后 02:00 又恢复正常 22.09°C。这种 10 分钟内升降 13°C 的剧烈波动在物理上不合理,判断为传感器故障或数据异常。\",\n \"推理步骤2: 01:45-01:50 卧室温度异常飙升期间,没有任何卧室设备活动(灯、窗帘、运动传感器均无变化),也没有其他房间温度同步上升,排除真实火灾或热源的可能性。\",\n \"推理步骤3: 01:55 厨房烟雾报警器触发(SmokeState=1),但厨房温度在该时段完全正常(~23°C),无人在厨房活动,灶具未开启。结合卧室温度异常的时间接近性,这可能是传感器串扰或环境干扰导致的误报。后续无持续报警,进一步支持误报判断。\",\n \"推理步骤4: 厨房温度传感器在 19:00 报告 2831(28.31°C),19:30 报告 2840(28.40°C),相比其他房间高出约 4-5°C,这与灶具在 19:15-19:35 开启使用一致,属于合理升温。但 19:16 和 19:36 两次报告 MeasuredValue=None,说明传感器在灶具使用前后出现了数据丢失,可能存在高温环境下的传感器通信故障。\",\n \"推理步骤5: 入户门在 18:29 开锁进门后,直到 21:50 才关门上锁(BooleanState=True),期间门处于未关闭状态超过 3 小时。虽然住户在家,但这是一个值得注意的安全习惯问题。\",\n \"推理步骤6: 住户整体生活模式正常——早晨 06:35 起床、07:24 出门上锁、18:29 回家、19:15 做饭、22:49 关灯就寝,属于典型的上班族作息,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"01:45 卧室温度从 ~22°C 突跳至 35.15°C,01:50 为 32°C,02:00 恢复 22°C——物理上不可能的温度变化速率\",\n \"01:55 厨房烟雾报警器触发(SmokeState=1),但厨房温度正常且无任何人员活动或灶具使用\",\n \"19:16 和 19:36 厨房温度传感器报告 MeasuredValue=None,出现数据丢失\",\n \"19:00 和 19:30 厨房温度异常偏高(28.3-28.4°C),虽与灶具使用相关但传感器同时出现 None 值表明工作不稳定\",\n \"入户门从 18:29 开门到 21:50 关门,超过 3 小时未关闭\"\n ],\n \"recommended_actions\": [\n \"检查卧室温度传感器硬件状态,清洁探头并确认固件版本,必要时更换传感器\",\n \"检查厨房温度传感器的安装位置是否离灶具过近,排查 None 值上报的原因(可能是高温导致通信中断),考虑重新定位或更换耐高温型号\",\n \"对厨房烟雾报警器进行功能测试和清洁,排除灰尘或虫子导致的误报,确认其与其他传感器之间无电磁干扰\",\n \"建议设置入户门未关闭超时提醒(如 10 分钟未关门则推送通知),提升居家安全性\",\n \"考虑为卧室温度传感器的异常读数设置合理阈值过滤规则,避免异常数据触发错误的自动化联动\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "卧室温度传感器在凌晨出现异常飙升读数,厨房温度传感器多次报告 None 值且出现异常高温读数,同时厨房烟雾报警器曾短暂触发,存在传感器故障风险。", "reasoning": ["推理步骤1: 卧室温度传感器在 00:00-01:30 期间稳定在 ~22°C(2191-2206),但在 01:45 突然跳升至 35.15°C(3515),01:50 为 32.00°C(3200),随后 02:00 又恢复正常 22.09°C。这种 10 分钟内升降 13°C 的剧烈波动在物理上不合理,判断为传感器故障或数据异常。", "推理步骤2: 01:45-01:50 卧室温度异常飙升期间,没有任何卧室设备活动(灯、窗帘、运动传感器均无变化),也没有其他房间温度同步上升,排除真实火灾或热源的可能性。", "推理步骤3: 01:55 厨房烟雾报警器触发(SmokeState=1),但厨房温度在该时段完全正常(~23°C),无人在厨房活动,灶具未开启。结合卧室温度异常的时间接近性,这可能是传感器串扰或环境干扰导致的误报。后续无持续报警,进一步支持误报判断。", "推理步骤4: 厨房温度传感器在 19:00 报告 2831(28.31°C),19:30 报告 2840(28.40°C),相比其他房间高出约 4-5°C,这与灶具在 19:15-19:35 开启使用一致,属于合理升温。但 19:16 和 19:36 两次报告 MeasuredValue=None,说明传感器在灶具使用前后出现了数据丢失,可能存在高温环境下的传感器通信故障。", "推理步骤5: 入户门在 18:29 开锁进门后,直到 21:50 才关门上锁(BooleanState=True),期间门处于未关闭状态超过 3 小时。虽然住户在家,但这是一个值得注意的安全习惯问题。", "推理步骤6: 住户整体生活模式正常——早晨 06:35 起床、07:24 出门上锁、18:29 回家、19:15 做饭、22:49 关灯就寝,属于典型的上班族作息,无入侵迹象。"], "key_evidence": ["01:45 卧室温度从 ~22°C 突跳至 35.15°C,01:50 为 32°C,02:00 恢复 22°C——物理上不可能的温度变化速率", "01:55 厨房烟雾报警器触发(SmokeState=1),但厨房温度正常且无任何人员活动或灶具使用", "19:16 和 19:36 厨房温度传感器报告 MeasuredValue=None,出现数据丢失", "19:00 和 19:30 厨房温度异常偏高(28.3-28.4°C),虽与灶具使用相关但传感器同时出现 None 值表明工作不稳定", "入户门从 18:29 开门到 21:50 关门,超过 3 小时未关闭"], "recommended_actions": ["检查卧室温度传感器硬件状态,清洁探头并确认固件版本,必要时更换传感器", "检查厨房温度传感器的安装位置是否离灶具过近,排查 None 值上报的原因(可能是高温导致通信中断),考虑重新定位或更换耐高温型号", "对厨房烟雾报警器进行功能测试和清洁,排除灰尘或虫子导致的误报,确认其与其他传感器之间无电磁干扰", "建议设置入户门未关闭超时提醒(如 10 分钟未关门则推送通知),提升居家安全性", "考虑为卧室温度传感器的异常读数设置合理阈值过滤规则,避免异常数据触发错误的自动化联动"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.969184398651123, "api_error": null} {"episode_id": "SQ4_TP_A_0739", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0739.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261368, "scenario_id": "INS-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-24T04:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),可能存在传感器故障或厨房局部过热风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 24.5°C 跳升至 28.4°C(2840),而此时灶具尚未开启(19:13 才开启),这一跳变幅度异常且缺乏合理触发源。\",\n \"推理步骤2: 19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None,表示传感器读数丢失或通信异常,正常传感器不应出现此情况。\",\n \"推理步骤3: 19:30 厨房温度仍高达 28.29°C,灶具在 19:49 关闭后温度逐步回落至 24.19°C(20:00),说明高温确实存在但传感器在关键时段无法正常报告数据。\",\n \"推理步骤4: 04:17 卧室窗户传感器报告 StateValue=False(窗户打开),随后卧室有人活动并去卫生间,结合凌晨时段和住户在家的上下文,判断为住户起夜开窗通风,属正常行为。\",\n \"推理步骤5: 住户整体作息模式正常——早晨 6:45 起床、7:33 出门上锁、18:28 回家、21:47 就寝锁门,入侵风险排除。\",\n \"推理步骤6: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和漏水威胁,但传感器故障可能导致未来无法及时预警。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从约 24.5°C 异常跳升至 28.4°C,灶具尚未开启\",\n \"19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None(数据丢失)\",\n \"19:30 厨房温度仍为 28.29°C,与客厅/卧室温度差距超过 4°C\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态和通信连接,确认是否存在故障或电量不足\",\n \"排查 19:00 厨房异常升温原因(是否有其他热源如烤箱、阳光直射等)\",\n \"考虑为厨房温度传感器设置异常值告警阈值,当读数为 None 或超出合理范围时立即通知用户\",\n \"确认厨房窗户(19:49 打开)是否已关闭,避免夜间安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),可能存在传感器故障或厨房局部过热风险。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 24.5°C 跳升至 28.4°C(2840),而此时灶具尚未开启(19:13 才开启),这一跳变幅度异常且缺乏合理触发源。", "推理步骤2: 19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None,表示传感器读数丢失或通信异常,正常传感器不应出现此情况。", "推理步骤3: 19:30 厨房温度仍高达 28.29°C,灶具在 19:49 关闭后温度逐步回落至 24.19°C(20:00),说明高温确实存在但传感器在关键时段无法正常报告数据。", "推理步骤4: 04:17 卧室窗户传感器报告 StateValue=False(窗户打开),随后卧室有人活动并去卫生间,结合凌晨时段和住户在家的上下文,判断为住户起夜开窗通风,属正常行为。", "推理步骤5: 住户整体作息模式正常——早晨 6:45 起床、7:33 出门上锁、18:28 回家、21:47 就寝锁门,入侵风险排除。", "推理步骤6: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和漏水威胁,但传感器故障可能导致未来无法及时预警。"], "key_evidence": ["19:00 厨房温度从约 24.5°C 异常跳升至 28.4°C,灶具尚未开启", "19:14 和 19:50 厨房温度传感器报告 MeasuredValue = None(数据丢失)", "19:30 厨房温度仍为 28.29°C,与客厅/卧室温度差距超过 4°C"], "recommended_actions": ["检查厨房温度传感器硬件状态和通信连接,确认是否存在故障或电量不足", "排查 19:00 厨房异常升温原因(是否有其他热源如烤箱、阳光直射等)", "考虑为厨房温度传感器设置异常值告警阈值,当读数为 None 或超出合理范围时立即通知用户", "确认厨房窗户(19:49 打开)是否已关闭,避免夜间安全隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.30484414100647, "api_error": null} {"episode_id": "SQ4_TP_A_0740", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0740.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261369, "scenario_id": "FG-04", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-21T10:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在10:53开启灶具后温度飙升至30°C以上且持续近1小时未关闭,烟雾报警器电池低电量,同时厨房温度传感器多次报告None值存在故障隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房灶具于10:53开启,随后11:00厨房温度从约25.2°C骤升至29.48°C,11:03进一步升至30.34°C,温度在30分钟内上升约4.3°C,远超正常烹饪引起的环境温升幅度。\",\n \"推理步骤2: 11:03烟雾报警器报告SmokeState=0(正常),但该报警器在前一天(6月20日10:53)已报告BatteryAlert=1(低电量警告),其检测可靠性存疑。若电池进一步耗尽,可能无法在真正发生烟雾时及时报警。\",\n \"推理步骤3: 11:30厨房温度仍高达29.54°C,说明灶具从10:53开启后至少持续运行了37分钟以上才在某个时间点关闭(日志中该次使用未见明确的关闭记录直到11:59重新开启前),期间无人操作记录,存在无人看管灶具的风险。\",\n \"推理步骤4: 厨房温度传感器在当天多次报告MeasuredValue=None(09:11、09:39、12:00、12:26、18:07、18:40),表明传感器存在间歇性故障或通信中断,这削弱了对厨房温度的持续监控能力,在灶具使用期间尤其危险。\",\n \"推理步骤5: 对比其他房间,11:00客厅温度25.43°C、卧室24.57°C,而厨房29.48°C,厨房比其他房间高出约4-5°C,排除了全屋升温的可能,确认是厨房局部异常高温。\",\n \"推理步骤6: 其余行为模式正常——住户约08:37起床、日间活动、23:02就寝并锁门,三餐烹饪时间合理,做完饭开窗通风(kitchen_window_contact StateValue=False)是正常习惯。入侵、漏水等其他威胁类型无异常信号。\"\n ],\n \"key_evidence\": [\n \"2026-06-20T10:53 厨房烟雾报警器 BatteryAlert=1,电池电量低\",\n \"2026-06-21T10:53 厨房灶具开启后,11:00厨房温度飙升至2948(29.48°C),11:03达到3034(30.34°C),11:30仍为2954(29.54°C)\",\n \"厨房温度传感器当天6次报告MeasuredValue=None,存在间歇性故障\",\n \"10:53灶具开启至11:59之间无明确关闭记录,存在长时间无人看管灶具的可能\",\n \"11:03 SmokeState=0表示未检测到烟雾,但在电池低电量状态下可靠性降低\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常工作\",\n \"检查并维修厨房温度传感器,解决间歇性报告None值的故障问题\",\n \"设置灶具使用超时自动提醒或自动关闭规则(如超过30分钟未操作则告警)\",\n \"增加联动规则:当厨房温度超过28°C且灶具处于开启状态时,自动推送告警通知\",\n \"考虑为厨房烟雾报警器增加电池状态定期巡检自动化,低电量时立即通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在10:53开启灶具后温度飙升至30°C以上且持续近1小时未关闭,烟雾报警器电池低电量,同时厨房温度传感器多次报告None值存在故障隐患。", "reasoning": ["推理步骤1: 厨房灶具于10:53开启,随后11:00厨房温度从约25.2°C骤升至29.48°C,11:03进一步升至30.34°C,温度在30分钟内上升约4.3°C,远超正常烹饪引起的环境温升幅度。", "推理步骤2: 11:03烟雾报警器报告SmokeState=0(正常),但该报警器在前一天(6月20日10:53)已报告BatteryAlert=1(低电量警告),其检测可靠性存疑。若电池进一步耗尽,可能无法在真正发生烟雾时及时报警。", "推理步骤3: 11:30厨房温度仍高达29.54°C,说明灶具从10:53开启后至少持续运行了37分钟以上才在某个时间点关闭(日志中该次使用未见明确的关闭记录直到11:59重新开启前),期间无人操作记录,存在无人看管灶具的风险。", "推理步骤4: 厨房温度传感器在当天多次报告MeasuredValue=None(09:11、09:39、12:00、12:26、18:07、18:40),表明传感器存在间歇性故障或通信中断,这削弱了对厨房温度的持续监控能力,在灶具使用期间尤其危险。", "推理步骤5: 对比其他房间,11:00客厅温度25.43°C、卧室24.57°C,而厨房29.48°C,厨房比其他房间高出约4-5°C,排除了全屋升温的可能,确认是厨房局部异常高温。", "推理步骤6: 其余行为模式正常——住户约08:37起床、日间活动、23:02就寝并锁门,三餐烹饪时间合理,做完饭开窗通风(kitchen_window_contact StateValue=False)是正常习惯。入侵、漏水等其他威胁类型无异常信号。"], "key_evidence": ["2026-06-20T10:53 厨房烟雾报警器 BatteryAlert=1,电池电量低", "2026-06-21T10:53 厨房灶具开启后,11:00厨房温度飙升至2948(29.48°C),11:03达到3034(30.34°C),11:30仍为2954(29.54°C)", "厨房温度传感器当天6次报告MeasuredValue=None,存在间歇性故障", "10:53灶具开启至11:59之间无明确关闭记录,存在长时间无人看管灶具的可能", "11:03 SmokeState=0表示未检测到烟雾,但在电池低电量状态下可靠性降低"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保其在紧急情况下能正常工作", "检查并维修厨房温度传感器,解决间歇性报告None值的故障问题", "设置灶具使用超时自动提醒或自动关闭规则(如超过30分钟未操作则告警)", "增加联动规则:当厨房温度超过28°C且灶具处于开启状态时,自动推送告警通知", "考虑为厨房烟雾报警器增加电池状态定期巡检自动化,低电量时立即通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.51425337791443, "api_error": null} {"episode_id": "SQ4_TP_A_0743", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0743.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261372, "scenario_id": "WD-01", "total_events": 186, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-13T05:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨5:05触发报警,且截至日志结束未见复位,存在持续漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 05:05卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。\",\n \"推理步骤2: 在此后的整个日志周期(直到23:30)中,没有出现 StateValue=False 的复位记录,说明漏水状态可能持续了约18小时未被处理。\",\n \"推理步骤3: 漏水发生在凌晨5:05,住户当时处于睡眠状态(无任何运动传感器触发、灯光全灭),直到08:32才有卫生间活动记录,住户可能未及时察觉漏水。\",\n \"推理步骤4: 厨房温度传感器在12:00出现异常跳变(从约25.4°C骤升至29.79°C),但结合12:12灶具开启的时间线,这更可能是传感器受灶具预热辐射影响或短暂读数偏差,12:30读数仍为29.73°C,之后灶具关闭温度回落至正常,不构成独立火灾风险。\",\n \"推理步骤5: 厨房温度传感器多次报告 MeasuredValue=None(09:10、09:50、12:13、12:56、18:10、18:40),均与灶具开关操作时间高度吻合,推测是灶具运行时传感器进入保护/屏蔽模式,属于设备设计行为而非故障。\",\n \"推理步骤6: 其余设备行为均符合正常生活模式——早晨起床、做饭、开空调、晚间就寝锁门,入户门锁自动上锁、窗帘开合等均无异常。\",\n \"推理步骤7: 12:00厨房温度异常值(2979,即29.79°C)虽然偏高,但未触发烟雾报警器,且后续温度正常回落,排除火灾风险,但建议关注该传感器的准确性。\"\n ],\n \"key_evidence\": [\n \"[05:05] bathroom_water_leak StateValue=True 且触发 StateChange 事件\",\n \"整个日志周期内未出现 bathroom_water_leak StateValue=False 的复位记录\",\n \"漏水发生时住户处于睡眠状态,08:32才首次出现卫生间活动\",\n \"[12:00] 厨房温度传感器出现异常高值2979(29.79°C),较前一读数跳升约4°C,需关注但未构成火灾告警\",\n \"厨房温度传感器在灶具使用期间多次报告 None 值\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶底座、淋浴区等),必要时关闭卫生间水阀\",\n \"确认 bathroom_water_leak 传感器当前状态,若漏水已停止但传感器未复位,手动复位或检查传感器是否正常工作\",\n \"检查厨房温度传感器的安装位置,确保其远离灶具热源,避免读数受烹饪影响产生误导性数据\",\n \"建议为漏水传感器配置即时推送告警(而非仅记录日志),确保夜间漏水能及时唤醒住户\",\n \"长期建议:考虑安装智能水阀,在漏水传感器触发时自动关闭供水,防止水损扩大\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨5:05触发报警,且截至日志结束未见复位,存在持续漏水风险。", "reasoning": ["推理步骤1: 05:05卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。", "推理步骤2: 在此后的整个日志周期(直到23:30)中,没有出现 StateValue=False 的复位记录,说明漏水状态可能持续了约18小时未被处理。", "推理步骤3: 漏水发生在凌晨5:05,住户当时处于睡眠状态(无任何运动传感器触发、灯光全灭),直到08:32才有卫生间活动记录,住户可能未及时察觉漏水。", "推理步骤4: 厨房温度传感器在12:00出现异常跳变(从约25.4°C骤升至29.79°C),但结合12:12灶具开启的时间线,这更可能是传感器受灶具预热辐射影响或短暂读数偏差,12:30读数仍为29.73°C,之后灶具关闭温度回落至正常,不构成独立火灾风险。", "推理步骤5: 厨房温度传感器多次报告 MeasuredValue=None(09:10、09:50、12:13、12:56、18:10、18:40),均与灶具开关操作时间高度吻合,推测是灶具运行时传感器进入保护/屏蔽模式,属于设备设计行为而非故障。", "推理步骤6: 其余设备行为均符合正常生活模式——早晨起床、做饭、开空调、晚间就寝锁门,入户门锁自动上锁、窗帘开合等均无异常。", "推理步骤7: 12:00厨房温度异常值(2979,即29.79°C)虽然偏高,但未触发烟雾报警器,且后续温度正常回落,排除火灾风险,但建议关注该传感器的准确性。"], "key_evidence": ["[05:05] bathroom_water_leak StateValue=True 且触发 StateChange 事件", "整个日志周期内未出现 bathroom_water_leak StateValue=False 的复位记录", "漏水发生时住户处于睡眠状态,08:32才首次出现卫生间活动", "[12:00] 厨房温度传感器出现异常高值2979(29.79°C),较前一读数跳升约4°C,需关注但未构成火灾告警", "厨房温度传感器在灶具使用期间多次报告 None 值"], "recommended_actions": ["立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶底座、淋浴区等),必要时关闭卫生间水阀", "确认 bathroom_water_leak 传感器当前状态,若漏水已停止但传感器未复位,手动复位或检查传感器是否正常工作", "检查厨房温度传感器的安装位置,确保其远离灶具热源,避免读数受烹饪影响产生误导性数据", "建议为漏水传感器配置即时推送告警(而非仅记录日志),确保夜间漏水能及时唤醒住户", "长期建议:考虑安装智能水阀,在漏水传感器触发时自动关闭供水,防止水损扩大"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.419279098510742, "api_error": null} {"episode_id": "SQ4_TP_A_0745", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0745.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261374, "scenario_id": "INS-02", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-06T10:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在10:23遭受连续4次错误密码尝试并触发防篡改报警,疑似有人试图暴力破解门锁。\",\n \"reasoning\": [\n \"推理步骤1: 10:23:00至10:23:40期间,front_door_lock连续报告4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3表示远程/键盘输入源,OperationError=1表示凭证错误(无效PIN码)。4次错误在不到1分钟内密集发生,符合暴力破解密码的行为模式。\",\n \"推理步骤2: 10:23:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数超限告警,进一步确认这是一次密码暴力尝试攻击。\",\n \"推理步骤3: 此时住户在家(09:52客厅有人体感应且空调、灯已开启),但入户门传感器(front_door_contact)未报告开门事件,说明攻击者未能成功进入,门锁防护生效。\",\n \"推理步骤4: 厨房温度传感器存在次要异常——12:00时突然跳升至29.81°C(前一读数25.82°C,跳升约4°C),但12:01灶具开启,12:30读数为29.72°C,12:50关灶后13:00回落至25.51°C。考虑到灶具使用和厨房通风(窗户多次打开),这属于烹饪导致的正常波动。\",\n \"推理步骤5: 厨房温度传感器多次报告MeasuredValue=None(09:19、09:39、12:02、12:51、17:58、18:50),均发生在灶具开启或关闭前后,可能是传感器在高温环境下暂时超量程或被蒸汽干扰,属于设备级小问题,不构成安全威胁但值得关注。\",\n \"推理步骤6: 其余设备行为均正常——住户约08:34起床,日间正常活动(做饭、开空调),22:47就寝前关灯、关空调、关窗帘、自动锁门,符合一室一厅单人居住的典型作息。\"\n ],\n \"key_evidence\": [\n \"10:23:00-10:23:40 入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒\",\n \"10:23:50 门锁触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警\",\n \"攻击期间front_door_contact未报告开门(StateValue未变化),说明入侵未成功\",\n \"次要发现:厨房温度传感器多次报告None值,可能存在传感器可靠性问题\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门外走廊监控录像,确认10:23前后是否有可疑人员在门前操作\",\n \"更换门锁PIN码,考虑启用更长位数的密码或启用双因素认证(PIN+手机确认)\",\n \"配置门锁错误尝试告警推送,确保此类事件能实时通知住户\",\n \"考虑在玄关增设摄像头或门铃摄像头,以便下次类似事件时有视觉证据\",\n \"检查厨房温度传感器的安装位置,确认其是否离灶具过近导致频繁读数异常(None值),必要时重新定位或更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在10:23遭受连续4次错误密码尝试并触发防篡改报警,疑似有人试图暴力破解门锁。", "reasoning": ["推理步骤1: 10:23:00至10:23:40期间,front_door_lock连续报告4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3表示远程/键盘输入源,OperationError=1表示凭证错误(无效PIN码)。4次错误在不到1分钟内密集发生,符合暴力破解密码的行为模式。", "推理步骤2: 10:23:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数超限告警,进一步确认这是一次密码暴力尝试攻击。", "推理步骤3: 此时住户在家(09:52客厅有人体感应且空调、灯已开启),但入户门传感器(front_door_contact)未报告开门事件,说明攻击者未能成功进入,门锁防护生效。", "推理步骤4: 厨房温度传感器存在次要异常——12:00时突然跳升至29.81°C(前一读数25.82°C,跳升约4°C),但12:01灶具开启,12:30读数为29.72°C,12:50关灶后13:00回落至25.51°C。考虑到灶具使用和厨房通风(窗户多次打开),这属于烹饪导致的正常波动。", "推理步骤5: 厨房温度传感器多次报告MeasuredValue=None(09:19、09:39、12:02、12:51、17:58、18:50),均发生在灶具开启或关闭前后,可能是传感器在高温环境下暂时超量程或被蒸汽干扰,属于设备级小问题,不构成安全威胁但值得关注。", "推理步骤6: 其余设备行为均正常——住户约08:34起床,日间正常活动(做饭、开空调),22:47就寝前关灯、关空调、关窗帘、自动锁门,符合一室一厅单人居住的典型作息。"], "key_evidence": ["10:23:00-10:23:40 入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒", "10:23:50 门锁触发DoorLockAlarm(AlarmCode=3)——错误密码次数超限报警", "攻击期间front_door_contact未报告开门(StateValue未变化),说明入侵未成功", "次要发现:厨房温度传感器多次报告None值,可能存在传感器可靠性问题"], "recommended_actions": ["立即检查入户门外走廊监控录像,确认10:23前后是否有可疑人员在门前操作", "更换门锁PIN码,考虑启用更长位数的密码或启用双因素认证(PIN+手机确认)", "配置门锁错误尝试告警推送,确保此类事件能实时通知住户", "考虑在玄关增设摄像头或门铃摄像头,以便下次类似事件时有视觉证据", "检查厨房温度传感器的安装位置,确认其是否离灶具过近导致频繁读数异常(None值),必要时重新定位或更换传感器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.053896188735962, "api_error": null} {"episode_id": "SQ4_TP_A_0746", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0746.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261375, "scenario_id": "DF-03", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T15:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及数据丢失(None),同时客厅运动传感器在无人期间出现快速反复触发,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约2496(24.96°C)跳升至2827(28.27°C),升幅超过3°C,远超正常半小时波动范围。虽然19:01灶具开启可部分解释升温,但灶具尚未开启时(19:00整点)温度已经飙升,时间顺序不匹配。\",\n \"推理步骤2: 厨房温度传感器在19:02和19:30各出现一次MeasuredValue=None(空值),表明传感器在该时段数据采集失败或通信中断。19:30同一时刻又恢复报告2825,说明传感器工作状态不稳定,可能存在硬件故障或连接问题。\",\n \"推理步骤3: 客厅运动传感器在15:50~15:51期间出现快速反复触发(30秒内占空/有人切换3次),但此时住户已于07:20出门且尚未回家(18:02才开门回来)。家中无人时段出现运动检测,需排查是否为传感器误报、宠物活动或其他原因。\",\n \"推理步骤4: 其余设备行为均符合正常生活模式——早晨06:42起床、07:20出门上锁、18:02回家开灯开空调、19:01做饭、22:06转入卧室就寝、22:46关灯睡觉,门锁开关与接触传感器联动正常,烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤5: 入户门在住户外出期间(07:20~18:02)始终保持锁定(LockState=1)且门接触传感器为关闭(StateValue=True),无入侵迹象。卧室窗户传感器全天无开启事件。综合来看不存在入侵威胁,但设备异常需要关注。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.96°C骤升至28.27°C,灶具在19:01才开启,时间顺序不符\",\n \"19:02和19:30厨房温度传感器报告MeasuredValue=None,数据采集中断\",\n \"15:50~15:51客厅运动传感器在无人在家时段快速反复触发3次(Occupancy在0和1之间快速切换)\",\n \"19:30厨房温度仍报2825(28.25°C),而20:00恢复至2413(24.13°C),波动幅度异常大\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和通信连接,确认是否存在故障或安装位置不当(如过于靠近灶具热源)\",\n \"查看厨房温度传感器的历史数据,确认None值是否为偶发还是频繁出现,必要时更换传感器\",\n \"排查客厅运动传感器误报原因:确认是否有宠物、窗帘飘动、阳光直射等干扰源,考虑调整灵敏度或安装位置\",\n \"如家中无宠物,建议结合15:50客厅运动事件与入户门日志进一步排查,确认无未授权进入的可能\",\n \"建议开启厨房烟雾报警器的定期自检功能,确保在温度传感器失效时仍有安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及数据丢失(None),同时客厅运动传感器在无人期间出现快速反复触发,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约2496(24.96°C)跳升至2827(28.27°C),升幅超过3°C,远超正常半小时波动范围。虽然19:01灶具开启可部分解释升温,但灶具尚未开启时(19:00整点)温度已经飙升,时间顺序不匹配。", "推理步骤2: 厨房温度传感器在19:02和19:30各出现一次MeasuredValue=None(空值),表明传感器在该时段数据采集失败或通信中断。19:30同一时刻又恢复报告2825,说明传感器工作状态不稳定,可能存在硬件故障或连接问题。", "推理步骤3: 客厅运动传感器在15:50~15:51期间出现快速反复触发(30秒内占空/有人切换3次),但此时住户已于07:20出门且尚未回家(18:02才开门回来)。家中无人时段出现运动检测,需排查是否为传感器误报、宠物活动或其他原因。", "推理步骤4: 其余设备行为均符合正常生活模式——早晨06:42起床、07:20出门上锁、18:02回家开灯开空调、19:01做饭、22:06转入卧室就寝、22:46关灯睡觉,门锁开关与接触传感器联动正常,烟雾报警器和漏水传感器全天无告警。", "推理步骤5: 入户门在住户外出期间(07:20~18:02)始终保持锁定(LockState=1)且门接触传感器为关闭(StateValue=True),无入侵迹象。卧室窗户传感器全天无开启事件。综合来看不存在入侵威胁,但设备异常需要关注。"], "key_evidence": ["19:00厨房温度从约24.96°C骤升至28.27°C,灶具在19:01才开启,时间顺序不符", "19:02和19:30厨房温度传感器报告MeasuredValue=None,数据采集中断", "15:50~15:51客厅运动传感器在无人在家时段快速反复触发3次(Occupancy在0和1之间快速切换)", "19:30厨房温度仍报2825(28.25°C),而20:00恢复至2413(24.13°C),波动幅度异常大"], "recommended_actions": ["检查厨房温度传感器的硬件状态和通信连接,确认是否存在故障或安装位置不当(如过于靠近灶具热源)", "查看厨房温度传感器的历史数据,确认None值是否为偶发还是频繁出现,必要时更换传感器", "排查客厅运动传感器误报原因:确认是否有宠物、窗帘飘动、阳光直射等干扰源,考虑调整灵敏度或安装位置", "如家中无宠物,建议结合15:50客厅运动事件与入户门日志进一步排查,确认无未授权进入的可能", "建议开启厨房烟雾报警器的定期自检功能,确保在温度传感器失效时仍有安全兜底"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.58722949028015, "api_error": null} {"episode_id": "SQ4_TP_A_0758", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0758.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261387, "scenario_id": "DF-06", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-27T00:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在双重异常:多次报告 None(疑似故障),且在 12:00 出现不合理的温度跳变(29.75°C),指向传感器故障或数据异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(09:25、09:36、12:14、12:32、18:07、18:42),共计 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能在灶具工作时因高温或干扰进入故障状态。\",\n \"推理步骤2: 12:00 厨房温度传感器报告 2975(29.75°C),而同一时刻客厅为 25.86°C、卧室为 24.70°C。厨房在 11:30 还是 25.47°C,30 分钟内跳升约 4.3°C 且灶具并未开启(灶具在 12:13 才开启),这一跳变缺乏合理热源解释,更像是传感器读数漂移或数据异常。12:30 仍维持 2976 进一步印证异常。\",\n \"推理步骤3: 卧室窗帘在 00:24 执行 DownOrClose 命令后,OperationalStatus 持续为 0b000010(正在关闭),且 CurrentPositionLiftPercent100ths 停留在 5000(50%),直到 08:34 才变为 0(全开)。窗帘在半小时内未完成关闭动作,可能存在机械卡阻,但影响较小。\",\n \"推理步骤4: 其余行为模式正常——住户约 08:34 起床、09:24 做早餐、12:13 做午餐、18:06 做晚餐、22:57 就寝,符合一室一厅单人居住的日常作息。入户门在就寝时自动上锁(LockState=1),门传感器显示关闭(StateValue=True),安防状态良好。\",\n \"推理步骤5: 每次做完饭后厨房窗户都会打开(StateValue=False)进行通风,烟雾报警器全天无触发,说明没有火灾风险。漏水传感器无报告,客厅空调在 10:11 开启制冷(SystemMode=3)、22:57 关闭,均属正常操作。\",\n \"推理步骤6: 厨房温度传感器的反复 None 值意味着在灶具使用期间该传感器完全失去监测能力,如果发生真正的厨房火灾或异常高温,系统将无法及时检测和报警,这是一个实质性的安全监控盲区。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间 6 次报告 MeasuredValue = None(09:25、09:36、12:14、12:32、18:07、18:42)\",\n \"12:00 厨房温度异常跳变至 2975(29.75°C),较 30 分钟前上升约 4.3°C,且当时灶具未开启,12:30 仍维持 2976\",\n \"卧室窗帘 00:24 执行关闭命令后 OperationalStatus 持续为运动中状态,位置停留在 50% 未完成动作\"\n ],\n \"recommended_actions\": [\n \"优先检查厨房温度传感器:确认其安装位置是否距灶具过近导致高温干扰,清洁传感器探头,必要时更换或重新定位\",\n \"在传感器修复前,可考虑将烟雾报警器的灵敏度适当提高,作为厨房温度监测失效期间的补偿手段\",\n \"检查卧室窗帘电机及导轨是否存在卡阻或阻力过大的问题,确保窗帘能正常完成开关动作\",\n \"建议为厨房温度传感器设置离线/无数据告警规则,当传感器连续报告 None 超过一定时间时主动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在双重异常:多次报告 None(疑似故障),且在 12:00 出现不合理的温度跳变(29.75°C),指向传感器故障或数据异常。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(09:25、09:36、12:14、12:32、18:07、18:42),共计 6 次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能在灶具工作时因高温或干扰进入故障状态。", "推理步骤2: 12:00 厨房温度传感器报告 2975(29.75°C),而同一时刻客厅为 25.86°C、卧室为 24.70°C。厨房在 11:30 还是 25.47°C,30 分钟内跳升约 4.3°C 且灶具并未开启(灶具在 12:13 才开启),这一跳变缺乏合理热源解释,更像是传感器读数漂移或数据异常。12:30 仍维持 2976 进一步印证异常。", "推理步骤3: 卧室窗帘在 00:24 执行 DownOrClose 命令后,OperationalStatus 持续为 0b000010(正在关闭),且 CurrentPositionLiftPercent100ths 停留在 5000(50%),直到 08:34 才变为 0(全开)。窗帘在半小时内未完成关闭动作,可能存在机械卡阻,但影响较小。", "推理步骤4: 其余行为模式正常——住户约 08:34 起床、09:24 做早餐、12:13 做午餐、18:06 做晚餐、22:57 就寝,符合一室一厅单人居住的日常作息。入户门在就寝时自动上锁(LockState=1),门传感器显示关闭(StateValue=True),安防状态良好。", "推理步骤5: 每次做完饭后厨房窗户都会打开(StateValue=False)进行通风,烟雾报警器全天无触发,说明没有火灾风险。漏水传感器无报告,客厅空调在 10:11 开启制冷(SystemMode=3)、22:57 关闭,均属正常操作。", "推理步骤6: 厨房温度传感器的反复 None 值意味着在灶具使用期间该传感器完全失去监测能力,如果发生真正的厨房火灾或异常高温,系统将无法及时检测和报警,这是一个实质性的安全监控盲区。"], "key_evidence": ["厨房温度传感器在灶具开启期间 6 次报告 MeasuredValue = None(09:25、09:36、12:14、12:32、18:07、18:42)", "12:00 厨房温度异常跳变至 2975(29.75°C),较 30 分钟前上升约 4.3°C,且当时灶具未开启,12:30 仍维持 2976", "卧室窗帘 00:24 执行关闭命令后 OperationalStatus 持续为运动中状态,位置停留在 50% 未完成动作"], "recommended_actions": ["优先检查厨房温度传感器:确认其安装位置是否距灶具过近导致高温干扰,清洁传感器探头,必要时更换或重新定位", "在传感器修复前,可考虑将烟雾报警器的灵敏度适当提高,作为厨房温度监测失效期间的补偿手段", "检查卧室窗帘电机及导轨是否存在卡阻或阻力过大的问题,确保窗帘能正常完成开关动作", "建议为厨房温度传感器设置离线/无数据告警规则,当传感器连续报告 None 超过一定时间时主动通知用户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.62197470664978, "api_error": null} {"episode_id": "SQ4_TP_A_0748", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0748.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261377, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-16T06:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 空值,同时门锁在凌晨出现连续上锁失败并触发告警,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:30 报告 2452(约24.5°C),但 19:00 突然跳升至 2830(约28.3°C),30分钟内上升近4°C,远超当日其他时段的正常波动幅度(通常 ±10~20 即 0.1~0.2°C)。虽然 19:10 灶具开启可部分解释升温,但灶具尚未开启时(19:00)温度已异常飙升,时间线不吻合。\",\n \"推理步骤2: 厨房温度传感器在 19:11 和 19:42 两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回空值,这指向传感器本身故障(可能因高温或硬件问题导致读数溢出/失效)。\",\n \"推理步骤3: 19:30 厨房温度继续上升至 2845(约28.5°C),灶具在 19:41 关闭后,20:00 温度回落至 2400(约24.0°C)。虽然开窗通风(19:41:30 窗户打开)有助于降温,但传感器两次 None 值仍然是不正常的设备行为。\",\n \"推理步骤4: 凌晨 06:07,门锁连续两次收到 LockDoor 命令,两次返回 LockState=2(未锁定状态),随后触发 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这说明门锁在该时段无法正常上锁,可能是机械故障或电量不足。\",\n \"推理步骤5: 住户 07:15 手动开锁出门、门自动上锁(LockState=1)成功,18:01 回家时手动开锁也正常,说明门锁后续恢复了工作,但凌晨的失败仍需排查原因。\",\n \"推理步骤6: 其余行为模式正常——住户约 06:19 起床、07:15 出门、18:01 回家、19:10 做饭、21:50 回卧室、22:42 关灯就寝,符合典型的单人一室一厅作息。温度整体呈白天升高夜间降低的自然趋势,客厅空调 18:01 开启制冷后温度逐步下降,均属正常。\",\n \"推理步骤7: 厨房窗户在做完饭后打开通风,洗碗机随后启动,烟雾报警器全天未触发,排除火灾风险。漏水传感器无报告,排除水患。卧室窗帘晚间关闭、灯光随人走动开关,均为正常联动。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 19:00 异常跳升至 2830(灶具 19:10 才开启,时间不匹配),19:11 和 19:42 两次报告 None 空值\",\n \"门锁 06:07:00~06:07:15 连续两次 LockDoor 命令均返回 LockState=2(未锁定),并触发 DoorLockAlarm(AlarmCode=0) 锁定失败告警\",\n \"卧室灯 22:42 关闭、22:44 运动传感器显示无人,但 22:45 灯的亮度属性仍有变化(CurrentLevel=17),存在轻微状态不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否存在故障或安装位置不当(如过于靠近灶具),必要时更换传感器\",\n \"检查入户门锁电池电量及机械部件,排查凌晨连续上锁失败的原因,确保门锁可靠工作\",\n \"查看门锁操作日志,确认 06:07 的两次 LockDoor 命令来源(是自动化规则还是远程操作),排除未授权访问的可能\",\n \"考虑为厨房温度传感器设置异常值告警阈值和 None 值监控,以便及时发现传感器故障\",\n \"检查卧室灯在关闭状态下是否应有亮度属性变更,排查是否为自动化规则冲突或设备固件问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 空值,同时门锁在凌晨出现连续上锁失败并触发告警,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:30 报告 2452(约24.5°C),但 19:00 突然跳升至 2830(约28.3°C),30分钟内上升近4°C,远超当日其他时段的正常波动幅度(通常 ±10~20 即 0.1~0.2°C)。虽然 19:10 灶具开启可部分解释升温,但灶具尚未开启时(19:00)温度已异常飙升,时间线不吻合。", "推理步骤2: 厨房温度传感器在 19:11 和 19:42 两次报告 MeasuredValue = None,表明传感器读数丢失。正常传感器不应返回空值,这指向传感器本身故障(可能因高温或硬件问题导致读数溢出/失效)。", "推理步骤3: 19:30 厨房温度继续上升至 2845(约28.5°C),灶具在 19:41 关闭后,20:00 温度回落至 2400(约24.0°C)。虽然开窗通风(19:41:30 窗户打开)有助于降温,但传感器两次 None 值仍然是不正常的设备行为。", "推理步骤4: 凌晨 06:07,门锁连续两次收到 LockDoor 命令,两次返回 LockState=2(未锁定状态),随后触发 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这说明门锁在该时段无法正常上锁,可能是机械故障或电量不足。", "推理步骤5: 住户 07:15 手动开锁出门、门自动上锁(LockState=1)成功,18:01 回家时手动开锁也正常,说明门锁后续恢复了工作,但凌晨的失败仍需排查原因。", "推理步骤6: 其余行为模式正常——住户约 06:19 起床、07:15 出门、18:01 回家、19:10 做饭、21:50 回卧室、22:42 关灯就寝,符合典型的单人一室一厅作息。温度整体呈白天升高夜间降低的自然趋势,客厅空调 18:01 开启制冷后温度逐步下降,均属正常。", "推理步骤7: 厨房窗户在做完饭后打开通风,洗碗机随后启动,烟雾报警器全天未触发,排除火灾风险。漏水传感器无报告,排除水患。卧室窗帘晚间关闭、灯光随人走动开关,均为正常联动。"], "key_evidence": ["厨房温度传感器 19:00 异常跳升至 2830(灶具 19:10 才开启,时间不匹配),19:11 和 19:42 两次报告 None 空值", "门锁 06:07:00~06:07:15 连续两次 LockDoor 命令均返回 LockState=2(未锁定),并触发 DoorLockAlarm(AlarmCode=0) 锁定失败告警", "卧室灯 22:42 关闭、22:44 运动传感器显示无人,但 22:45 灯的亮度属性仍有变化(CurrentLevel=17),存在轻微状态不一致"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否存在故障或安装位置不当(如过于靠近灶具),必要时更换传感器", "检查入户门锁电池电量及机械部件,排查凌晨连续上锁失败的原因,确保门锁可靠工作", "查看门锁操作日志,确认 06:07 的两次 LockDoor 命令来源(是自动化规则还是远程操作),排除未授权访问的可能", "考虑为厨房温度传感器设置异常值告警阈值和 None 值监控,以便及时发现传感器故障", "检查卧室灯在关闭状态下是否应有亮度属性变更,排查是否为自动化规则冲突或设备固件问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.20444917678833, "api_error": null} {"episode_id": "SQ4_TP_A_0761", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0761.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261390, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-11T18:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak/device_fault\",\n \"threat_description\": \"卫生间漏水传感器在18:26触发且至日志结束未解除,同时厨房温度传感器存在异常读数跳变和两次NULL上报,需要立即关注。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为模式正常——06:35起床、07:14出门上班、18:15回家、22:47入睡,门锁操作均为Manual开锁+Auto自动上锁,无入侵迹象。\",\n \"推理步骤2: 18:26卫生间漏水传感器(bathroom_water_leak)触发StateValue=True,且在此后直到23:30日志结束,未见StateValue=False的恢复事件,说明漏水状态持续存在超过5小时。住户18:15已到家但日志中未见任何针对漏水的处置动作。\",\n \"推理步骤3: 厨房温度传感器在19:00突然从前一读数~24.6°C跳升至28.32°C,虽然19:00灶具刚开启可以部分解释升温,但幅度异常大(30分钟内升约3.7°C)。更关键的是19:01和19:31两次上报MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。\",\n \"推理步骤4: 19:30灶具关闭后,19:30厨房温度仍为28.26°C,到20:00恢复至24.04°C(30分钟降4.2°C),降温速率合理(开窗通风19:30:30),但两次None读数仍然是设备异常的信号。\",\n \"推理步骤5: 全屋温度趋势符合夏季昼夜规律——夜间22~23°C,午间高峰25.8°C,无异常热源。空调18:15开启制冷模式(SystemMode=3)后客厅温度从24.5°C逐步下降,表现正常。\",\n \"推理步骤6: 卧室窗帘06:35打开(0%)、22:00关闭(10000%),卧室窗户传感器全天无开关事件,客厅窗户传感器无事件,厨房窗户19:30打开用于通风——均属正常。\",\n \"推理步骤7: 入户门在22:00:43确认关闭(StateValue=True)并自动上锁(LockState=1),全天门锁无异常操作、无失败尝试,安防状态良好。\"\n ],\n \"key_evidence\": [\n \"18:26 bathroom_water_leak StateValue=True 触发,至23:30日志结束未见恢复为False,漏水状态持续超过5小时\",\n \"19:01和19:31厨房温度传感器上报MeasuredValue=None,正常传感器不应返回空值,疑似设备故障\",\n \"19:00厨房温度从~24.6°C骤升至28.32°C,30分钟内升幅约3.7°C,虽有灶具使用但幅度偏大\",\n \"住户在家期间(18:15至22:47)未见对漏水报警的任何响应动作\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况——传感器已持续报警超过5小时,可能存在管道渗漏或设备溢水,长时间漏水可能造成楼下渗水和结构损坏\",\n \"如确认漏水属实,关闭卫生间水阀止损;如为传感器误报,擦干传感器并观察是否恢复\",\n \"检查厨房温度传感器状态——两次None读数表明传感器可能存在通信故障或硬件问题,建议重启设备或更换电池\",\n \"建议为漏水传感器配置更强的告警推送机制(如手机通知、蜂鸣器),确保住户在家时能及时感知报警\",\n \"建议为厨房温度传感器设置None值监控规则,连续出现空值时自动告警提示设备异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak/device_fault", "threat_description": "卫生间漏水传感器在18:26触发且至日志结束未解除,同时厨房温度传感器存在异常读数跳变和两次NULL上报,需要立即关注。", "reasoning": ["推理步骤1: 住户行为模式正常——06:35起床、07:14出门上班、18:15回家、22:47入睡,门锁操作均为Manual开锁+Auto自动上锁,无入侵迹象。", "推理步骤2: 18:26卫生间漏水传感器(bathroom_water_leak)触发StateValue=True,且在此后直到23:30日志结束,未见StateValue=False的恢复事件,说明漏水状态持续存在超过5小时。住户18:15已到家但日志中未见任何针对漏水的处置动作。", "推理步骤3: 厨房温度传感器在19:00突然从前一读数~24.6°C跳升至28.32°C,虽然19:00灶具刚开启可以部分解释升温,但幅度异常大(30分钟内升约3.7°C)。更关键的是19:01和19:31两次上报MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。", "推理步骤4: 19:30灶具关闭后,19:30厨房温度仍为28.26°C,到20:00恢复至24.04°C(30分钟降4.2°C),降温速率合理(开窗通风19:30:30),但两次None读数仍然是设备异常的信号。", "推理步骤5: 全屋温度趋势符合夏季昼夜规律——夜间22~23°C,午间高峰25.8°C,无异常热源。空调18:15开启制冷模式(SystemMode=3)后客厅温度从24.5°C逐步下降,表现正常。", "推理步骤6: 卧室窗帘06:35打开(0%)、22:00关闭(10000%),卧室窗户传感器全天无开关事件,客厅窗户传感器无事件,厨房窗户19:30打开用于通风——均属正常。", "推理步骤7: 入户门在22:00:43确认关闭(StateValue=True)并自动上锁(LockState=1),全天门锁无异常操作、无失败尝试,安防状态良好。"], "key_evidence": ["18:26 bathroom_water_leak StateValue=True 触发,至23:30日志结束未见恢复为False,漏水状态持续超过5小时", "19:01和19:31厨房温度传感器上报MeasuredValue=None,正常传感器不应返回空值,疑似设备故障", "19:00厨房温度从~24.6°C骤升至28.32°C,30分钟内升幅约3.7°C,虽有灶具使用但幅度偏大", "住户在家期间(18:15至22:47)未见对漏水报警的任何响应动作"], "recommended_actions": ["立即检查卫生间漏水情况——传感器已持续报警超过5小时,可能存在管道渗漏或设备溢水,长时间漏水可能造成楼下渗水和结构损坏", "如确认漏水属实,关闭卫生间水阀止损;如为传感器误报,擦干传感器并观察是否恢复", "检查厨房温度传感器状态——两次None读数表明传感器可能存在通信故障或硬件问题,建议重启设备或更换电池", "建议为漏水传感器配置更强的告警推送机制(如手机通知、蜂鸣器),确保住户在家时能及时感知报警", "建议为厨房温度传感器设置None值监控规则,连续出现空值时自动告警提示设备异常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.150954961776733, "api_error": null} {"episode_id": "SQ4_TP_A_0764", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0764.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261393, "scenario_id": "INS-01", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-20T00:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在故障:多次报告 None 值,且在 11:00-11:30 期间无人使用灶具时出现异常高温读数(约29.5°C),与同期其他房间温度偏差过大。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:06、09:28、11:52、12:52、18:13、18:52),每次都发生在灶具开启或关闭前后。正常的温度传感器不应因附近设备操作而丢失读数,说明传感器可能受灶具热源干扰或自身存在间歇性故障。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器读数分别为 2945 和 2949(约29.5°C),而同一时刻客厅温度约为 25.5°C、卧室约为 24.4°C。厨房与其他房间温差突然达到约4-5°C,但此时灶具并未开启(灶具在 09:27 关闭,11:51 才重新开启)。无热源运行时出现如此大的温差异常,指向传感器读数不可靠。\",\n \"推理步骤3: 对比其他时段,厨房温度与客厅温度通常非常接近(差值在 0-1°C 以内),但 11:00-11:30 这个窗口突然偏高约 4°C,之后 12:00 恢复到与客厅接近的水平(25.89°C vs 25.86°C),进一步证实 11:00-11:30 的高温读数是传感器异常而非真实环境温度。\",\n \"推理步骤4: 其余家庭行为均属正常模式——住户约 08:42 起床,三餐时间合理使用灶具并开窗通风,23:04 就寝时关灯、关空调、锁门,入户门自动上锁,窗帘关闭。客厅窗户在 00:34 打开(StateValue=False)后整日未见关闭记录,但夏季夜间通风属常见行为,不构成安全威胁。\",\n \"推理步骤5: 未发现入侵迹象(门锁正常、无异常时段的运动检测)、无漏水报警、无烟雾报警,整体安防状态良好。唯一的异常集中在厨房温度传感器的可靠性问题上。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 09:06、09:28、11:52、12:52、18:13、18:52 共6次报告 MeasuredValue = None\",\n \"11:00 厨房温度读数 2945(29.45°C)、11:30 读数 2949(29.49°C),而灶具在 09:27 已关闭、11:51 才重新开启,无热源运行期间温度异常偏高\",\n \"同时刻客厅温度约 25.5°C,厨房与客厅温差达 ~4°C,远超其他时段的正常差值(<1°C)\",\n \"12:00 厨房温度恢复至 2589(25.89°C),与客厅 2586(25.86°C)重新趋同,说明 11:00-11:30 的高温为传感器异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰和读数丢失,必要时重新选址安装\",\n \"对厨房温度传感器进行校准或更换,解决间歇性 None 值和异常高温读数问题\",\n \"在传感器修复前,避免依赖厨房温度数据触发自动化规则(如高温报警联动),防止误报或漏报\",\n \"确认客厅窗户(00:34 打开)是否为有意保持开启状态,如非有意建议关闭以确保夜间安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在故障:多次报告 None 值,且在 11:00-11:30 期间无人使用灶具时出现异常高温读数(约29.5°C),与同期其他房间温度偏差过大。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(09:06、09:28、11:52、12:52、18:13、18:52),每次都发生在灶具开启或关闭前后。正常的温度传感器不应因附近设备操作而丢失读数,说明传感器可能受灶具热源干扰或自身存在间歇性故障。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器读数分别为 2945 和 2949(约29.5°C),而同一时刻客厅温度约为 25.5°C、卧室约为 24.4°C。厨房与其他房间温差突然达到约4-5°C,但此时灶具并未开启(灶具在 09:27 关闭,11:51 才重新开启)。无热源运行时出现如此大的温差异常,指向传感器读数不可靠。", "推理步骤3: 对比其他时段,厨房温度与客厅温度通常非常接近(差值在 0-1°C 以内),但 11:00-11:30 这个窗口突然偏高约 4°C,之后 12:00 恢复到与客厅接近的水平(25.89°C vs 25.86°C),进一步证实 11:00-11:30 的高温读数是传感器异常而非真实环境温度。", "推理步骤4: 其余家庭行为均属正常模式——住户约 08:42 起床,三餐时间合理使用灶具并开窗通风,23:04 就寝时关灯、关空调、锁门,入户门自动上锁,窗帘关闭。客厅窗户在 00:34 打开(StateValue=False)后整日未见关闭记录,但夏季夜间通风属常见行为,不构成安全威胁。", "推理步骤5: 未发现入侵迹象(门锁正常、无异常时段的运动检测)、无漏水报警、无烟雾报警,整体安防状态良好。唯一的异常集中在厨房温度传感器的可靠性问题上。"], "key_evidence": ["厨房温度传感器在 09:06、09:28、11:52、12:52、18:13、18:52 共6次报告 MeasuredValue = None", "11:00 厨房温度读数 2945(29.45°C)、11:30 读数 2949(29.49°C),而灶具在 09:27 已关闭、11:51 才重新开启,无热源运行期间温度异常偏高", "同时刻客厅温度约 25.5°C,厨房与客厅温差达 ~4°C,远超其他时段的正常差值(<1°C)", "12:00 厨房温度恢复至 2589(25.89°C),与客厅 2586(25.86°C)重新趋同,说明 11:00-11:30 的高温为传感器异常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰和读数丢失,必要时重新选址安装", "对厨房温度传感器进行校准或更换,解决间歇性 None 值和异常高温读数问题", "在传感器修复前,避免依赖厨房温度数据触发自动化规则(如高温报警联动),防止误报或漏报", "确认客厅窗户(00:34 打开)是否为有意保持开启状态,如非有意建议关闭以确保夜间安全"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.861807346343994, "api_error": null} {"episode_id": "SQ4_TP_A_0772", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0772.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261401, "scenario_id": "DF-05", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-20T01:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器发生硬件故障,丧失烟雾/CO检测能力;厨房温度传感器多次报告 None 值,存在传感器故障;此外厨房在11:00出现一次异常温度飙升。\",\n \"reasoning\": [\n \"推理步骤1: 01:20 厨房烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5(硬件故障状态)并触发 HardwareFault 事件。此后整天日志中未见该报警器恢复正常,说明故障持续存在。\",\n \"推理步骤2: 烟雾报警器处于硬件故障状态意味着它无法正常检测烟雾和一氧化碳。而住户当天在 08:55、11:59、17:59 三次使用灶具做饭,期间报警器完全失去保护能力,这是显著的消防安全隐患。\",\n \"推理步骤3: 厨房温度传感器在 08:56、09:38、12:00、12:27、18:00、18:33 多次报告 MeasuredValue=None,表明传感器间歇性失效。虽然在下一个整点周期又能恢复读数,但这种不稳定行为说明传感器本身可能存在硬件或通信问题。\",\n \"推理步骤4: 11:00 厨房温度传感器读数从 2526(25.26°C)骤升至 2952(29.52°C),升幅约 4.3°C,而同一时刻客厅和卧室温度变化平缓。11:30 厨房仍为 2942。但当时灶具处于关闭状态(09:37已关,11:59才重新开启),这次异常升温原因不明——可能是传感器故障导致的虚假读数,也可能是厨房存在未知热源。\",\n \"推理步骤5: 其余设备行为均属正常:住户约 08:35 起床、22:45 就寝,作息规律;入户门在就寝时自动上锁且门传感器显示关闭;三次做饭后均开窗通风;空调制冷模式运行正常;无入侵、漏水等迹象。\"\n ],\n \"key_evidence\": [\n \"01:20 kitchen_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault(),且全天未恢复\",\n \"厨房温度传感器在 08:56、09:38、12:00、12:27、18:00、18:33 六次报告 MeasuredValue=None,表现为间歇性故障\",\n \"11:00 厨房温度从 25.26°C 异常飙升至 29.52°C,灶具当时处于关闭状态,客厅和卧室温度无对应变化\",\n \"住户当天三次使用灶具做饭,烟雾报警器全程处于故障状态,无法提供火灾/CO保护\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器,恢复烟雾和一氧化碳检测能力。在修复前,考虑临时放置独立式烟雾报警器作为替代\",\n \"在烟雾报警器修复前,尽量减少使用灶具明火烹饪,或确保做饭时厨房窗户保持打开\",\n \"检查厨房温度传感器的安装位置和连接状态,排查间歇性报告 None 值的原因,必要时更换传感器\",\n \"排查 11:00 厨房温度异常飙升的原因:确认传感器是否靠近热源或阳光直射位置,排除传感器误报的可能\",\n \"建议在智能家居系统中配置烟雾报警器硬件故障的即时推送通知,确保此类关键安全设备故障能第一时间被住户知晓\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器发生硬件故障,丧失烟雾/CO检测能力;厨房温度传感器多次报告 None 值,存在传感器故障;此外厨房在11:00出现一次异常温度飙升。", "reasoning": ["推理步骤1: 01:20 厨房烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5(硬件故障状态)并触发 HardwareFault 事件。此后整天日志中未见该报警器恢复正常,说明故障持续存在。", "推理步骤2: 烟雾报警器处于硬件故障状态意味着它无法正常检测烟雾和一氧化碳。而住户当天在 08:55、11:59、17:59 三次使用灶具做饭,期间报警器完全失去保护能力,这是显著的消防安全隐患。", "推理步骤3: 厨房温度传感器在 08:56、09:38、12:00、12:27、18:00、18:33 多次报告 MeasuredValue=None,表明传感器间歇性失效。虽然在下一个整点周期又能恢复读数,但这种不稳定行为说明传感器本身可能存在硬件或通信问题。", "推理步骤4: 11:00 厨房温度传感器读数从 2526(25.26°C)骤升至 2952(29.52°C),升幅约 4.3°C,而同一时刻客厅和卧室温度变化平缓。11:30 厨房仍为 2942。但当时灶具处于关闭状态(09:37已关,11:59才重新开启),这次异常升温原因不明——可能是传感器故障导致的虚假读数,也可能是厨房存在未知热源。", "推理步骤5: 其余设备行为均属正常:住户约 08:35 起床、22:45 就寝,作息规律;入户门在就寝时自动上锁且门传感器显示关闭;三次做饭后均开窗通风;空调制冷模式运行正常;无入侵、漏水等迹象。"], "key_evidence": ["01:20 kitchen_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5、Event:HardwareFault(),且全天未恢复", "厨房温度传感器在 08:56、09:38、12:00、12:27、18:00、18:33 六次报告 MeasuredValue=None,表现为间歇性故障", "11:00 厨房温度从 25.26°C 异常飙升至 29.52°C,灶具当时处于关闭状态,客厅和卧室温度无对应变化", "住户当天三次使用灶具做饭,烟雾报警器全程处于故障状态,无法提供火灾/CO保护"], "recommended_actions": ["立即检查或更换厨房烟雾报警器,恢复烟雾和一氧化碳检测能力。在修复前,考虑临时放置独立式烟雾报警器作为替代", "在烟雾报警器修复前,尽量减少使用灶具明火烹饪,或确保做饭时厨房窗户保持打开", "检查厨房温度传感器的安装位置和连接状态,排查间歇性报告 None 值的原因,必要时更换传感器", "排查 11:00 厨房温度异常飙升的原因:确认传感器是否靠近热源或阳光直射位置,排除传感器误报的可能", "建议在智能家居系统中配置烟雾报警器硬件故障的即时推送通知,确保此类关键安全设备故障能第一时间被住户知晓"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.949451208114624, "api_error": null} {"episode_id": "SQ4_TP_A_0766", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0766.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261395, "scenario_id": "INS-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-12T13:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"13:52 入户门锁遭受连续4次错误密码/凭证尝试并触发防撬报警,疑似有人试图非法入侵;同时厨房温度传感器存在异常读数和离线问题。\",\n \"reasoning\": [\n \"推理步骤1: 住户行为画像 — 住户约06:31起床,07:12出门(手动开锁、开关门、自动上锁),18:29回家,21:47进卧室准备就寝,22:34关灯入睡。这是典型的单人上班族作息。\",\n \"推理步骤2: 入侵威胁分析 — 13:52:00至13:52:40期间,front_door_lock连续产生4次LockOperationError(OperationError=1表示凭证无效,OperationSource=3表示远程/键盘输入)。这发生在住户外出期间(07:12出门,18:29才回家),家中无人。随后13:52:50触发了DoorLockAlarm(AlarmCode=3,即密码连续错误锁定报警)。4次错误尝试间隔仅10-15秒,具有暴力破解特征。\",\n \"推理步骤3: 入侵结果判断 — 报警后门锁未报告LockState变为2(解锁),front_door_contact也未报告StateValue=False(门未被打开),说明入侵尝试未成功,门锁防护机制生效。但这仍是高危事件,攻击者可能再次尝试。\",\n \"推理步骤4: 厨房温度传感器异常 — 18:00时kitchen_temp_sensor突然从约24.8°C跳升至28.59°C,而同一时刻客厅和卧室温度正常下降。18:30仍为28.55°C。此时灶具尚未开启(18:58才开),无合理热源解释这一突增。随后18:59和19:46两次报告MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。\",\n \"推理步骤5: 厨房窗户未关闭 — 19:45:30厨房窗户被打开(kitchen_window_contact StateValue=False),此后日志中再无关闭记录。住户22:34入睡时厨房窗户仍处于打开状态,存在安全隐患。\",\n \"推理步骤6: 正常行为确认 — 除上述异常外,其余设备行为均正常:温度随昼夜自然波动、灯光/窗帘/空调操作符合起居习惯、洗碗机晚餐后启动、门锁自动上锁功能正常。\"\n ],\n \"key_evidence\": [\n \"13:52:00-13:52:40 入户门锁连续4次凭证错误(LockOperationError, OperationError=1, OperationSource=3),住户不在家\",\n \"13:52:50 门锁触发DoorLockAlarm(AlarmCode=3)— 密码连续错误锁定报警\",\n \"18:00 厨房温度异常飙升至28.59°C(较前一读数24.86°C骤升约4°C),灶具当时未开启\",\n \"18:59 和 19:46 厨房温度传感器报告 MeasuredValue=None,疑似传感器故障\",\n \"19:45 厨房窗户打开后至日志结束(23:30)未关闭,住户已入睡\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁报警记录,确认是否有可疑人员在13:52前后出现,建议查看门口监控(如有)\",\n \"考虑临时启用门锁更高安全策略:增加错误锁定时间、启用入侵报警通知推送、必要时联系物业或报警\",\n \"检查厨房温度传感器是否工作正常,清理或更换传感器,排查18:00异常高温的原因(排除火灾隐患)\",\n \"提醒住户关闭厨房窗户 — 夜间窗户敞开存在安全和天气风险\",\n \"建议为门锁启用实时告警通知,确保类似暴力尝试事件能第一时间推送到住户手机\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "13:52 入户门锁遭受连续4次错误密码/凭证尝试并触发防撬报警,疑似有人试图非法入侵;同时厨房温度传感器存在异常读数和离线问题。", "reasoning": ["推理步骤1: 住户行为画像 — 住户约06:31起床,07:12出门(手动开锁、开关门、自动上锁),18:29回家,21:47进卧室准备就寝,22:34关灯入睡。这是典型的单人上班族作息。", "推理步骤2: 入侵威胁分析 — 13:52:00至13:52:40期间,front_door_lock连续产生4次LockOperationError(OperationError=1表示凭证无效,OperationSource=3表示远程/键盘输入)。这发生在住户外出期间(07:12出门,18:29才回家),家中无人。随后13:52:50触发了DoorLockAlarm(AlarmCode=3,即密码连续错误锁定报警)。4次错误尝试间隔仅10-15秒,具有暴力破解特征。", "推理步骤3: 入侵结果判断 — 报警后门锁未报告LockState变为2(解锁),front_door_contact也未报告StateValue=False(门未被打开),说明入侵尝试未成功,门锁防护机制生效。但这仍是高危事件,攻击者可能再次尝试。", "推理步骤4: 厨房温度传感器异常 — 18:00时kitchen_temp_sensor突然从约24.8°C跳升至28.59°C,而同一时刻客厅和卧室温度正常下降。18:30仍为28.55°C。此时灶具尚未开启(18:58才开),无合理热源解释这一突增。随后18:59和19:46两次报告MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。", "推理步骤5: 厨房窗户未关闭 — 19:45:30厨房窗户被打开(kitchen_window_contact StateValue=False),此后日志中再无关闭记录。住户22:34入睡时厨房窗户仍处于打开状态,存在安全隐患。", "推理步骤6: 正常行为确认 — 除上述异常外,其余设备行为均正常:温度随昼夜自然波动、灯光/窗帘/空调操作符合起居习惯、洗碗机晚餐后启动、门锁自动上锁功能正常。"], "key_evidence": ["13:52:00-13:52:40 入户门锁连续4次凭证错误(LockOperationError, OperationError=1, OperationSource=3),住户不在家", "13:52:50 门锁触发DoorLockAlarm(AlarmCode=3)— 密码连续错误锁定报警", "18:00 厨房温度异常飙升至28.59°C(较前一读数24.86°C骤升约4°C),灶具当时未开启", "18:59 和 19:46 厨房温度传感器报告 MeasuredValue=None,疑似传感器故障", "19:45 厨房窗户打开后至日志结束(23:30)未关闭,住户已入睡"], "recommended_actions": ["立即检查入户门锁报警记录,确认是否有可疑人员在13:52前后出现,建议查看门口监控(如有)", "考虑临时启用门锁更高安全策略:增加错误锁定时间、启用入侵报警通知推送、必要时联系物业或报警", "检查厨房温度传感器是否工作正常,清理或更换传感器,排查18:00异常高温的原因(排除火灾隐患)", "提醒住户关闭厨房窗户 — 夜间窗户敞开存在安全和天气风险", "建议为门锁启用实时告警通知,确保类似暴力尝试事件能第一时间推送到住户手机"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.021097898483276, "api_error": null} {"episode_id": "SQ4_TP_A_0776", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0776.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261405, "scenario_id": "INS-05", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "kitchen", "injection_time": "2026-06-16T09:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),同时存在入户门未关闭和厨房窗户未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约24.6°C跳升至28.41°C,而同一时段客厅和卧室温度仍在正常下降趋势中,这一跳变幅度(约3.8°C)远超正常波动。\",\n \"推理步骤2: 19:15灶具开启后,19:16和19:45厨房温度传感器连续两次报告MeasuredValue=None,说明传感器读数丢失或传感器故障。正常传感器即使在高温环境下也应返回数值而非None。\",\n \"推理步骤3: 19:30厨房温度再次报告28.34°C,与19:00的28.41°C一致,说明在灶具使用期间传感器读数在异常高值和None之间交替,可能是传感器受热过高导致间歇性故障。\",\n \"推理步骤4: 09:30入户门被远程解锁(OperationSource=8表示远程操作),门传感器显示门被打开(StateValue=False),但日志中始终未记录该次开门后的关门事件(StateValue=True),直到22:13才出现关门记录。这意味着入户门可能从09:30到22:13处于未关闭状态长达近13小时,存在安全隐患。\",\n \"推理步骤5: 厨房窗户在19:44被打开(StateValue=False),但日志中直到当天结束也未记录关闭事件,厨房窗户可能整夜处于开启状态。\",\n \"推理步骤6: 住户的整体作息模式正常——06:32起床、07:39出门、18:22回家、22:41就寝,灯光和运动传感器的联动也合理,排除入侵可能。烟雾报警器全天未触发,排除火灾风险。漏水传感器无报警,排除漏水风险。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.6°C骤升至28.41°C,与其他房间趋势不一致\",\n \"19:16和19:45厨房温度传感器报告MeasuredValue=None,传感器数据丢失\",\n \"09:30入户门远程解锁并打开后,直到22:13才记录到关门,门可能长时间未关\",\n \"19:44厨房窗户打开后全天未记录关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热异常,必要时更换或重新定位传感器\",\n \"排查厨房温度传感器的None读数问题,检查传感器固件版本和硬件状态,考虑更换\",\n \"确认入户门当前是否已正确关闭并上锁,排查09:30远程开锁的来源是否为授权操作\",\n \"建议为入户门设置长时间未关闭的自动告警规则(如超过5分钟未关门即推送通知)\",\n \"确认厨房窗户当前状态,夜间建议关闭以保障安全\",\n \"考虑为厨房窗户和入户门添加「未关闭超时提醒」自动化规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),同时存在入户门未关闭和厨房窗户未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约24.6°C跳升至28.41°C,而同一时段客厅和卧室温度仍在正常下降趋势中,这一跳变幅度(约3.8°C)远超正常波动。", "推理步骤2: 19:15灶具开启后,19:16和19:45厨房温度传感器连续两次报告MeasuredValue=None,说明传感器读数丢失或传感器故障。正常传感器即使在高温环境下也应返回数值而非None。", "推理步骤3: 19:30厨房温度再次报告28.34°C,与19:00的28.41°C一致,说明在灶具使用期间传感器读数在异常高值和None之间交替,可能是传感器受热过高导致间歇性故障。", "推理步骤4: 09:30入户门被远程解锁(OperationSource=8表示远程操作),门传感器显示门被打开(StateValue=False),但日志中始终未记录该次开门后的关门事件(StateValue=True),直到22:13才出现关门记录。这意味着入户门可能从09:30到22:13处于未关闭状态长达近13小时,存在安全隐患。", "推理步骤5: 厨房窗户在19:44被打开(StateValue=False),但日志中直到当天结束也未记录关闭事件,厨房窗户可能整夜处于开启状态。", "推理步骤6: 住户的整体作息模式正常——06:32起床、07:39出门、18:22回家、22:41就寝,灯光和运动传感器的联动也合理,排除入侵可能。烟雾报警器全天未触发,排除火灾风险。漏水传感器无报警,排除漏水风险。"], "key_evidence": ["19:00厨房温度从约24.6°C骤升至28.41°C,与其他房间趋势不一致", "19:16和19:45厨房温度传感器报告MeasuredValue=None,传感器数据丢失", "09:30入户门远程解锁并打开后,直到22:13才记录到关门,门可能长时间未关", "19:44厨房窗户打开后全天未记录关闭事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热异常,必要时更换或重新定位传感器", "排查厨房温度传感器的None读数问题,检查传感器固件版本和硬件状态,考虑更换", "确认入户门当前是否已正确关闭并上锁,排查09:30远程开锁的来源是否为授权操作", "建议为入户门设置长时间未关闭的自动告警规则(如超过5分钟未关门即推送通知)", "确认厨房窗户当前状态,夜间建议关闭以保障安全", "考虑为厨房窗户和入户门添加「未关闭超时提醒」自动化规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.031075477600098, "api_error": null} {"episode_id": "SQ4_TP_A_0779", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0779.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261408, "scenario_id": "DF-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-25T01:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时入户门和厨房窗户在住户就寝后仍未确认关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:30 报告 2467(约24.67°C),但 19:00 突然跳升至 2836(约28.36°C),30分钟内上升近 3.7°C,幅度异常。虽然 19:09 灶具开启,但灶具是在温度跳变之后才打开的,无法解释这次升温。\",\n \"推理步骤2: 厨房温度传感器在 19:10 和 19:43 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null。这表明传感器可能存在故障、通信中断或受到高温干扰导致读数溢出。\",\n \"推理步骤3: 19:30 厨房温度仍高达 2845(约28.45°C),灶具于 19:42 关闭后,19:42:30 厨房窗户被打开通风(contact=False),20:00 温度回落至 2400(约24°C),说明住户意识到了高温并采取了措施,但传感器的 null 值问题仍未解释。\",\n \"推理步骤4: 住户 18:12 进门时入户门开启(contact=False),但直到 22:09:36 才记录到门关闭(contact=True)并自动上锁。虽然这可能是住户进门后虚掩了门但传感器仍显示开启,近4小时门处于开启状态存在一定安全隐患,不过最终已关闭上锁。\",\n \"推理步骤5: 厨房窗户在 19:42:30 被打开后,日志中再无关闭记录。住户 22:58 关灯就寝,厨房窗户可能整夜处于开启状态,对于一室一厅住宅存在轻微安防风险。\",\n \"推理步骤6: 其余方面均正常——住户作息规律(06:25起床、07:25出门、18:12回家、22:58就寝),门锁操作均为手动/自动且无异常解锁事件,烟雾报警器和漏水传感器全天无告警,各房间温度随昼夜自然波动合理。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2467 骤升至 2836(灶具 19:09 才开启,无法解释此跳变)\",\n \"19:10 和 19:43 厨房温度传感器两次报告 MeasuredValue = None\",\n \"厨房窗户 19:42:30 打开后全天无关闭记录,住户已就寝\",\n \"入户门 18:12 开启后近4小时才于 22:09 关闭(期间处于未锁状态)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,排查 null 读数和异常跳变的原因,必要时更换传感器或检查其供电与通信链路\",\n \"建议设置自动化规则:就寝模式激活时检查所有窗户传感器状态,若有窗户未关闭则发送提醒\",\n \"建议设置自动化规则:入户门开启超过一定时间(如10分钟)且无人在玄关活动时,推送提醒通知\",\n \"可考虑为厨房温度传感器设置异常值告警阈值(如30分钟内变化超过3°C或出现 null 值时立即告警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障;同时入户门和厨房窗户在住户就寝后仍未确认关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:30 报告 2467(约24.67°C),但 19:00 突然跳升至 2836(约28.36°C),30分钟内上升近 3.7°C,幅度异常。虽然 19:09 灶具开启,但灶具是在温度跳变之后才打开的,无法解释这次升温。", "推理步骤2: 厨房温度传感器在 19:10 和 19:43 两次报告 MeasuredValue = None(空值),正常传感器不应返回 null。这表明传感器可能存在故障、通信中断或受到高温干扰导致读数溢出。", "推理步骤3: 19:30 厨房温度仍高达 2845(约28.45°C),灶具于 19:42 关闭后,19:42:30 厨房窗户被打开通风(contact=False),20:00 温度回落至 2400(约24°C),说明住户意识到了高温并采取了措施,但传感器的 null 值问题仍未解释。", "推理步骤4: 住户 18:12 进门时入户门开启(contact=False),但直到 22:09:36 才记录到门关闭(contact=True)并自动上锁。虽然这可能是住户进门后虚掩了门但传感器仍显示开启,近4小时门处于开启状态存在一定安全隐患,不过最终已关闭上锁。", "推理步骤5: 厨房窗户在 19:42:30 被打开后,日志中再无关闭记录。住户 22:58 关灯就寝,厨房窗户可能整夜处于开启状态,对于一室一厅住宅存在轻微安防风险。", "推理步骤6: 其余方面均正常——住户作息规律(06:25起床、07:25出门、18:12回家、22:58就寝),门锁操作均为手动/自动且无异常解锁事件,烟雾报警器和漏水传感器全天无告警,各房间温度随昼夜自然波动合理。"], "key_evidence": ["19:00 厨房温度从 2467 骤升至 2836(灶具 19:09 才开启,无法解释此跳变)", "19:10 和 19:43 厨房温度传感器两次报告 MeasuredValue = None", "厨房窗户 19:42:30 打开后全天无关闭记录,住户已就寝", "入户门 18:12 开启后近4小时才于 22:09 关闭(期间处于未锁状态)"], "recommended_actions": ["检查厨房温度传感器的工作状态,排查 null 读数和异常跳变的原因,必要时更换传感器或检查其供电与通信链路", "建议设置自动化规则:就寝模式激活时检查所有窗户传感器状态,若有窗户未关闭则发送提醒", "建议设置自动化规则:入户门开启超过一定时间(如10分钟)且无人在玄关活动时,推送提醒通知", "可考虑为厨房温度传感器设置异常值告警阈值(如30分钟内变化超过3°C或出现 null 值时立即告警)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.096657037734985, "api_error": null} {"episode_id": "SQ4_TP_A_0781", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0781.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261410, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bedroom", "injection_time": "2026-06-26T07:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器电池低电量告警,厨房温度传感器出现异常高温读数及多次数据丢失(None),需要关注设备健康状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房烟雾报警器在 6月25日 07:11 报告 BatteryAlert=1,表示电池电量低。烟雾报警器是关键安全设备,电池不足会导致火灾时无法正常报警,这是一个明确的维护风险。\",\n \"推理步骤2: 厨房温度传感器在 18:00 突然从约 2480(24.80°C)跳升至 2862(28.62°C),18:30 仍为 2851(28.51°C),而同时段客厅和卧室温度正常下降。此时灶具未开启(灶具 18:49 才开),且住户刚到家(18:18 开门),这次异常升温缺乏合理解释,可能是传感器故障或厨房存在未知热源。\",\n \"推理步骤3: 厨房温度传感器在 18:50 和 19:28 两次报告 MeasuredValue=None(数据丢失),分别发生在灶具开启后和灶具关闭后。正常传感器不应返回 None 值,这进一步印证该传感器存在故障或通信异常。\",\n \"推理步骤4: 住户行为模式正常——早晨 06:37 起床、洗漱、做早餐、07:29 出门上锁;傍晚 18:18 回家开门、开灯开空调、做晚饭、洗碗机运行、21:56 回卧室睡觉、22:41 关灯。门锁操作均为手动开锁+自动上锁,无异常入侵迹象。\",\n \"推理步骤5: 07:21 灶具使用期间 SmokeState=0 表示无烟雾,属正常烹饪。入户门在住户外出和睡觉时均已自动上锁(LockState=1),安防状态良好。温度整体随日照变化呈白天升高、夜间降低的正常趋势。\",\n \"推理步骤6: 18:18 住户回家后入户门传感器显示 StateValue=False(门开),但直到 21:56:36 才报告 StateValue=True(门关)并自动上锁。这意味着入户门在住户在家期间保持未关闭状态长达约 3 小时 38 分钟,虽然住户在家,但存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-25T07:11 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量\",\n \"2026-06-26T18:00 厨房温度异常跳升至 28.62°C(此前约 24.80°C),灶具尚未开启,无合理热源解释\",\n \"2026-06-26T18:50 和 19:28 厨房温度传感器两次报告 MeasuredValue=None,数据丢失\",\n \"入户门从 18:18:02 开启到 21:56:36 关闭,持续未关门约 3.5 小时\",\n \"2026-06-26T18:30 厨房温度仍高达 28.51°C,而客厅(24.60°C)和卧室(23.68°C)正常\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾报警功能正常运作\",\n \"检查厨房温度传感器的工作状态,排查 18:00 异常高温读数和两次 None 值的原因,必要时更换传感器\",\n \"建议设置入户门长时间未关闭的提醒规则(如超过 10 分钟未关门则推送通知),避免安全疏忽\",\n \"检查厨房是否存在未知热源或通风问题,排除 18:00 异常升温的环境因素\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器电池低电量告警,厨房温度传感器出现异常高温读数及多次数据丢失(None),需要关注设备健康状态。", "reasoning": ["推理步骤1: 厨房烟雾报警器在 6月25日 07:11 报告 BatteryAlert=1,表示电池电量低。烟雾报警器是关键安全设备,电池不足会导致火灾时无法正常报警,这是一个明确的维护风险。", "推理步骤2: 厨房温度传感器在 18:00 突然从约 2480(24.80°C)跳升至 2862(28.62°C),18:30 仍为 2851(28.51°C),而同时段客厅和卧室温度正常下降。此时灶具未开启(灶具 18:49 才开),且住户刚到家(18:18 开门),这次异常升温缺乏合理解释,可能是传感器故障或厨房存在未知热源。", "推理步骤3: 厨房温度传感器在 18:50 和 19:28 两次报告 MeasuredValue=None(数据丢失),分别发生在灶具开启后和灶具关闭后。正常传感器不应返回 None 值,这进一步印证该传感器存在故障或通信异常。", "推理步骤4: 住户行为模式正常——早晨 06:37 起床、洗漱、做早餐、07:29 出门上锁;傍晚 18:18 回家开门、开灯开空调、做晚饭、洗碗机运行、21:56 回卧室睡觉、22:41 关灯。门锁操作均为手动开锁+自动上锁,无异常入侵迹象。", "推理步骤5: 07:21 灶具使用期间 SmokeState=0 表示无烟雾,属正常烹饪。入户门在住户外出和睡觉时均已自动上锁(LockState=1),安防状态良好。温度整体随日照变化呈白天升高、夜间降低的正常趋势。", "推理步骤6: 18:18 住户回家后入户门传感器显示 StateValue=False(门开),但直到 21:56:36 才报告 StateValue=True(门关)并自动上锁。这意味着入户门在住户在家期间保持未关闭状态长达约 3 小时 38 分钟,虽然住户在家,但存在一定安全隐患。"], "key_evidence": ["2026-06-25T07:11 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量", "2026-06-26T18:00 厨房温度异常跳升至 28.62°C(此前约 24.80°C),灶具尚未开启,无合理热源解释", "2026-06-26T18:50 和 19:28 厨房温度传感器两次报告 MeasuredValue=None,数据丢失", "入户门从 18:18:02 开启到 21:56:36 关闭,持续未关门约 3.5 小时", "2026-06-26T18:30 厨房温度仍高达 28.51°C,而客厅(24.60°C)和卧室(23.68°C)正常"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾报警功能正常运作", "检查厨房温度传感器的工作状态,排查 18:00 异常高温读数和两次 None 值的原因,必要时更换传感器", "建议设置入户门长时间未关闭的提醒规则(如超过 10 分钟未关门则推送通知),避免安全疏忽", "检查厨房是否存在未知热源或通风问题,排除 18:00 异常升温的环境因素"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.725752115249634, "api_error": null} {"episode_id": "SQ4_TP_A_0792", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0792.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-03T00:00:00", "seed": 20261421, "scenario_id": "DF-06", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T14:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常跳变和多次空值读数,同时客厅窗帘执行关闭命令后长时间未到达目标位置,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约24.7°C跳升至28.36°C,而此时灶具尚未开启(19:02:30才开启),且客厅和卧室温度在同一时段正常下降,说明这次跳变不是环境温度变化所致,传感器可能存在读数异常。\",\n \"推理步骤2: 厨房温度传感器在19:03和19:49两次报告MeasuredValue=None(空值),表明传感器出现了数据丢失或通信故障。正常传感器不应返回空值,这是设备故障的典型信号。\",\n \"推理步骤3: 19:30厨房温度仍高达28.27°C,但灶具在19:48关闭后,20:00温度迅速回落至24.14°C(30分钟内降了约4°C),降幅异常大,进一步佐证传感器读数不稳定。\",\n \"推理步骤4: 客厅窗帘在14:16收到DownOrClose命令后,14:16:30报告位置为50%且OperationalStatus持续为0b000010(正在移动),14:17:00仍显示移动中,之后再无位置更新或停止状态报告。窗帘可能卡住或电机故障,未能完成关闭动作。\",\n \"推理步骤5: 住户行为模式正常——早晨6:41起床、7:38出门并自动锁门、18:28回家开灯开空调、19:02做饭、22:07转入卧室就寝、22:35关灯睡觉,符合典型单人一室一厅的作息规律,不存在入侵迹象。\",\n \"推理步骤6: 入户门在住户出门和睡前均正确上锁(LockState=1),门锁操作来源合理(Manual开锁、Auto自动上锁),无异常开锁事件。\",\n \"推理步骤7: 整体温度趋势合理——夜间约22-23°C,白天升至25-26°C,傍晚开空调后逐步降温,符合夏季室内温度变化规律。烟雾报警器全天无触发,排除火灾风险。漏水传感器无报警,排除水患。\"\n ],\n \"key_evidence\": [\n \"19:00厨房温度从约24.7°C异常跳升至28.36°C,灶具尚未开启\",\n \"19:03和19:49厨房温度传感器两次报告MeasuredValue=None\",\n \"19:30厨房温度28.27°C,20:00骤降至24.14°C,30分钟降幅超4°C,读数波动异常\",\n \"客厅窗帘14:16执行关闭命令后,14:17仍处于移动状态(OperationalStatus=0b000010),此后无完成状态更新\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和电池电量,必要时重新配对或更换传感器\",\n \"检查客厅窗帘电机和导轨是否有卡阻,手动测试窗帘能否正常开合,确认设备固件是否需要更新\",\n \"在厨房温度传感器修复前,做饭时加强人工关注,避免仅依赖传感器数据进行高温报警联动\",\n \"建议为关键传感器设置离线/空值告警规则,以便第一时间发现设备通信故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常跳变和多次空值读数,同时客厅窗帘执行关闭命令后长时间未到达目标位置,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约24.7°C跳升至28.36°C,而此时灶具尚未开启(19:02:30才开启),且客厅和卧室温度在同一时段正常下降,说明这次跳变不是环境温度变化所致,传感器可能存在读数异常。", "推理步骤2: 厨房温度传感器在19:03和19:49两次报告MeasuredValue=None(空值),表明传感器出现了数据丢失或通信故障。正常传感器不应返回空值,这是设备故障的典型信号。", "推理步骤3: 19:30厨房温度仍高达28.27°C,但灶具在19:48关闭后,20:00温度迅速回落至24.14°C(30分钟内降了约4°C),降幅异常大,进一步佐证传感器读数不稳定。", "推理步骤4: 客厅窗帘在14:16收到DownOrClose命令后,14:16:30报告位置为50%且OperationalStatus持续为0b000010(正在移动),14:17:00仍显示移动中,之后再无位置更新或停止状态报告。窗帘可能卡住或电机故障,未能完成关闭动作。", "推理步骤5: 住户行为模式正常——早晨6:41起床、7:38出门并自动锁门、18:28回家开灯开空调、19:02做饭、22:07转入卧室就寝、22:35关灯睡觉,符合典型单人一室一厅的作息规律,不存在入侵迹象。", "推理步骤6: 入户门在住户出门和睡前均正确上锁(LockState=1),门锁操作来源合理(Manual开锁、Auto自动上锁),无异常开锁事件。", "推理步骤7: 整体温度趋势合理——夜间约22-23°C,白天升至25-26°C,傍晚开空调后逐步降温,符合夏季室内温度变化规律。烟雾报警器全天无触发,排除火灾风险。漏水传感器无报警,排除水患。"], "key_evidence": ["19:00厨房温度从约24.7°C异常跳升至28.36°C,灶具尚未开启", "19:03和19:49厨房温度传感器两次报告MeasuredValue=None", "19:30厨房温度28.27°C,20:00骤降至24.14°C,30分钟降幅超4°C,读数波动异常", "客厅窗帘14:16执行关闭命令后,14:17仍处于移动状态(OperationalStatus=0b000010),此后无完成状态更新"], "recommended_actions": ["检查厨房温度传感器的连接状态和电池电量,必要时重新配对或更换传感器", "检查客厅窗帘电机和导轨是否有卡阻,手动测试窗帘能否正常开合,确认设备固件是否需要更新", "在厨房温度传感器修复前,做饭时加强人工关注,避免仅依赖传感器数据进行高温报警联动", "建议为关键传感器设置离线/空值告警规则,以便第一时间发现设备通信故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.445071935653687, "api_error": null} {"episode_id": "SQ4_TP_A_0810", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0810.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261439, "scenario_id": "DF-04", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-20T11:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现一次异常温度飙升,同时入户门锁出现锁定失败告警,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 09:24、09:49、11:49、12:33、18:10、18:36 共 6 次报告 MeasuredValue = None。虽然其中部分时段灶具正在使用,但 None 值意味着传感器未能返回有效读数,这不是正常的高温读数,而是传感器故障或通信异常的表现。\",\n \"推理步骤2: 11:00 时厨房温度从 2511(25.11°C)骤升至 2950(29.50°C),30 分钟内跳升约 4.4°C,而同时段客厅和卧室仅有正常波动。11:48 灶具才开启,说明这次温度飙升并非烹饪导致。这可能是传感器读数漂移或厨房存在异常热源。\",\n \"推理步骤3: 11:25 入户门锁连续两次执行 LockDoor 命令后状态均为 LockState=2(未完全锁定),并触发了 DoorLockAlarm(AlarmCode=0) 告警。AlarmCode=0 通常表示锁定失败/锁舌卡住。这意味着门锁可能存在机械故障,无法正常锁闭,构成物理安全隐患。\",\n \"推理步骤4: 厨房窗户传感器在 09:48、12:32、18:35 三次报告 StateValue=False(窗户打开),但日志中始终没有对应的关闭事件(StateValue=True)。如果窗户一直处于打开状态且住户已于 23:08 就寝并锁门,厨房窗户可能仍未关闭,存在安全隐患。\",\n \"推理步骤5: 其余行为模式正常——住户 08:25 起床、白天活动、23:08 就寝锁门,温度随日照呈现合理的升降曲线,空调制冷模式(SystemMode=3)在夏季合理,洗碗机晚餐后运行也属正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 6 次报告 MeasuredValue = None(09:24、09:49、11:49、12:33、18:10、18:36),表明传感器间歇性故障\",\n \"11:00 厨房温度异常飙升至 2950(29.5°C),较 30 分钟前上升约 4.4°C,且灶具当时未开启\",\n \"11:25 入户门锁两次 LockDoor 命令均返回 LockState=2 并触发 DoorLockAlarm(AlarmCode=0),锁定失败\",\n \"厨房窗户三次被打开但日志中无关闭记录,23:08 就寝时可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁机械状态,确认锁舌是否卡住或电量不足,必要时手动锁闭并安排维修\",\n \"检查厨房温度传感器的供电和网络连接,清理传感器探头,持续出现 None 值应考虑更换设备\",\n \"确认厨房窗户当前是否已关闭,就寝前应确保所有窗户关闭或纳入自动化场景联动\",\n \"建议在就寝/离家场景中增加自动检查:验证门锁状态为已锁定(LockState=1)、所有窗户传感器为关闭状态,否则发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现一次异常温度飙升,同时入户门锁出现锁定失败告警,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 09:24、09:49、11:49、12:33、18:10、18:36 共 6 次报告 MeasuredValue = None。虽然其中部分时段灶具正在使用,但 None 值意味着传感器未能返回有效读数,这不是正常的高温读数,而是传感器故障或通信异常的表现。", "推理步骤2: 11:00 时厨房温度从 2511(25.11°C)骤升至 2950(29.50°C),30 分钟内跳升约 4.4°C,而同时段客厅和卧室仅有正常波动。11:48 灶具才开启,说明这次温度飙升并非烹饪导致。这可能是传感器读数漂移或厨房存在异常热源。", "推理步骤3: 11:25 入户门锁连续两次执行 LockDoor 命令后状态均为 LockState=2(未完全锁定),并触发了 DoorLockAlarm(AlarmCode=0) 告警。AlarmCode=0 通常表示锁定失败/锁舌卡住。这意味着门锁可能存在机械故障,无法正常锁闭,构成物理安全隐患。", "推理步骤4: 厨房窗户传感器在 09:48、12:32、18:35 三次报告 StateValue=False(窗户打开),但日志中始终没有对应的关闭事件(StateValue=True)。如果窗户一直处于打开状态且住户已于 23:08 就寝并锁门,厨房窗户可能仍未关闭,存在安全隐患。", "推理步骤5: 其余行为模式正常——住户 08:25 起床、白天活动、23:08 就寝锁门,温度随日照呈现合理的升降曲线,空调制冷模式(SystemMode=3)在夏季合理,洗碗机晚餐后运行也属正常。"], "key_evidence": ["厨房温度传感器 6 次报告 MeasuredValue = None(09:24、09:49、11:49、12:33、18:10、18:36),表明传感器间歇性故障", "11:00 厨房温度异常飙升至 2950(29.5°C),较 30 分钟前上升约 4.4°C,且灶具当时未开启", "11:25 入户门锁两次 LockDoor 命令均返回 LockState=2 并触发 DoorLockAlarm(AlarmCode=0),锁定失败", "厨房窗户三次被打开但日志中无关闭记录,23:08 就寝时可能仍处于开启状态"], "recommended_actions": ["立即检查入户门锁机械状态,确认锁舌是否卡住或电量不足,必要时手动锁闭并安排维修", "检查厨房温度传感器的供电和网络连接,清理传感器探头,持续出现 None 值应考虑更换设备", "确认厨房窗户当前是否已关闭,就寝前应确保所有窗户关闭或纳入自动化场景联动", "建议在就寝/离家场景中增加自动检查:验证门锁状态为已锁定(LockState=1)、所有窗户传感器为关闭状态,否则发送提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.032273292541504, "api_error": null} {"episode_id": "SQ4_TP_A_0812", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0812.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261441, "scenario_id": "INS-02", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-07T22:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"22:50 入户门锁遭受连续错误密码尝试并触发防撬报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 22:50:00 至 22:50:40 期间,入户门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 表示来自键盘/密码输入,说明有人在短时间内反复尝试错误密码。\",\n \"推理步骤2: 22:50:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵/防撬报警\",这是门锁在检测到多次失败尝试后自动触发的安全警报,属于高危事件。\",\n \"推理步骤3: 此时住户已在家——22:56 客厅灯和空调关闭、卧室有人体感应且窗帘关闭、卧室灯关闭,符合住户准备就寝的行为模式。住户本人不太可能在自家门外连续输错密码4次并触发防撬报警。\",\n \"推理步骤4: 22:56:20 入户门传感器 StateValue=True(门处于关闭状态),22:56:21 门锁通过 Auto 方式上锁(LockState=1),说明门并未被成功打开,入侵尝试未得逞,但威胁确实存在。\",\n \"推理步骤5: 厨房温度传感器在 09:04、09:30、12:05、12:53、18:10、18:43 多次报告 MeasuredValue=None,表明该传感器存在间歇性故障,但结合做饭时段(灶具开关前后)来看,可能是高温导致传感器暂时失灵,属于次要设备异常。\",\n \"推理步骤6: 12:00 厨房温度突然从约 2550 跳升至 2985(29.85°C),而同时段客厅和卧室温度正常,这与午餐做饭时段吻合(12:04 灶具开启),属于烹饪导致的局部升温,非独立火灾风险。\",\n \"推理步骤7: 其余设备行为均符合正常生活模式——早晨起床(08:28 卧室活动→开灯→开窗帘)、三餐做饭、开空调制冷、晚间就寝,温度曲线符合夏季昼夜变化规律。\"\n ],\n \"key_evidence\": [\n \"22:50:00-22:50:40 入户门锁在50秒内产生4次密码输入错误事件(LockOperationError, OperationSource=3)\",\n \"22:50:50 门锁触发 DoorLockAlarm(AlarmCode=3) 防撬/强制入侵报警\",\n \"事件发生在深夜22:50,住户已在卧室准备就寝,排除住户自身误操作的可能性\",\n \"厨房温度传感器多次报告 None 值,存在间歇性设备故障\"\n ],\n \"recommended_actions\": [\n \"立即查看入户门外的监控摄像头录像(如有),确认22:50前后是否有可疑人员逗留\",\n \"考虑报警或通知物业安保,告知门锁遭受多次非法开锁尝试并触发防撬报警\",\n \"检查门锁密码是否存在泄露风险,建议立即更换门锁密码并启用更高安全级别的认证方式(如指纹+密码双重验证)\",\n \"确认门锁固件为最新版本,必要时启用连续失败自动锁定功能(如5次失败后锁定30分钟)\",\n \"排查厨房温度传感器间歇性报 None 的问题,检查传感器安装位置是否离灶具过近,或传感器本身是否需要更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"22:50 入户门锁遭受连续错误密码尝试并触发防撬报警,疑似有人试图非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 22:50:00 至 22:50:40 期间,入户门锁在不到1分钟内连续产生4次 LockOperationError(OperationError=1, OperationSource=3),OperationSource=3 表示来自键盘/密码输入,说明有人在短时间内反复尝试错误密码。\",\n \"推理步骤2: 22:50:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵/防撬报警\",这是门锁在检测到多次失败尝试后自动触发的安全警报,属于高危事件。\",\n \"推理步骤3: 此时住户已在家——22:56 客厅灯和空调关闭、卧室有人体感应且窗帘关闭、卧室灯关闭,符"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 26.999962329864502, "api_error": null} {"episode_id": "SQ4_TP_A_0814", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0814.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261443, "scenario_id": "INS-05", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "bedroom", "injection_time": "2026-06-06T07:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 11:00-11:30 出现异常高温读数(约29.5°C),与同期其他房间温差异常偏大,疑似传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(08:56、09:40、12:00、12:38、18:00、18:46),每次都发生在灶具开启或关闭前后。虽然单次 None 可能是灶具热辐射干扰,但一天内出现 6 次 null 读数表明传感器在高温环境下工作不稳定。\",\n \"推理步骤2: 更关键的是,11:00 和 11:30 厨房温度分别飙升至 2952(29.52°C)和 2956(29.56°C),而同一时刻客厅为 25.45°C、卧室为 24.40°C。厨房与客厅温差突然达到约 4°C,而此时灶具并未开启(上次灶具关闭在 09:39,下次开启在 11:59)。在灶具未使用的情况下,厨房不应比客厅高出近 4°C,此前和此后同等条件下厨房与客厅温差通常在 0.5°C 以内。\",\n \"推理步骤3: 排除火灾风险——厨房烟雾报警器全天未触发任何事件,且异常温度值在 12:00 之后恢复正常(与客厅基本持平),说明不是持续性热源导致。这更符合传感器间歇性故障的特征,而非真实环境温度异常。\",\n \"推理步骤4: 其余设备行为均属正常——住户约 07:31 起床出卧室,日间在客厅活动并开启空调制冷(SystemMode=3),三餐时间合理使用灶具并开窗通风,22:47 回卧室就寝并自动锁门,门锁操作均为合法用户(UserIndex=1)或自动锁定,无入侵迹象。卫生间漏水传感器无报警,烟雾报警器无报警。\",\n \"推理步骤5: 卫生间灯在 08:55 出现快速开关(OnOff=True 后立即 OnOff=False,同一秒内),可能是误触或灯具响应异常,但属于低风险的偶发事件。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(08:56、09:40、12:00、12:38、18:00、18:46)\",\n \"11:00 和 11:30 厨房温度异常飙升至 2952/2956(约29.5°C),而灶具在 09:39 已关闭、11:59 才重新开启,期间无热源,与客厅温差异常达 4°C\",\n \"异常温度在 12:00 后自行恢复正常,烟雾报警器全天无触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰和读数异常,建议将其移至远离热源的位置\",\n \"对厨房温度传感器进行校准或更换,频繁的 null 值和异常跳变表明硬件可能存在老化或故障\",\n \"关注卫生间灯的快速开关现象(08:55),如后续反复出现,建议检查灯具或开关模块是否接触不良\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 11:00-11:30 出现异常高温读数(约29.5°C),与同期其他房间温差异常偏大,疑似传感器故障。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中多次报告 MeasuredValue = None(08:56、09:40、12:00、12:38、18:00、18:46),每次都发生在灶具开启或关闭前后。虽然单次 None 可能是灶具热辐射干扰,但一天内出现 6 次 null 读数表明传感器在高温环境下工作不稳定。", "推理步骤2: 更关键的是,11:00 和 11:30 厨房温度分别飙升至 2952(29.52°C)和 2956(29.56°C),而同一时刻客厅为 25.45°C、卧室为 24.40°C。厨房与客厅温差突然达到约 4°C,而此时灶具并未开启(上次灶具关闭在 09:39,下次开启在 11:59)。在灶具未使用的情况下,厨房不应比客厅高出近 4°C,此前和此后同等条件下厨房与客厅温差通常在 0.5°C 以内。", "推理步骤3: 排除火灾风险——厨房烟雾报警器全天未触发任何事件,且异常温度值在 12:00 之后恢复正常(与客厅基本持平),说明不是持续性热源导致。这更符合传感器间歇性故障的特征,而非真实环境温度异常。", "推理步骤4: 其余设备行为均属正常——住户约 07:31 起床出卧室,日间在客厅活动并开启空调制冷(SystemMode=3),三餐时间合理使用灶具并开窗通风,22:47 回卧室就寝并自动锁门,门锁操作均为合法用户(UserIndex=1)或自动锁定,无入侵迹象。卫生间漏水传感器无报警,烟雾报警器无报警。", "推理步骤5: 卫生间灯在 08:55 出现快速开关(OnOff=True 后立即 OnOff=False,同一秒内),可能是误触或灯具响应异常,但属于低风险的偶发事件。"], "key_evidence": ["厨房温度传感器一天内 6 次报告 MeasuredValue = None(08:56、09:40、12:00、12:38、18:00、18:46)", "11:00 和 11:30 厨房温度异常飙升至 2952/2956(约29.5°C),而灶具在 09:39 已关闭、11:59 才重新开启,期间无热源,与客厅温差异常达 4°C", "异常温度在 12:00 后自行恢复正常,烟雾报警器全天无触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰和读数异常,建议将其移至远离热源的位置", "对厨房温度传感器进行校准或更换,频繁的 null 值和异常跳变表明硬件可能存在老化或故障", "关注卫生间灯的快速开关现象(08:55),如后续反复出现,建议检查灯具或开关模块是否接触不良"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.007619857788086, "api_error": null} {"episode_id": "SQ4_TP_A_0815", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0815.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261444, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-10T00:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨时段厨房温度异常飙升并触发烟雾报警,且厨房温度传感器在晚间做饭时多次报告 None 值,存在火灾隐患及传感器故障。\",\n \"reasoning\": [\n \"推理步骤1: 00:00 厨房基线温度约 22.99°C,但 00:09 骤升至 37.33°C,00:14 仍高达 32.00°C,9 分钟内升幅超过 14°C,远超正常环境波动。同一时段客厅和卧室温度无变化,排除全屋升温(如天气)因素。\",\n \"推理步骤2: 00:19 厨房烟雾报警器 SmokeState=1(告警状态),与温度异常飙升在时间上高度吻合,形成交叉印证。此时为凌晨深夜,住户处于睡眠状态(无任何运动传感器触发、无灯光操作),不存在正常烹饪场景。\",\n \"推理步骤3: 日志中未见灶具(kitchen_cook_surface)在凌晨有任何开启记录,也无住户进入厨房的活动痕迹,因此该高温+烟雾事件的来源不明,可能是电气故障、残留热源复燃等原因导致的真实火灾风险。\",\n \"推理步骤4: 00:30 厨房温度回落至 22.92°C,烟雾报警后续未见持续告警,说明事件可能是短暂性的(如短路打火、小范围燃烧后自熄),但根本原因未消除。\",\n \"推理步骤5: 晚间 19:00-19:35 做饭期间,厨房温度传感器两次报告 MeasuredValue=None(19:01 和 19:35),表明传感器出现读数丢失/故障。这削弱了厨房火灾监测的可靠性,若凌晨类似事件再次发生,可能无法被及时检测到。\",\n \"推理步骤6: 其余事件均属正常生活模式——06:30 起床、07:34 出门上锁、18:05 回家开灯开空调、19:00 做饭、21:53 睡前关灯锁门、22:51 熄灯就寝,无入侵或其他异常。\"\n ],\n \"key_evidence\": [\n \"00:09 厨房温度从 22.99°C 骤升至 37.33°C,00:14 仍为 32.00°C,而同时段客厅/卧室温度稳定在 23°C/22°C\",\n \"00:19 厨房烟雾报警器触发 SmokeState=1,时间与温度异常高度吻合\",\n \"凌晨时段无任何住户活动记录(无运动传感器触发、无灯光/灶具操作),排除正常烹饪\",\n \"19:01 和 19:35 厨房温度传感器报告 MeasuredValue=None,传感器存在间歇性故障\"\n ],\n \"recommended_actions\": [\n \"立即排查厨房凌晨高温及烟雾告警的根本原因:检查电气线路、插座、厨房电器是否存在短路或过热痕迹\",\n \"检修或更换厨房温度传感器,解决读数为 None 的间歇性故障,确保火灾监测链路完整\",\n \"确认烟雾报警器当前状态是否已复位(日志中未见 SmokeState 恢复为 0 的记录),如未复位需手动检查\",\n \"考虑为厨房增设独立的燃气泄漏传感器,并为烟雾/温度异常配置即时推送通知,确保深夜事件能唤醒住户\",\n \"建议短期内每晚睡前检查厨房电器是否完全断电,降低夜间无人时的火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨时段厨房温度异常飙升并触发烟雾报警,且厨房温度传感器在晚间做饭时多次报告 None 值,存在火灾隐患及传感器故障。", "reasoning": ["推理步骤1: 00:00 厨房基线温度约 22.99°C,但 00:09 骤升至 37.33°C,00:14 仍高达 32.00°C,9 分钟内升幅超过 14°C,远超正常环境波动。同一时段客厅和卧室温度无变化,排除全屋升温(如天气)因素。", "推理步骤2: 00:19 厨房烟雾报警器 SmokeState=1(告警状态),与温度异常飙升在时间上高度吻合,形成交叉印证。此时为凌晨深夜,住户处于睡眠状态(无任何运动传感器触发、无灯光操作),不存在正常烹饪场景。", "推理步骤3: 日志中未见灶具(kitchen_cook_surface)在凌晨有任何开启记录,也无住户进入厨房的活动痕迹,因此该高温+烟雾事件的来源不明,可能是电气故障、残留热源复燃等原因导致的真实火灾风险。", "推理步骤4: 00:30 厨房温度回落至 22.92°C,烟雾报警后续未见持续告警,说明事件可能是短暂性的(如短路打火、小范围燃烧后自熄),但根本原因未消除。", "推理步骤5: 晚间 19:00-19:35 做饭期间,厨房温度传感器两次报告 MeasuredValue=None(19:01 和 19:35),表明传感器出现读数丢失/故障。这削弱了厨房火灾监测的可靠性,若凌晨类似事件再次发生,可能无法被及时检测到。", "推理步骤6: 其余事件均属正常生活模式——06:30 起床、07:34 出门上锁、18:05 回家开灯开空调、19:00 做饭、21:53 睡前关灯锁门、22:51 熄灯就寝,无入侵或其他异常。"], "key_evidence": ["00:09 厨房温度从 22.99°C 骤升至 37.33°C,00:14 仍为 32.00°C,而同时段客厅/卧室温度稳定在 23°C/22°C", "00:19 厨房烟雾报警器触发 SmokeState=1,时间与温度异常高度吻合", "凌晨时段无任何住户活动记录(无运动传感器触发、无灯光/灶具操作),排除正常烹饪", "19:01 和 19:35 厨房温度传感器报告 MeasuredValue=None,传感器存在间歇性故障"], "recommended_actions": ["立即排查厨房凌晨高温及烟雾告警的根本原因:检查电气线路、插座、厨房电器是否存在短路或过热痕迹", "检修或更换厨房温度传感器,解决读数为 None 的间歇性故障,确保火灾监测链路完整", "确认烟雾报警器当前状态是否已复位(日志中未见 SmokeState 恢复为 0 的记录),如未复位需手动检查", "考虑为厨房增设独立的燃气泄漏传感器,并为烟雾/温度异常配置即时推送通知,确保深夜事件能唤醒住户", "建议短期内每晚睡前检查厨房电器是否完全断电,降低夜间无人时的火灾风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.7523410320282, "api_error": null} {"episode_id": "SQ4_TP_A_0820", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0820.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261449, "scenario_id": "INS-01", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-25T04:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 空值,疑似传感器故障;同时卧室窗户在凌晨 4:07 被打开后全天未关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:30 报告 2454(约24.5°C),到 19:00 突然跳升至 2837(约28.4°C),30分钟内上升近 4°C,远超正常波动幅度。此时灶具尚未开启(19:07:30 才开),排除烹饪导致的正常升温。\",\n \"推理步骤2: 灶具于 19:07:30 开启后,19:08 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应返回 None。19:45 灶具关闭后,19:46 再次报告 None。两次空值读数强烈指向传感器故障或通信异常。\",\n \"推理步骤3: 19:30 厨房温度传感器报告 2844(约28.4°C),与 19:00 的 2837 几乎持平,而此时灶具已运行超过 20 分钟,温度却未继续上升,进一步说明传感器读数不可信。\",\n \"推理步骤4: 卧室窗户传感器在 04:07 报告 StateValue = False(窗户打开),之后整个日志中再无该传感器的关闭事件。住户 07:22 出门、22:03 回卧室就寝,窗户始终处于打开状态,持续近 20 小时。\",\n \"推理步骤5: 凌晨 04:07 卧室窗户打开时,卧室运动传感器检测到有人(Occupancy=1),可能是住户起夜开窗通风,属于正常行为。但之后忘记关窗,白天无人在家时窗户敞开,存在入侵和财物安全风险。\",\n \"推理步骤6: 其他方面整体正常——住户作息规律(06:45 起床、07:22 出门、18:27 回家、22:31 就寝),门锁开关操作合理且自动上锁正常,烟雾报警器和漏水传感器全天无告警,客厅和卧室温度曲线符合夏季昼夜变化规律。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 2454 突跳至 2837(+3.83°C/30min),灶具此时尚未开启\",\n \"19:08 和 19:46 厨房温度传感器两次报告 MeasuredValue = None\",\n \"04:07 卧室窗户打开(StateValue=False)后全天无关闭记录,持续开放近 20 小时\",\n \"19:30 灶具运行 20+ 分钟后厨房温度仍为 2844,未见合理升温,传感器读数不可靠\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器:清洁探头、检查供电和无线连接,必要时更换传感器。在传感器恢复可靠前,烹饪时需人工留意厨房温度和烟雾情况。\",\n \"关闭卧室窗户:当前窗户已敞开近 20 小时,建议尽快关闭,尤其是夜间无人看管时段。\",\n \"设置窗户长时间未关提醒:在自动化规则中添加逻辑——当住户离家(门锁上锁)且窗户仍处于打开状态时,推送提醒通知。\",\n \"考虑为厨房温度传感器设置健康监测规则:当传感器返回 None 或出现超出合理范围的突变时,自动告警并标记为设备故障。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 空值,疑似传感器故障;同时卧室窗户在凌晨 4:07 被打开后全天未关闭,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:30 报告 2454(约24.5°C),到 19:00 突然跳升至 2837(约28.4°C),30分钟内上升近 4°C,远超正常波动幅度。此时灶具尚未开启(19:07:30 才开),排除烹饪导致的正常升温。", "推理步骤2: 灶具于 19:07:30 开启后,19:08 厨房温度传感器报告 MeasuredValue = None(空值),正常传感器不应返回 None。19:45 灶具关闭后,19:46 再次报告 None。两次空值读数强烈指向传感器故障或通信异常。", "推理步骤3: 19:30 厨房温度传感器报告 2844(约28.4°C),与 19:00 的 2837 几乎持平,而此时灶具已运行超过 20 分钟,温度却未继续上升,进一步说明传感器读数不可信。", "推理步骤4: 卧室窗户传感器在 04:07 报告 StateValue = False(窗户打开),之后整个日志中再无该传感器的关闭事件。住户 07:22 出门、22:03 回卧室就寝,窗户始终处于打开状态,持续近 20 小时。", "推理步骤5: 凌晨 04:07 卧室窗户打开时,卧室运动传感器检测到有人(Occupancy=1),可能是住户起夜开窗通风,属于正常行为。但之后忘记关窗,白天无人在家时窗户敞开,存在入侵和财物安全风险。", "推理步骤6: 其他方面整体正常——住户作息规律(06:45 起床、07:22 出门、18:27 回家、22:31 就寝),门锁开关操作合理且自动上锁正常,烟雾报警器和漏水传感器全天无告警,客厅和卧室温度曲线符合夏季昼夜变化规律。"], "key_evidence": ["19:00 厨房温度从 2454 突跳至 2837(+3.83°C/30min),灶具此时尚未开启", "19:08 和 19:46 厨房温度传感器两次报告 MeasuredValue = None", "04:07 卧室窗户打开(StateValue=False)后全天无关闭记录,持续开放近 20 小时", "19:30 灶具运行 20+ 分钟后厨房温度仍为 2844,未见合理升温,传感器读数不可靠"], "recommended_actions": ["立即检查厨房温度传感器:清洁探头、检查供电和无线连接,必要时更换传感器。在传感器恢复可靠前,烹饪时需人工留意厨房温度和烟雾情况。", "关闭卧室窗户:当前窗户已敞开近 20 小时,建议尽快关闭,尤其是夜间无人看管时段。", "设置窗户长时间未关提醒:在自动化规则中添加逻辑——当住户离家(门锁上锁)且窗户仍处于打开状态时,推送提醒通知。", "考虑为厨房温度传感器设置健康监测规则:当传感器返回 None 或出现超出合理范围的突变时,自动告警并标记为设备故障。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.642393350601196, "api_error": null} {"episode_id": "SQ4_TP_A_0822", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0822.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261451, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-19T09:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak/device_fault\",\n \"threat_description\": \"卫生间漏水传感器在无人在家时触发且持续未解除,同时厨房温度传感器出现异常跳变和多次读数丢失,存在水损和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:18 手动开锁出门,门锁自动上锁,之后家中无任何运动传感器触发,直到 18:08 住户回家开门,说明 07:18~18:08 期间家中无人。\",\n \"推理步骤2: 09:42 卫生间漏水传感器触发 (StateValue=True),此时家中无人,且整个日志中未出现该传感器恢复为 False 的记录,说明漏水状态从 09:42 一直持续到日志结束(超过 13 小时),这是一个需要紧急处理的真实漏水事件。\",\n \"推理步骤3: 厨房温度传感器在 18:00 出现异常跳变——从 17:30 的 2482(约 24.8°C)骤升至 2866(约 28.7°C),升幅约 3.8°C,而同时段客厅和卧室温度均在正常下降。18:30 仍维持在 2864,排除瞬时干扰。\",\n \"推理步骤4: 18:49 和 19:41 厨房温度传感器两次报告 MeasuredValue=None(空值),说明传感器读数丢失。虽然 18:48 灶具开启可能导致局部升温,但 18:00 的异常跳变发生在灶具开启前 48 分钟,且灶具关闭后(19:40)传感器再次报 None,指向传感器本身存在故障。\",\n \"推理步骤5: 18:08 住户回家后入户门一直未关(front_door_contact StateValue=False),直到 21:48 才关闭并上锁。虽然这可能是住户习惯(通风等),但入户门敞开近 3.5 小时存在一定安全隐患。\",\n \"推理步骤6: 其余行为模式正常——早晨起床、洗漱、出门的时序合理;晚间回家、开灯开空调、做饭、洗碗机运行、睡前关灯拉窗帘的流程符合单人住户的日常习惯。温度整体走势符合夏季昼夜变化规律。\"\n ],\n \"key_evidence\": [\n \"09:42 卫生间漏水传感器触发 (StateValue=True),全天未恢复,持续超过 13 小时\",\n \"家中 07:18~18:08 无人期间发生漏水,无法及时处理\",\n \"18:00 厨房温度从 ~24.8°C 骤升至 ~28.7°C(+3.8°C),灶具尚未开启,客厅/卧室温度同期正常下降\",\n \"厨房温度传感器在 18:49 和 19:41 两次报告 None 值,存在传感器故障迹象\",\n \"入户门 18:08 开启后直到 21:48 才关闭上锁,敞开约 3.5 小时\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗手台等),必要时关闭卫生间水阀止损\",\n \"检查卫生间及相邻区域是否已出现积水或渗漏到楼下,评估水损程度\",\n \"检查或更换厨房温度传感器,异常跳变和多次 None 读数表明传感器可能损坏或接触不良\",\n \"建议设置漏水传感器触发时的即时推送通知和自动关闭水阀联动(如有智能水阀),避免无人时漏水长时间无人处理\",\n \"建议养成回家后及时关闭入户门的习惯,或设置入户门长时间未关的提醒自动化\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak/device_fault", "threat_description": "卫生间漏水传感器在无人在家时触发且持续未解除,同时厨房温度传感器出现异常跳变和多次读数丢失,存在水损和设备故障双重风险。", "reasoning": ["推理步骤1: 住户于 07:18 手动开锁出门,门锁自动上锁,之后家中无任何运动传感器触发,直到 18:08 住户回家开门,说明 07:18~18:08 期间家中无人。", "推理步骤2: 09:42 卫生间漏水传感器触发 (StateValue=True),此时家中无人,且整个日志中未出现该传感器恢复为 False 的记录,说明漏水状态从 09:42 一直持续到日志结束(超过 13 小时),这是一个需要紧急处理的真实漏水事件。", "推理步骤3: 厨房温度传感器在 18:00 出现异常跳变——从 17:30 的 2482(约 24.8°C)骤升至 2866(约 28.7°C),升幅约 3.8°C,而同时段客厅和卧室温度均在正常下降。18:30 仍维持在 2864,排除瞬时干扰。", "推理步骤4: 18:49 和 19:41 厨房温度传感器两次报告 MeasuredValue=None(空值),说明传感器读数丢失。虽然 18:48 灶具开启可能导致局部升温,但 18:00 的异常跳变发生在灶具开启前 48 分钟,且灶具关闭后(19:40)传感器再次报 None,指向传感器本身存在故障。", "推理步骤5: 18:08 住户回家后入户门一直未关(front_door_contact StateValue=False),直到 21:48 才关闭并上锁。虽然这可能是住户习惯(通风等),但入户门敞开近 3.5 小时存在一定安全隐患。", "推理步骤6: 其余行为模式正常——早晨起床、洗漱、出门的时序合理;晚间回家、开灯开空调、做饭、洗碗机运行、睡前关灯拉窗帘的流程符合单人住户的日常习惯。温度整体走势符合夏季昼夜变化规律。"], "key_evidence": ["09:42 卫生间漏水传感器触发 (StateValue=True),全天未恢复,持续超过 13 小时", "家中 07:18~18:08 无人期间发生漏水,无法及时处理", "18:00 厨房温度从 ~24.8°C 骤升至 ~28.7°C(+3.8°C),灶具尚未开启,客厅/卧室温度同期正常下降", "厨房温度传感器在 18:49 和 19:41 两次报告 None 值,存在传感器故障迹象", "入户门 18:08 开启后直到 21:48 才关闭上锁,敞开约 3.5 小时"], "recommended_actions": ["立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗手台等),必要时关闭卫生间水阀止损", "检查卫生间及相邻区域是否已出现积水或渗漏到楼下,评估水损程度", "检查或更换厨房温度传感器,异常跳变和多次 None 读数表明传感器可能损坏或接触不良", "建议设置漏水传感器触发时的即时推送通知和自动关闭水阀联动(如有智能水阀),避免无人时漏水长时间无人处理", "建议养成回家后及时关闭入户门的习惯,或设置入户门长时间未关的提醒自动化"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.1507089138031, "api_error": null} {"episode_id": "SQ4_TP_A_0834", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0834.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261463, "scenario_id": "DF-04", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-01T23:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"存在多项异常:厨房温度传感器疑似故障(异常跳变与空值)、入户门锁深夜触发告警、厨房窗户做饭后未关闭,以及入户门在住户回家时未正常关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约2485跳至2854(即从24.85°C跳至28.54°C),升幅近4°C,而此时灶具尚未开启(18:50才开),且客厅和卧室温度在同一时段正常下降。18:30仍维持2854不变,读数完全一致,不符合自然温度波动规律,疑似传感器卡死或故障。\",\n \"推理步骤2: 厨房温度传感器在18:51和19:47两次报告MeasuredValue=None(空值),分别发生在灶具开启后和灶具关闭后。正常传感器不应返回空值,这进一步印证传感器存在间歇性故障。虽然19:00恢复了正常读数2427,但故障是间歇性的,不可忽视。\",\n \"推理步骤3: 23:20入户门锁在5秒内连续收到两次LockDoor命令,且触发了DoorLockAlarm(AlarmCode=0)。AlarmCode=0通常表示锁定失败告警。此时住户已在22:15进入卧室准备就寝,22:31卧室灯关闭,说明住户已入睡。深夜无人操作时门锁连续被命令锁定并触发告警,可能是远程指令异常、自动化规则重复触发,或锁具机械故障。\",\n \"推理步骤4: 住户18:05回家时,入户门传感器(front_door_contact)显示StateValue=False(门打开),但直到22:15:35才报告StateValue=True(门关闭)。这意味着入户门可能在长达4小时10分钟内处于未关闭状态,存在安全隐患。不过也可能是传感器事件未被记录,需要确认。\",\n \"推理步骤5: 厨房窗户在19:46:30被打开(StateValue=False,做饭后通风),但日志中直到结束都没有关闭记录。住户22:15已转入卧室就寝,厨房窗户整夜未关,存在入侵风险和天气影响风险。\",\n \"推理步骤6: 其余行为模式正常——住户06:15起床、06:33洗漱、07:35出门并自动锁门、18:05回家、22:15就寝,符合独居一室一厅的日常作息。温度整体呈白天升高夜间降低的自然趋势,空调制冷模式(SystemMode=3)合理。洗碗机20:01启动属正常使用。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度从~2485骤升至2854,18:30仍为2854(读数卡死),而灶具18:50才开启\",\n \"18:51和19:47厨房温度传感器两次报告MeasuredValue=None\",\n \"23:20门锁5秒内收到两次LockDoor命令并触发DoorLockAlarm(AlarmCode=0),住户此时已入睡\",\n \"入户门18:05打开后直到22:15才有关闭记录,长达4小时\",\n \"厨房窗户19:46打开后无关闭记录,整夜敞开\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排除间歇性故障\",\n \"排查23:20门锁告警原因:检查是否有异常的远程访问记录、自动化规则重复触发,或门锁机械部件是否正常\",\n \"确认入户门传感器工作是否正常,排查18:05至22:15期间门是否确实未关\",\n \"设置自动化规则:就寝时自动检查并关闭厨房窗户,或在窗户长时间未关时发送提醒\",\n \"为门锁告警事件配置即时推送通知,确保住户能第一时间知晓异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "存在多项异常:厨房温度传感器疑似故障(异常跳变与空值)、入户门锁深夜触发告警、厨房窗户做饭后未关闭,以及入户门在住户回家时未正常关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约2485跳至2854(即从24.85°C跳至28.54°C),升幅近4°C,而此时灶具尚未开启(18:50才开),且客厅和卧室温度在同一时段正常下降。18:30仍维持2854不变,读数完全一致,不符合自然温度波动规律,疑似传感器卡死或故障。", "推理步骤2: 厨房温度传感器在18:51和19:47两次报告MeasuredValue=None(空值),分别发生在灶具开启后和灶具关闭后。正常传感器不应返回空值,这进一步印证传感器存在间歇性故障。虽然19:00恢复了正常读数2427,但故障是间歇性的,不可忽视。", "推理步骤3: 23:20入户门锁在5秒内连续收到两次LockDoor命令,且触发了DoorLockAlarm(AlarmCode=0)。AlarmCode=0通常表示锁定失败告警。此时住户已在22:15进入卧室准备就寝,22:31卧室灯关闭,说明住户已入睡。深夜无人操作时门锁连续被命令锁定并触发告警,可能是远程指令异常、自动化规则重复触发,或锁具机械故障。", "推理步骤4: 住户18:05回家时,入户门传感器(front_door_contact)显示StateValue=False(门打开),但直到22:15:35才报告StateValue=True(门关闭)。这意味着入户门可能在长达4小时10分钟内处于未关闭状态,存在安全隐患。不过也可能是传感器事件未被记录,需要确认。", "推理步骤5: 厨房窗户在19:46:30被打开(StateValue=False,做饭后通风),但日志中直到结束都没有关闭记录。住户22:15已转入卧室就寝,厨房窗户整夜未关,存在入侵风险和天气影响风险。", "推理步骤6: 其余行为模式正常——住户06:15起床、06:33洗漱、07:35出门并自动锁门、18:05回家、22:15就寝,符合独居一室一厅的日常作息。温度整体呈白天升高夜间降低的自然趋势,空调制冷模式(SystemMode=3)合理。洗碗机20:01启动属正常使用。"], "key_evidence": ["18:00厨房温度从~2485骤升至2854,18:30仍为2854(读数卡死),而灶具18:50才开启", "18:51和19:47厨房温度传感器两次报告MeasuredValue=None", "23:20门锁5秒内收到两次LockDoor命令并触发DoorLockAlarm(AlarmCode=0),住户此时已入睡", "入户门18:05打开后直到22:15才有关闭记录,长达4小时", "厨房窗户19:46打开后无关闭记录,整夜敞开"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,排除间歇性故障", "排查23:20门锁告警原因:检查是否有异常的远程访问记录、自动化规则重复触发,或门锁机械部件是否正常", "确认入户门传感器工作是否正常,排查18:05至22:15期间门是否确实未关", "设置自动化规则:就寝时自动检查并关闭厨房窗户,或在窗户长时间未关时发送提醒", "为门锁告警事件配置即时推送通知,确保住户能第一时间知晓异常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.527408361434937, "api_error": null} {"episode_id": "SQ4_TP_A_0846", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_A_0846.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261475, "scenario_id": "INS-05", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "kitchen", "injection_time": "2026-06-28T21:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.44°C),疑似传感器故障或存在未被察觉的热源。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间(09:26、09:35、11:51、12:49、18:09、18:38)反复报告 MeasuredValue = None,一天内出现 6 次。虽然灶具使用时传感器可能因高温超量程而返回 None,但这种频繁的 None 值表明传感器可能安装位置不当(离灶具太近)或自身存在故障。\",\n \"推理步骤2: 更关键的是,11:00 和 11:30 厨房温度读数飙升至 2944/2942(即 29.44°C / 29.42°C),比同时段客厅高约 4°C,比前后正常读数高出约 4°C。但此时灶具处于关闭状态(09:34 关闭,11:50 才重新开启),厨房不应有额外热源导致如此异常升温。这可能意味着:(a) 传感器读数漂移/故障;(b) 存在未被记录的热源。\",\n \"推理步骤3: 整体温度趋势方面,三个区域温度从凌晨约 22-23°C 随日照升至午间 25-26°C,傍晚回落,符合夏季自然规律。客厅空调 10:10 开启制冷(SystemMode=3),客厅温度在午后逐步下降,行为合理。\",\n \"推理步骤4: 住户行为模式正常——08:41 起床、09:25 做早餐、11:50 做午餐、18:08 做晚餐,三餐规律。21:48 有人通过密码/APP(OperationSource=8, UserIndex=1)开锁进门,22:52 关灯就寝、门锁自动上锁,属于正常生活节奏。\",\n \"推理步骤5: 安防方面,入户门在 22:52 已确认关闭(StateValue=True)并自动上锁(LockState=1),无异常开锁事件。无烟雾报警、无漏水报警。但厨房窗户在 09:34、12:48、18:37 三次被打开(StateValue=False),日志中未见关闭记录,当前可能仍处于开启状态,夜间存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(09:26、09:35、11:51、12:49、18:09、18:38)\",\n \"11:00 和 11:30 厨房温度异常飙升至 29.44°C / 29.42°C,此时灶具处于关闭状态,比客厅同期高约 4°C\",\n \"厨房窗户传感器三次记录打开事件(09:34、12:48、18:37),但日志中无对应关闭记录,夜间可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认是否离灶具过近导致频繁超量程,或传感器本身存在硬件故障,必要时更换或重新定位\",\n \"排查 11:00-11:30 期间厨房异常高温的原因——确认是否有未被记录的热源(如烤箱、其他电器),排除火灾隐患\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间建议关闭窗户以保障安全,可考虑设置自动提醒规则\",\n \"建议为厨房温度传感器设置异常值告警阈值(如超过 28°C 或报告 None 时自动通知),以便及时发现问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且在 11:00 出现异常高温读数(29.44°C),疑似传感器故障或存在未被察觉的热源。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间(09:26、09:35、11:51、12:49、18:09、18:38)反复报告 MeasuredValue = None,一天内出现 6 次。虽然灶具使用时传感器可能因高温超量程而返回 None,但这种频繁的 None 值表明传感器可能安装位置不当(离灶具太近)或自身存在故障。", "推理步骤2: 更关键的是,11:00 和 11:30 厨房温度读数飙升至 2944/2942(即 29.44°C / 29.42°C),比同时段客厅高约 4°C,比前后正常读数高出约 4°C。但此时灶具处于关闭状态(09:34 关闭,11:50 才重新开启),厨房不应有额外热源导致如此异常升温。这可能意味着:(a) 传感器读数漂移/故障;(b) 存在未被记录的热源。", "推理步骤3: 整体温度趋势方面,三个区域温度从凌晨约 22-23°C 随日照升至午间 25-26°C,傍晚回落,符合夏季自然规律。客厅空调 10:10 开启制冷(SystemMode=3),客厅温度在午后逐步下降,行为合理。", "推理步骤4: 住户行为模式正常——08:41 起床、09:25 做早餐、11:50 做午餐、18:08 做晚餐,三餐规律。21:48 有人通过密码/APP(OperationSource=8, UserIndex=1)开锁进门,22:52 关灯就寝、门锁自动上锁,属于正常生活节奏。", "推理步骤5: 安防方面,入户门在 22:52 已确认关闭(StateValue=True)并自动上锁(LockState=1),无异常开锁事件。无烟雾报警、无漏水报警。但厨房窗户在 09:34、12:48、18:37 三次被打开(StateValue=False),日志中未见关闭记录,当前可能仍处于开启状态,夜间存在一定安全隐患。"], "key_evidence": ["厨房温度传感器一天内 6 次报告 MeasuredValue = None(09:26、09:35、11:51、12:49、18:09、18:38)", "11:00 和 11:30 厨房温度异常飙升至 29.44°C / 29.42°C,此时灶具处于关闭状态,比客厅同期高约 4°C", "厨房窗户传感器三次记录打开事件(09:34、12:48、18:37),但日志中无对应关闭记录,夜间可能仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认是否离灶具过近导致频繁超量程,或传感器本身存在硬件故障,必要时更换或重新定位", "排查 11:00-11:30 期间厨房异常高温的原因——确认是否有未被记录的热源(如烤箱、其他电器),排除火灾隐患", "确认厨房窗户当前是否仍处于打开状态,夜间建议关闭窗户以保障安全,可考虑设置自动提醒规则", "建议为厨房温度传感器设置异常值告警阈值(如超过 28°C 或报告 None 时自动通知),以便及时发现问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.986346006393433, "api_error": null} {"episode_id": "SQ4_TP_B_0720", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0720.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261349, "scenario_id": "FG-01", "total_events": 244, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-02T00:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨无人时灶具被开启,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 00:03 灶具开启(OnOff=True),但同一时刻客厅运动传感器显示 Occupancy=0,且全屋无任何运动传感器报告有人活动,表明此时家中可能无人或住户已入睡。\",\n \"推理步骤2: 灶具开启后厨房温度从 23.10°C(2310)在 15 分钟内飙升至 35.00°C(3500),升幅超过 12°C,远超正常烹饪温度变化速率。\",\n \"推理步骤3: 00:18 烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认存在烟雾/燃烧情况。\",\n \"推理步骤4: 灶具一直持续开启到 06:54 才关闭,意味着灶具在无人看管的情况下连续运行了近 7 小时,这是极其危险的行为。\",\n \"推理步骤5: 日志中未见烟雾报警后有任何人为响应(无运动传感器触发、无灯光开启、无门锁操作),直到 05:56 主卧才有人活动,说明住户可能在睡眠中未察觉报警。\",\n \"推理步骤6: 另外,厨房温度传感器在 06:55、07:09、18:23、19:28 多次报告 MeasuredValue=None,提示该传感器可能因高温损坏或存在故障。\"\n ],\n \"key_evidence\": [\n \"00:03 灶具开启时全屋无人活动(living_room_occupancy=0)\",\n \"厨房温度 15 分钟内从 23.1°C 飙升至 35.0°C(00:03→00:13)\",\n \"00:18 烟雾报警器触发 SmokeAlarm 事件\",\n \"灶具从 00:03 持续运行至 06:54,无人看管近 7 小时\",\n \"报警后无任何人为响应动作,直到 05:56 主卧才检测到活动\",\n \"厨房温度传感器多次报告 None 值,疑似传感器损坏\"\n ],\n \"recommended_actions\": [\n \"立即检查灶具是否存在误触发或故障,考虑加装灶具自动关断定时器\",\n \"检修厨房温度传感器(多次报告 None),确认是否因高温损坏需要更换\",\n \"为烟雾报警器配置联动通知(手机推送、声光报警联动卧室),确保住户能在睡眠中被唤醒\",\n \"设置自动化规则:深夜无人活动时灶具开启应自动告警或自动关闭\",\n \"检查 00:03 灶具开启的原因(是否为误操作、设备故障或自动化规则错误触发)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨无人时灶具被开启,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 00:03 灶具开启(OnOff=True),但同一时刻客厅运动传感器显示 Occupancy=0,且全屋无任何运动传感器报告有人活动,表明此时家中可能无人或住户已入睡。", "推理步骤2: 灶具开启后厨房温度从 23.10°C(2310)在 15 分钟内飙升至 35.00°C(3500),升幅超过 12°C,远超正常烹饪温度变化速率。", "推理步骤3: 00:18 烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认存在烟雾/燃烧情况。", "推理步骤4: 灶具一直持续开启到 06:54 才关闭,意味着灶具在无人看管的情况下连续运行了近 7 小时,这是极其危险的行为。", "推理步骤5: 日志中未见烟雾报警后有任何人为响应(无运动传感器触发、无灯光开启、无门锁操作),直到 05:56 主卧才有人活动,说明住户可能在睡眠中未察觉报警。", "推理步骤6: 另外,厨房温度传感器在 06:55、07:09、18:23、19:28 多次报告 MeasuredValue=None,提示该传感器可能因高温损坏或存在故障。"], "key_evidence": ["00:03 灶具开启时全屋无人活动(living_room_occupancy=0)", "厨房温度 15 分钟内从 23.1°C 飙升至 35.0°C(00:03→00:13)", "00:18 烟雾报警器触发 SmokeAlarm 事件", "灶具从 00:03 持续运行至 06:54,无人看管近 7 小时", "报警后无任何人为响应动作,直到 05:56 主卧才检测到活动", "厨房温度传感器多次报告 None 值,疑似传感器损坏"], "recommended_actions": ["立即检查灶具是否存在误触发或故障,考虑加装灶具自动关断定时器", "检修厨房温度传感器(多次报告 None),确认是否因高温损坏需要更换", "为烟雾报警器配置联动通知(手机推送、声光报警联动卧室),确保住户能在睡眠中被唤醒", "设置自动化规则:深夜无人活动时灶具开启应自动告警或自动关闭", "检查 00:03 灶具开启的原因(是否为误操作、设备故障或自动化规则错误触发)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.46937084197998, "api_error": null} {"episode_id": "SQ4_TP_B_0723", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0723.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261352, "scenario_id": "BA-04", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-03T02:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且灶具关闭后厨房窗户未关闭;阳台门凌晨异常开启后无后续关闭记录;下午入户门开锁后长时间未关门。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:02、07:10、18:50、19:30 四次报告 MeasuredValue = None。每次都与灶具开关操作时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在故障。\",\n \"推理步骤2: 07:01:30 和 19:29:30 厨房窗户传感器报告 StateValue = False(窗户打开),这与做饭通风的习惯一致,但日志中始终没有窗户关闭(StateValue = True)的记录。如果窗户确实一直处于打开状态,在无人在家期间(07:16~15:57)存在安全隐患。\",\n \"推理步骤3: 02:53 阳台门传感器报告 StateValue = False(门打开),时间为凌晨近3点,且之后整个日志中没有阳台门关闭的记录。凌晨时段阳台门开启本身值得关注,但结合主卧运动传感器同时触发(02:53:03 Occupancy=1),推测可能是住户起夜或通风,威胁程度不高。\",\n \"推理步骤4: 15:57 入户门解锁并打开(contact = False),但直到 22:12:27 才记录到门关闭(contact = True)并自动上锁。中间超过6小时入户门处于开启状态,这段时间 18:18 有第二次开门记录(住户回家),说明门确实长时间未关。虽然可能是住户习惯,但入户门长时间敞开存在入侵风险。\",\n \"推理步骤5: 其余行为模式正常——住户约 05:59 起床、07:16 出门、18:18 回家、22:12 就寝;温度曲线符合夏季昼夜变化规律(夜间 ~23°C,午间峰值 ~25.9°C);空调制冷模式(SystemMode=3)在回家后开启、睡前关闭;门锁操作均为 Manual/Auto 来源,无异常解锁尝试。\",\n \"推理步骤6: 灶具两次使用时长合理(早餐约7分钟、晚餐约40分钟),烟雾报警器全天无触发,漏水传感器无报警,整体无火灾或水灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 MeasuredValue = None(07:02, 07:10, 18:50, 19:30),与灶具操作时间强相关\",\n \"厨房窗户 07:01:30 和 19:29:30 两次打开,全天无关闭记录\",\n \"阳台门 02:53 凌晨打开,全天无关闭记录\",\n \"入户门 15:57 打开后直到 22:12:27 才关闭,中间超过 6 小时处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否存在硬件故障或安装位置不当(距灶具过近),必要时更换或重新定位\",\n \"确认厨房窗户和阳台门的当前实际状态,如确实未关闭请及时关闭,避免无人时门窗敞开\",\n \"考虑为入户门设置自动提醒规则:开门超过一定时间(如10分钟)未关闭时推送通知\",\n \"建议为阳台门传感器添加夜间(23:00~06:00)开启告警规则,及时发现异常开门事件\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且灶具关闭后厨房窗户未关闭;阳台门凌晨异常开启后无后续关闭记录;下午入户门开锁后长时间未关门。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:02、07:10、18:50、19:30 四次报告 MeasuredValue = None。每次都与灶具开关操作时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在故障。", "推理步骤2: 07:01:30 和 19:29:30 厨房窗户传感器报告 StateValue = False(窗户打开),这与做饭通风的习惯一致,但日志中始终没有窗户关闭(StateValue = True)的记录。如果窗户确实一直处于打开状态,在无人在家期间(07:16~15:57)存在安全隐患。", "推理步骤3: 02:53 阳台门传感器报告 StateValue = False(门打开),时间为凌晨近3点,且之后整个日志中没有阳台门关闭的记录。凌晨时段阳台门开启本身值得关注,但结合主卧运动传感器同时触发(02:53:03 Occupancy=1),推测可能是住户起夜或通风,威胁程度不高。", "推理步骤4: 15:57 入户门解锁并打开(contact = False),但直到 22:12:27 才记录到门关闭(contact = True)并自动上锁。中间超过6小时入户门处于开启状态,这段时间 18:18 有第二次开门记录(住户回家),说明门确实长时间未关。虽然可能是住户习惯,但入户门长时间敞开存在入侵风险。", "推理步骤5: 其余行为模式正常——住户约 05:59 起床、07:16 出门、18:18 回家、22:12 就寝;温度曲线符合夏季昼夜变化规律(夜间 ~23°C,午间峰值 ~25.9°C);空调制冷模式(SystemMode=3)在回家后开启、睡前关闭;门锁操作均为 Manual/Auto 来源,无异常解锁尝试。", "推理步骤6: 灶具两次使用时长合理(早餐约7分钟、晚餐约40分钟),烟雾报警器全天无触发,漏水传感器无报警,整体无火灾或水灾风险。"], "key_evidence": ["厨房温度传感器 4 次报告 MeasuredValue = None(07:02, 07:10, 18:50, 19:30),与灶具操作时间强相关", "厨房窗户 07:01:30 和 19:29:30 两次打开,全天无关闭记录", "阳台门 02:53 凌晨打开,全天无关闭记录", "入户门 15:57 打开后直到 22:12:27 才关闭,中间超过 6 小时处于开启状态"], "recommended_actions": ["检查厨房温度传感器是否存在硬件故障或安装位置不当(距灶具过近),必要时更换或重新定位", "确认厨房窗户和阳台门的当前实际状态,如确实未关闭请及时关闭,避免无人时门窗敞开", "考虑为入户门设置自动提醒规则:开门超过一定时间(如10分钟)未关闭时推送通知", "建议为阳台门传感器添加夜间(23:00~06:00)开启告警规则,及时发现异常开门事件"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.592561960220337, "api_error": null} {"episode_id": "SQ4_TP_B_0725", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0725.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-19T00:00:00", "seed": 20261354, "scenario_id": "FG-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-19T18:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器在18:20触发一氧化碳(CO)报警,且入户门在16:02开锁后长时间未关闭,存在CO中毒风险和入户安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:20厨房烟雾报警器报告COState=1(一氧化碳检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,这是一个明确的一氧化碳泄漏警报。\",\n \"推理步骤2: CO报警发生时灶具并未开启(早上07:18已关闭,晚上18:40才重新开启),说明CO来源可能不是正常烹饪,需要排查燃气管道或其他潜在泄漏源。\",\n \"推理步骤3: 住户18:06回家后在18:20即触发CO报警,随后18:40仍然开启灶具做饭,说明住户可能未注意到或忽视了CO报警,这增加了健康风险。\",\n \"推理步骤4: 日志中未见CO报警被消除或恢复正常的记录(COState未回到0),说明CO问题可能持续存在。\",\n \"推理步骤5: 16:02入户门开锁并打开(front_door_contact=False),但直到22:25才记录到门关闭(front_door_contact=True)并自动上锁。这意味着入户门敞开了超过6小时,存在入户安全风险,同时也可能与通风有关。\",\n \"推理步骤6: 厨房温度传感器在06:49和07:19、18:41和18:54多次报告MeasuredValue=None,传感器可能存在间歇性故障,影响对厨房温度异常的监测能力。\"\n ],\n \"key_evidence\": [\n \"18:20 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event:COAlarm()\",\n \"CO报警时灶具处于关闭状态(07:18关闭,18:40才重新开启),CO来源不明\",\n \"整个日志期间未见CO报警解除记录,警报可能持续未处理\",\n \"16:02入户门开锁打开后直到22:25才关闭,敞开超过6小时\",\n \"厨房温度传感器多次报告None值,存在设备故障嫌疑\"\n ],\n \"recommended_actions\": [\n \"立即确认CO报警状态:检查厨房烟雾报警器当前读数,确认一氧化碳是否仍然存在\",\n \"开窗通风:确保厨房窗户保持打开状态(当前已开),并考虑打开其他房间窗户加速空气流通\",\n \"排查CO来源:联系燃气公司检查燃气管道、热水器等可能的一氧化碳泄漏源,灶具关闭状态下出现CO尤其需要重视\",\n \"设置入户门未关闭提醒:门开超过一定时间(如10分钟)应自动推送告警,避免长时间敞开带来的安全隐患\",\n \"检修厨房温度传感器:多次报告None值表明传感器工作不稳定,应检查电池或连接状态并考虑更换\",\n \"建议住户配备独立的CO检测仪作为备份,并确保了解CO报警的正确应对流程(撤离、通风、报警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器在18:20触发一氧化碳(CO)报警,且入户门在16:02开锁后长时间未关闭,存在CO中毒风险和入户安全隐患。", "reasoning": ["推理步骤1: 18:20厨房烟雾报警器报告COState=1(一氧化碳检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,这是一个明确的一氧化碳泄漏警报。", "推理步骤2: CO报警发生时灶具并未开启(早上07:18已关闭,晚上18:40才重新开启),说明CO来源可能不是正常烹饪,需要排查燃气管道或其他潜在泄漏源。", "推理步骤3: 住户18:06回家后在18:20即触发CO报警,随后18:40仍然开启灶具做饭,说明住户可能未注意到或忽视了CO报警,这增加了健康风险。", "推理步骤4: 日志中未见CO报警被消除或恢复正常的记录(COState未回到0),说明CO问题可能持续存在。", "推理步骤5: 16:02入户门开锁并打开(front_door_contact=False),但直到22:25才记录到门关闭(front_door_contact=True)并自动上锁。这意味着入户门敞开了超过6小时,存在入户安全风险,同时也可能与通风有关。", "推理步骤6: 厨房温度传感器在06:49和07:19、18:41和18:54多次报告MeasuredValue=None,传感器可能存在间歇性故障,影响对厨房温度异常的监测能力。"], "key_evidence": ["18:20 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event:COAlarm()", "CO报警时灶具处于关闭状态(07:18关闭,18:40才重新开启),CO来源不明", "整个日志期间未见CO报警解除记录,警报可能持续未处理", "16:02入户门开锁打开后直到22:25才关闭,敞开超过6小时", "厨房温度传感器多次报告None值,存在设备故障嫌疑"], "recommended_actions": ["立即确认CO报警状态:检查厨房烟雾报警器当前读数,确认一氧化碳是否仍然存在", "开窗通风:确保厨房窗户保持打开状态(当前已开),并考虑打开其他房间窗户加速空气流通", "排查CO来源:联系燃气公司检查燃气管道、热水器等可能的一氧化碳泄漏源,灶具关闭状态下出现CO尤其需要重视", "设置入户门未关闭提醒:门开超过一定时间(如10分钟)应自动推送告警,避免长时间敞开带来的安全隐患", "检修厨房温度传感器:多次报告None值表明传感器工作不稳定,应检查电池或连接状态并考虑更换", "建议住户配备独立的CO检测仪作为备份,并确保了解CO报警的正确应对流程(撤离、通风、报警)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.44504952430725, "api_error": null} {"episode_id": "SQ4_TP_B_0731", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0731.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261360, "scenario_id": "FG-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "master_bedroom", "injection_time": "2026-06-26T20:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现多次异常读数和数据丢失,烟雾报警器电池低电量,且厨房窗户在住户离家后仍处于打开状态,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00和18:30分别报告2850和2860(即28.5°C和28.6°C),而同一时段其他房间温度约为24.5°C,厨房温度异常偏高约4°C,且当时灶具并未开启(灶具18:50才开启),这一温差不合理。\",\n \"推理步骤2: 厨房温度传感器在18:51和19:38两次报告MeasuredValue=None,表明传感器数据丢失或通信故障。正常传感器不应出现null值。\",\n \"推理步骤3: 20:44灶具再次开启,20:54厨房温度飙升至2878(28.78°C),同时烟雾报警器报告SmokeState=0(正常)。但此时烟雾报警器在前一天20:44已报告BatteryAlert=1(低电量警告),低电量可能影响报警器的检测灵敏度和可靠性。\",\n \"推理步骤4: 厨房窗户在19:37:30被打开(StateValue=False),但整个日志中再无关闭记录。住户在22:09关灯、锁门、关空调后离开或就寝,厨房窗户仍处于打开状态,存在安防隐患。\",\n \"推理步骤5: 住户的日常行为模式本身正常——早晨6:25起床、7:27出门、18:15回家、做饭、22:09就寝,门锁开关和运动传感器的时序一致,不存在入侵迹象。\",\n \"推理步骤6: 综合来看,核心问题是厨房温度传感器工作不稳定(异常高温读数+两次null值),烟雾报警器电池低电量削弱了厨房的火灾预警能力,厨房窗户未关闭增加了夜间安全风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在18:00/18:30报告2850/2860,比其他房间高约4°C,且灶具当时未开启\",\n \"厨房温度传感器在18:51和19:38两次报告MeasuredValue=None(数据丢失)\",\n \"烟雾报警器在2026-06-25T20:44报告BatteryAlert=1(低电量)\",\n \"20:44灶具开启后20:54厨房温度达2878,传感器读数波动剧烈\",\n \"厨房窗户19:37:30打开后至日志结束(23:30)未关闭,住户已就寝/离开\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾预警功能正常\",\n \"检查厨房温度传感器,排查异常高温读数和null值的原因(可能需要更换传感器或检查安装位置是否靠近热源)\",\n \"关闭厨房窗户,或设置自动化规则在就寝/离家时检查并提醒关闭所有窗户\",\n \"建议设置自动化规则:当灶具开启且烟雾报警器电池低电量时,发送高优先级提醒\",\n \"建议设置自动化规则:当温度传感器报告null值时立即告警,避免监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现多次异常读数和数据丢失,烟雾报警器电池低电量,且厨房窗户在住户离家后仍处于打开状态,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00和18:30分别报告2850和2860(即28.5°C和28.6°C),而同一时段其他房间温度约为24.5°C,厨房温度异常偏高约4°C,且当时灶具并未开启(灶具18:50才开启),这一温差不合理。", "推理步骤2: 厨房温度传感器在18:51和19:38两次报告MeasuredValue=None,表明传感器数据丢失或通信故障。正常传感器不应出现null值。", "推理步骤3: 20:44灶具再次开启,20:54厨房温度飙升至2878(28.78°C),同时烟雾报警器报告SmokeState=0(正常)。但此时烟雾报警器在前一天20:44已报告BatteryAlert=1(低电量警告),低电量可能影响报警器的检测灵敏度和可靠性。", "推理步骤4: 厨房窗户在19:37:30被打开(StateValue=False),但整个日志中再无关闭记录。住户在22:09关灯、锁门、关空调后离开或就寝,厨房窗户仍处于打开状态,存在安防隐患。", "推理步骤5: 住户的日常行为模式本身正常——早晨6:25起床、7:27出门、18:15回家、做饭、22:09就寝,门锁开关和运动传感器的时序一致,不存在入侵迹象。", "推理步骤6: 综合来看,核心问题是厨房温度传感器工作不稳定(异常高温读数+两次null值),烟雾报警器电池低电量削弱了厨房的火灾预警能力,厨房窗户未关闭增加了夜间安全风险。"], "key_evidence": ["厨房温度传感器在18:00/18:30报告2850/2860,比其他房间高约4°C,且灶具当时未开启", "厨房温度传感器在18:51和19:38两次报告MeasuredValue=None(数据丢失)", "烟雾报警器在2026-06-25T20:44报告BatteryAlert=1(低电量)", "20:44灶具开启后20:54厨房温度达2878,传感器读数波动剧烈", "厨房窗户19:37:30打开后至日志结束(23:30)未关闭,住户已就寝/离开"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾预警功能正常", "检查厨房温度传感器,排查异常高温读数和null值的原因(可能需要更换传感器或检查安装位置是否靠近热源)", "关闭厨房窗户,或设置自动化规则在就寝/离家时检查并提醒关闭所有窗户", "建议设置自动化规则:当灶具开启且烟雾报警器电池低电量时,发送高优先级提醒", "建议设置自动化规则:当温度传感器报告null值时立即告警,避免监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.670509338378906, "api_error": null} {"episode_id": "SQ4_TP_B_0732", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0732.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261361, "scenario_id": "BA-05", "total_events": 238, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-29T21:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房灶具在住户外出期间(07:08-17:55)持续处于开启状态长达近9小时无人关闭,存在安全隐患;同时厨房温度传感器多次报告 None 值,疑似设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:25 关灯、锁门离家(front_door_lock LockState=1, 手动上锁后自动锁定),但厨房灶具在 07:08 被开启后,直到 07:25 离家时并未关闭。\",\n \"推理步骤2: 住户离家后,整个白天(07:25-16:28)家中无任何运动传感器触发、无灯光操作,确认家中无人。但灶具从 07:08 一直保持开启状态。\",\n \"推理步骤3: 16:28 入户门解锁、有人进入,但未见任何厨房操作。17:55 住户正式回家后开灯开空调,直到 18:27 才再次操作厨房灶具(先关再开的记录缺失,说明灶具可能一直处于开启状态,或在 16:28-18:27 之间被静默关闭但日志未记录)。\",\n \"推理步骤4: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:52、07:09、18:28、19:21),这不是正常的温度读数,表明传感器可能存在故障或被灶具高温干扰。\",\n \"推理步骤5: 06:51 灶具显示 OnOff=False 后紧接着 07:08 又 OnOff=True,而 06:51 的关闭事件发生在住户起床(06:16)后、离家前,结合厨房窗户在灶具关闭后打开(通风),这是正常做早餐流程。但离家时未确认灶具关闭是安全隐患。\",\n \"推理步骤6: 烟雾报警器全天未触发,说明未发生明火或严重烟雾事件,但长时间无人看管的灶具仍属于火灾风险。\",\n \"推理步骤7: 其余设备行为正常——入户门开关锁流程合理、空调在回家后开启制冷(SystemMode=3)、晚间正常关灯就寝、洗碗机晚餐后启动、温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。\"\n ],\n \"key_evidence\": [\n \"07:08 厨房灶具开启(kitchen_cook_surface OnOff=True),07:25 住户离家锁门,灶具未见关闭记录\",\n \"07:25 至 16:28 家中无人(无运动传感器触发),灶具状态未变更\",\n \"厨房温度传感器多次报告 None 值(06:52、07:09、18:28、19:21),与灶具开关操作时间高度相关,疑似传感器故障或高温导致读数异常\",\n \"烟雾报警器未触发,未发生实际火灾,但风险客观存在\"\n ],\n \"recommended_actions\": [\n \"检查厨房灶具是否具备无人自动关闭功能,建议配置离家场景自动关闭灶具\",\n \"排查厨房温度传感器故障原因——多次报告 None 值不正常,可能需要更换传感器或调整安装位置(远离灶具热源)\",\n \"建议设置自动化规则:当入户门锁定且家中无运动检测时,自动检查并关闭灶具等高危设备\",\n \"建议设置灶具长时间开启(如超过30分钟无人操作)的告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房灶具在住户外出期间(07:08-17:55)持续处于开启状态长达近9小时无人关闭,存在安全隐患;同时厨房温度传感器多次报告 None 值,疑似设备故障。", "reasoning": ["推理步骤1: 住户于 07:25 关灯、锁门离家(front_door_lock LockState=1, 手动上锁后自动锁定),但厨房灶具在 07:08 被开启后,直到 07:25 离家时并未关闭。", "推理步骤2: 住户离家后,整个白天(07:25-16:28)家中无任何运动传感器触发、无灯光操作,确认家中无人。但灶具从 07:08 一直保持开启状态。", "推理步骤3: 16:28 入户门解锁、有人进入,但未见任何厨房操作。17:55 住户正式回家后开灯开空调,直到 18:27 才再次操作厨房灶具(先关再开的记录缺失,说明灶具可能一直处于开启状态,或在 16:28-18:27 之间被静默关闭但日志未记录)。", "推理步骤4: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:52、07:09、18:28、19:21),这不是正常的温度读数,表明传感器可能存在故障或被灶具高温干扰。", "推理步骤5: 06:51 灶具显示 OnOff=False 后紧接着 07:08 又 OnOff=True,而 06:51 的关闭事件发生在住户起床(06:16)后、离家前,结合厨房窗户在灶具关闭后打开(通风),这是正常做早餐流程。但离家时未确认灶具关闭是安全隐患。", "推理步骤6: 烟雾报警器全天未触发,说明未发生明火或严重烟雾事件,但长时间无人看管的灶具仍属于火灾风险。", "推理步骤7: 其余设备行为正常——入户门开关锁流程合理、空调在回家后开启制冷(SystemMode=3)、晚间正常关灯就寝、洗碗机晚餐后启动、温度曲线符合夏季昼夜变化规律(夜间约23°C,午间峰值约25.9°C)。"], "key_evidence": ["07:08 厨房灶具开启(kitchen_cook_surface OnOff=True),07:25 住户离家锁门,灶具未见关闭记录", "07:25 至 16:28 家中无人(无运动传感器触发),灶具状态未变更", "厨房温度传感器多次报告 None 值(06:52、07:09、18:28、19:21),与灶具开关操作时间高度相关,疑似传感器故障或高温导致读数异常", "烟雾报警器未触发,未发生实际火灾,但风险客观存在"], "recommended_actions": ["检查厨房灶具是否具备无人自动关闭功能,建议配置离家场景自动关闭灶具", "排查厨房温度传感器故障原因——多次报告 None 值不正常,可能需要更换传感器或调整安装位置(远离灶具热源)", "建议设置自动化规则:当入户门锁定且家中无运动检测时,自动检查并关闭灶具等高危设备", "建议设置灶具长时间开启(如超过30分钟无人操作)的告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.650925397872925, "api_error": null} {"episode_id": "SQ4_TP_B_0736", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0736.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261365, "scenario_id": "BA-05", "total_events": 232, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-24T23:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),同时厨房窗户在深夜仍处于打开状态,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然报告 2842(28.42°C),而同一时刻其他房间温度均在 24.28~24.44°C 范围内,厨房温度比其他房间高出约 4°C,且灶具尚未开启(19:09 才开启),这一跳变缺乏合理热源解释。\",\n \"推理步骤2: 19:10 和 19:39 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据采集失败或设备通信异常。19:30 再次报告 2832(28.32°C)的异常高值,进一步印证传感器工作状态不稳定。\",\n \"推理步骤3: 20:00 之后厨房温度恢复到与其他房间一致的水平(约 24°C),说明并非真实持续高温,更可能是传感器故障导致的虚假读数。\",\n \"推理步骤4: 19:38 厨房窗户被打开(contact=False),之后日志中再无关闭记录,意味着厨房窗户在住户就寝后仍处于打开状态,夜间存在安防风险。\",\n \"推理步骤5: 23:19 客厅运动传感器在所有灯关闭、住户应已就寝的情况下检测到占用,需关注是否为误报或有人活动。但该事件为孤立事件,无门锁或门磁配合,大概率为传感器灵敏度问题或宠物活动,威胁等级较低。\",\n \"推理步骤6: 其余设备行为均符合正常生活模式——早晨起床如厕、出门上班(门锁手动开锁后自动回锁)、傍晚回家开灯开空调、做饭后开洗碗机、睡前关灯锁门,无入侵或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数 2842(28.42°C),灶具尚未开启,其他房间温度仅约 24.4°C,温差异常\",\n \"19:10 和 19:39 厨房温度传感器连续两次报告 MeasuredValue = None,表明设备故障或通信中断\",\n \"19:30 厨房温度传感器再次报告异常高值 2832,20:00 后恢复正常,符合间歇性故障特征\",\n \"19:38 厨房窗户打开后至日志结束(23:30)未关闭,住户就寝后窗户仍敞开\",\n \"23:19 客厅运动传感器在全屋熄灯就寝后检测到占用事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,排除间歇性故障\",\n \"关闭厨房窗户或设置就寝模式自动提醒:当门锁上锁且灯全关时,若有窗户仍处于打开状态则发送通知\",\n \"检查客厅运动传感器灵敏度设置,确认 23:19 的占用事件是否为误触发,必要时调整检测阈值\",\n \"考虑为厨房温度传感器设置异常值过滤规则:当单次读数偏离相邻房间均值超过 3°C 时标记为可疑数据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),同时厨房窗户在深夜仍处于打开状态,存在安全隐患。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然报告 2842(28.42°C),而同一时刻其他房间温度均在 24.28~24.44°C 范围内,厨房温度比其他房间高出约 4°C,且灶具尚未开启(19:09 才开启),这一跳变缺乏合理热源解释。", "推理步骤2: 19:10 和 19:39 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据采集失败或设备通信异常。19:30 再次报告 2832(28.32°C)的异常高值,进一步印证传感器工作状态不稳定。", "推理步骤3: 20:00 之后厨房温度恢复到与其他房间一致的水平(约 24°C),说明并非真实持续高温,更可能是传感器故障导致的虚假读数。", "推理步骤4: 19:38 厨房窗户被打开(contact=False),之后日志中再无关闭记录,意味着厨房窗户在住户就寝后仍处于打开状态,夜间存在安防风险。", "推理步骤5: 23:19 客厅运动传感器在所有灯关闭、住户应已就寝的情况下检测到占用,需关注是否为误报或有人活动。但该事件为孤立事件,无门锁或门磁配合,大概率为传感器灵敏度问题或宠物活动,威胁等级较低。", "推理步骤6: 其余设备行为均符合正常生活模式——早晨起床如厕、出门上班(门锁手动开锁后自动回锁)、傍晚回家开灯开空调、做饭后开洗碗机、睡前关灯锁门,无入侵或火灾迹象。"], "key_evidence": ["19:00 厨房温度传感器读数 2842(28.42°C),灶具尚未开启,其他房间温度仅约 24.4°C,温差异常", "19:10 和 19:39 厨房温度传感器连续两次报告 MeasuredValue = None,表明设备故障或通信中断", "19:30 厨房温度传感器再次报告异常高值 2832,20:00 后恢复正常,符合间歇性故障特征", "19:38 厨房窗户打开后至日志结束(23:30)未关闭,住户就寝后窗户仍敞开", "23:19 客厅运动传感器在全屋熄灯就寝后检测到占用事件"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,排除间歇性故障", "关闭厨房窗户或设置就寝模式自动提醒:当门锁上锁且灯全关时,若有窗户仍处于打开状态则发送通知", "检查客厅运动传感器灵敏度设置,确认 23:19 的占用事件是否为误触发,必要时调整检测阈值", "考虑为厨房温度传感器设置异常值过滤规则:当单次读数偏离相邻房间均值超过 3°C 时标记为可疑数据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.977962493896484, "api_error": null} {"episode_id": "SQ4_TP_B_0741", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0741.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261370, "scenario_id": "INS-02", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-06T21:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"入户门锁在深夜21:30连续4次操作失败并触发强制入侵报警,高度疑似非法闯入尝试。\",\n \"reasoning\": [\n \"推理步骤1: 在21:30:00至21:30:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示来自外部物理操作(如键盘输入密码),OperationError=1表示凭证无效/密码错误。\",\n \"推理步骤2: 4次错误密码尝试间隔极短(15秒、10秒、15秒),呈现快速连续试错的模式,不符合住户偶尔输错密码的正常行为。\",\n \"推理步骤3: 紧随其后在21:30:50触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3在Matter DoorLock Cluster中对应'Wrong Code Entry Limit'或强制入侵告警,说明门锁自身已判定这是异常行为并主动报警。\",\n \"推理步骤4: 事件发生在晚间21:30,整个日志中没有任何入户门开启(front_door_contact)、玄关运动检测(entrance_occupancy)或门锁成功解锁的记录,说明全天无人正常进出,家中可能无人或住户已在家中,此时的外部开锁尝试更加可疑。\",\n \"推理步骤5: 温度数据方面,全天四个传感器的温度变化呈现正常的昼夜曲线(夜间约22.9°C → 正午峰值约25.9°C → 夜间回落至23.3°C),各房间温度高度一致,无异常热源,排除火灾等其他威胁。\"\n ],\n \"key_evidence\": [\n \"21:30:00-21:30:40期间入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒\",\n \"21:30:50门锁触发DoorLockAlarm(AlarmCode=3),表明错误尝试次数已达门锁安全阈值\",\n \"全天无门锁成功解锁或入户门开启记录,表明该操作并非住户行为\"\n ],\n \"recommended_actions\": [\n \"立即通过手机查看入户门区域的实时状态,确认门锁当前是否处于锁定状态\",\n \"如家中有摄像头,立即回放21:30前后的入户门走廊录像,确认是否有可疑人员\",\n \"考虑立即报警或通知物业安保前往查看\",\n \"临时启用门锁的更高安全策略(如降低错误尝试次数上限、延长锁定时间)\",\n \"检查门锁密码是否存在泄露风险,建议更换门锁密码\",\n \"建议在入户门区域增设摄像头或可视门铃,提升事后追溯能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "入户门锁在深夜21:30连续4次操作失败并触发强制入侵报警,高度疑似非法闯入尝试。", "reasoning": ["推理步骤1: 在21:30:00至21:30:40的40秒内,入户门锁连续报告了4次LockOperationError(OperationError=1, OperationSource=3)。OperationSource=3通常表示来自外部物理操作(如键盘输入密码),OperationError=1表示凭证无效/密码错误。", "推理步骤2: 4次错误密码尝试间隔极短(15秒、10秒、15秒),呈现快速连续试错的模式,不符合住户偶尔输错密码的正常行为。", "推理步骤3: 紧随其后在21:30:50触发了DoorLockAlarm(AlarmCode=3)。AlarmCode=3在Matter DoorLock Cluster中对应'Wrong Code Entry Limit'或强制入侵告警,说明门锁自身已判定这是异常行为并主动报警。", "推理步骤4: 事件发生在晚间21:30,整个日志中没有任何入户门开启(front_door_contact)、玄关运动检测(entrance_occupancy)或门锁成功解锁的记录,说明全天无人正常进出,家中可能无人或住户已在家中,此时的外部开锁尝试更加可疑。", "推理步骤5: 温度数据方面,全天四个传感器的温度变化呈现正常的昼夜曲线(夜间约22.9°C → 正午峰值约25.9°C → 夜间回落至23.3°C),各房间温度高度一致,无异常热源,排除火灾等其他威胁。"], "key_evidence": ["21:30:00-21:30:40期间入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3),间隔仅10-15秒", "21:30:50门锁触发DoorLockAlarm(AlarmCode=3),表明错误尝试次数已达门锁安全阈值", "全天无门锁成功解锁或入户门开启记录,表明该操作并非住户行为"], "recommended_actions": ["立即通过手机查看入户门区域的实时状态,确认门锁当前是否处于锁定状态", "如家中有摄像头,立即回放21:30前后的入户门走廊录像,确认是否有可疑人员", "考虑立即报警或通知物业安保前往查看", "临时启用门锁的更高安全策略(如降低错误尝试次数上限、延长锁定时间)", "检查门锁密码是否存在泄露风险,建议更换门锁密码", "建议在入户门区域增设摄像头或可视门铃,提升事后追溯能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.574029207229614, "api_error": null} {"episode_id": "SQ4_TP_B_0738", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0738.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261367, "scenario_id": "FG-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-30T11:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在11:18和11:23出现两次异常高温读数(35.26°C和32.00°C),厨房温度传感器在19:00和19:30出现异常高温读数(28.32°C和28.39°C)且中间两次报告None值,同时11:28厨房烟雾报警器触发,多个传感器存在故障嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器在11:00报告2552(25.52°C),但11:18突然跳至3526(35.26°C),11:23为3200(32.00°C),而11:30又恢复到2555(25.55°C)。这两次读数偏离正常值约10°C,且使用了非标准的属性格式(缺少TemperatureMeasurement前缀),持续时间极短后自行恢复,不符合真实环境温度变化规律,高度疑似传感器故障或数据异常。\",\n \"推理步骤2: 11:28厨房烟雾报警器触发(SmokeState=1),但同一时段厨房温度传感器读数正常(2540-2556),厨房灶具处于关闭状态,厨房灯也未开启,家中无人(住户07:39已出门)。没有任何烹饪活动或火源的佐证,烟雾报警很可能是误报,但也不能完全排除风险,因为此时恰好客厅传感器也在报异常数据。\",\n \"推理步骤3: 厨房温度传感器在19:00报告2832(28.32°C),而同时段其他房间温度约为24.3-24.5°C,偏高约4°C。19:07和19:29两次报告MeasuredValue=None(空值),19:30又恢复到2839(28.39°C)。虽然19:06灶具开启可以部分解释温度偏高,但None值表明传感器存在间歇性通信故障或硬件问题。\",\n \"推理步骤4: 住户的日常行为模式本身是正常的——早晨06:37起床、07:39出门上班、18:22回家、开空调做饭、21:57关灯休息,入户门锁的开关和自动上锁均正常。但传感器数据异常需要关注,因为传感器是整个安全系统的感知基础,传感器不可靠会导致真实威胁无法被检测。\",\n \"推理步骤5: 烟雾报警触发后,日志中没有任何后续处理记录(如报警解除、用户确认等),且住户当时不在家,这意味着如果是真实烟雾事件,无人响应存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"11:18客厅温度传感器读数3526(35.26°C),11:23读数3200(32.00°C),使用非标准属性格式,11:30恢复正常2555\",\n \"11:28厨房烟雾报警器SmokeState=1触发,但无任何火源或烹饪活动佐证,住户不在家\",\n \"19:00厨房温度传感器读数2832(28.32°C)异常偏高,19:07和19:29两次报告MeasuredValue=None\",\n \"烟雾报警触发后无后续解除或确认记录\"\n ],\n \"recommended_actions\": [\n \"检查客厅温度传感器硬件状态,确认是否存在接触不良、固件bug或电磁干扰,必要时更换设备\",\n \"检查厨房温度传感器,重点排查间歇性断连(None值)的原因,检查电池电量和无线信号强度\",\n \"检查厨房烟雾报警器是否需要清洁或校准,确认11:28的报警是否已解除,排除真实烟雾残留的可能\",\n \"建议为烟雾报警器配置远程推送通知,确保住户不在家时也能第一时间收到警报并采取行动\",\n \"考虑增加传感器数据校验规则:当单个传感器读数突变超过阈值且与相邻房间不一致时,标记为疑似故障而非直接触发警报,减少误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在11:18和11:23出现两次异常高温读数(35.26°C和32.00°C),厨房温度传感器在19:00和19:30出现异常高温读数(28.32°C和28.39°C)且中间两次报告None值,同时11:28厨房烟雾报警器触发,多个传感器存在故障嫌疑。", "reasoning": ["推理步骤1: 客厅温度传感器在11:00报告2552(25.52°C),但11:18突然跳至3526(35.26°C),11:23为3200(32.00°C),而11:30又恢复到2555(25.55°C)。这两次读数偏离正常值约10°C,且使用了非标准的属性格式(缺少TemperatureMeasurement前缀),持续时间极短后自行恢复,不符合真实环境温度变化规律,高度疑似传感器故障或数据异常。", "推理步骤2: 11:28厨房烟雾报警器触发(SmokeState=1),但同一时段厨房温度传感器读数正常(2540-2556),厨房灶具处于关闭状态,厨房灯也未开启,家中无人(住户07:39已出门)。没有任何烹饪活动或火源的佐证,烟雾报警很可能是误报,但也不能完全排除风险,因为此时恰好客厅传感器也在报异常数据。", "推理步骤3: 厨房温度传感器在19:00报告2832(28.32°C),而同时段其他房间温度约为24.3-24.5°C,偏高约4°C。19:07和19:29两次报告MeasuredValue=None(空值),19:30又恢复到2839(28.39°C)。虽然19:06灶具开启可以部分解释温度偏高,但None值表明传感器存在间歇性通信故障或硬件问题。", "推理步骤4: 住户的日常行为模式本身是正常的——早晨06:37起床、07:39出门上班、18:22回家、开空调做饭、21:57关灯休息,入户门锁的开关和自动上锁均正常。但传感器数据异常需要关注,因为传感器是整个安全系统的感知基础,传感器不可靠会导致真实威胁无法被检测。", "推理步骤5: 烟雾报警触发后,日志中没有任何后续处理记录(如报警解除、用户确认等),且住户当时不在家,这意味着如果是真实烟雾事件,无人响应存在安全隐患。"], "key_evidence": ["11:18客厅温度传感器读数3526(35.26°C),11:23读数3200(32.00°C),使用非标准属性格式,11:30恢复正常2555", "11:28厨房烟雾报警器SmokeState=1触发,但无任何火源或烹饪活动佐证,住户不在家", "19:00厨房温度传感器读数2832(28.32°C)异常偏高,19:07和19:29两次报告MeasuredValue=None", "烟雾报警触发后无后续解除或确认记录"], "recommended_actions": ["检查客厅温度传感器硬件状态,确认是否存在接触不良、固件bug或电磁干扰,必要时更换设备", "检查厨房温度传感器,重点排查间歇性断连(None值)的原因,检查电池电量和无线信号强度", "检查厨房烟雾报警器是否需要清洁或校准,确认11:28的报警是否已解除,排除真实烟雾残留的可能", "建议为烟雾报警器配置远程推送通知,确保住户不在家时也能第一时间收到警报并采取行动", "考虑增加传感器数据校验规则:当单个传感器读数突变超过阈值且与相邻房间不一致时,标记为疑似故障而非直接触发警报,减少误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.709805250167847, "api_error": null} {"episode_id": "SQ4_TP_B_0744", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0744.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261373, "scenario_id": "FG-01", "total_events": 238, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-02T17:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在无人在家时灶具被开启,温度急剧飙升并触发烟雾报警,且厨房温度传感器出现多次读数异常(None值),存在火灾风险和设备故障隐患。\",\n \"reasoning\": [\n \"推理步骤1: 住户于07:29通过手动操作解锁入户门离家,门锁随后自动上锁,此后至18:25无任何入户门操作,说明07:29~18:25期间家中无人。\",\n \"推理步骤2: 17:03厨房灶具被开启(kitchen_cook_surface OnOff=True),但同一时刻主卧运动传感器显示无人(Occupancy=0),且全屋无任何运动传感器报告有人活动,灶具在无人状态下启动极为异常。\",\n \"推理步骤3: 灶具开启后厨房温度在5分钟内从2479(约24.8°C)飙升至2949(约29.5°C),10分钟后达到3500(约35.0°C),升幅超过10°C,远超正常烹饪引起的环境温度变化。\",\n \"推理步骤4: 17:18厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认产生了烟雾,这是火灾风险的直接证据。\",\n \"推理步骤5: 日志中未见灶具在17:18报警后被关闭的记录,直到住户18:25回家后也未立即处理,灶具下一次出现状态是19:10再次开启,说明第一次开启的关闭时间不明。\",\n \"推理步骤6: 19:00厨房温度传感器读数为2827(约28.3°C),远高于同时段其他房间的24°C左右,且19:11和19:38两次报告MeasuredValue=None,传感器可能因高温损坏或出现故障。\",\n \"推理步骤7: 22:04住户关灯、关空调、锁门入睡,但厨房窗户在19:37被打开后(StateValue=False),日志中无关闭记录,夜间厨房窗户保持开启状态存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"17:03 厨房灶具在全屋无人时自动开启\",\n \"17:08 厨房温度5分钟内从约24.8°C飙升至约29.5°C,17:13达到约35.0°C\",\n \"17:18 厨房烟雾报警器触发 SmokeAlarm 事件\",\n \"19:11 和 19:38 厨房温度传感器返回 None,疑似传感器故障\",\n \"19:00 厨房温度仍高达约28.3°C,显著高于其他房间\",\n \"厨房窗户自19:37打开后未见关闭记录,夜间处于开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具17:03无人启动的原因:排查是否存在设备故障、误触、或远程控制被非法访问的可能\",\n \"检修厨房温度传感器,两次返回None值表明传感器可能已因高温受损或存在通信故障\",\n \"为灶具设置安全联动规则:当全屋无人(所有运动传感器Occupancy=0)时禁止灶具开启,或开启后自动告警\",\n \"设置烟雾报警联动自动化:触发烟雾报警时自动关闭灶具、打开窗户通风、并向住户手机推送紧急通知\",\n \"确认厨房窗户当前状态,夜间无人区域窗户开启存在入侵风险,建议关闭并锁好\",\n \"审查智能家居系统的远程访问日志,排除未授权访问导致灶具被远程开启的可能性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在无人在家时灶具被开启,温度急剧飙升并触发烟雾报警,且厨房温度传感器出现多次读数异常(None值),存在火灾风险和设备故障隐患。", "reasoning": ["推理步骤1: 住户于07:29通过手动操作解锁入户门离家,门锁随后自动上锁,此后至18:25无任何入户门操作,说明07:29~18:25期间家中无人。", "推理步骤2: 17:03厨房灶具被开启(kitchen_cook_surface OnOff=True),但同一时刻主卧运动传感器显示无人(Occupancy=0),且全屋无任何运动传感器报告有人活动,灶具在无人状态下启动极为异常。", "推理步骤3: 灶具开启后厨房温度在5分钟内从2479(约24.8°C)飙升至2949(约29.5°C),10分钟后达到3500(约35.0°C),升幅超过10°C,远超正常烹饪引起的环境温度变化。", "推理步骤4: 17:18厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认产生了烟雾,这是火灾风险的直接证据。", "推理步骤5: 日志中未见灶具在17:18报警后被关闭的记录,直到住户18:25回家后也未立即处理,灶具下一次出现状态是19:10再次开启,说明第一次开启的关闭时间不明。", "推理步骤6: 19:00厨房温度传感器读数为2827(约28.3°C),远高于同时段其他房间的24°C左右,且19:11和19:38两次报告MeasuredValue=None,传感器可能因高温损坏或出现故障。", "推理步骤7: 22:04住户关灯、关空调、锁门入睡,但厨房窗户在19:37被打开后(StateValue=False),日志中无关闭记录,夜间厨房窗户保持开启状态存在安全隐患。"], "key_evidence": ["17:03 厨房灶具在全屋无人时自动开启", "17:08 厨房温度5分钟内从约24.8°C飙升至约29.5°C,17:13达到约35.0°C", "17:18 厨房烟雾报警器触发 SmokeAlarm 事件", "19:11 和 19:38 厨房温度传感器返回 None,疑似传感器故障", "19:00 厨房温度仍高达约28.3°C,显著高于其他房间", "厨房窗户自19:37打开后未见关闭记录,夜间处于开启状态"], "recommended_actions": ["立即检查厨房灶具17:03无人启动的原因:排查是否存在设备故障、误触、或远程控制被非法访问的可能", "检修厨房温度传感器,两次返回None值表明传感器可能已因高温受损或存在通信故障", "为灶具设置安全联动规则:当全屋无人(所有运动传感器Occupancy=0)时禁止灶具开启,或开启后自动告警", "设置烟雾报警联动自动化:触发烟雾报警时自动关闭灶具、打开窗户通风、并向住户手机推送紧急通知", "确认厨房窗户当前状态,夜间无人区域窗户开启存在入侵风险,建议关闭并锁好", "审查智能家居系统的远程访问日志,排除未授权访问导致灶具被远程开启的可能性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.310789823532104, "api_error": null} {"episode_id": "SQ4_TP_B_0760", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0760.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261389, "scenario_id": "DF-03", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-03", "scenario_name": "运动传感器持续触发", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_malfunction", "key_evidence": ["运动传感器高频率周期性触发", "该房间无其他活动迹象(灯关、无门窗事件)", "周期性极其规律(不像人类活动的随机性)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-26T23:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,且厨房窗户在做饭结束后开启至今未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2450(24.5°C)跳升至 2842(28.42°C),涨幅近 4°C,而此时灶具尚未开启(19:09:30 才开),其他房间温度同期仅在 24.3°C 左右,排除全屋升温因素。\",\n \"推理步骤2: 19:10 和 19:38 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器故障或通信异常。灶具 19:09:30 开启、19:37 关闭期间正是需要温度监控的关键时段,传感器却失效,存在安全监控盲区。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2825(28.25°C),仍显著高于其他房间(约 24.3°C)。到 20:00 回落至 2418(24.18°C),说明灶具关闭和开窗通风后温度恢复正常,但 19:00 灶具未开时就出现 28.4°C 的异常高温,不能完全用烹饪解释。\",\n \"推理步骤4: 厨房窗户在 19:37:30 打开(StateValue=False),之后日志中再无关闭记录,截至 23:30 仍处于开启状态。夜间无人区域窗户长时间敞开存在安全隐患(入侵风险、雨水等)。\",\n \"推理步骤5: 其余设备行为均属正常——凌晨全屋安静,06:27 起床如厕,07:40 出门上班(门锁手动开锁→关门→自动上锁),18:12 回家(开锁→开灯→开空调),19:09 做饭,21:53 关灯关空调准备休息,23:03 主卧有人活动后入睡。入户门锁操作、运动传感器触发、温度日变化曲线均符合单人居住的正常作息。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。主卧 23:03-23:04 的运动传感器快速交替触发属于睡前翻身等正常活动。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2842(28.42°C),灶具此时尚未开启,其他房间温度仅约 24.3°C\",\n \"19:10 和 19:38 厨房温度传感器两次报告 MeasuredValue = None,烹饪期间温度监控中断\",\n \"厨房窗户 19:37:30 打开后至日志结束(23:30)未关闭\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,排查 null 读数和异常跳变的原因(可能是传感器靠近热源、通信干扰或硬件老化)\",\n \"关闭厨房窗户,或设置自动化规则:当无人在厨房且灶具关闭超过一定时间后,提醒用户关窗\",\n \"考虑为厨房温度传感器设置异常值告警(如温度突变超过 3°C/30min 或出现 null 值时立即通知),避免烹饪期间出现监控盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,且厨房窗户在做饭结束后开启至今未关闭。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2450(24.5°C)跳升至 2842(28.42°C),涨幅近 4°C,而此时灶具尚未开启(19:09:30 才开),其他房间温度同期仅在 24.3°C 左右,排除全屋升温因素。", "推理步骤2: 19:10 和 19:38 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失。Matter 协议下 null 值通常意味着传感器故障或通信异常。灶具 19:09:30 开启、19:37 关闭期间正是需要温度监控的关键时段,传感器却失效,存在安全监控盲区。", "推理步骤3: 19:30 传感器恢复后读数为 2825(28.25°C),仍显著高于其他房间(约 24.3°C)。到 20:00 回落至 2418(24.18°C),说明灶具关闭和开窗通风后温度恢复正常,但 19:00 灶具未开时就出现 28.4°C 的异常高温,不能完全用烹饪解释。", "推理步骤4: 厨房窗户在 19:37:30 打开(StateValue=False),之后日志中再无关闭记录,截至 23:30 仍处于开启状态。夜间无人区域窗户长时间敞开存在安全隐患(入侵风险、雨水等)。", "推理步骤5: 其余设备行为均属正常——凌晨全屋安静,06:27 起床如厕,07:40 出门上班(门锁手动开锁→关门→自动上锁),18:12 回家(开锁→开灯→开空调),19:09 做饭,21:53 关灯关空调准备休息,23:03 主卧有人活动后入睡。入户门锁操作、运动传感器触发、温度日变化曲线均符合单人居住的正常作息。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,排除火灾和漏水风险。主卧 23:03-23:04 的运动传感器快速交替触发属于睡前翻身等正常活动。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2842(28.42°C),灶具此时尚未开启,其他房间温度仅约 24.3°C", "19:10 和 19:38 厨房温度传感器两次报告 MeasuredValue = None,烹饪期间温度监控中断", "厨房窗户 19:37:30 打开后至日志结束(23:30)未关闭"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,排查 null 读数和异常跳变的原因(可能是传感器靠近热源、通信干扰或硬件老化)", "关闭厨房窗户,或设置自动化规则:当无人在厨房且灶具关闭超过一定时间后,提醒用户关窗", "考虑为厨房温度传感器设置异常值告警(如温度突变超过 3°C/30min 或出现 null 值时立即通知),避免烹饪期间出现监控盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.45650291442871, "api_error": null} {"episode_id": "SQ4_TP_B_0768", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0768.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261397, "scenario_id": "WD-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-30T17:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在17:26至17:56期间持续报警,且住户在家期间未见任何处置动作,漏水风险持续存在。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在17:26、17:36、17:56连续三次报告StateValue=True,间隔约10-20分钟,说明漏水状态持续未消除,不是瞬时误触发。\",\n \"推理步骤2: 16:15住户已通过入户门锁回家(手动开锁+入户门传感器+玄关运动传感器触发),但从17:26漏水报警开始直到日志结束(23:30),未见任何针对漏水的处置动作(如关闭阀门、卫生间灯亮起或运动传感器触发等),说明住户可能未注意到报警。\",\n \"推理步骤3: 18:07住户再次进门(可能是第二位住户),之后活动集中在客厅和厨房(开灯、开空调、做饭),卫生间方向始终无人活动迹象,漏水问题很可能被忽视。\",\n \"推理步骤4: 厨房温度传感器在07:00:06、07:03:00、18:47:00、19:10:00多次报告MeasuredValue=None,与灶具开启时间高度吻合,属于灶具工作时传感器受热干扰的已知行为,不构成独立威胁。\",\n \"推理步骤5: 厨房窗户在灶具关闭后打开(07:02:30和19:09:30),属于做饭后通风的正常操作。但07:02:30开窗后直到日志结束未见关窗记录,窗户可能一直处于开启状态,存在轻微安全隐患(外出期间窗户未关)。\",\n \"推理步骤6: 入户门锁操作均为手动开锁后自动上锁,模式正常;22:23确认入户门关闭并自动上锁,夜间门禁安全。\",\n \"推理步骤7: 全天温度变化符合夏季昼夜规律(夜间约23°C,午间峰值约25.8°C),无异常热源迹象。\"\n ],\n \"key_evidence\": [\n \"17:26、17:36、17:56 卫生间漏水传感器连续三次报告 StateValue=True,持续至少30分钟\",\n \"漏水期间及之后无卫生间运动传感器或灯光触发记录,表明无人前往处置\",\n \"厨房窗户07:02:30开启后全天无关闭记录,住户07:28外出至16:15期间窗户处于开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗手台等),必要时关闭卫生间水阀\",\n \"检查漏水是否已造成地面积水或渗透到邻近区域,防止地板损坏或触电风险\",\n \"确认厨房窗户当前状态,夜间及外出时建议关闭以保障安全\",\n \"建议为漏水传感器配置主动推送告警(如手机通知),避免报警被忽视\",\n \"检查厨房温度传感器安装位置,频繁出现None读数可能说明传感器距灶具过近,建议调整位置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在17:26至17:56期间持续报警,且住户在家期间未见任何处置动作,漏水风险持续存在。", "reasoning": ["推理步骤1: 卫生间漏水传感器在17:26、17:36、17:56连续三次报告StateValue=True,间隔约10-20分钟,说明漏水状态持续未消除,不是瞬时误触发。", "推理步骤2: 16:15住户已通过入户门锁回家(手动开锁+入户门传感器+玄关运动传感器触发),但从17:26漏水报警开始直到日志结束(23:30),未见任何针对漏水的处置动作(如关闭阀门、卫生间灯亮起或运动传感器触发等),说明住户可能未注意到报警。", "推理步骤3: 18:07住户再次进门(可能是第二位住户),之后活动集中在客厅和厨房(开灯、开空调、做饭),卫生间方向始终无人活动迹象,漏水问题很可能被忽视。", "推理步骤4: 厨房温度传感器在07:00:06、07:03:00、18:47:00、19:10:00多次报告MeasuredValue=None,与灶具开启时间高度吻合,属于灶具工作时传感器受热干扰的已知行为,不构成独立威胁。", "推理步骤5: 厨房窗户在灶具关闭后打开(07:02:30和19:09:30),属于做饭后通风的正常操作。但07:02:30开窗后直到日志结束未见关窗记录,窗户可能一直处于开启状态,存在轻微安全隐患(外出期间窗户未关)。", "推理步骤6: 入户门锁操作均为手动开锁后自动上锁,模式正常;22:23确认入户门关闭并自动上锁,夜间门禁安全。", "推理步骤7: 全天温度变化符合夏季昼夜规律(夜间约23°C,午间峰值约25.8°C),无异常热源迹象。"], "key_evidence": ["17:26、17:36、17:56 卫生间漏水传感器连续三次报告 StateValue=True,持续至少30分钟", "漏水期间及之后无卫生间运动传感器或灯光触发记录,表明无人前往处置", "厨房窗户07:02:30开启后全天无关闭记录,住户07:28外出至16:15期间窗户处于开启状态"], "recommended_actions": ["立即检查卫生间漏水情况,确认漏水源头(水管接头、马桶、洗手台等),必要时关闭卫生间水阀", "检查漏水是否已造成地面积水或渗透到邻近区域,防止地板损坏或触电风险", "确认厨房窗户当前状态,夜间及外出时建议关闭以保障安全", "建议为漏水传感器配置主动推送告警(如手机通知),避免报警被忽视", "检查厨房温度传感器安装位置,频繁出现None读数可能说明传感器距灶具过近,建议调整位置"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.240322828292847, "api_error": null} {"episode_id": "SQ4_TP_B_0767", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0767.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261396, "scenario_id": "INS-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-25T05:13:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion/device_fault\",\n \"threat_description\": \"凌晨5:13发生连续4次门锁操作失败并触发防撬报警,同时厨房温度传感器出现异常高温读数和多次空值,存在入侵未遂和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 在05:13:00至05:13:40的40秒内,入户门锁连续产生4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示来自外部物理操作(如钥匙或暴力尝试),短时间内连续失败高度可疑。\",\n \"推理步骤2: 紧接着在05:13:50,门锁触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'或强制入侵类报警,说明门锁自身已判定这是一次异常操作序列。\",\n \"推理步骤3: 事件发生在凌晨5:13,属于深夜/凌晨时段,此时住户大概率在睡眠中(从日志看00:00-06:30期间无任何人体活动或灯光事件),非正常出入时间,入侵嫌疑更大。\",\n \"推理步骤4: 入侵尝试未成功——门锁状态始终未变为Unlocked(LockState=2),门磁传感器也未报告开门(BooleanState.StateValue未变为False),说明入侵者未能进入。\",\n \"推理步骤5: 厨房温度传感器在18:00突然从约24.7°C跳升至28.7°C(2466→2870),18:30仍为28.55°C(2855),而同时段其他房间温度正常下降。这一异常升温发生在灶具开启(18:45)之前,不能用烹饪解释。\",\n \"推理步骤6: 厨房温度传感器在18:46和19:44两次报告MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。19:00恢复正常读数2433后,19:44再次出现空值,不稳定性明显。\",\n \"推理步骤7: 厨房窗户在19:43:30被打开(StateValue=False),但直到日志结束(23:30)都未关闭,住户已于22:13关灯就寝,窗户整夜未关存在安全隐患。\",\n \"推理步骤8: 其余设备行为正常——住户约06:30起床(卫生间活动),07:30出门上班(手动开锁、开关门、自动上锁),18:07回家(开锁进门、开灯开空调),22:13就寝(关灯关空调、门锁自动上锁),符合单人上班族的日常作息。\"\n ],\n \"key_evidence\": [\n \"05:13:00-05:13:40 入户门锁连续4次LockOperationError(OperationSource=3,外部物理操作)\",\n \"05:13:50 门锁触发DoorLockAlarm(AlarmCode=3),确认异常操作报警\",\n \"18:00 厨房温度异常飙升至28.7°C(其他房间约24.7°C),灶具尚未开启\",\n \"18:46和19:44 厨房温度传感器两次报告空值(MeasuredValue=None),疑似传感器故障\",\n \"19:43 厨房窗户打开后至日志结束未关闭,住户已就寝\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁及门口区域,查看是否有撬锁痕迹或可疑物品,建议调取门口监控录像确认05:13前后是否有可疑人员\",\n \"考虑加强入户门安全措施:启用门锁连续失败后的即时推送告警,必要时加装智能门铃摄像头\",\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排查两次空值读数和异常高温的原因\",\n \"关闭厨房窗户或设置就寝模式自动检查所有窗户关闭状态,避免夜间窗户敞开带来的安全和天气风险\",\n \"建议向物业或社区安保报告凌晨门锁异常事件,提醒邻居注意安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion/device_fault", "threat_description": "凌晨5:13发生连续4次门锁操作失败并触发防撬报警,同时厨房温度传感器出现异常高温读数和多次空值,存在入侵未遂和设备故障双重风险。", "reasoning": ["推理步骤1: 在05:13:00至05:13:40的40秒内,入户门锁连续产生4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示来自外部物理操作(如钥匙或暴力尝试),短时间内连续失败高度可疑。", "推理步骤2: 紧接着在05:13:50,门锁触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'或强制入侵类报警,说明门锁自身已判定这是一次异常操作序列。", "推理步骤3: 事件发生在凌晨5:13,属于深夜/凌晨时段,此时住户大概率在睡眠中(从日志看00:00-06:30期间无任何人体活动或灯光事件),非正常出入时间,入侵嫌疑更大。", "推理步骤4: 入侵尝试未成功——门锁状态始终未变为Unlocked(LockState=2),门磁传感器也未报告开门(BooleanState.StateValue未变为False),说明入侵者未能进入。", "推理步骤5: 厨房温度传感器在18:00突然从约24.7°C跳升至28.7°C(2466→2870),18:30仍为28.55°C(2855),而同时段其他房间温度正常下降。这一异常升温发生在灶具开启(18:45)之前,不能用烹饪解释。", "推理步骤6: 厨房温度传感器在18:46和19:44两次报告MeasuredValue=None(空值),表明传感器可能存在故障或通信异常。19:00恢复正常读数2433后,19:44再次出现空值,不稳定性明显。", "推理步骤7: 厨房窗户在19:43:30被打开(StateValue=False),但直到日志结束(23:30)都未关闭,住户已于22:13关灯就寝,窗户整夜未关存在安全隐患。", "推理步骤8: 其余设备行为正常——住户约06:30起床(卫生间活动),07:30出门上班(手动开锁、开关门、自动上锁),18:07回家(开锁进门、开灯开空调),22:13就寝(关灯关空调、门锁自动上锁),符合单人上班族的日常作息。"], "key_evidence": ["05:13:00-05:13:40 入户门锁连续4次LockOperationError(OperationSource=3,外部物理操作)", "05:13:50 门锁触发DoorLockAlarm(AlarmCode=3),确认异常操作报警", "18:00 厨房温度异常飙升至28.7°C(其他房间约24.7°C),灶具尚未开启", "18:46和19:44 厨房温度传感器两次报告空值(MeasuredValue=None),疑似传感器故障", "19:43 厨房窗户打开后至日志结束未关闭,住户已就寝"], "recommended_actions": ["立即检查入户门锁及门口区域,查看是否有撬锁痕迹或可疑物品,建议调取门口监控录像确认05:13前后是否有可疑人员", "考虑加强入户门安全措施:启用门锁连续失败后的即时推送告警,必要时加装智能门铃摄像头", "检查厨房温度传感器硬件状态,清洁或更换传感器,排查两次空值读数和异常高温的原因", "关闭厨房窗户或设置就寝模式自动检查所有窗户关闭状态,避免夜间窗户敞开带来的安全和天气风险", "建议向物业或社区安保报告凌晨门锁异常事件,提醒邻居注意安全"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.149344205856323, "api_error": null} {"episode_id": "SQ4_TP_B_0770", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0770.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261399, "scenario_id": "DF-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-05T10:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障,同时厨房窗户在睡前未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2452(24.52°C)跳升至 2835(28.35°C),而同一时刻其他房间温度仅在 24.3-24.5°C 范围,温差接近 4°C,远超正常室间差异。\",\n \"推理步骤2: 19:10 灶具开启后,19:11 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None(空值),说明传感器在高温环境下出现数据采集失败。\",\n \"推理步骤3: 19:30 厨房温度传感器再次报告 2835,与 19:00 的异常值完全一致,正常传感器在灶具运行期间应有渐变读数而非固定值,进一步印证传感器卡死或故障。\",\n \"推理步骤4: 19:34 灶具关闭、19:34:30 厨房窗户打开通风,20:00 厨房温度恢复到 2420(24.20°C),说明实际厨房温度已正常回落,但传感器此前的行为仍属异常。\",\n \"推理步骤5: 厨房窗户在 19:34:30 打开后,日志中直到 23:30 结束都没有关闭记录(无 StateValue = True),住户已于 21:57 关灯锁门进入睡眠状态,窗户整夜未关存在安全隐患。\",\n \"推理步骤6: 其余设备行为均正常——住户早晨 6:50 起床、7:27 出门上班、18:14 回家、19:10 做饭、21:57 睡前关灯锁门,入户门锁开关和自动上锁逻辑正确,烟雾报警器和漏水传感器无告警,不存在入侵或火灾/漏水威胁。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器从 ~2452 骤升至 2835,与其他房间温度偏差约 4°C\",\n \"19:11 和 19:35 厨房温度传感器报告 MeasuredValue = None,数据采集失败\",\n \"19:30 厨房温度传感器再次报告 2835,与 19:00 完全一致,疑似读数卡死\",\n \"厨房窗户 19:34:30 打开(StateValue = False)后至日志结束(23:30)无关闭记录,住户已入睡\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,必要时重新校准或更换传感器\",\n \"排查传感器固件是否需要更新,解决高温环境下报告 None 值的问题\",\n \"关闭厨房窗户,或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户\",\n \"考虑为厨房窗户添加定时未关闭告警,避免夜间窗户敞开带来的安防风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失(None),疑似传感器故障,同时厨房窗户在睡前未关闭。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2452(24.52°C)跳升至 2835(28.35°C),而同一时刻其他房间温度仅在 24.3-24.5°C 范围,温差接近 4°C,远超正常室间差异。", "推理步骤2: 19:10 灶具开启后,19:11 和 19:35 厨房温度传感器连续两次报告 MeasuredValue = None(空值),说明传感器在高温环境下出现数据采集失败。", "推理步骤3: 19:30 厨房温度传感器再次报告 2835,与 19:00 的异常值完全一致,正常传感器在灶具运行期间应有渐变读数而非固定值,进一步印证传感器卡死或故障。", "推理步骤4: 19:34 灶具关闭、19:34:30 厨房窗户打开通风,20:00 厨房温度恢复到 2420(24.20°C),说明实际厨房温度已正常回落,但传感器此前的行为仍属异常。", "推理步骤5: 厨房窗户在 19:34:30 打开后,日志中直到 23:30 结束都没有关闭记录(无 StateValue = True),住户已于 21:57 关灯锁门进入睡眠状态,窗户整夜未关存在安全隐患。", "推理步骤6: 其余设备行为均正常——住户早晨 6:50 起床、7:27 出门上班、18:14 回家、19:10 做饭、21:57 睡前关灯锁门,入户门锁开关和自动上锁逻辑正确,烟雾报警器和漏水传感器无告警,不存在入侵或火灾/漏水威胁。"], "key_evidence": ["19:00 厨房温度传感器从 ~2452 骤升至 2835,与其他房间温度偏差约 4°C", "19:11 和 19:35 厨房温度传感器报告 MeasuredValue = None,数据采集失败", "19:30 厨房温度传感器再次报告 2835,与 19:00 完全一致,疑似读数卡死", "厨房窗户 19:34:30 打开(StateValue = False)后至日志结束(23:30)无关闭记录,住户已入睡"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,必要时重新校准或更换传感器", "排查传感器固件是否需要更新,解决高温环境下报告 None 值的问题", "关闭厨房窗户,或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户", "考虑为厨房窗户添加定时未关闭告警,避免夜间窗户敞开带来的安防风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.303966283798218, "api_error": null} {"episode_id": "SQ4_TP_B_0774", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0774.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261403, "scenario_id": "BA-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-12T11:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时凌晨 2:30 出现无明确触发原因的多房间活动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:49、06:59、18:46、19:05 四次报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,但正常传感器在高温环境下应报告数值而非 None,这表明传感器可能在灶具工作时因高温或干扰出现故障。\",\n \"推理步骤2: 凌晨 02:30 客厅运动传感器触发,02:32 次卧运动传感器触发,02:35 次卧灯打开,02:37 厨房灯打开,02:40 玄关运动传感器触发。这一系列活动发生在深夜,且入户门锁和门磁均无开关记录,排除外人入侵。推测为住户(次卧住户)起夜活动,路径为次卧→厨房→经过玄关,属于合理的夜间活动模式。\",\n \"推理步骤3: 16:27 入户门解锁开门但未见关门/上锁记录,直到 17:41 再次解锁开门。16:27 的开门后门磁显示 StateValue=False(门开),但没有后续 True(关门)记录,直到 22:34 才出现关门上锁。结合 17:41 有人进入后开灯开空调的行为,推测 16:27 可能是住户短暂开门(如取快递),门磁关门事件可能丢失,或者门确实未完全关闭直到 17:41 有人回来。这存在一定的安全隐患。\",\n \"推理步骤4: 早晨 07:14 住户出门流程正常——关灯、手动开锁(LockOperationType=1)、开门、关门、自动上锁。晚间 22:34 就寝流程正常——关客厅灯和空调、进主卧、关窗帘、确认前门关闭并自动上锁、关主卧灯。整体生活节奏合理。\",\n \"推理步骤5: 全天温度变化呈现正常的日间升温(夜间约 23°C → 正午约 25.8°C)、傍晚降温的自然曲线,各房间温度一致性良好,无异常温差,排除火灾或暖通故障风险。烟雾报警器全天无触发,厨房窗户在做饭后打开通风属正常操作。\",\n \"推理步骤6: 洗碗机 19:34 启动(OperationalState=1 为运行中),但日志中无后续停止记录。可能是正常运行周期尚未结束(在日志截止时间内),也可能是状态上报遗漏,暂不构成威胁但值得留意。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:49、06:59、18:46、19:05 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"16:27 入户门解锁开门后无明确的关门记录,门可能处于未关闭状态长达约 75 分钟(至 17:41)\",\n \"凌晨 02:30-02:40 多房间活动但无入户门开启记录,符合住户起夜特征\",\n \"次卧灯 02:35 开启后日志中无关闭记录,可能持续亮灯至早晨\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:该传感器在灶具工作时反复输出 None,建议检查其安装位置是否离灶具过近导致超量程,或传感器本身存在故障,必要时更换\",\n \"确认 16:27 开门事件的门磁状态:检查入户门磁传感器是否存在漏报问题,建议设置门长时间未关闭的告警规则(如超过 5 分钟未关门则推送提醒)\",\n \"检查次卧灯是否仍在亮着:日志显示 02:35 开灯后无关灯记录,建议确认灯的当前状态,避免不必要的能耗\",\n \"为洗碗机添加运行超时告警:如运行时间超过正常周期(通常 1-2 小时)仍未停止,及时提醒用户检查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时凌晨 2:30 出现无明确触发原因的多房间活动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:49、06:59、18:46、19:05 四次报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,但正常传感器在高温环境下应报告数值而非 None,这表明传感器可能在灶具工作时因高温或干扰出现故障。", "推理步骤2: 凌晨 02:30 客厅运动传感器触发,02:32 次卧运动传感器触发,02:35 次卧灯打开,02:37 厨房灯打开,02:40 玄关运动传感器触发。这一系列活动发生在深夜,且入户门锁和门磁均无开关记录,排除外人入侵。推测为住户(次卧住户)起夜活动,路径为次卧→厨房→经过玄关,属于合理的夜间活动模式。", "推理步骤3: 16:27 入户门解锁开门但未见关门/上锁记录,直到 17:41 再次解锁开门。16:27 的开门后门磁显示 StateValue=False(门开),但没有后续 True(关门)记录,直到 22:34 才出现关门上锁。结合 17:41 有人进入后开灯开空调的行为,推测 16:27 可能是住户短暂开门(如取快递),门磁关门事件可能丢失,或者门确实未完全关闭直到 17:41 有人回来。这存在一定的安全隐患。", "推理步骤4: 早晨 07:14 住户出门流程正常——关灯、手动开锁(LockOperationType=1)、开门、关门、自动上锁。晚间 22:34 就寝流程正常——关客厅灯和空调、进主卧、关窗帘、确认前门关闭并自动上锁、关主卧灯。整体生活节奏合理。", "推理步骤5: 全天温度变化呈现正常的日间升温(夜间约 23°C → 正午约 25.8°C)、傍晚降温的自然曲线,各房间温度一致性良好,无异常温差,排除火灾或暖通故障风险。烟雾报警器全天无触发,厨房窗户在做饭后打开通风属正常操作。", "推理步骤6: 洗碗机 19:34 启动(OperationalState=1 为运行中),但日志中无后续停止记录。可能是正常运行周期尚未结束(在日志截止时间内),也可能是状态上报遗漏,暂不构成威胁但值得留意。"], "key_evidence": ["厨房温度传感器在 06:49、06:59、18:46、19:05 四次报告 MeasuredValue = None,均与灶具使用时段重合", "16:27 入户门解锁开门后无明确的关门记录,门可能处于未关闭状态长达约 75 分钟(至 17:41)", "凌晨 02:30-02:40 多房间活动但无入户门开启记录,符合住户起夜特征", "次卧灯 02:35 开启后日志中无关闭记录,可能持续亮灯至早晨"], "recommended_actions": ["检查厨房温度传感器:该传感器在灶具工作时反复输出 None,建议检查其安装位置是否离灶具过近导致超量程,或传感器本身存在故障,必要时更换", "确认 16:27 开门事件的门磁状态:检查入户门磁传感器是否存在漏报问题,建议设置门长时间未关闭的告警规则(如超过 5 分钟未关门则推送提醒)", "检查次卧灯是否仍在亮着:日志显示 02:35 开灯后无关灯记录,建议确认灯的当前状态,避免不必要的能耗", "为洗碗机添加运行超时告警:如运行时间超过正常周期(通常 1-2 小时)仍未停止,及时提醒用户检查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.28072738647461, "api_error": null} {"episode_id": "SQ4_TP_B_0775", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0775.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261404, "scenario_id": "FG-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-26T12:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器在住户外出期间触发了一氧化碳(CO)报警,且厨房窗户自早晨起一直处于开启状态,存在CO中毒隐患。\",\n \"reasoning\": [\n \"推理步骤1: 12:19 厨房烟雾报警器报告 COState=1(一氧化碳警告)、ExpressedState=2(CO报警激活),并触发了 COAlarm 事件。\",\n \"推理步骤2: 此时住户已于 07:22 出门(前门上锁、关门),家中无人。灶具在 07:01 已关闭,但厨房窗户在 07:01:30 被打开后,日志中未见关闭记录。\",\n \"推理步骤3: CO报警发生时灶具处于关闭状态,说明CO来源可能不是灶具本身的正常使用,而可能是灶具残余燃气泄漏、管道问题或其他燃烧源。\",\n \"推理步骤4: 住户在 15:59 短暂回家后又离开,18:08 再次回家后正常生活(开灯、开空调、做饭),但日志中未见CO报警被消除或确认的记录,说明该报警可能未被处理。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告 None 值(06:55、07:02、18:14、19:22),这可能是传感器受高温影响暂时失效,属于已知行为,但也需关注传感器健康状态。\"\n ],\n \"key_evidence\": [\n \"12:19 kitchen_smoke_alarm 触发 COAlarm 事件,COState=1,ExpressedState=2\",\n \"CO报警时灶具已关闭近5小时(07:01关闭),家中无人\",\n \"厨房窗户自 07:01:30 打开后全天未见关闭记录\",\n \"日志中无CO报警消除/确认记录,住户回家后未见处理动作\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房燃气管道和灶具是否存在泄漏,必要时联系燃气公司上门检测\",\n \"确认CO报警器当前状态,如仍处于报警状态需立即通风并排查CO来源\",\n \"检查厨房温度传感器是否正常工作(多次报告None值需排查)\",\n \"建议设置自动化规则:CO报警触发时自动推送紧急通知到住户手机,并联动打开所有窗户通风\",\n \"考虑安装独立的燃气泄漏探测器作为补充安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器在住户外出期间触发了一氧化碳(CO)报警,且厨房窗户自早晨起一直处于开启状态,存在CO中毒隐患。", "reasoning": ["推理步骤1: 12:19 厨房烟雾报警器报告 COState=1(一氧化碳警告)、ExpressedState=2(CO报警激活),并触发了 COAlarm 事件。", "推理步骤2: 此时住户已于 07:22 出门(前门上锁、关门),家中无人。灶具在 07:01 已关闭,但厨房窗户在 07:01:30 被打开后,日志中未见关闭记录。", "推理步骤3: CO报警发生时灶具处于关闭状态,说明CO来源可能不是灶具本身的正常使用,而可能是灶具残余燃气泄漏、管道问题或其他燃烧源。", "推理步骤4: 住户在 15:59 短暂回家后又离开,18:08 再次回家后正常生活(开灯、开空调、做饭),但日志中未见CO报警被消除或确认的记录,说明该报警可能未被处理。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告 None 值(06:55、07:02、18:14、19:22),这可能是传感器受高温影响暂时失效,属于已知行为,但也需关注传感器健康状态。"], "key_evidence": ["12:19 kitchen_smoke_alarm 触发 COAlarm 事件,COState=1,ExpressedState=2", "CO报警时灶具已关闭近5小时(07:01关闭),家中无人", "厨房窗户自 07:01:30 打开后全天未见关闭记录", "日志中无CO报警消除/确认记录,住户回家后未见处理动作"], "recommended_actions": ["立即检查厨房燃气管道和灶具是否存在泄漏,必要时联系燃气公司上门检测", "确认CO报警器当前状态,如仍处于报警状态需立即通风并排查CO来源", "检查厨房温度传感器是否正常工作(多次报告None值需排查)", "建议设置自动化规则:CO报警触发时自动推送紧急通知到住户手机,并联动打开所有窗户通风", "考虑安装独立的燃气泄漏探测器作为补充安全措施"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.85357093811035, "api_error": null} {"episode_id": "SQ4_TP_B_0783", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0783.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261412, "scenario_id": "BA-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-29T10:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,同时凌晨 2:30 存在无人解锁情况下的室内活动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从 ~2445 跳至 2828(约 28.28°C),相比同时段其他房间(~24.4°C)高出近 4°C,虽然此时灶具尚未开启(19:14 才开),说明要么传感器受到预热辐射影响,要么读数本身存在异常跳变。\",\n \"推理步骤2: 厨房温度传感器在 19:15 和 19:55 两次报告 MeasuredValue = None(空值),这是明确的设备故障信号。正常传感器不应返回 null,可能是高温环境导致传感器暂时失灵或通信中断。\",\n \"推理步骤3: 19:30 厨房温度读数为 2843(28.43°C),灶具正在使用中,虽然做饭时厨房温度升高是合理的,但传感器在高温下出现 null 值说明其工作在极限边界,可靠性存疑。\",\n \"推理步骤4: 凌晨 2:30-2:40,客厅运动传感器检测到活动,随后客厅灯和厨房灯被打开,玄关也检测到运动。但整个过程中入户门锁没有任何解锁记录、门磁也未触发。结合深夜时段,这可能是住户起夜活动(从卧室走出),属于正常行为,但灯在之后未见关闭记录,略有异常。\",\n \"推理步骤5: 早晨 7:20 的出门流程完全正常:手动开锁 → 门磁开 → 门磁关 → 自动上锁,符合住户出门模式。傍晚 18:09 回家流程也正常。22:04 关灯、关空调、门锁自动上锁,是正常的就寝/离家流程。\",\n \"推理步骤6: 全天温度曲线呈现合理的日间升温、夜间降温趋势(夜间 ~23°C,午间峰值 ~25.8°C),各房间温度一致性良好,无火灾或异常热源迹象。烟雾报警器全天无触发。\",\n \"推理步骤7: 厨房窗户在 19:54 做完饭后打开通风(门磁 StateValue=False 表示打开),但日志中未见关闭记录,截至 23:30 仍处于打开状态,存在夜间安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 19:00 读数突跳至 2828,19:15 和 19:55 两次报告 None 值\",\n \"厨房窗户 19:54 打开后至日志结束(23:30)未见关闭记录\",\n \"凌晨 2:30 客厅检测到运动并开灯,但无入户门解锁记录(推测为住户起夜)\",\n \"凌晨 2:35 开启的客厅灯和 2:37 开启的厨房灯在日志中直到 7:08/7:20 才有后续灯光操作记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常和 null 值,必要时更换或重新定位传感器\",\n \"设置自动化规则:厨房窗户打开超过一定时间(如 2 小时)或在夜间 22:00 后仍未关闭时发送提醒\",\n \"确认凌晨 2:30 的活动是否为住户本人,如非预期活动可考虑加装室内摄像头或调整运动传感器灵敏度\",\n \"建议为厨房温度传感器设置健康监测告警,当连续出现 null 值时自动通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,同时凌晨 2:30 存在无人解锁情况下的室内活动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从 ~2445 跳至 2828(约 28.28°C),相比同时段其他房间(~24.4°C)高出近 4°C,虽然此时灶具尚未开启(19:14 才开),说明要么传感器受到预热辐射影响,要么读数本身存在异常跳变。", "推理步骤2: 厨房温度传感器在 19:15 和 19:55 两次报告 MeasuredValue = None(空值),这是明确的设备故障信号。正常传感器不应返回 null,可能是高温环境导致传感器暂时失灵或通信中断。", "推理步骤3: 19:30 厨房温度读数为 2843(28.43°C),灶具正在使用中,虽然做饭时厨房温度升高是合理的,但传感器在高温下出现 null 值说明其工作在极限边界,可靠性存疑。", "推理步骤4: 凌晨 2:30-2:40,客厅运动传感器检测到活动,随后客厅灯和厨房灯被打开,玄关也检测到运动。但整个过程中入户门锁没有任何解锁记录、门磁也未触发。结合深夜时段,这可能是住户起夜活动(从卧室走出),属于正常行为,但灯在之后未见关闭记录,略有异常。", "推理步骤5: 早晨 7:20 的出门流程完全正常:手动开锁 → 门磁开 → 门磁关 → 自动上锁,符合住户出门模式。傍晚 18:09 回家流程也正常。22:04 关灯、关空调、门锁自动上锁,是正常的就寝/离家流程。", "推理步骤6: 全天温度曲线呈现合理的日间升温、夜间降温趋势(夜间 ~23°C,午间峰值 ~25.8°C),各房间温度一致性良好,无火灾或异常热源迹象。烟雾报警器全天无触发。", "推理步骤7: 厨房窗户在 19:54 做完饭后打开通风(门磁 StateValue=False 表示打开),但日志中未见关闭记录,截至 23:30 仍处于打开状态,存在夜间安全隐患。"], "key_evidence": ["厨房温度传感器 19:00 读数突跳至 2828,19:15 和 19:55 两次报告 None 值", "厨房窗户 19:54 打开后至日志结束(23:30)未见关闭记录", "凌晨 2:30 客厅检测到运动并开灯,但无入户门解锁记录(推测为住户起夜)", "凌晨 2:35 开启的客厅灯和 2:37 开启的厨房灯在日志中直到 7:08/7:20 才有后续灯光操作记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常和 null 值,必要时更换或重新定位传感器", "设置自动化规则:厨房窗户打开超过一定时间(如 2 小时)或在夜间 22:00 后仍未关闭时发送提醒", "确认凌晨 2:30 的活动是否为住户本人,如非预期活动可考虑加装室内摄像头或调整运动传感器灵敏度", "建议为厨房温度传感器设置健康监测告警,当连续出现 null 值时自动通知用户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.17790126800537, "api_error": null} {"episode_id": "SQ4_TP_B_0789", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0789.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261418, "scenario_id": "WD-03", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-22T23:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在住户入睡后持续报警,存在漏水风险,可能造成财产损失。\",\n \"reasoning\": [\n \"推理步骤1: 22:23 住户关闭客厅灯和空调,进入主卧并关闭主卧灯,前门自动上锁,表明住户已就寝。\",\n \"推理步骤2: 23:26 卫生间漏水传感器首次触发 StateValue=True,随后在 23:36 和 23:56 持续报警,30分钟内连续三次触发,说明漏水状态未消除且在持续。\",\n \"推理步骤3: 住户已入睡,无人响应漏水警报,若不及时处理可能导致水漫卫生间甚至渗透到其他房间,造成地板、家具损坏或电气安全隐患。\",\n \"推理步骤4: 其余设备行为均正常——早晨起床做饭出门、下午回家、傍晚做饭开洗碗机、晚间就寝,符合单人住户的日常作息模式。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间报告 None 值,属于高温时传感器量程保护的正常现象,灶具关闭后恢复正常读数。\"\n ],\n \"key_evidence\": [\n \"23:26、23:36、23:56 卫生间漏水传感器连续三次报告 StateValue=True,间隔约10-20分钟,漏水状态持续未消除\",\n \"22:23 住户已就寝(关灯、关空调、前门上锁),漏水发生时无人响应\",\n \"整个日志中无卫生间运动传感器触发记录,说明无人前往卫生间处理漏水\"\n ],\n \"recommended_actions\": [\n \"立即向住户发送高优先级警报(推送通知、电话或短信),唤醒住户处理漏水\",\n \"如系统支持,自动关闭卫生间总水阀(智能水阀)以止损\",\n \"建议住户检查卫生间水管接头、马桶底部密封圈、热水器等可能的漏水源\",\n \"漏水解除后检查地面是否有积水渗透到相邻房间,排查电气安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在住户入睡后持续报警,存在漏水风险,可能造成财产损失。", "reasoning": ["推理步骤1: 22:23 住户关闭客厅灯和空调,进入主卧并关闭主卧灯,前门自动上锁,表明住户已就寝。", "推理步骤2: 23:26 卫生间漏水传感器首次触发 StateValue=True,随后在 23:36 和 23:56 持续报警,30分钟内连续三次触发,说明漏水状态未消除且在持续。", "推理步骤3: 住户已入睡,无人响应漏水警报,若不及时处理可能导致水漫卫生间甚至渗透到其他房间,造成地板、家具损坏或电气安全隐患。", "推理步骤4: 其余设备行为均正常——早晨起床做饭出门、下午回家、傍晚做饭开洗碗机、晚间就寝,符合单人住户的日常作息模式。", "推理步骤5: 厨房温度传感器在灶具使用期间报告 None 值,属于高温时传感器量程保护的正常现象,灶具关闭后恢复正常读数。"], "key_evidence": ["23:26、23:36、23:56 卫生间漏水传感器连续三次报告 StateValue=True,间隔约10-20分钟,漏水状态持续未消除", "22:23 住户已就寝(关灯、关空调、前门上锁),漏水发生时无人响应", "整个日志中无卫生间运动传感器触发记录,说明无人前往卫生间处理漏水"], "recommended_actions": ["立即向住户发送高优先级警报(推送通知、电话或短信),唤醒住户处理漏水", "如系统支持,自动关闭卫生间总水阀(智能水阀)以止损", "建议住户检查卫生间水管接头、马桶底部密封圈、热水器等可能的漏水源", "漏水解除后检查地面是否有积水渗透到相邻房间,排查电气安全隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.128955602645874, "api_error": null} {"episode_id": "SQ4_TP_B_0790", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0790.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261419, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-17T17:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,存在设备故障风险;同时 16:20 入户门被开锁后未见关门/锁门记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:23 起床,07:48 出门(关灯、手动锁门、门自动上锁),17:53 回家(开灯、开空调),22:31 就寝(关灯关空调、拉窗帘、门自动上锁),符合单人上班族的典型模式。\",\n \"推理步骤2: 厨房温度传感器在 06:39 和 07:27(早餐做饭期间)以及 18:39 和 18:51(晚餐做饭期间)共 4 次报告 MeasuredValue = None。灶具开启时传感器应能正常读数,None 值表明传感器可能受热干扰或硬件故障,导致在最需要温度监控的时刻(明火使用期间)丧失监测能力。\",\n \"推理步骤3: 16:20 入户门锁被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),玄关检测到有人,但之后没有关门(StateValue=True)和重新上锁的记录。直到 17:21 才有下一次门锁事件。这意味着大门在无人在家期间敞开了约 1 小时。\",\n \"推理步骤4: 17:21 的开门事件格式与其他事件略有不同(OperationSource=3, UserIndex=1),表明是通过密码/指纹等凭证开锁,属于正常回家行为。但结合 16:20 的异常开门,需要确认 16:20 是否为住户本人操作。\",\n \"推理步骤5: 厨房窗户在做完饭后打开(07:26 和 18:50)属于正常通风行为,但日志中未见关窗记录,若长时间未关可能存在安全隐患(尤其夜间)。\",\n \"推理步骤6: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:00-12:30),傍晚逐步回落,开空调后(17:53 制冷模式)温度从约 24.7°C 降至 23.3°C,均属合理范围。\",\n \"推理步骤7: 烟雾报警器和漏水传感器全天无告警,洗碗机正常运行,洗衣机无异常事件,其余设备状态正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间 4 次报告 MeasuredValue = None(06:39、07:27、18:39、18:51),丧失关键时刻的温度监控能力\",\n \"16:20:00 入户门手动开锁并打开,但无后续关门和上锁记录,大门疑似敞开约 1 小时(至 17:21 下一次门事件)\",\n \"厨房窗户两次打开(07:26:30 和 18:50:30)后无关闭记录,可能整夜未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,清洁传感器或考虑更换,确保做饭期间温度监控不中断\",\n \"排查 16:20 的入户门开锁事件——确认是否为住户本人操作,检查门锁电池和门磁传感器是否正常工作\",\n \"建议设置自动化规则:大门打开超过 5 分钟未关闭时发送告警通知\",\n \"确认厨房窗户当前状态,建议设置就寝模式自动检查所有窗户是否关闭\",\n \"考虑为入户门锁的手动开锁操作增加即时通知,便于在外出时及时发现异常开门\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,存在设备故障风险;同时 16:20 入户门被开锁后未见关门/锁门记录,存在安全隐患。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:23 起床,07:48 出门(关灯、手动锁门、门自动上锁),17:53 回家(开灯、开空调),22:31 就寝(关灯关空调、拉窗帘、门自动上锁),符合单人上班族的典型模式。", "推理步骤2: 厨房温度传感器在 06:39 和 07:27(早餐做饭期间)以及 18:39 和 18:51(晚餐做饭期间)共 4 次报告 MeasuredValue = None。灶具开启时传感器应能正常读数,None 值表明传感器可能受热干扰或硬件故障,导致在最需要温度监控的时刻(明火使用期间)丧失监测能力。", "推理步骤3: 16:20 入户门锁被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),玄关检测到有人,但之后没有关门(StateValue=True)和重新上锁的记录。直到 17:21 才有下一次门锁事件。这意味着大门在无人在家期间敞开了约 1 小时。", "推理步骤4: 17:21 的开门事件格式与其他事件略有不同(OperationSource=3, UserIndex=1),表明是通过密码/指纹等凭证开锁,属于正常回家行为。但结合 16:20 的异常开门,需要确认 16:20 是否为住户本人操作。", "推理步骤5: 厨房窗户在做完饭后打开(07:26 和 18:50)属于正常通风行为,但日志中未见关窗记录,若长时间未关可能存在安全隐患(尤其夜间)。", "推理步骤6: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:00-12:30),傍晚逐步回落,开空调后(17:53 制冷模式)温度从约 24.7°C 降至 23.3°C,均属合理范围。", "推理步骤7: 烟雾报警器和漏水传感器全天无告警,洗碗机正常运行,洗衣机无异常事件,其余设备状态正常。"], "key_evidence": ["厨房温度传感器在灶具使用期间 4 次报告 MeasuredValue = None(06:39、07:27、18:39、18:51),丧失关键时刻的温度监控能力", "16:20:00 入户门手动开锁并打开,但无后续关门和上锁记录,大门疑似敞开约 1 小时(至 17:21 下一次门事件)", "厨房窗户两次打开(07:26:30 和 18:50:30)后无关闭记录,可能整夜未关"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,清洁传感器或考虑更换,确保做饭期间温度监控不中断", "排查 16:20 的入户门开锁事件——确认是否为住户本人操作,检查门锁电池和门磁传感器是否正常工作", "建议设置自动化规则:大门打开超过 5 分钟未关闭时发送告警通知", "确认厨房窗户当前状态,建议设置就寝模式自动检查所有窗户是否关闭", "考虑为入户门锁的手动开锁操作增加即时通知,便于在外出时及时发现异常开门"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.700932025909424, "api_error": null} {"episode_id": "SQ4_TP_B_0797", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0797.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261426, "scenario_id": "BA-03", "total_events": 233, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-27T09:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在多次异常:周期性报告 None 值,且在 11:00-11:30 出现约 4°C 的异常温度飙升(29.5°C),同时主卧灯疑似故障快速闪烁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 09:00:03、09:34:00、11:56:00、12:41:00、18:05:00、18:48:00 多次报告 MeasuredValue = None。虽然部分 None 出现在灶具开启后不久,可能是传感器因高温自我保护,但 09:00:03 灶具刚开启 30 秒就报 None,且 18:48:00 灶具已关闭后仍报 None,说明传感器本身工作不稳定。\",\n \"推理步骤2: 在 11:00 和 11:30,厨房温度传感器分别报告 2952 和 2955(即 29.52°C 和 29.55°C),而同时段客厅/主卧/次卧温度仅约 25.5°C。厨房温度比其他房间高出约 4°C,但此时灶具并未开启(09:33 已关闭,11:55 才再次开启)。在无热源运行的情况下,厨房不应出现如此大的温差,这指向传感器读数异常或厨房存在未知热源。\",\n \"推理步骤3: 主卧灯在 09:59:00-09:59:14 的 14 秒内发生了 7 次开关切换(开-关-开-关-开-开-关),这种快速闪烁模式不符合正常人工操作习惯,更像是设备故障、线路接触不良或通信协议异常导致的状态抖动。\",\n \"推理步骤4: 其余设备行为基本正常——凌晨全屋温度约 22.9-23.1°C 无人活动;08:30 起床使用卫生间后做早餐;10:07 客厅有人开灯开空调(SystemMode=3 为制冷模式,符合当日气温偏高的情况);中午和傍晚各做了一次饭;22:56 关灯关空调后入户门自动上锁,符合正常作息。\",\n \"推理步骤5: 厨房窗户传感器在做饭结束后打开(BooleanState=False 表示窗户打开),这是通风的正常行为。但日志中未见窗户关闭事件,结合入户门已锁、住户可能已就寝,厨房窗户可能整夜处于打开状态,存在轻微安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 MeasuredValue = None,部分发生在灶具未运行或刚关闭时\",\n \"11:00-11:30 厨房温度异常飙升至 29.5°C,比同时段其他房间高约 4°C,且此时灶具处于关闭状态\",\n \"主卧灯在 09:59:00-09:59:14 间发生 7 次快速开关切换,间隔仅 2-3 秒,疑似设备故障\",\n \"厨房窗户在 09:33、12:40、18:47 三次打开,但日志中无对应的关闭事件,可能整夜未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和供电情况,频繁报告 None 值表明传感器可能需要更换或重新校准\",\n \"排查 11:00-11:30 厨房异常高温的原因:确认是否有其他热源(如烤箱、阳光直射),若无则进一步确认传感器故障\",\n \"检查主卧灯的开关模块和网络连接,快速闪烁可能是继电器粘连、固件 bug 或 Zigbee/Thread 通信干扰所致\",\n \"建议设置自动化规则:入户门上锁时检查厨房窗户状态,若未关闭则发送提醒\",\n \"考虑为厨房温度传感器设置 None 值告警,连续多次 None 时自动通知用户检修\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在多次异常:周期性报告 None 值,且在 11:00-11:30 出现约 4°C 的异常温度飙升(29.5°C),同时主卧灯疑似故障快速闪烁。", "reasoning": ["推理步骤1: 厨房温度传感器在 09:00:03、09:34:00、11:56:00、12:41:00、18:05:00、18:48:00 多次报告 MeasuredValue = None。虽然部分 None 出现在灶具开启后不久,可能是传感器因高温自我保护,但 09:00:03 灶具刚开启 30 秒就报 None,且 18:48:00 灶具已关闭后仍报 None,说明传感器本身工作不稳定。", "推理步骤2: 在 11:00 和 11:30,厨房温度传感器分别报告 2952 和 2955(即 29.52°C 和 29.55°C),而同时段客厅/主卧/次卧温度仅约 25.5°C。厨房温度比其他房间高出约 4°C,但此时灶具并未开启(09:33 已关闭,11:55 才再次开启)。在无热源运行的情况下,厨房不应出现如此大的温差,这指向传感器读数异常或厨房存在未知热源。", "推理步骤3: 主卧灯在 09:59:00-09:59:14 的 14 秒内发生了 7 次开关切换(开-关-开-关-开-开-关),这种快速闪烁模式不符合正常人工操作习惯,更像是设备故障、线路接触不良或通信协议异常导致的状态抖动。", "推理步骤4: 其余设备行为基本正常——凌晨全屋温度约 22.9-23.1°C 无人活动;08:30 起床使用卫生间后做早餐;10:07 客厅有人开灯开空调(SystemMode=3 为制冷模式,符合当日气温偏高的情况);中午和傍晚各做了一次饭;22:56 关灯关空调后入户门自动上锁,符合正常作息。", "推理步骤5: 厨房窗户传感器在做饭结束后打开(BooleanState=False 表示窗户打开),这是通风的正常行为。但日志中未见窗户关闭事件,结合入户门已锁、住户可能已就寝,厨房窗户可能整夜处于打开状态,存在轻微安全隐患。"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 MeasuredValue = None,部分发生在灶具未运行或刚关闭时", "11:00-11:30 厨房温度异常飙升至 29.5°C,比同时段其他房间高约 4°C,且此时灶具处于关闭状态", "主卧灯在 09:59:00-09:59:14 间发生 7 次快速开关切换,间隔仅 2-3 秒,疑似设备故障", "厨房窗户在 09:33、12:40、18:47 三次打开,但日志中无对应的关闭事件,可能整夜未关"], "recommended_actions": ["检查厨房温度传感器的硬件状态和供电情况,频繁报告 None 值表明传感器可能需要更换或重新校准", "排查 11:00-11:30 厨房异常高温的原因:确认是否有其他热源(如烤箱、阳光直射),若无则进一步确认传感器故障", "检查主卧灯的开关模块和网络连接,快速闪烁可能是继电器粘连、固件 bug 或 Zigbee/Thread 通信干扰所致", "建议设置自动化规则:入户门上锁时检查厨房窗户状态,若未关闭则发送提醒", "考虑为厨房温度传感器设置 None 值告警,连续多次 None 时自动通知用户检修"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.86980938911438, "api_error": null} {"episode_id": "SQ4_TP_B_0800", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0800.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261429, "scenario_id": "BA-03", "total_events": 199, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-07T08:22:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅主灯在08:22出现快速反复开关闪烁,疑似设备故障或线路接触不良。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据方面,四个传感器全天走势一致——凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~12:30达到峰值约25.8~25.9°C,之后平稳回落至夜间23.2~23.4°C。各房间温差始终在2°C以内,变化平滑且符合夏季自然昼夜温度曲线,无任何异常升温(如火灾)或骤降迹象。\",\n \"推理步骤2: 客厅主灯(living_room_light_1)在08:22:00至08:22:14的14秒内发生了7次状态变化(开-关-开-关-开-开-关),平均每2~3秒切换一次。这种高频闪烁模式不符合正常人工操作习惯——人手动开关灯不会在14秒内连续切换7次。\",\n \"推理步骤3: 可能的原因包括:(a) 智能开关或灯具内部继电器接触不良导致抖动;(b) 无线信号干扰导致重复指令;(c) 自动化规则冲突反复触发开关。无论哪种原因,都指向设备层面的异常,而非安全入侵威胁。\",\n \"推理步骤4: 除此之外,整个24小时日志中没有任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的事件上报,说明无入侵、火灾、漏水等安全事件发生。\"\n ],\n \"key_evidence\": [\n \"08:22:00~08:22:14,客厅主灯14秒内发生7次开关状态切换(True→False→True→False→True→True→False),呈现异常高频闪烁\",\n \"全天温度曲线平滑正常,四房间走势同步,无突变或异常偏离\",\n \"24小时内无门锁、门窗、运动、烟雾、漏水等安全类传感器告警\"\n ],\n \"recommended_actions\": [\n \"检查客厅主灯(living_room_light_1)的物理接线和智能开关模块,排查继电器或接触不良问题\",\n \"查看智能家居平台中是否存在针对客厅主灯的自动化规则冲突或重复触发场景\",\n \"如闪烁问题反复出现,建议更换开关模块或灯具,避免频繁通断导致电气隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "客厅主灯在08:22出现快速反复开关闪烁,疑似设备故障或线路接触不良。", "reasoning": ["推理步骤1: 温度数据方面,四个传感器全天走势一致——凌晨约22.9~23.1°C,随日出逐步升高,中午12:00~12:30达到峰值约25.8~25.9°C,之后平稳回落至夜间23.2~23.4°C。各房间温差始终在2°C以内,变化平滑且符合夏季自然昼夜温度曲线,无任何异常升温(如火灾)或骤降迹象。", "推理步骤2: 客厅主灯(living_room_light_1)在08:22:00至08:22:14的14秒内发生了7次状态变化(开-关-开-关-开-开-关),平均每2~3秒切换一次。这种高频闪烁模式不符合正常人工操作习惯——人手动开关灯不会在14秒内连续切换7次。", "推理步骤3: 可能的原因包括:(a) 智能开关或灯具内部继电器接触不良导致抖动;(b) 无线信号干扰导致重复指令;(c) 自动化规则冲突反复触发开关。无论哪种原因,都指向设备层面的异常,而非安全入侵威胁。", "推理步骤4: 除此之外,整个24小时日志中没有任何门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的事件上报,说明无入侵、火灾、漏水等安全事件发生。"], "key_evidence": ["08:22:00~08:22:14,客厅主灯14秒内发生7次开关状态切换(True→False→True→False→True→True→False),呈现异常高频闪烁", "全天温度曲线平滑正常,四房间走势同步,无突变或异常偏离", "24小时内无门锁、门窗、运动、烟雾、漏水等安全类传感器告警"], "recommended_actions": ["检查客厅主灯(living_room_light_1)的物理接线和智能开关模块,排查继电器或接触不良问题", "查看智能家居平台中是否存在针对客厅主灯的自动化规则冲突或重复触发场景", "如闪烁问题反复出现,建议更换开关模块或灯具,避免频繁通断导致电气隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.030615091323853, "api_error": null} {"episode_id": "SQ4_TP_B_0799", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0799.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261428, "scenario_id": "DF-02", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-24T23:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在 16:23 开锁后近两小时未关门、未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:22、18:15、18:55 四次报告 MeasuredValue = None。虽然每次都发生在灶具开启或关闭前后,可能是高温导致传感器读数溢出,但正常传感器应返回数值而非 None,这表明传感器可能存在故障或兼容性问题。\",\n \"推理步骤2: 16:23 入户门通过手动方式解锁并打开(contact=False),但直到 22:18:32 门才关闭(contact=True)并自动上锁。期间近 6 小时入户门处于开启且未锁状态。结合 18:09 有第二次开门记录(住户回家),说明 16:23 的开门可能是住户外出后忘记关门,或有人进入后未关门。虽然 18:09 住户回家的行为链完整(开门→玄关感应→客厅感应→开灯→开空调),但 16:23 至 18:09 之间门一直敞开,存在入侵风险窗口。\",\n \"推理步骤3: 住户整体作息模式合理——05:57 起床、07:13 出门、18:09 回家、22:18 就寝,灯光和空调使用与活动一致。早晚各做一次饭,灶具使用时长合理(约16-40分钟),做完饭后开窗通风,洗碗机晚间启动,均属正常生活模式。\",\n \"推理步骤4: 全屋温度变化符合夏季昼夜规律:夜间约 22.9-23.1°C,白天升至 25-26°C 峰值,傍晚回家开空调后逐步降温。各房间温度一致性好,无局部异常高温,排除火灾风险。\",\n \"推理步骤5: 烟雾报警器和漏水传感器全天无告警,厨房窗户做饭后开启通风属正常操作。门锁操作均为 Manual 或 Auto 来源,无异常远程解锁记录。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:05、07:22、18:15、18:55 四次返回 MeasuredValue = None\",\n \"入户门 16:23 解锁开启后,直到 22:18:32 才关闭上锁,中间约 6 小时门处于开启状态\",\n \"16:23 开门时无后续室内活动(无灯光、无运动传感器触发),直到 18:09 才有完整的回家行为链\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否工作正常,确认其在高温环境下的量程是否足够,必要时更换或重新校准\",\n \"设置入户门长时间未关闭的告警规则(如超过 5-10 分钟未关门则推送提醒),避免门户长时间敞开\",\n \"排查 16:23 的开门事件是否为住户本人操作,确认该时段是否有非预期人员进出\",\n \"考虑为入户门增加自动关门或超时自动上锁机制,提升无人在家时的安全性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在 16:23 开锁后近两小时未关门、未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:22、18:15、18:55 四次报告 MeasuredValue = None。虽然每次都发生在灶具开启或关闭前后,可能是高温导致传感器读数溢出,但正常传感器应返回数值而非 None,这表明传感器可能存在故障或兼容性问题。", "推理步骤2: 16:23 入户门通过手动方式解锁并打开(contact=False),但直到 22:18:32 门才关闭(contact=True)并自动上锁。期间近 6 小时入户门处于开启且未锁状态。结合 18:09 有第二次开门记录(住户回家),说明 16:23 的开门可能是住户外出后忘记关门,或有人进入后未关门。虽然 18:09 住户回家的行为链完整(开门→玄关感应→客厅感应→开灯→开空调),但 16:23 至 18:09 之间门一直敞开,存在入侵风险窗口。", "推理步骤3: 住户整体作息模式合理——05:57 起床、07:13 出门、18:09 回家、22:18 就寝,灯光和空调使用与活动一致。早晚各做一次饭,灶具使用时长合理(约16-40分钟),做完饭后开窗通风,洗碗机晚间启动,均属正常生活模式。", "推理步骤4: 全屋温度变化符合夏季昼夜规律:夜间约 22.9-23.1°C,白天升至 25-26°C 峰值,傍晚回家开空调后逐步降温。各房间温度一致性好,无局部异常高温,排除火灾风险。", "推理步骤5: 烟雾报警器和漏水传感器全天无告警,厨房窗户做饭后开启通风属正常操作。门锁操作均为 Manual 或 Auto 来源,无异常远程解锁记录。"], "key_evidence": ["厨房温度传感器在 07:05、07:22、18:15、18:55 四次返回 MeasuredValue = None", "入户门 16:23 解锁开启后,直到 22:18:32 才关闭上锁,中间约 6 小时门处于开启状态", "16:23 开门时无后续室内活动(无灯光、无运动传感器触发),直到 18:09 才有完整的回家行为链"], "recommended_actions": ["检查厨房温度传感器是否工作正常,确认其在高温环境下的量程是否足够,必要时更换或重新校准", "设置入户门长时间未关闭的告警规则(如超过 5-10 分钟未关门则推送提醒),避免门户长时间敞开", "排查 16:23 的开门事件是否为住户本人操作,确认该时段是否有非预期人员进出", "考虑为入户门增加自动关门或超时自动上锁机制,提升无人在家时的安全性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.69271755218506, "api_error": null} {"episode_id": "SQ4_TP_B_0806", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0806.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261435, "scenario_id": "DF-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-15T08:44:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.61°C),随后在18:56和19:28两次报告None值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,随日照升温至中午峰值约25.9°C,午后逐步回落,符合夏季自然温度曲线,各房间温度高度一致。\",\n \"推理步骤2: 厨房温度传感器在18:00突然从约24.8°C跳升至28.61°C,而同一时刻其他三个房间温度均在24.5-24.7°C范围内。此时灶具尚未开启(18:55才开),住户也尚未回家(18:07才进门),没有合理的热源解释这一约4°C的异常偏差。\",\n \"推理步骤3: 18:30厨房温度仍高达28.59°C,进一步确认这不是瞬时干扰而是持续性异常读数。\",\n \"推理步骤4: 18:56(灶具刚开启1分钟后)和19:28(灶具关闭1分钟后),厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了数据丢失或通信故障。\",\n \"推理步骤5: 19:00和19:30厨房温度恢复到与其他房间一致的正常范围(24.26°C / 24.42°C),说明传感器间歇性恢复正常,但故障具有反复性。\",\n \"推理步骤6: 安全事件方面——住户07:11手动开锁出门、门自动上锁,18:07手动开锁回家,22:05关灯关空调、门自动上锁就寝,出入模式完全正常,无入侵迹象。\",\n \"推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,灶具使用时间约32分钟后正常关闭,做饭后开窗通风,均为正常生活行为。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数28.61°C,比同时刻其他房间高出约4°C,且此时无任何热源运行\",\n \"18:30 厨房温度传感器仍为28.59°C,异常持续\",\n \"18:56 和 19:28 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失\",\n \"异常前后(17:30约24.88°C → 18:00约28.61°C → 19:00约24.26°C)温度剧烈波动不符合物理规律\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到局部热源(如阳光直射、电器散热)影响\",\n \"检查传感器与网关之间的通信质量,排查两次None值报告是否为无线信号干扰或固件Bug\",\n \"若传感器持续出现异常读数或None值,建议更换传感器,因为厨房温度传感器对烹饪安全监控至关重要\",\n \"考虑为厨房温度传感器设置异常阈值告警规则(如与其他房间偏差超过3°C时自动通知),以便及时发现类似故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.61°C),随后在18:56和19:28两次报告None值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨各房间温度约22.9-23.1°C,随日照升温至中午峰值约25.9°C,午后逐步回落,符合夏季自然温度曲线,各房间温度高度一致。", "推理步骤2: 厨房温度传感器在18:00突然从约24.8°C跳升至28.61°C,而同一时刻其他三个房间温度均在24.5-24.7°C范围内。此时灶具尚未开启(18:55才开),住户也尚未回家(18:07才进门),没有合理的热源解释这一约4°C的异常偏差。", "推理步骤3: 18:30厨房温度仍高达28.59°C,进一步确认这不是瞬时干扰而是持续性异常读数。", "推理步骤4: 18:56(灶具刚开启1分钟后)和19:28(灶具关闭1分钟后),厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了数据丢失或通信故障。", "推理步骤5: 19:00和19:30厨房温度恢复到与其他房间一致的正常范围(24.26°C / 24.42°C),说明传感器间歇性恢复正常,但故障具有反复性。", "推理步骤6: 安全事件方面——住户07:11手动开锁出门、门自动上锁,18:07手动开锁回家,22:05关灯关空调、门自动上锁就寝,出入模式完全正常,无入侵迹象。", "推理步骤7: 烟雾报警器全天无触发,漏水传感器无报警,灶具使用时间约32分钟后正常关闭,做饭后开窗通风,均为正常生活行为。"], "key_evidence": ["18:00 厨房温度传感器读数28.61°C,比同时刻其他房间高出约4°C,且此时无任何热源运行", "18:30 厨房温度传感器仍为28.59°C,异常持续", "18:56 和 19:28 厨房温度传感器两次报告 MeasuredValue = None,出现数据丢失", "异常前后(17:30约24.88°C → 18:00约28.61°C → 19:00约24.26°C)温度剧烈波动不符合物理规律"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否受到局部热源(如阳光直射、电器散热)影响", "检查传感器与网关之间的通信质量,排查两次None值报告是否为无线信号干扰或固件Bug", "若传感器持续出现异常读数或None值,建议更换传感器,因为厨房温度传感器对烹饪安全监控至关重要", "考虑为厨房温度传感器设置异常阈值告警规则(如与其他房间偏差超过3°C时自动通知),以便及时发现类似故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.000523805618286, "api_error": null} {"episode_id": "SQ4_TP_B_0811", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0811.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261440, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-11T19:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;此外厨房窗户在住户外出期间持续处于开启状态,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:07、18:41、19:11 四次报告 MeasuredValue = None,每次都紧跟在灶具开启或关闭操作之后,说明传感器可能受灶具热源干扰导致读数异常,或传感器本身存在故障。\",\n \"推理步骤2: 厨房窗户在 07:06:30 被打开(StateValue=False),之后住户于 07:11:28 出门并锁门离开。直到 15:59 住户回家,窗户始终未关闭,期间无人在家约 9 小时,开窗状态增加了入侵风险。\",\n \"推理步骤3: 19:10:30 厨房窗户再次被打开,日志中未见关闭记录,结合厨房灯也未见关闭记录,可能存在遗忘关窗/关灯的情况。\",\n \"推理步骤4: 入户门锁操作均为正常模式——早晨手动开锁出门后自动上锁,下午/傍晚回家开锁进入,19:19 有 UserIndex=1 的用户通过密码/指纹开锁进入(可能是家庭第二位成员),随后次卧和客厅均检测到人体存在,行为合理,无入侵迹象。\",\n \"推理步骤5: 全屋温度变化符合夏季昼夜规律(夜间约 22.9°C,午间峰值约 25.9°C),18:13 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,属正常使用。\",\n \"推理步骤6: 烟雾报警器和漏水传感器全天无告警,洗碗机正常启动运行,无火灾或水患迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:53、07:07、18:41、19:11 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"kitchen_window_contact 于 07:06:30 打开后,住户 07:11 离家,窗户在无人期间持续开启约 9 小时\",\n \"kitchen_window_contact 于 19:10:30 再次打开,日志中无后续关闭记录\",\n \"19:19 入户门通过 UserIndex=1 开锁,随后客厅和次卧检测到人体活动,符合第二位家庭成员回家的正常模式\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常;如传感器持续报 None,建议更换或重新校准\",\n \"设置离家自动化规则:当入户门锁定且无人在家时,自动检查并提醒关闭厨房窗户\",\n \"考虑为厨房窗户添加长时间开启告警(如超过 1 小时无人在家时推送通知)\",\n \"确认厨房灯(18:40 开启)和厨房窗户(19:10 打开)在睡前是否已关闭,建议加入就寝场景自动检查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具干扰;此外厨房窗户在住户外出期间持续处于开启状态,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:07、18:41、19:11 四次报告 MeasuredValue = None,每次都紧跟在灶具开启或关闭操作之后,说明传感器可能受灶具热源干扰导致读数异常,或传感器本身存在故障。", "推理步骤2: 厨房窗户在 07:06:30 被打开(StateValue=False),之后住户于 07:11:28 出门并锁门离开。直到 15:59 住户回家,窗户始终未关闭,期间无人在家约 9 小时,开窗状态增加了入侵风险。", "推理步骤3: 19:10:30 厨房窗户再次被打开,日志中未见关闭记录,结合厨房灯也未见关闭记录,可能存在遗忘关窗/关灯的情况。", "推理步骤4: 入户门锁操作均为正常模式——早晨手动开锁出门后自动上锁,下午/傍晚回家开锁进入,19:19 有 UserIndex=1 的用户通过密码/指纹开锁进入(可能是家庭第二位成员),随后次卧和客厅均检测到人体存在,行为合理,无入侵迹象。", "推理步骤5: 全屋温度变化符合夏季昼夜规律(夜间约 22.9°C,午间峰值约 25.9°C),18:13 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,属正常使用。", "推理步骤6: 烟雾报警器和漏水传感器全天无告警,洗碗机正常启动运行,无火灾或水患迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:53、07:07、18:41、19:11 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "kitchen_window_contact 于 07:06:30 打开后,住户 07:11 离家,窗户在无人期间持续开启约 9 小时", "kitchen_window_contact 于 19:10:30 再次打开,日志中无后续关闭记录", "19:19 入户门通过 UserIndex=1 开锁,随后客厅和次卧检测到人体活动,符合第二位家庭成员回家的正常模式"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致读数异常;如传感器持续报 None,建议更换或重新校准", "设置离家自动化规则:当入户门锁定且无人在家时,自动检查并提醒关闭厨房窗户", "考虑为厨房窗户添加长时间开启告警(如超过 1 小时无人在家时推送通知)", "确认厨房灯(18:40 开启)和厨房窗户(19:10 打开)在睡前是否已关闭,建议加入就寝场景自动检查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.520668983459473, "api_error": null} {"episode_id": "SQ4_TP_B_0817", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0817.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261446, "scenario_id": "DF-04", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-29T23:54:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次数据丢失(None),同时厨房窗户在做饭结束后开启至今未关闭;此外深夜门锁出现重复锁门指令并触发 DoorLockAlarm(AlarmCode=0) 报警。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在19:00突然从约2450跳至2834(即从约24.5°C跳至28.3°C),升幅约4°C,而同一时刻其他房间温度仅在24.3-24.4°C范围,且灶具尚未开启(19:10才开),说明该跳变不是烹饪导致的,传感器可能存在故障或受到干扰。\",\n \"推理步骤2: 厨房温度传感器在19:11和19:42两次报告 MeasuredValue = None,表示传感器读数丢失。这在正常运行中不应出现,进一步佐证传感器工作异常。19:30时传感器又报出2837的高值,之后20:00恢复到2400,读数极不稳定。\",\n \"推理步骤3: 灶具在19:41关闭后,厨房窗户在19:41:30被打开(StateValue=False),但在整个日志剩余时间内没有关闭记录。考虑到住户22:10已关灯、关空调并锁门准备休息,厨房窗户仍处于开启状态,存在夜间安全隐患(入侵风险、雨水进入等)。\",\n \"推理步骤4: 23:54出现两次连续的 LockDoor 指令(间隔仅5秒),且触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败或锁具卡死报警。住户已在22:10:42通过自动锁定完成了门锁上锁(LockState=1),深夜再次发送锁门指令并触发报警,可能是门锁机械故障、通信异常,或有人/自动化规则异常重复操作。\",\n \"推理步骤5: 其余行为模式正常——早晨6:55起床、7:18出门上班、18:19回家、开灯开空调、19:10做饭、22:10关灯休息,符合单人住户的典型作息。入户门的开关锁操作和运动传感器触发时序合理,不存在入侵迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从约2450骤升至2834,灶具尚未开启,其他房间温度无对应变化\",\n \"19:11 和 19:42 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)\",\n \"19:41:30 厨房窗户打开后至日志结束(23:59)未关闭,住户已进入睡眠状态\",\n \"23:54 门锁在已锁定状态下收到两次 LockDoor 指令,并触发 DoorLockAlarm(AlarmCode=0)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁或更换传感器,排除故障或干扰源\",\n \"立即关闭厨房窗户,或设置自动化规则在就寝模式下自动关闭所有窗户\",\n \"检查入户门锁机械状态和电池电量,排查 AlarmCode=0 的具体原因(卡死/电量低/通信故障)\",\n \"审查23:54触发 LockDoor 指令的来源(自动化规则或远程操作),避免不必要的重复指令导致门锁磨损或误报\",\n \"建议为厨房温度传感器设置异常值过滤规则,当读数突变超过阈值或出现 None 时及时告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次数据丢失(None),同时厨房窗户在做饭结束后开启至今未关闭;此外深夜门锁出现重复锁门指令并触发 DoorLockAlarm(AlarmCode=0) 报警。", "reasoning": ["推理步骤1: 厨房温度传感器在19:00突然从约2450跳至2834(即从约24.5°C跳至28.3°C),升幅约4°C,而同一时刻其他房间温度仅在24.3-24.4°C范围,且灶具尚未开启(19:10才开),说明该跳变不是烹饪导致的,传感器可能存在故障或受到干扰。", "推理步骤2: 厨房温度传感器在19:11和19:42两次报告 MeasuredValue = None,表示传感器读数丢失。这在正常运行中不应出现,进一步佐证传感器工作异常。19:30时传感器又报出2837的高值,之后20:00恢复到2400,读数极不稳定。", "推理步骤3: 灶具在19:41关闭后,厨房窗户在19:41:30被打开(StateValue=False),但在整个日志剩余时间内没有关闭记录。考虑到住户22:10已关灯、关空调并锁门准备休息,厨房窗户仍处于开启状态,存在夜间安全隐患(入侵风险、雨水进入等)。", "推理步骤4: 23:54出现两次连续的 LockDoor 指令(间隔仅5秒),且触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败或锁具卡死报警。住户已在22:10:42通过自动锁定完成了门锁上锁(LockState=1),深夜再次发送锁门指令并触发报警,可能是门锁机械故障、通信异常,或有人/自动化规则异常重复操作。", "推理步骤5: 其余行为模式正常——早晨6:55起床、7:18出门上班、18:19回家、开灯开空调、19:10做饭、22:10关灯休息,符合单人住户的典型作息。入户门的开关锁操作和运动传感器触发时序合理,不存在入侵迹象。"], "key_evidence": ["19:00 厨房温度从约2450骤升至2834,灶具尚未开启,其他房间温度无对应变化", "19:11 和 19:42 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)", "19:41:30 厨房窗户打开后至日志结束(23:59)未关闭,住户已进入睡眠状态", "23:54 门锁在已锁定状态下收到两次 LockDoor 指令,并触发 DoorLockAlarm(AlarmCode=0)"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁或更换传感器,排除故障或干扰源", "立即关闭厨房窗户,或设置自动化规则在就寝模式下自动关闭所有窗户", "检查入户门锁机械状态和电池电量,排查 AlarmCode=0 的具体原因(卡死/电量低/通信故障)", "审查23:54触发 LockDoor 指令的来源(自动化规则或远程操作),避免不必要的重复指令导致门锁磨损或误报", "建议为厨房温度传感器设置异常值过滤规则,当读数突变超过阈值或出现 None 时及时告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.777461290359497, "api_error": null} {"episode_id": "SQ4_TP_B_0819", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0819.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261448, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "master_bedroom", "injection_time": "2026-06-05T16:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.67°C),随后两次报告None值,表明传感器可能故障;同时厨房窗户在做完饭后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 分析全天温度趋势——凌晨各房间温度约22.9°C,随日照升温至中午峰值约25.8°C,下午逐步回落,各传感器走势高度一致,属正常昼夜波动。\",\n \"推理步骤2: 18:00时厨房温度突然跳升至2867(28.67°C),而同一时刻其他三个房间温度均在24.5°C左右,厨房比其他房间高出约4°C。此时灶具尚未开启(18:53才开),无合理热源解释这一异常升温。\",\n \"推理步骤3: 18:30厨房温度仍高达28.50°C,持续偏离其他房间约4°C。18:54和19:47两次报告MeasuredValue=None,说明传感器读数丢失,进一步印证传感器工作状态异常。\",\n \"推理步骤4: 19:00时厨房温度恢复到24.39°C,与其他房间重新对齐,但此前的异常高温和None值不能忽视——传感器可能存在间歇性故障。\",\n \"推理步骤5: 19:46厨房窗户打开(StateValue=False),但直到日志结束(23:30)未见关闭记录。夜间窗户持续敞开存在安全隐患(入侵风险、雨水进入等)。\",\n \"推理步骤6: 住户行为模式正常——早晨6:30起床、7:38出门上班并自动锁门、16:29回家、18:07再次进门、21:48关灯锁门就寝,门锁均正常操作,无入侵迹象。\",\n \"推理步骤7: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和漏水风险。灶具使用时段(18:53-19:46)合理,做饭后正常关闭。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数2867(28.67°C),比同时刻其他房间高约4°C,且灶具尚未开启\",\n \"18:30 厨房温度仍为2850(28.50°C),异常持续\",\n \"18:54 和 19:47 厨房温度传感器两次报告 MeasuredValue=None,读数丢失\",\n \"19:46 厨房窗户打开后至日志结束(23:30)未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换电池,必要时更换传感器\",\n \"关闭厨房窗户或设置自动化规则:夜间(如22:00后)若厨房窗户仍处于打开状态则发送提醒\",\n \"为厨房温度传感器设置异常阈值告警:当读数突变超过2°C/30min或出现None值时立即通知用户\",\n \"考虑将厨房温度传感器远离可能的热源(如灶具、烤箱排气口),避免误读\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.67°C),随后两次报告None值,表明传感器可能故障;同时厨房窗户在做完饭后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 分析全天温度趋势——凌晨各房间温度约22.9°C,随日照升温至中午峰值约25.8°C,下午逐步回落,各传感器走势高度一致,属正常昼夜波动。", "推理步骤2: 18:00时厨房温度突然跳升至2867(28.67°C),而同一时刻其他三个房间温度均在24.5°C左右,厨房比其他房间高出约4°C。此时灶具尚未开启(18:53才开),无合理热源解释这一异常升温。", "推理步骤3: 18:30厨房温度仍高达28.50°C,持续偏离其他房间约4°C。18:54和19:47两次报告MeasuredValue=None,说明传感器读数丢失,进一步印证传感器工作状态异常。", "推理步骤4: 19:00时厨房温度恢复到24.39°C,与其他房间重新对齐,但此前的异常高温和None值不能忽视——传感器可能存在间歇性故障。", "推理步骤5: 19:46厨房窗户打开(StateValue=False),但直到日志结束(23:30)未见关闭记录。夜间窗户持续敞开存在安全隐患(入侵风险、雨水进入等)。", "推理步骤6: 住户行为模式正常——早晨6:30起床、7:38出门上班并自动锁门、16:29回家、18:07再次进门、21:48关灯锁门就寝,门锁均正常操作,无入侵迹象。", "推理步骤7: 烟雾报警器全天未触发,漏水传感器无报警,排除火灾和漏水风险。灶具使用时段(18:53-19:46)合理,做饭后正常关闭。"], "key_evidence": ["18:00 厨房温度传感器读数2867(28.67°C),比同时刻其他房间高约4°C,且灶具尚未开启", "18:30 厨房温度仍为2850(28.50°C),异常持续", "18:54 和 19:47 厨房温度传感器两次报告 MeasuredValue=None,读数丢失", "19:46 厨房窗户打开后至日志结束(23:30)未见关闭记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换电池,必要时更换传感器", "关闭厨房窗户或设置自动化规则:夜间(如22:00后)若厨房窗户仍处于打开状态则发送提醒", "为厨房温度传感器设置异常阈值告警:当读数突变超过2°C/30min或出现None值时立即通知用户", "考虑将厨房温度传感器远离可能的热源(如灶具、烤箱排气口),避免误读"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.69509243965149, "api_error": null} {"episode_id": "SQ4_TP_B_0827", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0827.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261456, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-11T19:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次 null 值,疑似传感器故障,同时存在入户门未及时上锁和厨房窗户未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.7°C(2870),而同一时刻其他三个房间温度均在 24.5-24.7°C 范围内,温差高达约 4°C,且此时灶具尚未开启(灶具 18:53 才开),排除烹饪导致的正常升温。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.5°C(2852),进一步确认这不是瞬时噪声而是持续异常读数。\",\n \"推理步骤3: 厨房温度传感器在 18:54 和 19:38 两次报告 MeasuredValue = None(空值),说明传感器出现了读数丢失。结合之前的异常高温,高度怀疑该传感器存在硬件故障或连接不稳定。\",\n \"推理步骤4: 19:00 厨房温度恢复到 24.3°C(2433),与其他房间一致,说明异常是间歇性的,更符合传感器故障特征而非真实环境温度变化。\",\n \"推理步骤5: 烟雾报警器全天无任何触发记录,排除真实火灾或烟雾风险,进一步佐证高温读数为传感器故障而非实际危险。\",\n \"推理步骤6: 18:19 住户回家后,入户门开锁并打开(StateValue=False),但直到 21:56 才记录到门关闭和自动上锁,中间近 3.5 小时入户门处于未锁定状态,存在安全隐患。\",\n \"推理步骤7: 19:37 厨房窗户打开(StateValue=False),此后日志中无关闭记录,窗户可能整夜处于开启状态。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度传感器读数 2870(28.7°C),较其他房间高出约 4°C,且灶具未开启\",\n \"18:30 厨房温度传感器读数 2852(28.5°C),异常持续\",\n \"18:54 和 19:38 厨房温度传感器两次报告 MeasuredValue = None\",\n \"烟雾报警器全天未触发,排除真实火灾风险\",\n \"18:19 入户门开锁后至 21:56 才重新上锁,间隔约 3.5 小时\",\n \"19:37 厨房窗户打开后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和连接,清洁探头或更换传感器\",\n \"在传感器修复前,加强对厨房烟雾报警器的关注,作为温度监测的备用手段\",\n \"设置入户门自动上锁策略(如开门超过一定时间未锁定则发送提醒)\",\n \"确认厨房窗户当前状态,夜间建议关闭窗户以保障安全\",\n \"考虑为温度传感器配置异常值告警规则(如单次跳变超过 2°C 或出现 null 值时立即通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次 null 值,疑似传感器故障,同时存在入户门未及时上锁和厨房窗户未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 18:00 突然从约 24.7°C 跳升至 28.7°C(2870),而同一时刻其他三个房间温度均在 24.5-24.7°C 范围内,温差高达约 4°C,且此时灶具尚未开启(灶具 18:53 才开),排除烹饪导致的正常升温。", "推理步骤2: 18:30 厨房温度仍高达 28.5°C(2852),进一步确认这不是瞬时噪声而是持续异常读数。", "推理步骤3: 厨房温度传感器在 18:54 和 19:38 两次报告 MeasuredValue = None(空值),说明传感器出现了读数丢失。结合之前的异常高温,高度怀疑该传感器存在硬件故障或连接不稳定。", "推理步骤4: 19:00 厨房温度恢复到 24.3°C(2433),与其他房间一致,说明异常是间歇性的,更符合传感器故障特征而非真实环境温度变化。", "推理步骤5: 烟雾报警器全天无任何触发记录,排除真实火灾或烟雾风险,进一步佐证高温读数为传感器故障而非实际危险。", "推理步骤6: 18:19 住户回家后,入户门开锁并打开(StateValue=False),但直到 21:56 才记录到门关闭和自动上锁,中间近 3.5 小时入户门处于未锁定状态,存在安全隐患。", "推理步骤7: 19:37 厨房窗户打开(StateValue=False),此后日志中无关闭记录,窗户可能整夜处于开启状态。"], "key_evidence": ["18:00 厨房温度传感器读数 2870(28.7°C),较其他房间高出约 4°C,且灶具未开启", "18:30 厨房温度传感器读数 2852(28.5°C),异常持续", "18:54 和 19:38 厨房温度传感器两次报告 MeasuredValue = None", "烟雾报警器全天未触发,排除真实火灾风险", "18:19 入户门开锁后至 21:56 才重新上锁,间隔约 3.5 小时", "19:37 厨房窗户打开后无关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态和连接,清洁探头或更换传感器", "在传感器修复前,加强对厨房烟雾报警器的关注,作为温度监测的备用手段", "设置入户门自动上锁策略(如开门超过一定时间未锁定则发送提醒)", "确认厨房窗户当前状态,夜间建议关闭窗户以保障安全", "考虑为温度传感器配置异常值告警规则(如单次跳变超过 2°C 或出现 null 值时立即通知)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.27601385116577, "api_error": null} {"episode_id": "SQ4_TP_B_0826", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0826.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261455, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-23T19:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房窗户在做饭后开启但日志中无关闭记录;入户门在16:19开锁进入后近2小时未关门/未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:35、07:09、18:33、19:09四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,但正常传感器不应因灶具开启而丢失读数,这表明传感器可能受高温干扰或存在硬件故障。值得注意的是,在灶具关闭后的下一个整点(07:00、19:00),传感器又恢复了正常读数,说明故障是间歇性的。\",\n \"推理步骤2: 厨房窗户传感器在07:08:30和19:08:30两次报告 StateValue=False(窗户打开),均发生在灶具关闭后约30秒,这是合理的通风行为。但整个日志中没有窗户关闭(StateValue=True)的记录,意味着厨房窗户可能一直处于打开状态。住户外出期间(07:20~18:04)窗户持续开启存在安全隐患。\",\n \"推理步骤3: 16:19入户门被手动开锁(LockState=2)、门传感器显示门打开(StateValue=False),但之后没有关门和上锁记录,直到18:04再次出现开锁事件。这意味着16:19~18:04之间约1小时45分钟,入户门可能处于未关闭或未上锁状态。18:04的事件序列显示有人进入并开始正常活动(开灯、开空调),推测是住户回家,但16:19的进入者身份和目的不明——没有触发客厅活动(无灯、无空调),仅有玄关运动传感器响应。\",\n \"推理步骤4: 19:25有一次通过 UserIndex=1 的开锁事件(OperationSource=3,可能是密码或指纹),随后多个房间检测到运动(玄关、客厅、次卧),且入户门在19:25:08关闭,这是正常的家庭成员回家模式。\",\n \"推理步骤5: 整体温度趋势正常——夜间约22.9°C,白天逐步升至25.9°C峰值(约12:00-12:30),傍晚回落。18:04开启空调(制冷模式SystemMode=3)后,客厅温度从24.6°C逐步降至23.3°C,符合预期。22:41关闭空调和灯光、进入主卧就寝,属于正常作息。\",\n \"推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁在07:20和22:41均有自动上锁记录,就寝流程正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:35、07:09、18:33、19:09四次报告 MeasuredValue = None,与灶具使用时段重合但属异常行为\",\n \"厨房窗户在07:08:30和19:08:30打开,但全天日志中无关闭记录,住户外出期间窗户可能持续敞开\",\n \"16:19入户门手动开锁并打开,但无对应的关门和上锁记录,且进入者未触发客厅等区域的典型居家活动\",\n \"19:25开锁事件携带 UserIndex=1,属于已注册用户,进入后多房间有运动检测,为正常回家行为\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:传感器在灶具使用期间反复丢失读数,建议检查其安装位置是否离灶具过近,或更换传感器排除硬件故障\",\n \"确认厨房窗户状态:日志显示窗户两次打开但无关闭记录,建议实地确认窗户是否已关闭;如传感器正常则应补充关窗,尤其是外出和夜间时段\",\n \"排查16:19的入户门事件:该时段有人手动开锁进入但未表现出正常居家行为,建议查看门锁的详细操作日志(是否有 UserIndex)或门口摄像头录像,确认进入者身份\",\n \"建议为入户门设置未关门/未上锁超时告警,避免长时间门户洞开的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房窗户在做饭后开启但日志中无关闭记录;入户门在16:19开锁进入后近2小时未关门/未上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在06:35、07:09、18:33、19:09四个时间点报告 MeasuredValue = None。虽然前两次和后两次分别与灶具使用时间重合,但正常传感器不应因灶具开启而丢失读数,这表明传感器可能受高温干扰或存在硬件故障。值得注意的是,在灶具关闭后的下一个整点(07:00、19:00),传感器又恢复了正常读数,说明故障是间歇性的。", "推理步骤2: 厨房窗户传感器在07:08:30和19:08:30两次报告 StateValue=False(窗户打开),均发生在灶具关闭后约30秒,这是合理的通风行为。但整个日志中没有窗户关闭(StateValue=True)的记录,意味着厨房窗户可能一直处于打开状态。住户外出期间(07:20~18:04)窗户持续开启存在安全隐患。", "推理步骤3: 16:19入户门被手动开锁(LockState=2)、门传感器显示门打开(StateValue=False),但之后没有关门和上锁记录,直到18:04再次出现开锁事件。这意味着16:19~18:04之间约1小时45分钟,入户门可能处于未关闭或未上锁状态。18:04的事件序列显示有人进入并开始正常活动(开灯、开空调),推测是住户回家,但16:19的进入者身份和目的不明——没有触发客厅活动(无灯、无空调),仅有玄关运动传感器响应。", "推理步骤4: 19:25有一次通过 UserIndex=1 的开锁事件(OperationSource=3,可能是密码或指纹),随后多个房间检测到运动(玄关、客厅、次卧),且入户门在19:25:08关闭,这是正常的家庭成员回家模式。", "推理步骤5: 整体温度趋势正常——夜间约22.9°C,白天逐步升至25.9°C峰值(约12:00-12:30),傍晚回落。18:04开启空调(制冷模式SystemMode=3)后,客厅温度从24.6°C逐步降至23.3°C,符合预期。22:41关闭空调和灯光、进入主卧就寝,属于正常作息。", "推理步骤6: 烟雾报警器、漏水传感器全天无告警,门锁在07:20和22:41均有自动上锁记录,就寝流程正常。"], "key_evidence": ["厨房温度传感器在06:35、07:09、18:33、19:09四次报告 MeasuredValue = None,与灶具使用时段重合但属异常行为", "厨房窗户在07:08:30和19:08:30打开,但全天日志中无关闭记录,住户外出期间窗户可能持续敞开", "16:19入户门手动开锁并打开,但无对应的关门和上锁记录,且进入者未触发客厅等区域的典型居家活动", "19:25开锁事件携带 UserIndex=1,属于已注册用户,进入后多房间有运动检测,为正常回家行为"], "recommended_actions": ["检查厨房温度传感器:传感器在灶具使用期间反复丢失读数,建议检查其安装位置是否离灶具过近,或更换传感器排除硬件故障", "确认厨房窗户状态:日志显示窗户两次打开但无关闭记录,建议实地确认窗户是否已关闭;如传感器正常则应补充关窗,尤其是外出和夜间时段", "排查16:19的入户门事件:该时段有人手动开锁进入但未表现出正常居家行为,建议查看门锁的详细操作日志(是否有 UserIndex)或门口摄像头录像,确认进入者身份", "建议为入户门设置未关门/未上锁超时告警,避免长时间门户洞开的安全风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.07619881629944, "api_error": null} {"episode_id": "SQ4_TP_B_0829", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0829.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261458, "scenario_id": "FG-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "balcony", "injection_time": "2026-06-26T14:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次 null 值,结合烟雾报警器电池低电量告警,存在设备故障风险,可能影响火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 14:16 报告 2910(29.1°C),而同时段其他房间温度约 25.3°C,灶具刚开启 10 分钟,温升幅度合理但偏高。\",\n \"推理步骤2: 18:00 厨房温度传感器报告 2870(28.7°C),此时灶具并未开启(14:06 开启的灶具无关闭记录,但 18:50 再次开启说明中间已关闭),其他房间温度约 24.5°C,厨房比其他房间高出约 4°C,异常偏高。18:30 仍为 2863,持续异常。\",\n \"推理步骤3: 厨房温度传感器在 18:51 和 19:47 两次报告 MeasuredValue = None(空值),表明传感器出现读数故障或通信异常。正常传感器不应返回 null。\",\n \"推理步骤4: 2026-06-25T14:06 厨房烟雾报警器报告 BatteryAlert = 1(低电量告警),这意味着烟雾报警器可能无法在关键时刻正常工作,与温度传感器故障叠加会严重削弱厨房火灾预警能力。\",\n \"推理步骤5: 其他行为模式正常——早晨起床、出门上班(07:35 手动开锁出门后自动上锁)、傍晚回家(18:24)、晚间做饭、睡前关灯锁门(21:46),均符合单人居住的日常作息。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 18:00 和 18:30 报告 2870/2863(约 28.7°C),灶具未开启状态下比其他房间高约 4°C\",\n \"kitchen_temp_sensor 在 18:51 和 19:47 两次报告 MeasuredValue = None,传感器读数异常\",\n \"kitchen_smoke_alarm 于 2026-06-25T14:06 报告 BatteryAlert = 1,电池电量低\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾预警功能正常\",\n \"检查厨房温度传感器,排查 null 读数和异常高温的原因(可能需要重启或更换传感器)\",\n \"在传感器修复前,加强厨房使用时的人工巡视,特别是灶具使用期间\",\n \"检查 14:06 开启的灶具是否有正常关闭记录,确认无遗漏关火情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次 null 值,结合烟雾报警器电池低电量告警,存在设备故障风险,可能影响火灾预警能力。", "reasoning": ["推理步骤1: 厨房温度传感器在 14:16 报告 2910(29.1°C),而同时段其他房间温度约 25.3°C,灶具刚开启 10 分钟,温升幅度合理但偏高。", "推理步骤2: 18:00 厨房温度传感器报告 2870(28.7°C),此时灶具并未开启(14:06 开启的灶具无关闭记录,但 18:50 再次开启说明中间已关闭),其他房间温度约 24.5°C,厨房比其他房间高出约 4°C,异常偏高。18:30 仍为 2863,持续异常。", "推理步骤3: 厨房温度传感器在 18:51 和 19:47 两次报告 MeasuredValue = None(空值),表明传感器出现读数故障或通信异常。正常传感器不应返回 null。", "推理步骤4: 2026-06-25T14:06 厨房烟雾报警器报告 BatteryAlert = 1(低电量告警),这意味着烟雾报警器可能无法在关键时刻正常工作,与温度传感器故障叠加会严重削弱厨房火灾预警能力。", "推理步骤5: 其他行为模式正常——早晨起床、出门上班(07:35 手动开锁出门后自动上锁)、傍晚回家(18:24)、晚间做饭、睡前关灯锁门(21:46),均符合单人居住的日常作息。"], "key_evidence": ["kitchen_temp_sensor 在 18:00 和 18:30 报告 2870/2863(约 28.7°C),灶具未开启状态下比其他房间高约 4°C", "kitchen_temp_sensor 在 18:51 和 19:47 两次报告 MeasuredValue = None,传感器读数异常", "kitchen_smoke_alarm 于 2026-06-25T14:06 报告 BatteryAlert = 1,电池电量低"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾预警功能正常", "检查厨房温度传感器,排查 null 读数和异常高温的原因(可能需要重启或更换传感器)", "在传感器修复前,加强厨房使用时的人工巡视,特别是灶具使用期间", "检查 14:06 开启的灶具是否有正常关闭记录,确认无遗漏关火情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.337831497192383, "api_error": null} {"episode_id": "SQ4_TP_B_0835", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0835.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261464, "scenario_id": "FG-01", "total_events": 233, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-06T04:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨4:18厨房灶具在无人状态下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾隐患;同时厨房温度传感器多次报告None值,疑似设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 04:18厨房灶具开启(OnOff=True),但同一时刻客厅运动传感器显示无人(Occupancy=0),且凌晨0:00-04:18期间全屋无任何运动传感器触发、无灯光开启、无门锁操作,说明住户处于深度睡眠或不在家,灶具在无人看管的情况下启动极为异常。\",\n \"推理步骤2: 灶具开启后厨房温度从约23°C(2295)在5分钟内飙升至29.23°C(2923),10分钟内达到35°C(3500),升温速率约每分钟1.2°C,远超正常烹饪升温幅度,表明可能存在干烧或明火失控。\",\n \"推理步骤3: 04:33烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认厨房已产生烟雾,进一步印证火灾风险。从灶具开启到烟雾报警仅15分钟,且期间无人操作关闭灶具。\",\n \"推理步骤4: 04:30的定时温度采集显示厨房温度回落至2305(23.05°C),与04:28的3500(35°C)形成矛盾,但04:33仍触发烟雾报警,说明温度传感器可能在高温下出现读数异常或采样延迟。\",\n \"推理步骤5: 日志中厨房温度传感器在09:12、09:37、12:07、12:39、17:48、18:27多次报告MeasuredValue=None,均发生在灶具使用前后,表明该传感器存在间歇性故障,无法可靠监测厨房温度,削弱了火灾预警能力。\",\n \"推理步骤6: 12:00厨房温度出现2975(29.75°C)的异常高值,而同时段其他房间均在25.7-25.9°C范围,虽然此时灶具尚未开启(12:06才开),可能是传感器故障导致的虚高读数,进一步佐证传感器不可靠。\",\n \"推理步骤7: 对比白天正常烹饪场景(09:11、12:06、17:47),住户均在有人活动的情况下开灶、烹饪后关灶并开窗通风,行为模式合理。唯独04:18的灶具启动完全不符合正常生活模式。\"\n ],\n \"key_evidence\": [\n \"04:18 厨房灶具在全屋无人活动的凌晨自动开启\",\n \"04:23 厨房温度5分钟内从23°C飙升至29.23°C,04:28达到35°C\",\n \"04:33 厨房烟雾报警器触发(SmokeState=1),确认产生烟雾\",\n \"凌晨时段无任何运动传感器、灯光、门锁事件,排除人为操作可能\",\n \"厨房温度传感器全天6次报告None值,存在间歇性设备故障\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具是否仍在运行,如是则远程或手动关闭,并确认明火已熄灭\",\n \"排查灶具凌晨自动启动的原因:检查是否存在误设的定时任务、自动化规则,或灶具控制模块是否故障\",\n \"尽快更换或维修厨房温度传感器,消除间歇性None值故障,恢复可靠的温度监测能力\",\n \"为厨房灶具增加安全联动规则:当全屋无人活动超过一定时间时禁止灶具启动,或灶具开启后若无人操作超过15分钟自动关闭\",\n \"检查烟雾报警器当前状态是否已恢复正常,确认报警事件已被正确记录和通知到住户\",\n \"建议在厨房加装燃气泄漏传感器,与灶具联动实现更完善的安全防护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨4:18厨房灶具在无人状态下自动开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾隐患;同时厨房温度传感器多次报告None值,疑似设备故障。", "reasoning": ["推理步骤1: 04:18厨房灶具开启(OnOff=True),但同一时刻客厅运动传感器显示无人(Occupancy=0),且凌晨0:00-04:18期间全屋无任何运动传感器触发、无灯光开启、无门锁操作,说明住户处于深度睡眠或不在家,灶具在无人看管的情况下启动极为异常。", "推理步骤2: 灶具开启后厨房温度从约23°C(2295)在5分钟内飙升至29.23°C(2923),10分钟内达到35°C(3500),升温速率约每分钟1.2°C,远超正常烹饪升温幅度,表明可能存在干烧或明火失控。", "推理步骤3: 04:33烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认厨房已产生烟雾,进一步印证火灾风险。从灶具开启到烟雾报警仅15分钟,且期间无人操作关闭灶具。", "推理步骤4: 04:30的定时温度采集显示厨房温度回落至2305(23.05°C),与04:28的3500(35°C)形成矛盾,但04:33仍触发烟雾报警,说明温度传感器可能在高温下出现读数异常或采样延迟。", "推理步骤5: 日志中厨房温度传感器在09:12、09:37、12:07、12:39、17:48、18:27多次报告MeasuredValue=None,均发生在灶具使用前后,表明该传感器存在间歇性故障,无法可靠监测厨房温度,削弱了火灾预警能力。", "推理步骤6: 12:00厨房温度出现2975(29.75°C)的异常高值,而同时段其他房间均在25.7-25.9°C范围,虽然此时灶具尚未开启(12:06才开),可能是传感器故障导致的虚高读数,进一步佐证传感器不可靠。", "推理步骤7: 对比白天正常烹饪场景(09:11、12:06、17:47),住户均在有人活动的情况下开灶、烹饪后关灶并开窗通风,行为模式合理。唯独04:18的灶具启动完全不符合正常生活模式。"], "key_evidence": ["04:18 厨房灶具在全屋无人活动的凌晨自动开启", "04:23 厨房温度5分钟内从23°C飙升至29.23°C,04:28达到35°C", "04:33 厨房烟雾报警器触发(SmokeState=1),确认产生烟雾", "凌晨时段无任何运动传感器、灯光、门锁事件,排除人为操作可能", "厨房温度传感器全天6次报告None值,存在间歇性设备故障"], "recommended_actions": ["立即检查厨房灶具是否仍在运行,如是则远程或手动关闭,并确认明火已熄灭", "排查灶具凌晨自动启动的原因:检查是否存在误设的定时任务、自动化规则,或灶具控制模块是否故障", "尽快更换或维修厨房温度传感器,消除间歇性None值故障,恢复可靠的温度监测能力", "为厨房灶具增加安全联动规则:当全屋无人活动超过一定时间时禁止灶具启动,或灶具开启后若无人操作超过15分钟自动关闭", "检查烟雾报警器当前状态是否已恢复正常,确认报警事件已被正确记录和通知到住户", "建议在厨房加装燃气泄漏传感器,与灶具联动实现更完善的安全防护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.27475094795227, "api_error": null} {"episode_id": "SQ4_TP_B_0840", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0840.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261469, "scenario_id": "INS-02", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-18T05:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨5:30发生连续4次门锁操作失败并触发强制入侵报警,疑似有人尝试非法开锁。\",\n \"reasoning\": [\n \"推理步骤1: 在05:30:00至05:30:40期间,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/外部操作来源,说明有人从外部反复尝试开锁但失败。\",\n \"推理步骤2: 紧接着在05:30:50,门锁触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应强制入侵报警(Forced Door Open / Tamper Alarm),表明门锁检测到异常入侵行为并主动告警。\",\n \"推理步骤3: 事件发生在凌晨5:30,属于深夜/清晨时段,住户大概率在睡眠中(从日志看住户约06:34才起床活动),此时段的外部开锁尝试高度可疑。\",\n \"推理步骤4: 4次失败尝试间隔极短(15秒、10秒、15秒),呈现暴力破解或试探性攻击的模式,而非住户偶尔输错密码的行为。\",\n \"推理步骤5: 附带发现——厨房温度传感器在19:00报告2838(约28.38°C),相比其他房间高出约4°C,随后在19:13和19:33报告None值。结合灶具在19:12开启、19:32关闭,温度升高可由烹饪解释,但None值表明传感器可能存在故障或被高温影响导致读数异常。\"\n ],\n \"key_evidence\": [\n \"05:30:00-05:30:40: 入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3)\",\n \"05:30:50: 门锁触发DoorLockAlarm(AlarmCode=3)强制入侵报警\",\n \"事件发生在凌晨5:30,住户尚在睡眠(06:34才有首次活动记录)\",\n \"厨房温度传感器在19:13和19:33报告MeasuredValue=None,可能存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁及门框是否有物理损坏或撬动痕迹\",\n \"查看门口监控录像(如有),确认05:30前后是否有可疑人员\",\n \"考虑向物业或警方报告此次入侵告警事件\",\n \"检查门锁固件是否为最新版本,排除远程漏洞利用的可能\",\n \"建议启用门锁连续失败后的自动锁定延时策略(如5次失败后锁定30分钟)\",\n \"检查厨房温度传感器状态,排查None值读数的原因,必要时更换传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨5:30发生连续4次门锁操作失败并触发强制入侵报警,疑似有人尝试非法开锁。", "reasoning": ["推理步骤1: 在05:30:00至05:30:40期间,入户门锁连续报告4次LockOperationError(OperationError=1, OperationSource=3),OperationSource=3表示远程/外部操作来源,说明有人从外部反复尝试开锁但失败。", "推理步骤2: 紧接着在05:30:50,门锁触发了DoorLockAlarm(AlarmCode=3),AlarmCode=3对应强制入侵报警(Forced Door Open / Tamper Alarm),表明门锁检测到异常入侵行为并主动告警。", "推理步骤3: 事件发生在凌晨5:30,属于深夜/清晨时段,住户大概率在睡眠中(从日志看住户约06:34才起床活动),此时段的外部开锁尝试高度可疑。", "推理步骤4: 4次失败尝试间隔极短(15秒、10秒、15秒),呈现暴力破解或试探性攻击的模式,而非住户偶尔输错密码的行为。", "推理步骤5: 附带发现——厨房温度传感器在19:00报告2838(约28.38°C),相比其他房间高出约4°C,随后在19:13和19:33报告None值。结合灶具在19:12开启、19:32关闭,温度升高可由烹饪解释,但None值表明传感器可能存在故障或被高温影响导致读数异常。"], "key_evidence": ["05:30:00-05:30:40: 入户门锁连续4次LockOperationError(OperationError=1, OperationSource=3)", "05:30:50: 门锁触发DoorLockAlarm(AlarmCode=3)强制入侵报警", "事件发生在凌晨5:30,住户尚在睡眠(06:34才有首次活动记录)", "厨房温度传感器在19:13和19:33报告MeasuredValue=None,可能存在设备故障"], "recommended_actions": ["立即检查入户门锁及门框是否有物理损坏或撬动痕迹", "查看门口监控录像(如有),确认05:30前后是否有可疑人员", "考虑向物业或警方报告此次入侵告警事件", "检查门锁固件是否为最新版本,排除远程漏洞利用的可能", "建议启用门锁连续失败后的自动锁定延时策略(如5次失败后锁定30分钟)", "检查厨房温度传感器状态,排查None值读数的原因,必要时更换传感器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.404947757720947, "api_error": null} {"episode_id": "SQ4_TP_B_0843", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0843.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261472, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-09T17:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受到灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2831(28.31°C),而同一时刻其他房间温度仅约 24.3-24.5°C,温差异常大(约 4°C 瞬间跳升)。\",\n \"推理步骤2: 19:10 灶具开启后,19:11 厨房温度传感器报告 MeasuredValue = None(null),19:30 恢复为 2832 但仍异常偏高,19:37 灶具关闭后 19:38 再次报告 None。传感器两次返回空值说明设备可能超出量程或通信异常。\",\n \"推理步骤3: 20:00 之后厨房温度恢复到 2406(24.06°C)并与其他房间趋势一致,说明异常是暂时性的。但 19:00 灶具尚未开启时温度就已跳升至 28.3°C,这不符合正常烹饪前的环境温度,可能是传感器本身存在故障或安装位置过于靠近灶具。\",\n \"推理步骤4: 其余事件均属正常——早晨出门(07:37 手动开锁、关门、自动上锁)、傍晚回家(17:40 密码开锁、18:06 手动开锁进入两人)、晚间关灯锁门就寝,均符合两室一厅家庭的日常作息。\",\n \"推理步骤5: 厨房窗户在灶具关闭后打开(19:37:30),属于烹饪后通风的正常行为,但日志中未见窗户关闭事件,结合夜间无人活动,厨房窗户可能仍处于开启状态。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从约 24.6°C 瞬间跳至 28.31°C,灶具尚未开启\",\n \"19:11 和 19:38 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 厨房温度仍为 28.32°C,而其他房间仅约 24.3°C\",\n \"厨房窗户 19:37:30 打开后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰和超量程\",\n \"排查传感器硬件状态,两次 null 读数可能意味着传感器需要更换或固件升级\",\n \"确认厨房窗户当前状态,若仍开启建议关闭以保障夜间安全\",\n \"考虑为厨房温度传感器设置合理的告警阈值,以便在异常跳变时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和两次 null 值,疑似传感器故障或受到灶具高温干扰。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2831(28.31°C),而同一时刻其他房间温度仅约 24.3-24.5°C,温差异常大(约 4°C 瞬间跳升)。", "推理步骤2: 19:10 灶具开启后,19:11 厨房温度传感器报告 MeasuredValue = None(null),19:30 恢复为 2832 但仍异常偏高,19:37 灶具关闭后 19:38 再次报告 None。传感器两次返回空值说明设备可能超出量程或通信异常。", "推理步骤3: 20:00 之后厨房温度恢复到 2406(24.06°C)并与其他房间趋势一致,说明异常是暂时性的。但 19:00 灶具尚未开启时温度就已跳升至 28.3°C,这不符合正常烹饪前的环境温度,可能是传感器本身存在故障或安装位置过于靠近灶具。", "推理步骤4: 其余事件均属正常——早晨出门(07:37 手动开锁、关门、自动上锁)、傍晚回家(17:40 密码开锁、18:06 手动开锁进入两人)、晚间关灯锁门就寝,均符合两室一厅家庭的日常作息。", "推理步骤5: 厨房窗户在灶具关闭后打开(19:37:30),属于烹饪后通风的正常行为,但日志中未见窗户关闭事件,结合夜间无人活动,厨房窗户可能仍处于开启状态。"], "key_evidence": ["19:00 厨房温度从约 24.6°C 瞬间跳至 28.31°C,灶具尚未开启", "19:11 和 19:38 厨房温度传感器两次报告 MeasuredValue = None", "19:30 厨房温度仍为 28.32°C,而其他房间仅约 24.3°C", "厨房窗户 19:37:30 打开后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰和超量程", "排查传感器硬件状态,两次 null 读数可能意味着传感器需要更换或固件升级", "确认厨房窗户当前状态,若仍开启建议关闭以保障夜间安全", "考虑为厨房温度传感器设置合理的告警阈值,以便在异常跳变时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.19251847267151, "api_error": null} {"episode_id": "SQ4_TP_B_0841", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0841.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261470, "scenario_id": "BA-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-02T18:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障;同时凌晨存在无人触发门锁的活动痕迹,厨房窗户在日志结束时仍处于打开状态。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度趋势分析——凌晨约22.9°C,白天逐步升至约25.8°C(12:30峰值),傍晚回落,符合夏季自然温度变化规律,各房间温度高度一致。\",\n \"推理步骤2: 厨房温度传感器在18:00突然从约24.6°C跳升至28.57°C,18:30继续报28.61°C,与同时段其他房间(约24.5-24.6°C)偏差达4°C。此时灶具尚未开启(18:51才开),且住户刚进门,不存在烹饪热源,这一异常升温无合理解释。\",\n \"推理步骤3: 厨房温度传感器在18:52和19:35两次报告MeasuredValue=None(空值),说明传感器出现数据采集中断。第一次发生在灶具刚开启后,第二次发生在灶具关闭、窗户打开后。随后19:00恢复正常读数24.29°C,与其他房间一致,说明之前的28.5°C+读数并非真实环境温度。\",\n \"推理步骤4: 综合18:00的异常高温跳变和两次None值,高度怀疑厨房温度传感器存在硬件故障或接触不良,导致间歇性读数异常和数据丢失。烟雾报警器全天未触发,排除真实火灾风险。\",\n \"推理步骤5: 凌晨02:30-02:40出现客厅占用→卫生间占用→客厅灯亮→厨房灯亮→玄关占用的活动序列,但无门锁解锁/开门记录。结合时间推断,这更可能是住户夜间起夜活动(从卧室经客厅去卫生间/厨房),属于正常生活行为,不构成入侵威胁。\",\n \"推理步骤6: 07:25住户手动开锁出门,门自动上锁关闭;18:15住户回家手动开锁进门,一系列开灯、开空调操作符合下班回家模式。21:56关灯关空调后门自动锁闭,符合就寝或外出模式。门锁安全状态正常。\",\n \"推理步骤7: 19:34厨房窗户打开(StateValue=False),但日志中无后续关闭记录。虽然可能是通风目的,但在无人看管的情况下窗户持续打开存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器突跳至2857(28.57°C),较同时段其他房间高出约4°C,且灶具尚未开启\",\n \"18:30厨房温度传感器继续报2861(28.61°C),异常持续\",\n \"18:52和19:35厨房温度传感器两次报告MeasuredValue=None,出现数据丢失\",\n \"19:00厨房温度恢复至2429(24.29°C),与其他房间一致,证明之前的高温为虚假读数\",\n \"19:34厨房窗户打开后至日志结束(23:30)无关闭记录\",\n \"烟雾报警器全天未触发,排除真实火灾\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和硬件状态,清洁探头或更换传感器,排除接触不良或老化问题\",\n \"为厨房温度传感器设置异常值过滤规则:当单个传感器读数与其他房间偏差超过3°C且无明确热源时,标记为可疑读数而非触发告警\",\n \"添加传感器健康监测:当MeasuredValue连续报None时,自动发送设备故障通知\",\n \"确认厨房窗户是否需要关闭,建议设置窗户长时间打开(如超过2小时)的提醒规则\",\n \"凌晨活动虽判断为正常起夜,但建议保持关注,若频繁出现可结合门锁状态进一步确认\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次数据丢失(None),疑似传感器故障;同时凌晨存在无人触发门锁的活动痕迹,厨房窗户在日志结束时仍处于打开状态。", "reasoning": ["推理步骤1: 全天温度趋势分析——凌晨约22.9°C,白天逐步升至约25.8°C(12:30峰值),傍晚回落,符合夏季自然温度变化规律,各房间温度高度一致。", "推理步骤2: 厨房温度传感器在18:00突然从约24.6°C跳升至28.57°C,18:30继续报28.61°C,与同时段其他房间(约24.5-24.6°C)偏差达4°C。此时灶具尚未开启(18:51才开),且住户刚进门,不存在烹饪热源,这一异常升温无合理解释。", "推理步骤3: 厨房温度传感器在18:52和19:35两次报告MeasuredValue=None(空值),说明传感器出现数据采集中断。第一次发生在灶具刚开启后,第二次发生在灶具关闭、窗户打开后。随后19:00恢复正常读数24.29°C,与其他房间一致,说明之前的28.5°C+读数并非真实环境温度。", "推理步骤4: 综合18:00的异常高温跳变和两次None值,高度怀疑厨房温度传感器存在硬件故障或接触不良,导致间歇性读数异常和数据丢失。烟雾报警器全天未触发,排除真实火灾风险。", "推理步骤5: 凌晨02:30-02:40出现客厅占用→卫生间占用→客厅灯亮→厨房灯亮→玄关占用的活动序列,但无门锁解锁/开门记录。结合时间推断,这更可能是住户夜间起夜活动(从卧室经客厅去卫生间/厨房),属于正常生活行为,不构成入侵威胁。", "推理步骤6: 07:25住户手动开锁出门,门自动上锁关闭;18:15住户回家手动开锁进门,一系列开灯、开空调操作符合下班回家模式。21:56关灯关空调后门自动锁闭,符合就寝或外出模式。门锁安全状态正常。", "推理步骤7: 19:34厨房窗户打开(StateValue=False),但日志中无后续关闭记录。虽然可能是通风目的,但在无人看管的情况下窗户持续打开存在一定安全隐患。"], "key_evidence": ["18:00厨房温度传感器突跳至2857(28.57°C),较同时段其他房间高出约4°C,且灶具尚未开启", "18:30厨房温度传感器继续报2861(28.61°C),异常持续", "18:52和19:35厨房温度传感器两次报告MeasuredValue=None,出现数据丢失", "19:00厨房温度恢复至2429(24.29°C),与其他房间一致,证明之前的高温为虚假读数", "19:34厨房窗户打开后至日志结束(23:30)无关闭记录", "烟雾报警器全天未触发,排除真实火灾"], "recommended_actions": ["检查厨房温度传感器的安装位置和硬件状态,清洁探头或更换传感器,排除接触不良或老化问题", "为厨房温度传感器设置异常值过滤规则:当单个传感器读数与其他房间偏差超过3°C且无明确热源时,标记为可疑读数而非触发告警", "添加传感器健康监测:当MeasuredValue连续报None时,自动发送设备故障通知", "确认厨房窗户是否需要关闭,建议设置窗户长时间打开(如超过2小时)的提醒规则", "凌晨活动虽判断为正常起夜,但建议保持关注,若频繁出现可结合门锁状态进一步确认"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.191808462142944, "api_error": null} {"episode_id": "SQ4_TP_B_0848", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0848.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261477, "scenario_id": "DF-06", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-21T16:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭设备状态正常,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 全天温度变化符合自然规律——凌晨最低约22.9°C,中午峰值约25.9°C,傍晚后逐步回落至23.3°C,呈现典型的夏季昼夜温度曲线,四个传感器读数高度一致,无单点异常升温。\",\n \"推理步骤2: 次卧窗帘在16:21下发DownOrClose指令并持续关闭(OperationalStatus=0b000010表示正在向下运动,CurrentPositionLiftPercent100ths=5000表示已到50%位置),时间处于下午傍晚时段,属于遮阳或隐私需求的正常操作。\",\n \"推理步骤3: 整个24小时内无入户门锁异常开锁、无门窗传感器触发开启事件、无运动传感器异常触发、无烟雾报警、无漏水报警、无灶具异常启动,所有安全类传感器均未上报告警事件。\",\n \"推理步骤4: 厨房温度与其他房间同步变化,未出现独立升温,排除灶具遗忘关闭或火灾隐患的可能。\",\n \"推理步骤5: 无任何设备在深夜异常时段(00:00-06:00)被操作,排除入侵相关的设备联动异常。\"\n ],\n \"key_evidence\": [\n \"四个温度传感器全天读数同步变化,范围22.9°C~25.9°C,符合6月夏季昼夜温差规律\",\n \"次卧窗帘16:21关闭操作属于正常傍晚时段行为\",\n \"全天无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的异常事件上报\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭设备状态正常,未发现安全威胁", "reasoning": ["推理步骤1: 全天温度变化符合自然规律——凌晨最低约22.9°C,中午峰值约25.9°C,傍晚后逐步回落至23.3°C,呈现典型的夏季昼夜温度曲线,四个传感器读数高度一致,无单点异常升温。", "推理步骤2: 次卧窗帘在16:21下发DownOrClose指令并持续关闭(OperationalStatus=0b000010表示正在向下运动,CurrentPositionLiftPercent100ths=5000表示已到50%位置),时间处于下午傍晚时段,属于遮阳或隐私需求的正常操作。", "推理步骤3: 整个24小时内无入户门锁异常开锁、无门窗传感器触发开启事件、无运动传感器异常触发、无烟雾报警、无漏水报警、无灶具异常启动,所有安全类传感器均未上报告警事件。", "推理步骤4: 厨房温度与其他房间同步变化,未出现独立升温,排除灶具遗忘关闭或火灾隐患的可能。", "推理步骤5: 无任何设备在深夜异常时段(00:00-06:00)被操作,排除入侵相关的设备联动异常。"], "key_evidence": ["四个温度传感器全天读数同步变化,范围22.9°C~25.9°C,符合6月夏季昼夜温差规律", "次卧窗帘16:21关闭操作属于正常傍晚时段行为", "全天无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器的异常事件上报"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.694316148757935, "api_error": null} {"episode_id": "SQ4_TP_B_0849", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_B_0849.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-17T00:00:00", "seed": 20261478, "scenario_id": "FG-03", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-17T19:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房发生一氧化碳(CO)报警,且厨房温度传感器出现异常读数和故障,存在CO中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:00厨房温度传感器突然从约24.5°C跳升至28.35°C,远超其他房间同时刻的温度(约24.3°C),说明厨房出现异常热源或传感器受干扰。\",\n \"推理步骤2: 19:03灶具开启,19:04厨房温度传感器报告None(读数丢失),传感器可能因高温或烟气干扰失效。\",\n \"推理步骤3: 19:24厨房烟雾报警器触发CO报警(COState=1, ExpressedState=2, COAlarm事件),表明厨房存在一氧化碳泄漏。\",\n \"推理步骤4: 用户在19:33关闭灶具并打开厨房窗户通风,说明住户已察觉问题并采取了初步应对措施。\",\n \"推理步骤5: 19:30厨房温度仍高达28.39°C,19:34传感器再次报告None,传感器可能已损坏或仍处于异常环境中。\",\n \"推理步骤6: 虽然住户已关灶开窗,但CO报警后日志中未见烟雾报警器恢复正常状态(COState回到0),无法确认CO已完全消散。同时厨房温度传感器持续故障需要关注。\"\n ],\n \"key_evidence\": [\n \"19:24 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event: COAlarm()\",\n \"19:00和19:30厨房温度异常飙升至28.35°C/28.39°C,远高于其他房间\",\n \"19:04和19:34厨房温度传感器读数为None,传感器疑似故障\",\n \"灶具使用约20分钟后触发CO报警,提示燃气燃烧不充分或排烟不畅\"\n ],\n \"recommended_actions\": [\n \"确认CO报警是否已解除,若未解除应立即撤离并通风,必要时拨打燃气公司或119\",\n \"检查燃气灶具是否存在燃烧不充分问题(火焰颜色、喷嘴堵塞等),安排专业人员检修\",\n \"检查厨房排烟系统(抽油烟机/排气扇)是否正常工作\",\n \"检修或更换厨房温度传感器,其多次报告None表明可能已损坏\",\n \"确认厨房窗户保持开启状态直至CO完全消散,建议使用独立CO检测仪复测\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房发生一氧化碳(CO)报警,且厨房温度传感器出现异常读数和故障,存在CO中毒风险。", "reasoning": ["推理步骤1: 19:00厨房温度传感器突然从约24.5°C跳升至28.35°C,远超其他房间同时刻的温度(约24.3°C),说明厨房出现异常热源或传感器受干扰。", "推理步骤2: 19:03灶具开启,19:04厨房温度传感器报告None(读数丢失),传感器可能因高温或烟气干扰失效。", "推理步骤3: 19:24厨房烟雾报警器触发CO报警(COState=1, ExpressedState=2, COAlarm事件),表明厨房存在一氧化碳泄漏。", "推理步骤4: 用户在19:33关闭灶具并打开厨房窗户通风,说明住户已察觉问题并采取了初步应对措施。", "推理步骤5: 19:30厨房温度仍高达28.39°C,19:34传感器再次报告None,传感器可能已损坏或仍处于异常环境中。", "推理步骤6: 虽然住户已关灶开窗,但CO报警后日志中未见烟雾报警器恢复正常状态(COState回到0),无法确认CO已完全消散。同时厨房温度传感器持续故障需要关注。"], "key_evidence": ["19:24 kitchen_smoke_alarm 触发CO报警:COState=1, ExpressedState=2, Event: COAlarm()", "19:00和19:30厨房温度异常飙升至28.35°C/28.39°C,远高于其他房间", "19:04和19:34厨房温度传感器读数为None,传感器疑似故障", "灶具使用约20分钟后触发CO报警,提示燃气燃烧不充分或排烟不畅"], "recommended_actions": ["确认CO报警是否已解除,若未解除应立即撤离并通风,必要时拨打燃气公司或119", "检查燃气灶具是否存在燃烧不充分问题(火焰颜色、喷嘴堵塞等),安排专业人员检修", "检查厨房排烟系统(抽油烟机/排气扇)是否正常工作", "检修或更换厨房温度传感器,其多次报告None表明可能已损坏", "确认厨房窗户保持开启状态直至CO完全消散,建议使用独立CO检测仪复测"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.385923147201538, "api_error": null} {"episode_id": "SQ4_TP_C_0721", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0721.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261350, "scenario_id": "BA-03", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-10T02:27:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,儿童房灯凌晨出现快速闪烁,存在设备故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:40、07:30、18:21、19:30 四个时间点报告 MeasuredValue = None。虽然其中部分时段灶具正在使用,但传感器不应返回空值,正常情况下应报告实际温度读数,这表明传感器可能存在间歇性故障或通信异常。\",\n \"推理步骤2: 凌晨 02:27:00 至 02:27:14,儿童房灯在 14 秒内发生了 7 次开关切换(True-False-True-False-True-True-False),频率极高且发生在深夜无人活动时段。儿童房运动传感器在该时段无任何触发记录,排除了人为操作的可能。这种快速闪烁模式可能是智能开关故障、固件异常或线路接触不良。\",\n \"推理步骤3: 入侵风险方面未发现异常——两次入户门开锁均为 Manual 操作,07:29 出门后自动上锁,16:04 和 18:01 的进门模式符合放学回家和大人下班的生活规律。22:21 确认门已关闭并自动上锁,夜间安全。\",\n \"推理步骤4: 温度趋势整体正常,各房间从夜间约 23°C 逐步升至午间约 25.8°C 后回落,符合夏季自然温度变化曲线。18:01 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,行为合理。\",\n \"推理步骤5: 厨房灶具两次使用(06:39-07:29 早餐、18:20-19:29 晚餐)时长和时段均合理,烟雾报警器全天无触发,无火灾风险。厨房窗户在做完饭后打开通风属正常行为。\",\n \"推理步骤6: 所有漏水传感器全天无报告,无水患风险。洗碗机 19:59 启动运行,属正常晚餐后使用。\",\n \"推理步骤7: 16:04 入户门开锁后仅 2 秒儿童房即检测到人体存在,随后开灯,符合孩子放学回家直奔房间的行为模式。入户门在该次进入后未记录关门上锁事件,直到 22:21 才确认门关闭上锁——中间约 6 小时入户门可能处于未锁状态,存在一定安全隐患,但 18:01 大人回家时再次开锁说明门至少在 18:01 前已关闭。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 MeasuredValue = None(06:40、07:30、18:21、19:30)\",\n \"儿童房灯凌晨 02:27:00-02:27:14 在 14 秒内发生 7 次开关切换,期间无运动传感器触发\",\n \"所有入户门操作均为 Manual/Auto 来源,无异常解锁方式\",\n \"烟雾报警器、漏水传感器全天无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的连接状态和固件版本,必要时重新配对或更换设备\",\n \"检查儿童房智能灯开关的固件和线路连接,排查凌晨快速闪烁的原因,避免电气安全隐患\",\n \"建议为儿童房灯设置异常闪烁检测规则:若短时间内开关超过 3 次则自动断电并发送告警\",\n \"确认厨房窗户(07:29 和 19:29 打开)在睡前是否已关闭,日志中未见关闭记录\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,儿童房灯凌晨出现快速闪烁,存在设备故障风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:40、07:30、18:21、19:30 四个时间点报告 MeasuredValue = None。虽然其中部分时段灶具正在使用,但传感器不应返回空值,正常情况下应报告实际温度读数,这表明传感器可能存在间歇性故障或通信异常。", "推理步骤2: 凌晨 02:27:00 至 02:27:14,儿童房灯在 14 秒内发生了 7 次开关切换(True-False-True-False-True-True-False),频率极高且发生在深夜无人活动时段。儿童房运动传感器在该时段无任何触发记录,排除了人为操作的可能。这种快速闪烁模式可能是智能开关故障、固件异常或线路接触不良。", "推理步骤3: 入侵风险方面未发现异常——两次入户门开锁均为 Manual 操作,07:29 出门后自动上锁,16:04 和 18:01 的进门模式符合放学回家和大人下班的生活规律。22:21 确认门已关闭并自动上锁,夜间安全。", "推理步骤4: 温度趋势整体正常,各房间从夜间约 23°C 逐步升至午间约 25.8°C 后回落,符合夏季自然温度变化曲线。18:01 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,行为合理。", "推理步骤5: 厨房灶具两次使用(06:39-07:29 早餐、18:20-19:29 晚餐)时长和时段均合理,烟雾报警器全天无触发,无火灾风险。厨房窗户在做完饭后打开通风属正常行为。", "推理步骤6: 所有漏水传感器全天无报告,无水患风险。洗碗机 19:59 启动运行,属正常晚餐后使用。", "推理步骤7: 16:04 入户门开锁后仅 2 秒儿童房即检测到人体存在,随后开灯,符合孩子放学回家直奔房间的行为模式。入户门在该次进入后未记录关门上锁事件,直到 22:21 才确认门关闭上锁——中间约 6 小时入户门可能处于未锁状态,存在一定安全隐患,但 18:01 大人回家时再次开锁说明门至少在 18:01 前已关闭。"], "key_evidence": ["厨房温度传感器 4 次报告 MeasuredValue = None(06:40、07:30、18:21、19:30)", "儿童房灯凌晨 02:27:00-02:27:14 在 14 秒内发生 7 次开关切换,期间无运动传感器触发", "所有入户门操作均为 Manual/Auto 来源,无异常解锁方式", "烟雾报警器、漏水传感器全天无告警"], "recommended_actions": ["检查厨房温度传感器的连接状态和固件版本,必要时重新配对或更换设备", "检查儿童房智能灯开关的固件和线路连接,排查凌晨快速闪烁的原因,避免电气安全隐患", "建议为儿童房灯设置异常闪烁检测规则:若短时间内开关超过 3 次则自动断电并发送告警", "确认厨房窗户(07:29 和 19:29 打开)在睡前是否已关闭,日志中未见关闭记录"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.810786724090576, "api_error": null} {"episode_id": "SQ4_TP_C_0727", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0727.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261356, "scenario_id": "CH-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-03", "scenario_name": "儿童深夜活动", "category": "child_specific", "is_anomaly": true, "threat_type": "child_nighttime_wandering", "key_evidence": ["凌晨时段儿童房活动 → 离开房间去其他区域", "家长卧室无活动(不是家长带着孩子)", "低龄儿童深夜独自活动有安全风险(摔倒、误触电器等)"], "expected_response": "通知家长(轻柔方式),建议查看孩子情况", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-25T14:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户做饭后未关闭,且儿童房凌晨有异常活动。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:40、07:11、18:19、18:57 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器可能受高温或油烟影响出现间歇性故障。虽然在下一个整点周期恢复了正常数值,但反复出现 None 值表明传感器工作不稳定。\",\n \"推理步骤2: 厨房窗户在 07:10:30 做完早餐后打开通风(BooleanState=False 表示打开),但日志中没有关闭记录。到 18:56:30 晚餐后再次出现打开事件,说明窗户可能整天处于打开状态。家中 07:42 至 16:35 期间无人(全家出门),厨房窗户长时间敞开存在安全隐患。\",\n \"推理步骤3: 凌晨 01:30 儿童房检测到运动并开灯,01:35 运动消失,01:36 客厅检测到运动。这符合小孩夜间起床(如上厕所、喝水)的行为模式,属于低风险事件,但值得家长留意儿童夜间活动频率。\",\n \"推理步骤4: 入户门锁操作均正常——早上 07:42 手动开锁出门后自动上锁,下午 16:35 和 17:53 分两批回家(推测一位家长带孩子先回、另一位稍后到家),晚上 22:28 确认门已关闭并自动上锁。所有开锁均为 Manual 操作,无异常入侵迹象。\",\n \"推理步骤5: 温度趋势正常,符合夏季昼夜变化规律:凌晨约 22.9-23.0°C,中午升至 25.8°C 峰值,傍晚逐步回落。17:53 开启客厅空调(制冷模式 SystemMode=3)后温度从 24.5°C 降至 22:00 的 23.5°C,表现合理。\",\n \"推理步骤6: 次卫灯在 06:37 开启但日志中无关闭记录,可能存在忘关灯的情况,属于能耗浪费但非安全威胁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:40、07:11、18:19、18:57 四次报告 MeasuredValue = None,表明传感器间歇性失效\",\n \"kitchen_window_contact 在 07:10:30 报告打开(BooleanState=False),家中无人期间(07:42-16:35)无关闭记录,窗户长时间敞开\",\n \"所有入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常来源的开锁事件\",\n \"儿童房凌晨 01:30 短暂活动(5分钟),随后客厅检测到运动,符合夜间起夜模式\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器:该传感器在灶具使用期间反复报告 None 值,可能是传感器老化、安装位置过近灶台或油烟干扰所致。建议清洁传感器或调整安装位置,若问题持续则更换设备。\",\n \"设置厨房窗户离家自动提醒:当入户门上锁(离家模式)时,若厨房窗户仍处于打开状态,应触发提醒通知,避免无人在家时窗户长时间敞开。\",\n \"关注儿童夜间活动:凌晨 01:30 的活动本次为单次事件,若频繁发生建议关注儿童睡眠质量。\",\n \"检查次卫灯是否遗忘关闭:日志显示 06:37 开启后无关闭记录,建议确认或设置无人自动关灯规则。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户做饭后未关闭,且儿童房凌晨有异常活动。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:40、07:11、18:19、18:57 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,说明传感器可能受高温或油烟影响出现间歇性故障。虽然在下一个整点周期恢复了正常数值,但反复出现 None 值表明传感器工作不稳定。", "推理步骤2: 厨房窗户在 07:10:30 做完早餐后打开通风(BooleanState=False 表示打开),但日志中没有关闭记录。到 18:56:30 晚餐后再次出现打开事件,说明窗户可能整天处于打开状态。家中 07:42 至 16:35 期间无人(全家出门),厨房窗户长时间敞开存在安全隐患。", "推理步骤3: 凌晨 01:30 儿童房检测到运动并开灯,01:35 运动消失,01:36 客厅检测到运动。这符合小孩夜间起床(如上厕所、喝水)的行为模式,属于低风险事件,但值得家长留意儿童夜间活动频率。", "推理步骤4: 入户门锁操作均正常——早上 07:42 手动开锁出门后自动上锁,下午 16:35 和 17:53 分两批回家(推测一位家长带孩子先回、另一位稍后到家),晚上 22:28 确认门已关闭并自动上锁。所有开锁均为 Manual 操作,无异常入侵迹象。", "推理步骤5: 温度趋势正常,符合夏季昼夜变化规律:凌晨约 22.9-23.0°C,中午升至 25.8°C 峰值,傍晚逐步回落。17:53 开启客厅空调(制冷模式 SystemMode=3)后温度从 24.5°C 降至 22:00 的 23.5°C,表现合理。", "推理步骤6: 次卫灯在 06:37 开启但日志中无关闭记录,可能存在忘关灯的情况,属于能耗浪费但非安全威胁。"], "key_evidence": ["kitchen_temp_sensor 在 06:40、07:11、18:19、18:57 四次报告 MeasuredValue = None,表明传感器间歇性失效", "kitchen_window_contact 在 07:10:30 报告打开(BooleanState=False),家中无人期间(07:42-16:35)无关闭记录,窗户长时间敞开", "所有入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常来源的开锁事件", "儿童房凌晨 01:30 短暂活动(5分钟),随后客厅检测到运动,符合夜间起夜模式"], "recommended_actions": ["检查或更换厨房温度传感器:该传感器在灶具使用期间反复报告 None 值,可能是传感器老化、安装位置过近灶台或油烟干扰所致。建议清洁传感器或调整安装位置,若问题持续则更换设备。", "设置厨房窗户离家自动提醒:当入户门上锁(离家模式)时,若厨房窗户仍处于打开状态,应触发提醒通知,避免无人在家时窗户长时间敞开。", "关注儿童夜间活动:凌晨 01:30 的活动本次为单次事件,若频繁发生建议关注儿童睡眠质量。", "检查次卫灯是否遗忘关闭:日志显示 06:37 开启后无关闭记录,建议确认或设置无人自动关灯规则。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.422764539718628, "api_error": null} {"episode_id": "SQ4_TP_C_0728", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0728.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261357, "scenario_id": "CH-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "CH-04", "scenario_name": "儿童尝试开门外出", "category": "child_specific", "is_anomaly": true, "threat_type": "child_escape_attempt", "key_evidence": ["玄关运动 + 门锁解锁失败", "密码错误(小孩可能记不准密码)", "无成人在玄关区域", "跟 INS-02 的区别:这里不是暴力破解,只有1-2次尝试,且家中有其他房间的活动(说明有人在家)"], "expected_response": "通知家长孩子在尝试开门", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-09T08:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障;同时入户门在家中无人时段出现两次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:45、07:27、18:37、19:24 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,可能是高温/油烟干扰导致传感器读数异常或通信中断。\",\n \"推理步骤2: 08:19 玄关运动传感器检测到有人,随后入户门锁连续两次报告 LockOperationError(OperationError=1, OperationSource=3,即 Keypad/PIN 来源的无效凭证错误)。此时家人已于 07:50 出门且门已自动上锁,属于无人在家时段,两次连续错误密码尝试存在潜在入侵试探风险。\",\n \"推理步骤3: 不过仅有两次失败尝试且之后无进一步开锁成功或门被打开的记录,门锁保持锁定状态,实际入侵未发生。可能是邻居误按或快递员尝试,威胁程度有限。\",\n \"推理步骤4: 其余行为模式正常——早起做饭、开窗通风、孩子放学回家、晚间做饭用餐、睡前关灯锁门,温度随日照自然升降,空调制冷效果合理。\",\n \"推理步骤5: 厨房窗户在做饭后打开(BooleanState=False 表示开启)属于正常通风行为,但日志中未见其关闭记录,若长时间未关可能存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"08:19:05 和 08:19:15 入户门锁连续两次 LockOperationError(无效凭证,来源为 Keypad),发生在全家外出时段\",\n \"厨房温度传感器在 06:45、07:27、18:37、19:24 四次报告 MeasuredValue = None\",\n \"厨房窗户在 07:26 和 19:23 被打开,日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查入户门锁 08:19 的开锁失败记录,确认是否有可疑人员尝试进入,必要时查看门口监控或更换门锁密码\",\n \"检修厨房温度传感器,清洁探头或更换设备,确保在灶具使用时仍能正常监测温度(与烟雾报警联动的关键传感器)\",\n \"确认厨房窗户当前是否已关闭,夜间和外出时应保持关闭以防入侵\",\n \"考虑为入户门锁设置连续失败锁定策略(如3次失败后临时锁定并推送告警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障;同时入户门在家中无人时段出现两次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:45、07:27、18:37、19:24 四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,可能是高温/油烟干扰导致传感器读数异常或通信中断。", "推理步骤2: 08:19 玄关运动传感器检测到有人,随后入户门锁连续两次报告 LockOperationError(OperationError=1, OperationSource=3,即 Keypad/PIN 来源的无效凭证错误)。此时家人已于 07:50 出门且门已自动上锁,属于无人在家时段,两次连续错误密码尝试存在潜在入侵试探风险。", "推理步骤3: 不过仅有两次失败尝试且之后无进一步开锁成功或门被打开的记录,门锁保持锁定状态,实际入侵未发生。可能是邻居误按或快递员尝试,威胁程度有限。", "推理步骤4: 其余行为模式正常——早起做饭、开窗通风、孩子放学回家、晚间做饭用餐、睡前关灯锁门,温度随日照自然升降,空调制冷效果合理。", "推理步骤5: 厨房窗户在做饭后打开(BooleanState=False 表示开启)属于正常通风行为,但日志中未见其关闭记录,若长时间未关可能存在安全隐患。"], "key_evidence": ["08:19:05 和 08:19:15 入户门锁连续两次 LockOperationError(无效凭证,来源为 Keypad),发生在全家外出时段", "厨房温度传感器在 06:45、07:27、18:37、19:24 四次报告 MeasuredValue = None", "厨房窗户在 07:26 和 19:23 被打开,日志中无关闭记录"], "recommended_actions": ["检查入户门锁 08:19 的开锁失败记录,确认是否有可疑人员尝试进入,必要时查看门口监控或更换门锁密码", "检修厨房温度传感器,清洁探头或更换设备,确保在灶具使用时仍能正常监测温度(与烟雾报警联动的关键传感器)", "确认厨房窗户当前是否已关闭,夜间和外出时应保持关闭以防入侵", "考虑为入户门锁设置连续失败锁定策略(如3次失败后临时锁定并推送告警)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.634615659713745, "api_error": null} {"episode_id": "SQ4_TP_C_0730", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0730.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261359, "scenario_id": "CH-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-01", "scenario_name": "儿童独自在家异常", "category": "child_specific", "is_anomaly": true, "threat_type": "child_alone_unexpected", "key_evidence": ["工作日上午学校时段", "家长已出门(LockOperation 记录)", "仅儿童房有活动信号,其他房间无人", "活动模式像小孩(仅在一个房间)"], "expected_response": "通知家长确认孩子是否生病在家/逃学", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-26T06:09:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——凌晨无人活动,06:12 主卧起床,06:50 儿童房起床,07:17 全家出门并自动锁门,16:15 有人回家(孩子放学),18:03 大人回家,22:16 就寝锁门。这是典型的工作日家庭节奏,无入侵迹象。\",\n \"推理步骤2: 入户门锁操作均正常——07:17 手动开锁出门后自动上锁,07:30 出现一次 UserIndex=1 的开锁/上锁操作(可能是确认锁门或远程操作),16:15 和 18:03 手动开锁回家,22:16 确认门关闭并自动上锁。所有锁操作来源合理,无异常开锁。\",\n \"推理步骤3: 温度趋势合理——凌晨约 23°C,随日出逐步升至中午峰值约 25.9°C,午后回落,晚间降至约 23.3°C。各房间温差在正常范围内,无异常高温指示火灾风险。\",\n \"推理步骤4: 厨房温度传感器在 06:59、07:12、18:37、19:02 四次报告 MeasuredValue = None。这些时间点均与灶具使用时段重合(06:58-07:11 早餐、18:36-19:01 晚餐),可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然灶具关闭后传感器恢复了正常读数,但反复出现 None 值不应忽视。\",\n \"推理步骤5: 厨房窗户在 07:11:30(早餐后)和 19:01:30(晚餐后)被打开(BooleanState = False 表示开启),但整个日志中未见对应的关闭事件。做饭后开窗通风是合理行为,但如果窗户长时间未关闭(尤其是夜间),存在安全隐患。\",\n \"推理步骤6: 烟雾报警器(厨房和客厅)全天无触发事件,漏水传感器无报警,排除火灾和漏水风险。\",\n \"推理步骤7: 儿童房窗帘在 06:50 打开(0%)、20:54 关闭(100%),配合孩子作息,正常。主卧窗帘 22:16 关闭,配合就寝,正常。客厅空调 18:03 开启制冷(SystemMode=3),22:16 关闭,符合夏季傍晚使用习惯。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:59、07:12、18:37、19:02 四次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"厨房窗户在 07:11:30 和 19:01:30 两次被打开,但全天日志中无关闭记录\",\n \"所有门锁操作来源合理(Manual/Auto),无未授权开锁事件\",\n \"烟雾报警器和漏水传感器全天无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器位置合理,建议更换或维修该传感器\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间建议关闭以保障安全\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当连续报告无效值时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 整体生活作息正常——凌晨无人活动,06:12 主卧起床,06:50 儿童房起床,07:17 全家出门并自动锁门,16:15 有人回家(孩子放学),18:03 大人回家,22:16 就寝锁门。这是典型的工作日家庭节奏,无入侵迹象。", "推理步骤2: 入户门锁操作均正常——07:17 手动开锁出门后自动上锁,07:30 出现一次 UserIndex=1 的开锁/上锁操作(可能是确认锁门或远程操作),16:15 和 18:03 手动开锁回家,22:16 确认门关闭并自动上锁。所有锁操作来源合理,无异常开锁。", "推理步骤3: 温度趋势合理——凌晨约 23°C,随日出逐步升至中午峰值约 25.9°C,午后回落,晚间降至约 23.3°C。各房间温差在正常范围内,无异常高温指示火灾风险。", "推理步骤4: 厨房温度传感器在 06:59、07:12、18:37、19:02 四次报告 MeasuredValue = None。这些时间点均与灶具使用时段重合(06:58-07:11 早餐、18:36-19:01 晚餐),可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在间歇性故障。虽然灶具关闭后传感器恢复了正常读数,但反复出现 None 值不应忽视。", "推理步骤5: 厨房窗户在 07:11:30(早餐后)和 19:01:30(晚餐后)被打开(BooleanState = False 表示开启),但整个日志中未见对应的关闭事件。做饭后开窗通风是合理行为,但如果窗户长时间未关闭(尤其是夜间),存在安全隐患。", "推理步骤6: 烟雾报警器(厨房和客厅)全天无触发事件,漏水传感器无报警,排除火灾和漏水风险。", "推理步骤7: 儿童房窗帘在 06:50 打开(0%)、20:54 关闭(100%),配合孩子作息,正常。主卧窗帘 22:16 关闭,配合就寝,正常。客厅空调 18:03 开启制冷(SystemMode=3),22:16 关闭,符合夏季傍晚使用习惯。"], "key_evidence": ["厨房温度传感器在 06:59、07:12、18:37、19:02 四次报告 MeasuredValue = None,均与灶具使用时段重合", "厨房窗户在 07:11:30 和 19:01:30 两次被打开,但全天日志中无关闭记录", "所有门锁操作来源合理(Manual/Auto),无未授权开锁事件", "烟雾报警器和漏水传感器全天无告警"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器位置合理,建议更换或维修该传感器", "确认厨房窗户当前是否仍处于打开状态,夜间建议关闭以保障安全", "考虑为厨房温度传感器设置 None 值告警规则,当连续报告无效值时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.689706087112427, "api_error": null} {"episode_id": "SQ4_TP_C_0737", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0737.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261366, "scenario_id": "CH-02", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-21T21:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在21:04开启后至日志结束(23:30)未见关闭记录,持续超过2.5小时无人关注,存在火灾/干烧风险。\",\n \"reasoning\": [\n \"推理步骤1: 21:04:30 厨房灶具(kitchen_cook_surface)OnOff 设为 True,表示灶具被点燃。\",\n \"推理步骤2: 从21:04:30到日志结束23:30:00,整段时间内没有出现灶具关闭(OnOff = False)的记录,意味着灶具至少持续运行了约2.5小时。\",\n \"推理步骤3: 21:04:15 客厅检测到有人活动,但厨房和其他区域此后无运动传感器触发记录,说明住户可能不在厨房附近持续看管灶具。\",\n \"推理步骤4: 厨房温度从21:00的23.85°C逐步下降到23:30的23.42°C,与全屋夜间降温趋势一致,未出现异常升温,说明目前尚未发生明火事故,但长时间无人看管的灶具仍是显著隐患。\",\n \"推理步骤5: 厨房烟雾报警器未触发,表明当前尚无烟雾产生,但干烧或忘关灶具的风险随时间增加而升高。\"\n ],\n \"key_evidence\": [\n \"21:04:30 kitchen_cook_surface OnOff = True,之后无关闭记录\",\n \"灶具持续开启超过2.5小时,期间无厨房运动传感器活动记录\",\n \"厨房烟雾报警器未触发、厨房温度未异常升高(排除当前已起火,但不排除干烧风险)\"\n ],\n \"recommended_actions\": [\n \"立即提醒住户确认厨房灶具是否需要关闭\",\n \"如住户无响应,考虑远程关闭灶具(若设备支持远程控制)\",\n \"建议设置灶具长时间开启的自动告警规则(如超过1小时未关闭则提醒)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "fire_risk", "threat_description": "厨房灶具在21:04开启后至日志结束(23:30)未见关闭记录,持续超过2.5小时无人关注,存在火灾/干烧风险。", "reasoning": ["推理步骤1: 21:04:30 厨房灶具(kitchen_cook_surface)OnOff 设为 True,表示灶具被点燃。", "推理步骤2: 从21:04:30到日志结束23:30:00,整段时间内没有出现灶具关闭(OnOff = False)的记录,意味着灶具至少持续运行了约2.5小时。", "推理步骤3: 21:04:15 客厅检测到有人活动,但厨房和其他区域此后无运动传感器触发记录,说明住户可能不在厨房附近持续看管灶具。", "推理步骤4: 厨房温度从21:00的23.85°C逐步下降到23:30的23.42°C,与全屋夜间降温趋势一致,未出现异常升温,说明目前尚未发生明火事故,但长时间无人看管的灶具仍是显著隐患。", "推理步骤5: 厨房烟雾报警器未触发,表明当前尚无烟雾产生,但干烧或忘关灶具的风险随时间增加而升高。"], "key_evidence": ["21:04:30 kitchen_cook_surface OnOff = True,之后无关闭记录", "灶具持续开启超过2.5小时,期间无厨房运动传感器活动记录", "厨房烟雾报警器未触发、厨房温度未异常升高(排除当前已起火,但不排除干烧风险)"], "recommended_actions": ["立即提醒住户确认厨房灶具是否需要关闭", "如住户无响应,考虑远程关闭灶具(若设备支持远程控制)", "建议设置灶具长时间开启的自动告警规则(如超过1小时未关闭则提醒)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.962892055511475, "api_error": null} {"episode_id": "SQ4_TP_C_0742", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0742.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261371, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-15T08:01:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在08:01-08:06出现异常高温读数并触发烟雾报警,厨房温度传感器多次报告None值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器在08:00报告2460(24.60°C),但08:01突然跳至3665(36.65°C),08:06为3200(32.00°C),5分钟内飙升超过12°C,这在正常物理环境中几乎不可能发生。\",\n \"推理步骤2: 08:11客厅烟雾报警器触发(SmokeState=1),但同一时段其他房间温度传感器均无异常升温,且家中07:33已全员出门(前门上锁、所有灯关闭),无人在家操作任何热源设备。\",\n \"推理步骤3: 到08:30客厅温度恢复至2461(24.61°C),与其他房间一致,说明并未发生真实火灾。若真有火情,温度不会在20分钟内自行恢复正常,且应伴随持续升温和多房间联动。\",\n \"推理步骤4: 综合判断,08:01-08:06的异常高温读数极可能是传感器瞬时故障或数据上报格式异常(注意这两条日志缺少完整的Cluster前缀'TemperatureMeasurement.'),导致烟雾报警器被误触发。\",\n \"推理步骤5: 厨房温度传感器在07:04、07:05、18:32、19:20多次报告MeasuredValue=None,均发生在灶具开启/关闭前后,可能是灶具工作时的热干扰导致传感器读数溢出或通信中断。\",\n \"推理步骤6: 其余家庭行为模式正常——早晨06:26起床、07:33出门上锁、16:31孩子放学回家、18:19大人回家做饭、21:04孩子就寝、22:47大人就寝并锁门,符合典型三口之家作息。\"\n ],\n \"key_evidence\": [\n \"08:01 living_room_temp_sensor MeasuredValue=3665(缺少Cluster前缀),较08:00的2460瞬间跳升12°C\",\n \"08:06 living_room_temp_sensor MeasuredValue=3200,持续异常高温\",\n \"08:11 living_room_smoke_alarm SmokeState=1 烟雾报警触发,但家中无人、无热源设备运行\",\n \"08:30 客厅温度自行恢复至2461,排除真实火灾可能\",\n \"厨房温度传感器在07:04、07:05、18:32、19:20四次报告None值,均与灶具操作时间高度关联\",\n \"异常温度日志缺少标准'TemperatureMeasurement.'前缀,可能为设备通信异常的佐证\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器硬件状态,清洁探头并确认固件版本,必要时更换设备\",\n \"检查客厅烟雾报警器是否仍处于告警状态,手动复位并确认其工作正常\",\n \"排查厨房温度传感器报告None值的原因,检查其与灶具的物理距离是否过近导致热干扰或通信中断\",\n \"在智能家居平台中增加温度突变过滤逻辑:单次跳变超过5°C且其他房间无联动变化时,标记为疑似传感器故障而非真实告警\",\n \"建议为烟雾报警器增加多源交叉验证机制,仅在温度传感器持续升温且多个传感器联动时才升级为火灾告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在08:01-08:06出现异常高温读数并触发烟雾报警,厨房温度传感器多次报告None值,存在传感器故障风险。", "reasoning": ["推理步骤1: 客厅温度传感器在08:00报告2460(24.60°C),但08:01突然跳至3665(36.65°C),08:06为3200(32.00°C),5分钟内飙升超过12°C,这在正常物理环境中几乎不可能发生。", "推理步骤2: 08:11客厅烟雾报警器触发(SmokeState=1),但同一时段其他房间温度传感器均无异常升温,且家中07:33已全员出门(前门上锁、所有灯关闭),无人在家操作任何热源设备。", "推理步骤3: 到08:30客厅温度恢复至2461(24.61°C),与其他房间一致,说明并未发生真实火灾。若真有火情,温度不会在20分钟内自行恢复正常,且应伴随持续升温和多房间联动。", "推理步骤4: 综合判断,08:01-08:06的异常高温读数极可能是传感器瞬时故障或数据上报格式异常(注意这两条日志缺少完整的Cluster前缀'TemperatureMeasurement.'),导致烟雾报警器被误触发。", "推理步骤5: 厨房温度传感器在07:04、07:05、18:32、19:20多次报告MeasuredValue=None,均发生在灶具开启/关闭前后,可能是灶具工作时的热干扰导致传感器读数溢出或通信中断。", "推理步骤6: 其余家庭行为模式正常——早晨06:26起床、07:33出门上锁、16:31孩子放学回家、18:19大人回家做饭、21:04孩子就寝、22:47大人就寝并锁门,符合典型三口之家作息。"], "key_evidence": ["08:01 living_room_temp_sensor MeasuredValue=3665(缺少Cluster前缀),较08:00的2460瞬间跳升12°C", "08:06 living_room_temp_sensor MeasuredValue=3200,持续异常高温", "08:11 living_room_smoke_alarm SmokeState=1 烟雾报警触发,但家中无人、无热源设备运行", "08:30 客厅温度自行恢复至2461,排除真实火灾可能", "厨房温度传感器在07:04、07:05、18:32、19:20四次报告None值,均与灶具操作时间高度关联", "异常温度日志缺少标准'TemperatureMeasurement.'前缀,可能为设备通信异常的佐证"], "recommended_actions": ["立即检查客厅温度传感器硬件状态,清洁探头并确认固件版本,必要时更换设备", "检查客厅烟雾报警器是否仍处于告警状态,手动复位并确认其工作正常", "排查厨房温度传感器报告None值的原因,检查其与灶具的物理距离是否过近导致热干扰或通信中断", "在智能家居平台中增加温度突变过滤逻辑:单次跳变超过5°C且其他房间无联动变化时,标记为疑似传感器故障而非真实告警", "建议为烟雾报警器增加多源交叉验证机制,仅在温度传感器持续升温且多个传感器联动时才升级为火灾告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.343833923339844, "api_error": null} {"episode_id": "SQ4_TP_C_0749", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0749.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261378, "scenario_id": "DF-05", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-27T20:27:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器在20:27发生硬件故障,该设备已失去烟雾/CO检测能力,存在安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 20:27客厅烟雾报警器上报 HardwareFaultAlert=True,ExpressedState=5(对应硬件故障状态),并触发了 HardwareFault 事件,表明设备自检发现内部硬件异常。\",\n \"推理步骤2: 检查全天温度数据,所有房间温度走势一致——凌晨约22.9~23.1°C,午间峰值约25.7~25.9°C,晚间回落至23.3~23.5°C,属于夏季正常昼夜温度波动,无任何房间出现异常升温,排除真实火灾导致报警器损坏的可能。\",\n \"推理步骤3: 厨房烟雾报警器未报告任何异常,厨房温度也无异常波动,进一步确认不存在火情,问题局限于客厅烟雾报警器自身硬件故障。\",\n \"推理步骤4: 烟雾报警器处于硬件故障状态意味着它无法正常检测烟雾和一氧化碳,客厅作为家庭主要活动区域,失去火灾/CO预警能力是显著的安全隐患。\"\n ],\n \"key_evidence\": [\n \"20:27 living_room_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件\",\n \"全天各房间温度走势平稳一致,无异常升温,排除火灾因素\",\n \"故障发生后无后续恢复事件,说明硬件故障持续存在\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅烟雾报警器,尝试手动复位;若无法恢复正常,尽快更换设备\",\n \"在报警器修复前,加强人工巡查,特别关注客厅区域的用火用电安全\",\n \"确认厨房烟雾报警器工作正常,确保家中至少有一个有效的烟雾检测点\",\n \"考虑在客厅临时放置独立式烟雾报警器作为过渡方案\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器在20:27发生硬件故障,该设备已失去烟雾/CO检测能力,存在安全监控盲区。", "reasoning": ["推理步骤1: 20:27客厅烟雾报警器上报 HardwareFaultAlert=True,ExpressedState=5(对应硬件故障状态),并触发了 HardwareFault 事件,表明设备自检发现内部硬件异常。", "推理步骤2: 检查全天温度数据,所有房间温度走势一致——凌晨约22.9~23.1°C,午间峰值约25.7~25.9°C,晚间回落至23.3~23.5°C,属于夏季正常昼夜温度波动,无任何房间出现异常升温,排除真实火灾导致报警器损坏的可能。", "推理步骤3: 厨房烟雾报警器未报告任何异常,厨房温度也无异常波动,进一步确认不存在火情,问题局限于客厅烟雾报警器自身硬件故障。", "推理步骤4: 烟雾报警器处于硬件故障状态意味着它无法正常检测烟雾和一氧化碳,客厅作为家庭主要活动区域,失去火灾/CO预警能力是显著的安全隐患。"], "key_evidence": ["20:27 living_room_smoke_alarm 上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件", "全天各房间温度走势平稳一致,无异常升温,排除火灾因素", "故障发生后无后续恢复事件,说明硬件故障持续存在"], "recommended_actions": ["立即检查客厅烟雾报警器,尝试手动复位;若无法恢复正常,尽快更换设备", "在报警器修复前,加强人工巡查,特别关注客厅区域的用火用电安全", "确认厨房烟雾报警器工作正常,确保家中至少有一个有效的烟雾检测点", "考虑在客厅临时放置独立式烟雾报警器作为过渡方案"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.987767934799194, "api_error": null} {"episode_id": "SQ4_TP_C_0747", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0747.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261376, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-24T07:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器在07:45-07:55出现异常高温读数并触发烟雾报警,同时厨房温度传感器多次报告None值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:45客厅温度传感器报告MeasuredValue=3584(约35.84°C),07:50报告3200(约32°C),而同一时段其他房间温度均在24.2-24.4°C范围内,客厅温度出现了约12°C的突然跳变,且报文格式缺少Cluster前缀(TemperatureMeasurement),疑似数据异常。\",\n \"推理步骤2: 07:55客厅烟雾报警器触发(SmokeState=1),但08:00客厅温度恢复到正常的24.62°C,且全屋无任何其他火灾迹象(无人在家、无灶具运行、无门窗异常开启)。如果是真实火灾,温度不会在5分钟内从35°C骤降回24°C,这更符合传感器故障或数据毛刺导致的误报。\",\n \"推理步骤3: 厨房温度传感器在06:31、07:02、18:17、18:58四次报告MeasuredValue=None,均发生在灶具开启或关闭前后。虽然灶具运行时温度传感器可能受热干扰,但正常传感器不应返回None,这表明传感器可能存在间歇性通信故障或硬件问题。\",\n \"推理步骤4: 07:21全家出门后入户门正常上锁(Auto锁定),07:45-07:55期间无任何运动传感器触发、无门窗开启记录,排除入侵导致的真实火情可能。\",\n \"推理步骤5: 16:21有人回家(入户门手动开锁)后进入儿童房,18:10第二批人回家后正常生活(开灯、开空调、做饭、用餐),22:43就寝锁门,整体生活模式正常,无入侵迹象。\",\n \"推理步骤6: 厨房窗户在07:01做完早饭后打开(通风)、18:57晚饭后再次打开,属于正常行为。但日志中未见这两次窗户关闭的记录(BooleanState.StateValue=True),厨房窗户可能处于持续打开状态,夜间存在安全隐患。\"\n ],\n \"key_evidence\": [\n \"07:45 客厅温度传感器读数突变至3584(35.84°C),07:50变为3200(32°C),且报文格式异常(缺少Cluster名称前缀),08:00恢复正常值2462\",\n \"07:55 客厅烟雾报警器触发 SmokeState=1,但无任何关联火灾证据(无人在家、无热源运行、其他房间温度正常)\",\n \"厨房温度传感器在06:31、07:02、18:17、18:58四次返回None值,指示传感器间歇性故障\",\n \"厨房窗户在07:01:30和18:57:30两次打开,日志中无对应关闭记录,可能整夜处于开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器硬件状态,清洁探头或更换设备,排除传感器故障导致的虚假高温读数\",\n \"确认客厅烟雾报警器当前状态,若仍处于报警状态需手动复位;建议对烟雾报警器进行功能测试以排除误报隐患\",\n \"检修或更换厨房温度传感器,多次返回None值表明设备通信不稳定,厨房作为高风险区域需要可靠的温度监测\",\n \"确认厨房窗户当前是否关闭,夜间无人时应关闭窗户并确保窗户传感器状态同步正确\",\n \"考虑为烟雾报警器与温度传感器建立交叉验证规则:仅当温度持续升高且多个传感器协同确认时才触发高级别火灾警报,减少单点故障导致的误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器在07:45-07:55出现异常高温读数并触发烟雾报警,同时厨房温度传感器多次报告None值,存在传感器故障风险。", "reasoning": ["推理步骤1: 07:45客厅温度传感器报告MeasuredValue=3584(约35.84°C),07:50报告3200(约32°C),而同一时段其他房间温度均在24.2-24.4°C范围内,客厅温度出现了约12°C的突然跳变,且报文格式缺少Cluster前缀(TemperatureMeasurement),疑似数据异常。", "推理步骤2: 07:55客厅烟雾报警器触发(SmokeState=1),但08:00客厅温度恢复到正常的24.62°C,且全屋无任何其他火灾迹象(无人在家、无灶具运行、无门窗异常开启)。如果是真实火灾,温度不会在5分钟内从35°C骤降回24°C,这更符合传感器故障或数据毛刺导致的误报。", "推理步骤3: 厨房温度传感器在06:31、07:02、18:17、18:58四次报告MeasuredValue=None,均发生在灶具开启或关闭前后。虽然灶具运行时温度传感器可能受热干扰,但正常传感器不应返回None,这表明传感器可能存在间歇性通信故障或硬件问题。", "推理步骤4: 07:21全家出门后入户门正常上锁(Auto锁定),07:45-07:55期间无任何运动传感器触发、无门窗开启记录,排除入侵导致的真实火情可能。", "推理步骤5: 16:21有人回家(入户门手动开锁)后进入儿童房,18:10第二批人回家后正常生活(开灯、开空调、做饭、用餐),22:43就寝锁门,整体生活模式正常,无入侵迹象。", "推理步骤6: 厨房窗户在07:01做完早饭后打开(通风)、18:57晚饭后再次打开,属于正常行为。但日志中未见这两次窗户关闭的记录(BooleanState.StateValue=True),厨房窗户可能处于持续打开状态,夜间存在安全隐患。"], "key_evidence": ["07:45 客厅温度传感器读数突变至3584(35.84°C),07:50变为3200(32°C),且报文格式异常(缺少Cluster名称前缀),08:00恢复正常值2462", "07:55 客厅烟雾报警器触发 SmokeState=1,但无任何关联火灾证据(无人在家、无热源运行、其他房间温度正常)", "厨房温度传感器在06:31、07:02、18:17、18:58四次返回None值,指示传感器间歇性故障", "厨房窗户在07:01:30和18:57:30两次打开,日志中无对应关闭记录,可能整夜处于开启状态"], "recommended_actions": ["立即检查客厅温度传感器硬件状态,清洁探头或更换设备,排除传感器故障导致的虚假高温读数", "确认客厅烟雾报警器当前状态,若仍处于报警状态需手动复位;建议对烟雾报警器进行功能测试以排除误报隐患", "检修或更换厨房温度传感器,多次返回None值表明设备通信不稳定,厨房作为高风险区域需要可靠的温度监测", "确认厨房窗户当前是否关闭,夜间无人时应关闭窗户并确保窗户传感器状态同步正确", "考虑为烟雾报警器与温度传感器建立交叉验证规则:仅当温度持续升高且多个传感器协同确认时才触发高级别火灾警报,减少单点故障导致的误报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.122474193572998, "api_error": null} {"episode_id": "SQ4_TP_C_0750", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0750.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261379, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-05T15:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"客厅烟雾报警器在无人在家时触发一氧化碳(CO)报警,且至今未解除,存在CO中毒健康风险。\",\n \"reasoning\": [\n \"推理步骤1: 15:05 客厅烟雾报警器报告 COState=1(CO检测异常)、ExpressedState=2(报警状态)并触发 COAlarm 事件。此时全家已于 07:40 出门(门锁上锁、所有灯关闭),家中无人。\",\n \"推理步骤2: 从 15:05 到 18:16 家人回家,长达约3小时的CO报警期间无人处理。18:16 家人回家后开灯、开空调,但日志中始终没有出现 COState=0 或 ExpressedState=0 的恢复记录,说明CO报警可能至今未解除,CO源未被排查。\",\n \"推理步骤3: CO报警发生时无灶具使用(灶具 07:29 已关闭),排除烹饪产生CO的可能。需要排查其他CO来源,如燃气管道泄漏、热水器故障、外部CO渗入等。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间(07:00 和 18:42)多次报告 MeasuredValue=None,属于设备异常,但这是传感器故障问题,与CO报警无直接关联。\",\n \"推理步骤5: 其余家庭活动模式正常——早晨起床(儿童房 06:17、主卧 06:28)、做早餐(06:59-07:29)、出门上班上学(07:40)、孩子先回家(15:55)、大人后回家(18:16)、晚餐(18:41-19:13)、睡觉(21:18-22:32),门锁开关、灯光、运动传感器均与正常生活节奏吻合,无入侵迹象。\",\n \"推理步骤6: 温度趋势符合夏季日间规律(凌晨约23°C,午间升至约25.8°C,傍晚回落),开空调后客厅温度从约24.6°C降至约23.6°C,均属正常。无异常温升指向火灾风险。\"\n ],\n \"key_evidence\": [\n \"15:05 living_room_smoke_alarm 触发 COState=1、ExpressedState=2、COAlarm 事件,表明检测到一氧化碳\",\n \"整个日志中未出现 CO 报警解除记录(COState=0),报警状态可能持续至今\",\n \"CO报警时家中无人(07:40 出门,15:55 才有人回来),报警未被及时响应\",\n \"CO报警时灶具处于关闭状态(07:29 已关),CO来源不明\",\n \"厨房温度传感器在 07:00、07:30、18:42、19:14 多次报告 MeasuredValue=None,存在传感器故障\"\n ],\n \"recommended_actions\": [\n \"立即开窗通风,打开客厅和厨房窗户,确保空气流通以降低可能的CO浓度\",\n \"检查CO报警器当前状态,确认CO是否仍然存在;如报警持续,所有人应立即撤离并拨打燃气公司或119\",\n \"排查CO来源:重点检查燃气管道、热水器、壁挂炉等可能产生CO的设备是否存在泄漏或不完全燃烧\",\n \"检修厨房温度传感器,该传感器在灶具使用期间多次报告空值(None),可能是高温导致传感器故障或通信中断\",\n \"建议在厨房也加装独立的CO检测器,目前厨房烟雾报警器仅有烟雾检测功能,缺少CO监测能力\",\n \"确认入户门在 15:55 回家后是否已重新上锁(日志中 15:55 开锁后未见回锁记录,直到 22:32 才自动上锁)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "客厅烟雾报警器在无人在家时触发一氧化碳(CO)报警,且至今未解除,存在CO中毒健康风险。", "reasoning": ["推理步骤1: 15:05 客厅烟雾报警器报告 COState=1(CO检测异常)、ExpressedState=2(报警状态)并触发 COAlarm 事件。此时全家已于 07:40 出门(门锁上锁、所有灯关闭),家中无人。", "推理步骤2: 从 15:05 到 18:16 家人回家,长达约3小时的CO报警期间无人处理。18:16 家人回家后开灯、开空调,但日志中始终没有出现 COState=0 或 ExpressedState=0 的恢复记录,说明CO报警可能至今未解除,CO源未被排查。", "推理步骤3: CO报警发生时无灶具使用(灶具 07:29 已关闭),排除烹饪产生CO的可能。需要排查其他CO来源,如燃气管道泄漏、热水器故障、外部CO渗入等。", "推理步骤4: 厨房温度传感器在灶具使用期间(07:00 和 18:42)多次报告 MeasuredValue=None,属于设备异常,但这是传感器故障问题,与CO报警无直接关联。", "推理步骤5: 其余家庭活动模式正常——早晨起床(儿童房 06:17、主卧 06:28)、做早餐(06:59-07:29)、出门上班上学(07:40)、孩子先回家(15:55)、大人后回家(18:16)、晚餐(18:41-19:13)、睡觉(21:18-22:32),门锁开关、灯光、运动传感器均与正常生活节奏吻合,无入侵迹象。", "推理步骤6: 温度趋势符合夏季日间规律(凌晨约23°C,午间升至约25.8°C,傍晚回落),开空调后客厅温度从约24.6°C降至约23.6°C,均属正常。无异常温升指向火灾风险。"], "key_evidence": ["15:05 living_room_smoke_alarm 触发 COState=1、ExpressedState=2、COAlarm 事件,表明检测到一氧化碳", "整个日志中未出现 CO 报警解除记录(COState=0),报警状态可能持续至今", "CO报警时家中无人(07:40 出门,15:55 才有人回来),报警未被及时响应", "CO报警时灶具处于关闭状态(07:29 已关),CO来源不明", "厨房温度传感器在 07:00、07:30、18:42、19:14 多次报告 MeasuredValue=None,存在传感器故障"], "recommended_actions": ["立即开窗通风,打开客厅和厨房窗户,确保空气流通以降低可能的CO浓度", "检查CO报警器当前状态,确认CO是否仍然存在;如报警持续,所有人应立即撤离并拨打燃气公司或119", "排查CO来源:重点检查燃气管道、热水器、壁挂炉等可能产生CO的设备是否存在泄漏或不完全燃烧", "检修厨房温度传感器,该传感器在灶具使用期间多次报告空值(None),可能是高温导致传感器故障或通信中断", "建议在厨房也加装独立的CO检测器,目前厨房烟雾报警器仅有烟雾检测功能,缺少CO监测能力", "确认入户门在 15:55 回家后是否已重新上锁(日志中 15:55 开锁后未见回锁记录,直到 22:32 才自动上锁)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.769861698150635, "api_error": null} {"episode_id": "SQ4_TP_C_0753", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0753.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261382, "scenario_id": "DF-04", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-29T07:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门锁在无人在家期间触发了重复锁门指令和告警。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、06:53、18:39、19:14 四次报告 MeasuredValue = None。前两次发生在灶具使用期间(06:45 开灶,06:52 关灶),后两次同样与灶具使用时段重合(18:38 开灶,19:13 关灶)。灶具工作时传感器读数丢失,可能是高温导致传感器暂时失效或通信中断,属于设备可靠性问题。\",\n \"推理步骤2: 厨房烟雾报警器全天未触发,且灶具关闭后温度传感器均恢复正常读数(07:00 报 2426、19:30 报 2433),说明并非真正的火灾风险,但传感器在关键时刻(烹饪期间)失效意味着如果真的发生危险,可能无法及时检测到异常温升。\",\n \"推理步骤3: 07:14 全家出门(关灯、手动开锁出门、门自动上锁),之后 07:23 出现两次 LockDoor 指令(间隔仅 10 秒),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。此时家中无人,重复锁门指令可能来自远程操作或自动化规则异常重试,告警说明门锁状态可能存在不确定性。\",\n \"推理步骤4: 16:10 有人回家(开锁、入户传感器触发、儿童房有人),但入户门在此次开门后未记录到关门(BooleanState.StateValue = True)和上锁事件,直到 22:19 才记录到门关闭并自动上锁。这意味着从 16:10 到 22:19 约 6 小时内,入户门可能处于未关闭或未上锁状态。\",\n \"推理步骤5: 其余行为模式正常——早晨 06:17 起床、06:45 做早餐、07:14 出门;下午 16:10 孩子放学回家、17:50 大人回家开空调;晚间做饭、用餐、洗碗机运行、20:50 孩子关灯睡觉、22:19 大人就寝。温度曲线呈现夏季典型日变化(夜间 22.9°C → 午间峰值 25.8°C → 夜间回落 23.3°C),属正常范围。\",\n \"推理步骤6: 厨房窗户在做完饭后打开(06:52:30 和 19:13:30),是通风的正常操作,但日志中未记录关闭事件,需确认窗户是否仍处于开启状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None(06:46、06:53、18:39、19:14),均与灶具使用时段重合\",\n \"07:23 入户门锁在无人在家时收到两次 LockDoor 指令并触发 DoorLockAlarm(AlarmCode=0)\",\n \"16:10 开门回家后至 22:19 期间无门关闭/上锁记录,入户门可能长时间未锁\",\n \"厨房窗户两次打开(06:52、19:13)但日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时通信中断,必要时更换耐高温型号或调整安装位置\",\n \"排查 07:23 门锁告警原因:检查是否有自动化规则在出门后重复发送锁门指令,确认门锁机械部件和电池状态是否正常\",\n \"确认入户门当前锁定状态,建议启用「离家后未锁门超时提醒」自动化规则\",\n \"确认厨房窗户当前是否已关闭,建议在夜间或离家模式下增加窗户未关提醒\",\n \"考虑为入户门锁启用防篡改告警通知,确保远程锁门指令异常时能及时收到推送\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门锁在无人在家期间触发了重复锁门指令和告警。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、06:53、18:39、19:14 四次报告 MeasuredValue = None。前两次发生在灶具使用期间(06:45 开灶,06:52 关灶),后两次同样与灶具使用时段重合(18:38 开灶,19:13 关灶)。灶具工作时传感器读数丢失,可能是高温导致传感器暂时失效或通信中断,属于设备可靠性问题。", "推理步骤2: 厨房烟雾报警器全天未触发,且灶具关闭后温度传感器均恢复正常读数(07:00 报 2426、19:30 报 2433),说明并非真正的火灾风险,但传感器在关键时刻(烹饪期间)失效意味着如果真的发生危险,可能无法及时检测到异常温升。", "推理步骤3: 07:14 全家出门(关灯、手动开锁出门、门自动上锁),之后 07:23 出现两次 LockDoor 指令(间隔仅 10 秒),并触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。此时家中无人,重复锁门指令可能来自远程操作或自动化规则异常重试,告警说明门锁状态可能存在不确定性。", "推理步骤4: 16:10 有人回家(开锁、入户传感器触发、儿童房有人),但入户门在此次开门后未记录到关门(BooleanState.StateValue = True)和上锁事件,直到 22:19 才记录到门关闭并自动上锁。这意味着从 16:10 到 22:19 约 6 小时内,入户门可能处于未关闭或未上锁状态。", "推理步骤5: 其余行为模式正常——早晨 06:17 起床、06:45 做早餐、07:14 出门;下午 16:10 孩子放学回家、17:50 大人回家开空调;晚间做饭、用餐、洗碗机运行、20:50 孩子关灯睡觉、22:19 大人就寝。温度曲线呈现夏季典型日变化(夜间 22.9°C → 午间峰值 25.8°C → 夜间回落 23.3°C),属正常范围。", "推理步骤6: 厨房窗户在做完饭后打开(06:52:30 和 19:13:30),是通风的正常操作,但日志中未记录关闭事件,需确认窗户是否仍处于开启状态。"], "key_evidence": ["厨房温度传感器 4 次报告 None(06:46、06:53、18:39、19:14),均与灶具使用时段重合", "07:23 入户门锁在无人在家时收到两次 LockDoor 指令并触发 DoorLockAlarm(AlarmCode=0)", "16:10 开门回家后至 22:19 期间无门关闭/上锁记录,入户门可能长时间未锁", "厨房窗户两次打开(06:52、19:13)但日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时通信中断,必要时更换耐高温型号或调整安装位置", "排查 07:23 门锁告警原因:检查是否有自动化规则在出门后重复发送锁门指令,确认门锁机械部件和电池状态是否正常", "确认入户门当前锁定状态,建议启用「离家后未锁门超时提醒」自动化规则", "确认厨房窗户当前是否已关闭,建议在夜间或离家模式下增加窗户未关提醒", "考虑为入户门锁启用防篡改告警通知,确保远程锁门指令异常时能及时收到推送"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.23278546333313, "api_error": null} {"episode_id": "SQ4_TP_C_0754", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0754.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261383, "scenario_id": "CH-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-03T17:50:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房灶具关闭后未见窗户关闭确认,通风管理存在隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、07:10、18:39、19:07 共四次报告 MeasuredValue = None。这些时间点均与灶具操作(开启或关闭)高度相关,说明传感器可能在高温或油烟环境下出现读数丢失,属于设备异常。\",\n \"推理步骤2: 除厨房传感器外,其余三个温度传感器(客厅、主卧、儿童房)全天读数正常且趋势一致——夜间约 22.9-23.1°C,白天升至峰值约 25.8°C,傍晚回落,符合夏季自然温度曲线,无异常跳变。\",\n \"推理步骤3: 入户门锁全天共三次操作:07:36 手动开锁出门后自动上锁(早晨出门)、16:19 手动开锁进门(下午回家,随后儿童房有人活动)、18:14 手动开锁进门(傍晚回家,随后客厅灯和空调开启)。三次操作均为 Manual 开锁 + Auto 上锁模式,时间和行为链条合理,符合三口之家的通勤/放学节奏,无入侵迹象。\",\n \"推理步骤4: 22:35 入户门确认关闭(StateValue=True)并自动上锁(LockState=1),说明夜间门锁安全。但注意 16:19 进门后日志中未出现 front_door_contact 关闭和上锁记录,可能是日志遗漏,也可能门在一段时间内未关闭,存在轻微安全隐患。\",\n \"推理步骤5: 厨房窗户在 06:55:30 和 19:06:30 两次打开(StateValue=False),均发生在灶具关闭后,属于做饭后通风的合理行为。但日志中始终未出现厨房窗户关闭(StateValue=True)的记录,意味着厨房窗户可能整夜处于打开状态。\",\n \"推理步骤6: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无触发,说明无火灾和漏水风险。灶具在 19:06 已关闭,无遗忘关火的问题。\",\n \"推理步骤7: 儿童房 20:55 关灯并关闭窗帘(100%),符合儿童就寝习惯。主卧 22:35 关灯关窗帘,符合成人就寝时间。整体作息模式正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:56、07:10、18:39、19:07 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"厨房窗户两次打开(06:55:30 和 19:06:30)但全天日志中无关闭记录,可能整夜敞开\",\n \"16:19 入户门开锁进入后,日志中缺少门关闭和上锁的记录\",\n \"其余所有传感器(温度、烟雾、漏水、门锁)工作正常,无安全告警触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:该传感器在灶具使用前后频繁丢失读数,建议检查其安装位置是否离灶台过近,清洁传感器探头,必要时更换设备\",\n \"确认厨房窗户状态:日志显示窗户打开后无关闭记录,建议检查窗户是否仍处于打开状态,夜间开窗存在安全和蚊虫隐患\",\n \"排查 16:19 入户门状态:该时段进门后缺少关门/上锁日志,建议检查门磁传感器是否工作正常,或确认自动上锁功能是否在该场景下正常触发\",\n \"考虑为厨房灶具添加自动联动规则:灶具关闭一定时间后自动提醒关闭厨房窗户,避免长时间无人看管时窗户敞开\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房灶具关闭后未见窗户关闭确认,通风管理存在隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、07:10、18:39、19:07 共四次报告 MeasuredValue = None。这些时间点均与灶具操作(开启或关闭)高度相关,说明传感器可能在高温或油烟环境下出现读数丢失,属于设备异常。", "推理步骤2: 除厨房传感器外,其余三个温度传感器(客厅、主卧、儿童房)全天读数正常且趋势一致——夜间约 22.9-23.1°C,白天升至峰值约 25.8°C,傍晚回落,符合夏季自然温度曲线,无异常跳变。", "推理步骤3: 入户门锁全天共三次操作:07:36 手动开锁出门后自动上锁(早晨出门)、16:19 手动开锁进门(下午回家,随后儿童房有人活动)、18:14 手动开锁进门(傍晚回家,随后客厅灯和空调开启)。三次操作均为 Manual 开锁 + Auto 上锁模式,时间和行为链条合理,符合三口之家的通勤/放学节奏,无入侵迹象。", "推理步骤4: 22:35 入户门确认关闭(StateValue=True)并自动上锁(LockState=1),说明夜间门锁安全。但注意 16:19 进门后日志中未出现 front_door_contact 关闭和上锁记录,可能是日志遗漏,也可能门在一段时间内未关闭,存在轻微安全隐患。", "推理步骤5: 厨房窗户在 06:55:30 和 19:06:30 两次打开(StateValue=False),均发生在灶具关闭后,属于做饭后通风的合理行为。但日志中始终未出现厨房窗户关闭(StateValue=True)的记录,意味着厨房窗户可能整夜处于打开状态。", "推理步骤6: 烟雾报警器(厨房和客厅)全天无触发,漏水传感器无触发,说明无火灾和漏水风险。灶具在 19:06 已关闭,无遗忘关火的问题。", "推理步骤7: 儿童房 20:55 关灯并关闭窗帘(100%),符合儿童就寝习惯。主卧 22:35 关灯关窗帘,符合成人就寝时间。整体作息模式正常。"], "key_evidence": ["厨房温度传感器在 06:56、07:10、18:39、19:07 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "厨房窗户两次打开(06:55:30 和 19:06:30)但全天日志中无关闭记录,可能整夜敞开", "16:19 入户门开锁进入后,日志中缺少门关闭和上锁的记录", "其余所有传感器(温度、烟雾、漏水、门锁)工作正常,无安全告警触发"], "recommended_actions": ["检查厨房温度传感器:该传感器在灶具使用前后频繁丢失读数,建议检查其安装位置是否离灶台过近,清洁传感器探头,必要时更换设备", "确认厨房窗户状态:日志显示窗户打开后无关闭记录,建议检查窗户是否仍处于打开状态,夜间开窗存在安全和蚊虫隐患", "排查 16:19 入户门状态:该时段进门后缺少关门/上锁日志,建议检查门磁传感器是否工作正常,或确认自动上锁功能是否在该场景下正常触发", "考虑为厨房灶具添加自动联动规则:灶具关闭一定时间后自动提醒关闭厨房窗户,避免长时间无人看管时窗户敞开"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.973554849624634, "api_error": null} {"episode_id": "SQ4_TP_C_0755", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0755.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261384, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-11T01:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅烟雾报警器在凌晨触发CO(一氧化碳)报警,且厨房温度传感器多次报告null值存在故障;此外入户门在16:00开锁后长时间未关闭/未上锁,直到22:33才重新确认关闭。\",\n \"reasoning\": [\n \"推理步骤1: 01:52客厅烟雾报警器触发CO报警(COState=1, ExpressedState=2, Event:COAlarm),此时全家处于深夜睡眠状态,所有房间温度正常(约23°C),无灶具使用记录,没有明显的CO来源,但报警器确实触发了。日志中未见任何后续的报警解除记录(COState恢复为0),说明该报警可能一直未被处理或确认。\",\n \"推理步骤2: 厨房温度传感器在06:39、07:18、18:38、19:24多次报告MeasuredValue=None。这与灶具开关操作时间高度相关(06:38灶具开、07:17灶具关、18:37灶具开、19:23灶具关),但正常传感器不应因灶具操作而返回null。这表明厨房温度传感器可能存在硬件故障或受灶具热量干扰导致读数溢出,影响了厨房的温度监控能力。\",\n \"推理步骤3: 16:00入户门锁被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),有人进入(entrance_occupancy=1, kids_room_occupancy=1),推测是孩子放学回家。但此后直到17:44大人回家再次开门,期间门锁状态未见重新上锁记录,且16:00开门后未见关门记录(StateValue恢复为True)。门可能在16:00到22:33之间处于未完全关闭或未上锁状态长达6.5小时。\",\n \"推理步骤4: 整体生活模式分析——06:31起床、07:26出门、16:00孩子回家、17:44大人回家、18:37做晚饭、20:49孩子睡觉、22:33大人睡觉——属于正常的三口之家作息。温度从夜间23°C升至中午约25.9°C再回落,符合夏季自然温度变化。空调在17:44开启制冷模式(SystemMode=3)、22:33关闭,合理。\",\n \"推理步骤5: CO报警是最严重的问题。凌晨1:52触发,此时无烹饪活动、无燃气使用迹象,可能原因包括:传感器误报/故障、外部CO渗入、或燃气热水器等未被监控设备的泄漏。无论哪种原因,CO报警未被处理是重大安全隐患。\"\n ],\n \"key_evidence\": [\n \"01:52 客厅烟雾报警器触发CO报警(COState=1, ExpressedState=2, Event:COAlarm),且日志中无后续解除记录\",\n \"厨房温度传感器在06:39、07:18、18:38、19:24四次报告MeasuredValue=None,传感器工作异常\",\n \"16:00入户门开锁开门后,直到22:33才出现门关闭和自动上锁记录,中间约6.5小时门锁/门状态不明\",\n \"CO报警发生在凌晨深夜,当时无任何灶具或明火使用记录,CO来源不明\"\n ],\n \"recommended_actions\": [\n \"立即检查CO报警状态:确认客厅烟雾报警器当前是否仍处于报警状态,手动检测室内CO浓度,排除一氧化碳泄漏风险。如仍在报警,立即开窗通风并撤离。\",\n \"排查CO来源:检查燃气热水器、壁挂炉等可能产生CO的设备是否正常工作,检查烟道是否堵塞。如无法确定来源,建议联系燃气公司上门检测。\",\n \"维修或更换厨房温度传感器:该传感器多次返回null值,已无法可靠监测厨房温度,在灶具使用场景下尤其危险,应尽快更换。\",\n \"检查入户门锁和门磁传感器:确认16:00至22:33期间门是否确实未关闭,排查门锁自动上锁功能是否正常,考虑设置门未关闭超时提醒。\",\n \"建议为CO报警器设置联动自动化规则:触发CO报警时自动推送手机通知、开启通风设备、打开所有灯光以便撤离。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅烟雾报警器在凌晨触发CO(一氧化碳)报警,且厨房温度传感器多次报告null值存在故障;此外入户门在16:00开锁后长时间未关闭/未上锁,直到22:33才重新确认关闭。", "reasoning": ["推理步骤1: 01:52客厅烟雾报警器触发CO报警(COState=1, ExpressedState=2, Event:COAlarm),此时全家处于深夜睡眠状态,所有房间温度正常(约23°C),无灶具使用记录,没有明显的CO来源,但报警器确实触发了。日志中未见任何后续的报警解除记录(COState恢复为0),说明该报警可能一直未被处理或确认。", "推理步骤2: 厨房温度传感器在06:39、07:18、18:38、19:24多次报告MeasuredValue=None。这与灶具开关操作时间高度相关(06:38灶具开、07:17灶具关、18:37灶具开、19:23灶具关),但正常传感器不应因灶具操作而返回null。这表明厨房温度传感器可能存在硬件故障或受灶具热量干扰导致读数溢出,影响了厨房的温度监控能力。", "推理步骤3: 16:00入户门锁被手动开锁(LockOperationType=1),门传感器显示门打开(StateValue=False),有人进入(entrance_occupancy=1, kids_room_occupancy=1),推测是孩子放学回家。但此后直到17:44大人回家再次开门,期间门锁状态未见重新上锁记录,且16:00开门后未见关门记录(StateValue恢复为True)。门可能在16:00到22:33之间处于未完全关闭或未上锁状态长达6.5小时。", "推理步骤4: 整体生活模式分析——06:31起床、07:26出门、16:00孩子回家、17:44大人回家、18:37做晚饭、20:49孩子睡觉、22:33大人睡觉——属于正常的三口之家作息。温度从夜间23°C升至中午约25.9°C再回落,符合夏季自然温度变化。空调在17:44开启制冷模式(SystemMode=3)、22:33关闭,合理。", "推理步骤5: CO报警是最严重的问题。凌晨1:52触发,此时无烹饪活动、无燃气使用迹象,可能原因包括:传感器误报/故障、外部CO渗入、或燃气热水器等未被监控设备的泄漏。无论哪种原因,CO报警未被处理是重大安全隐患。"], "key_evidence": ["01:52 客厅烟雾报警器触发CO报警(COState=1, ExpressedState=2, Event:COAlarm),且日志中无后续解除记录", "厨房温度传感器在06:39、07:18、18:38、19:24四次报告MeasuredValue=None,传感器工作异常", "16:00入户门开锁开门后,直到22:33才出现门关闭和自动上锁记录,中间约6.5小时门锁/门状态不明", "CO报警发生在凌晨深夜,当时无任何灶具或明火使用记录,CO来源不明"], "recommended_actions": ["立即检查CO报警状态:确认客厅烟雾报警器当前是否仍处于报警状态,手动检测室内CO浓度,排除一氧化碳泄漏风险。如仍在报警,立即开窗通风并撤离。", "排查CO来源:检查燃气热水器、壁挂炉等可能产生CO的设备是否正常工作,检查烟道是否堵塞。如无法确定来源,建议联系燃气公司上门检测。", "维修或更换厨房温度传感器:该传感器多次返回null值,已无法可靠监测厨房温度,在灶具使用场景下尤其危险,应尽快更换。", "检查入户门锁和门磁传感器:确认16:00至22:33期间门是否确实未关闭,排查门锁自动上锁功能是否正常,考虑设置门未关闭超时提醒。", "建议为CO报警器设置联动自动化规则:触发CO报警时自动推送手机通知、开启通风设备、打开所有灯光以便撤离。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.86811089515686, "api_error": null} {"episode_id": "SQ4_TP_C_0759", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0759.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261388, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-21T11:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在无人在家时连续两次上锁失败并触发锁定告警,可能存在门锁故障或被篡改风险。\",\n \"reasoning\": [\n \"推理步骤1: 11:10:00 和 11:10:10 连续发送了两次 LockDoor 命令,两次返回的 LockState 均为 2(未锁定/unlocked),说明门锁执行上锁命令后并未成功锁定。\",\n \"推理步骤2: 11:10:15 门锁触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中对应 LockJammed(锁体卡住),表明锁舌机械结构可能被卡住或受阻。\",\n \"推理步骤3: 整个日志中没有任何运动传感器触发、灯光开关或空调操作记录,说明当天家中很可能无人在家。在无人状态下门锁无法正常锁定,是一个安全隐患。\",\n \"推理步骤4: 温度数据方面,四个传感器全天走势一致——凌晨约22.9-23.1°C,中午升至约25.7-25.9°C,晚间回落至约23.3°C,符合6月夏季自然昼夜温差规律,无异常热源或火灾迹象。\",\n \"推理步骤5: 除门锁事件外,无烟雾报警、漏水报警、门窗异常开合等其他安全事件,其余设备状态正常。\"\n ],\n \"key_evidence\": [\n \"11:10:00 和 11:10:10 两次 LockDoor 命令后 LockState 均保持为 2(未锁定),上锁失败\",\n \"11:10:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁体卡住告警\",\n \"全天无运动传感器、灯光、空调等活动记录,推断家中无人,门锁故障意味着入户门可能处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即远程确认入户门锁当前状态,如仍为未锁定,尽快安排人员到场手动锁门或检查锁体\",\n \"检查门锁锁舌及门框对位是否有异物阻挡或机械磨损,排除人为篡改可能\",\n \"如门锁支持备用上锁方式(如反锁旋钮),可通知邻居或物业协助临时锁定\",\n \"考虑对门锁进行固件升级或更换锁体,避免 LockJammed 问题反复出现\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在无人在家时连续两次上锁失败并触发锁定告警,可能存在门锁故障或被篡改风险。", "reasoning": ["推理步骤1: 11:10:00 和 11:10:10 连续发送了两次 LockDoor 命令,两次返回的 LockState 均为 2(未锁定/unlocked),说明门锁执行上锁命令后并未成功锁定。", "推理步骤2: 11:10:15 门锁触发了 DoorLockAlarm(AlarmCode=0),AlarmCode=0 在 Matter DoorLock Cluster 中对应 LockJammed(锁体卡住),表明锁舌机械结构可能被卡住或受阻。", "推理步骤3: 整个日志中没有任何运动传感器触发、灯光开关或空调操作记录,说明当天家中很可能无人在家。在无人状态下门锁无法正常锁定,是一个安全隐患。", "推理步骤4: 温度数据方面,四个传感器全天走势一致——凌晨约22.9-23.1°C,中午升至约25.7-25.9°C,晚间回落至约23.3°C,符合6月夏季自然昼夜温差规律,无异常热源或火灾迹象。", "推理步骤5: 除门锁事件外,无烟雾报警、漏水报警、门窗异常开合等其他安全事件,其余设备状态正常。"], "key_evidence": ["11:10:00 和 11:10:10 两次 LockDoor 命令后 LockState 均保持为 2(未锁定),上锁失败", "11:10:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁体卡住告警", "全天无运动传感器、灯光、空调等活动记录,推断家中无人,门锁故障意味着入户门可能处于未锁定状态"], "recommended_actions": ["立即远程确认入户门锁当前状态,如仍为未锁定,尽快安排人员到场手动锁门或检查锁体", "检查门锁锁舌及门框对位是否有异物阻挡或机械磨损,排除人为篡改可能", "如门锁支持备用上锁方式(如反锁旋钮),可通知邻居或物业协助临时锁定", "考虑对门锁进行固件升级或更换锁体,避免 LockJammed 问题反复出现"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 19.990850925445557, "api_error": null} {"episode_id": "SQ4_TP_C_0762", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0762.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261391, "scenario_id": "CH-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T18:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午回家时未及时关闭上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:37、07:14、18:48、19:29 共四次报告 MeasuredValue = None。其中 06:37 和 18:48 均发生在灶具开启后不久,07:14 和 19:29 发生在灶具关闭、厨房窗户打开后。灶具使用期间正是最需要温度监控的时段,传感器失效会导致无法及时发现厨房过热或火灾风险。\",\n \"推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),全天均正常上报数值,无 None 值出现,说明这不是系统级通信问题,而是厨房温度传感器自身的故障或受灶具高温干扰导致的异常。\",\n \"推理步骤3: 15:57 入户门解锁开门(contact=False),有人进入(entrance_occupancy=1),随后孩子进入儿童房(kids_room_occupancy=1),但日志中没有记录入户门关闭(contact=True)和重新上锁的事件,直到 22:39 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能从 15:57 到 22:39 长达近7小时处于未关闭或未上锁状态。\",\n \"推理步骤4: 同样,17:52 第二次开门进入后,也没有立即关门上锁的记录,进一步印证了入户门长时间未锁的情况。\",\n \"推理步骤5: 其余设备行为均属正常——早晨起床开灯、做早餐、出门关灯锁门、傍晚回家开空调做晚餐、晚间关灯就寝,符合三室两厅家庭(有小孩)的典型日常作息。温度整体走势也符合夏季白天升温、夜间降温的自然规律。烟雾报警器和漏水传感器全天无告警,厨房灶具使用时长合理(早餐约37分钟、晚餐约41分钟)。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:37、07:14、18:48、19:29 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"15:57 入户门解锁开门后,直到 22:39 才记录到门关闭(contact=True)和自动上锁(LockState=1),中间约6小时42分钟无关门/上锁记录\",\n \"17:52 入户门再次解锁开门,同样无后续关门上锁记录\",\n \"其他三个温度传感器全天数据正常,排除系统性通信故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:可能受灶具高温影响导致读数溢出或传感器故障,建议检查其安装位置是否距灶具过近,必要时更换传感器\",\n \"在厨房温度传感器修复前,灶具使用期间应加强人工监控,避免因传感器失效而遗漏火灾预警\",\n \"检查入户门锁和门磁传感器:确认门磁传感器是否正常工作,排除漏报关门事件的可能;如确实是住户忘记关门,建议设置门未关闭超时提醒(如开门超过5分钟未关闭则推送告警)\",\n \"建议为入户门锁启用自动上锁策略(如开门后一定时间内未手动关闭则自动提醒或上锁),防止长时间门户大开\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在下午回家时未及时关闭上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:37、07:14、18:48、19:29 共四次报告 MeasuredValue = None。其中 06:37 和 18:48 均发生在灶具开启后不久,07:14 和 19:29 发生在灶具关闭、厨房窗户打开后。灶具使用期间正是最需要温度监控的时段,传感器失效会导致无法及时发现厨房过热或火灾风险。", "推理步骤2: 对比其他三个温度传感器(客厅、主卧、儿童房),全天均正常上报数值,无 None 值出现,说明这不是系统级通信问题,而是厨房温度传感器自身的故障或受灶具高温干扰导致的异常。", "推理步骤3: 15:57 入户门解锁开门(contact=False),有人进入(entrance_occupancy=1),随后孩子进入儿童房(kids_room_occupancy=1),但日志中没有记录入户门关闭(contact=True)和重新上锁的事件,直到 22:39 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能从 15:57 到 22:39 长达近7小时处于未关闭或未上锁状态。", "推理步骤4: 同样,17:52 第二次开门进入后,也没有立即关门上锁的记录,进一步印证了入户门长时间未锁的情况。", "推理步骤5: 其余设备行为均属正常——早晨起床开灯、做早餐、出门关灯锁门、傍晚回家开空调做晚餐、晚间关灯就寝,符合三室两厅家庭(有小孩)的典型日常作息。温度整体走势也符合夏季白天升温、夜间降温的自然规律。烟雾报警器和漏水传感器全天无告警,厨房灶具使用时长合理(早餐约37分钟、晚餐约41分钟)。"], "key_evidence": ["kitchen_temp_sensor 在 06:37、07:14、18:48、19:29 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "15:57 入户门解锁开门后,直到 22:39 才记录到门关闭(contact=True)和自动上锁(LockState=1),中间约6小时42分钟无关门/上锁记录", "17:52 入户门再次解锁开门,同样无后续关门上锁记录", "其他三个温度传感器全天数据正常,排除系统性通信故障"], "recommended_actions": ["检查厨房温度传感器:可能受灶具高温影响导致读数溢出或传感器故障,建议检查其安装位置是否距灶具过近,必要时更换传感器", "在厨房温度传感器修复前,灶具使用期间应加强人工监控,避免因传感器失效而遗漏火灾预警", "检查入户门锁和门磁传感器:确认门磁传感器是否正常工作,排除漏报关门事件的可能;如确实是住户忘记关门,建议设置门未关闭超时提醒(如开门超过5分钟未关闭则推送告警)", "建议为入户门锁启用自动上锁策略(如开门后一定时间内未手动关闭则自动提醒或上锁),防止长时间门户大开"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.42205786705017, "api_error": null} {"episode_id": "SQ4_TP_C_0765", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0765.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261394, "scenario_id": "BA-04", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "BA-04", "scenario_name": "不合理的房间移动序列", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "impossible_movement_pattern", "key_evidence": ["从阳台到主卧在物理上必须经过客厅,但客厅无运动信号", "可能原因:(1) 客厅运动传感器故障 (2) 有人故意躲避传感器 (3) 数据异常", "不管哪种原因都值得调查"], "expected_response": "标记为异常事件,建议检查客厅传感器或确认是否有人", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-18T08:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,夜间可能处于敞开状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:33、07:13、18:35、19:00 共四次报告 MeasuredValue = None,且均发生在灶具开启期间或刚关闭后。这表明传感器可能受高温或油烟影响出现间歇性故障,无法正常采集数据。\",\n \"推理步骤2: 厨房窗户传感器在 07:12:30 报告 StateValue=False(窗户打开),之后日志中未见关闭事件。到 18:59:30 再次报告 StateValue=False(再次打开或仍处于打开状态),但整天日志中始终没有 StateValue=True 的关闭记录。这意味着厨房窗户可能在夜间一直处于打开状态,存在安全隐患。\",\n \"推理步骤3: 其余设备行为均符合正常家庭作息模式——06:12 主卧起床、06:32 厨房做早餐、06:45 卫生间洗漱、06:46 儿童房起床、07:15 全家出门并自动锁门、16:20 孩子放学回家、17:45 大人下班回家开空调、18:34 做晚饭、21:08 孩子睡觉、22:33 大人就寝锁门,均为典型三口之家的日常节奏。\",\n \"推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),不存在入侵迹象。\",\n \"推理步骤5: 所有温度传感器(除厨房 None 值外)的温度变化趋势合理:夜间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.8-25.9°C,傍晚逐步回落,符合夏季自然温度曲线。烟雾报警器和漏水传感器全天无告警事件。\",\n \"推理步骤6: 阳台门传感器在 08:04 报告 StateValue=False(打开),之后无关闭记录。结合当时主卧有人活动,可能是晾晒衣物,但夜间阳台门未关闭同样存在一定安全风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:33、07:13、18:35、19:00 四次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_window_contact 在 07:12:30 和 18:59:30 两次报告 StateValue=False(打开),全天无关闭记录\",\n \"balcony_door_contact 在 08:04 报告 StateValue=False(打开),之后无关闭记录\",\n \"其余所有设备状态变化(门锁、灯光、空调、窗帘、运动传感器)均符合三口之家正常作息规律\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致高温干扰,必要时更换传感器\",\n \"确认厨房窗户当前状态:如已入夜且无人在厨房,建议关闭厨房窗户以防止安全隐患\",\n \"确认阳台门当前状态:夜间应关闭阳台门并确保锁好,防止入侵风险\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当传感器连续报告无效值时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,夜间可能处于敞开状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:33、07:13、18:35、19:00 共四次报告 MeasuredValue = None,且均发生在灶具开启期间或刚关闭后。这表明传感器可能受高温或油烟影响出现间歇性故障,无法正常采集数据。", "推理步骤2: 厨房窗户传感器在 07:12:30 报告 StateValue=False(窗户打开),之后日志中未见关闭事件。到 18:59:30 再次报告 StateValue=False(再次打开或仍处于打开状态),但整天日志中始终没有 StateValue=True 的关闭记录。这意味着厨房窗户可能在夜间一直处于打开状态,存在安全隐患。", "推理步骤3: 其余设备行为均符合正常家庭作息模式——06:12 主卧起床、06:32 厨房做早餐、06:45 卫生间洗漱、06:46 儿童房起床、07:15 全家出门并自动锁门、16:20 孩子放学回家、17:45 大人下班回家开空调、18:34 做晚饭、21:08 孩子睡觉、22:33 大人就寝锁门,均为典型三口之家的日常节奏。", "推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,无异常开锁方式(如远程、强制),不存在入侵迹象。", "推理步骤5: 所有温度传感器(除厨房 None 值外)的温度变化趋势合理:夜间约 22.9-23.1°C,白天随气温升高至中午峰值约 25.8-25.9°C,傍晚逐步回落,符合夏季自然温度曲线。烟雾报警器和漏水传感器全天无告警事件。", "推理步骤6: 阳台门传感器在 08:04 报告 StateValue=False(打开),之后无关闭记录。结合当时主卧有人活动,可能是晾晒衣物,但夜间阳台门未关闭同样存在一定安全风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:33、07:13、18:35、19:00 四次报告 MeasuredValue = None,传感器工作异常", "kitchen_window_contact 在 07:12:30 和 18:59:30 两次报告 StateValue=False(打开),全天无关闭记录", "balcony_door_contact 在 08:04 报告 StateValue=False(打开),之后无关闭记录", "其余所有设备状态变化(门锁、灯光、空调、窗帘、运动传感器)均符合三口之家正常作息规律"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致高温干扰,必要时更换传感器", "确认厨房窗户当前状态:如已入夜且无人在厨房,建议关闭厨房窗户以防止安全隐患", "确认阳台门当前状态:夜间应关闭阳台门并确保锁好,防止入侵风险", "考虑为厨房温度传感器设置 None 值告警规则,当传感器连续报告无效值时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 65.16221499443054, "api_error": null} {"episode_id": "SQ4_TP_C_0773", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0773.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261402, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-10T23:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"客厅烟雾报警器在23:08触发一氧化碳(CO)报警,家人已在卧室就寝,存在一氧化碳中毒的严重健康威胁。\",\n \"reasoning\": [\n \"推理步骤1: 23:08客厅烟雾报警器报告COState=1(一氧化碳检测异常)、ExpressedState=2(报警状态)并触发COAlarm事件,这是明确的一氧化碳泄漏警报。\",\n \"推理步骤2: 此时家庭处于就寝状态——22:32客厅灯和空调已关闭,主卧窗帘关闭、灯熄灭,入户门已自动上锁。家人(至少成人在主卧、孩子在儿童房21:06已关灯就寝)很可能已经入睡,对CO泄漏的感知能力极低。\",\n \"推理步骤3: 回溯潜在CO来源——厨房灶具在18:13开启、19:10关闭,但厨房窗户在19:10:30打开后日志中未见关闭记录(06:59:30首次打开,BooleanState.StateValue=False表示开启状态),厨房烟雾报警器未触发,说明CO可能并非来自厨房灶具残留。客厅报警器单独触发CO警报,需排查客厅区域是否存在燃气管道泄漏、热水器故障或其他CO排放源。\",\n \"推理步骤4: 厨房温度传感器在07:00:00、07:00:10、18:14:00、19:11:00多次报告MeasuredValue=None,表明该传感器存在间歇性故障,可能影响厨房区域的环境监测可靠性,但这属于次要的设备故障问题。\",\n \"推理步骤5: 入户门在16:15有人进入后未见上锁记录(BooleanState.StateValue=False后无True),直到17:49再次有人进入,22:32才确认门关闭并自动上锁。16:15进入的人(推测为放学回家的孩子)进门后门锁状态需关注,但相比CO报警属于低优先级。\"\n ],\n \"key_evidence\": [\n \"23:08 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认一氧化碳报警\",\n \"22:32 家庭进入就寝模式:客厅灯/空调关闭,主卧窗帘关闭、灯熄灭,入户门上锁,家人处于睡眠中感知能力低\",\n \"厨房温度传感器多次报告None值(07:00、07:00:10、18:14、19:11),存在设备故障\",\n \"厨房灶具19:10已关闭,但客厅而非厨房触发CO报警,提示CO来源可能不在厨房\"\n ],\n \"recommended_actions\": [\n \"紧急:立即通过所有可用渠道(手机推送、室内警报器最大音量、智能音箱广播)唤醒所有家庭成员,告知一氧化碳泄漏危险\",\n \"紧急:自动解锁入户门(front_door_lock)并打开所有窗户/窗帘,最大限度通风换气\",\n \"紧急:指引家人立即撤离至室外通风处,拨打119/燃气公司紧急电话\",\n \"打开全屋所有灯光辅助撤离,关闭燃气总阀(如有智能控制)\",\n \"排查厨房温度传感器间歇性故障(多次报告None),安排维修或更换\",\n \"CO警报解除后,请专业人员排查客厅区域CO来源(燃气管道、热水器排气等)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "客厅烟雾报警器在23:08触发一氧化碳(CO)报警,家人已在卧室就寝,存在一氧化碳中毒的严重健康威胁。", "reasoning": ["推理步骤1: 23:08客厅烟雾报警器报告COState=1(一氧化碳检测异常)、ExpressedState=2(报警状态)并触发COAlarm事件,这是明确的一氧化碳泄漏警报。", "推理步骤2: 此时家庭处于就寝状态——22:32客厅灯和空调已关闭,主卧窗帘关闭、灯熄灭,入户门已自动上锁。家人(至少成人在主卧、孩子在儿童房21:06已关灯就寝)很可能已经入睡,对CO泄漏的感知能力极低。", "推理步骤3: 回溯潜在CO来源——厨房灶具在18:13开启、19:10关闭,但厨房窗户在19:10:30打开后日志中未见关闭记录(06:59:30首次打开,BooleanState.StateValue=False表示开启状态),厨房烟雾报警器未触发,说明CO可能并非来自厨房灶具残留。客厅报警器单独触发CO警报,需排查客厅区域是否存在燃气管道泄漏、热水器故障或其他CO排放源。", "推理步骤4: 厨房温度传感器在07:00:00、07:00:10、18:14:00、19:11:00多次报告MeasuredValue=None,表明该传感器存在间歇性故障,可能影响厨房区域的环境监测可靠性,但这属于次要的设备故障问题。", "推理步骤5: 入户门在16:15有人进入后未见上锁记录(BooleanState.StateValue=False后无True),直到17:49再次有人进入,22:32才确认门关闭并自动上锁。16:15进入的人(推测为放学回家的孩子)进门后门锁状态需关注,但相比CO报警属于低优先级。"], "key_evidence": ["23:08 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认一氧化碳报警", "22:32 家庭进入就寝模式:客厅灯/空调关闭,主卧窗帘关闭、灯熄灭,入户门上锁,家人处于睡眠中感知能力低", "厨房温度传感器多次报告None值(07:00、07:00:10、18:14、19:11),存在设备故障", "厨房灶具19:10已关闭,但客厅而非厨房触发CO报警,提示CO来源可能不在厨房"], "recommended_actions": ["紧急:立即通过所有可用渠道(手机推送、室内警报器最大音量、智能音箱广播)唤醒所有家庭成员,告知一氧化碳泄漏危险", "紧急:自动解锁入户门(front_door_lock)并打开所有窗户/窗帘,最大限度通风换气", "紧急:指引家人立即撤离至室外通风处,拨打119/燃气公司紧急电话", "打开全屋所有灯光辅助撤离,关闭燃气总阀(如有智能控制)", "排查厨房温度传感器间歇性故障(多次报告None),安排维修或更换", "CO警报解除后,请专业人员排查客厅区域CO来源(燃气管道、热水器排气等)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 51.293625831604004, "api_error": null} {"episode_id": "SQ4_TP_C_0777", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0777.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261406, "scenario_id": "DF-02", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-02", "scenario_name": "温度传感器读数漂移(drift)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_drift_fault", "key_evidence": ["温度读数持续单向偏移,不符合正常日间温度曲线", "其他传感器或空调自带温度显示不一致(如果可以交叉验证)"], "expected_response": "", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-13T12:47:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报\",\n \"推理步骤2: 温度值以百分之一摄氏度为单位(Matter 标准),凌晨 00:00-05:30 各房间温度稳定在约 22.9-23.1°C,属于夏季夜间正常室温\",\n \"推理步骤3: 从 06:00 起温度开始上升,各房间同步升温,至 12:00-13:30 达到峰值约 25.5-25.9°C,随后逐步回落,到 23:30 降回约 23.3°C,这是典型的夏季自然昼夜温度曲线\",\n \"推理步骤4: 四个传感器之间的温差始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除了局部火灾隐患或设备故障导致的异常发热\",\n \"推理步骤5: 全天最高温度约 25.9°C、最低约 22.9°C,温度范围完全在正常居住环境内,未触及任何安全阈值\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C ~ 25.9°C,符合 6 月夏季昼夜温差特征\",\n \"四个房间温度高度同步变化,房间间温差始终 < 1°C,无局部异常热源\",\n \"无任何安防类设备(烟雾报警器、门窗传感器、漏水传感器、运动传感器、门锁)的异常事件上报\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"如午间室温接近 26°C 感觉偏热,可考虑在白天高温时段自动开启空调降温\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全屋温度变化符合夏季自然昼夜温差规律,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天数据,无门锁、门窗传感器、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件上报", "推理步骤2: 温度值以百分之一摄氏度为单位(Matter 标准),凌晨 00:00-05:30 各房间温度稳定在约 22.9-23.1°C,属于夏季夜间正常室温", "推理步骤3: 从 06:00 起温度开始上升,各房间同步升温,至 12:00-13:30 达到峰值约 25.5-25.9°C,随后逐步回落,到 23:30 降回约 23.3°C,这是典型的夏季自然昼夜温度曲线", "推理步骤4: 四个传感器之间的温差始终在 1°C 以内,不存在某个房间温度异常偏高或偏低的情况,排除了局部火灾隐患或设备故障导致的异常发热", "推理步骤5: 全天最高温度约 25.9°C、最低约 22.9°C,温度范围完全在正常居住环境内,未触及任何安全阈值"], "key_evidence": ["全天温度范围 22.9°C ~ 25.9°C,符合 6 月夏季昼夜温差特征", "四个房间温度高度同步变化,房间间温差始终 < 1°C,无局部异常热源", "无任何安防类设备(烟雾报警器、门窗传感器、漏水传感器、运动传感器、门锁)的异常事件上报"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "如午间室温接近 26°C 感觉偏热,可考虑在白天高温时段自动开启空调降温"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.981740951538086, "api_error": null} {"episode_id": "SQ4_TP_C_0778", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0778.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261407, "scenario_id": "BA-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-11T12:19:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时凌晨 2:30 出现无明确原因的活动,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:56、07:05、18:34、19:28 四次报告 MeasuredValue = None。虽然其中部分时间点与灶具开关操作时间接近,但传感器不应因灶具操作而丢失读数,正常情况下应报告升高的温度值而非 None。这表明传感器可能存在故障、通信中断或受灶具热量干扰导致超量程。\",\n \"推理步骤2: 凌晨 02:30 客厅运动传感器检测到活动(Occupancy=1),随后 02:35 客厅灯打开、02:37 厨房灯打开、02:40 玄关运动传感器触发。这一时间段属于深夜,活动模式(客厅→厨房→玄关)可能是住户起夜喝水或上厕所,但入户门锁和门磁均未触发,排除外部入侵。灯是主动打开的(非自动触发),符合住户操作特征。综合判断为住户正常起夜活动,风险较低。\",\n \"推理步骤3: 入户门锁操作均正常——07:14 手动开锁出门后自动上锁(全家出门上班/上学),15:56 手动开锁(孩子放学回家,随后儿童房有活动),18:01 手动开锁(大人下班回家,随后客厅有活动并开空调)。22:15 确认门磁关闭且自动上锁,全天门锁行为合理。\",\n \"推理步骤4: 温度趋势正常——凌晨约 23°C,随日出逐步升至中午峰值约 25.9°C,午后回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。各房间温度一致性好,无异常局部升温(排除火灾隐患)。\",\n \"推理步骤5: 灶具使用模式合理——早晨 07:04 开灶做早餐、06:55 关灶(此处时间顺序显示 06:55 先关灶可能是前一天残留状态或预热操作),晚间 18:33 开灶做晚餐、19:27 关灶,时长约 54 分钟,属正常烹饪范围。烟雾报警器全天未触发。\",\n \"推理步骤6: 洗碗机 19:33 启动(晚餐后),洗衣机和漏水传感器全天无异常事件。儿童房窗帘早晨打开(06:19)、晚上关闭(21:19),作息规律正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:56、07:05、18:34、19:28 四次报告 MeasuredValue = None,均与灶具操作时间相关但不应出现空值\",\n \"凌晨 02:30-02:40 客厅和玄关出现活动,但入户门锁/门磁未触发,灯为主动操作,判断为住户起夜\",\n \"全天入户门锁操作均为 Manual 开锁 + Auto 上锁,模式正常\",\n \"烟雾报警器、漏水传感器全天无告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置和工作状态,确认是否因距灶具过近导致超量程或通信故障,必要时更换或重新定位\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当连续出现空值时及时通知住户\",\n \"凌晨活动虽判断为正常起夜,但建议开启夜间异常活动提醒(如超过一定时长的深夜活动),以便区分住户行为和潜在入侵\",\n \"确认 06:55 灶具关闭事件是否为前一晚遗留状态——如果灶具在夜间处于开启状态则存在安全隐患,建议增加灶具长时间开启的自动告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时凌晨 2:30 出现无明确原因的活动,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:56、07:05、18:34、19:28 四次报告 MeasuredValue = None。虽然其中部分时间点与灶具开关操作时间接近,但传感器不应因灶具操作而丢失读数,正常情况下应报告升高的温度值而非 None。这表明传感器可能存在故障、通信中断或受灶具热量干扰导致超量程。", "推理步骤2: 凌晨 02:30 客厅运动传感器检测到活动(Occupancy=1),随后 02:35 客厅灯打开、02:37 厨房灯打开、02:40 玄关运动传感器触发。这一时间段属于深夜,活动模式(客厅→厨房→玄关)可能是住户起夜喝水或上厕所,但入户门锁和门磁均未触发,排除外部入侵。灯是主动打开的(非自动触发),符合住户操作特征。综合判断为住户正常起夜活动,风险较低。", "推理步骤3: 入户门锁操作均正常——07:14 手动开锁出门后自动上锁(全家出门上班/上学),15:56 手动开锁(孩子放学回家,随后儿童房有活动),18:01 手动开锁(大人下班回家,随后客厅有活动并开空调)。22:15 确认门磁关闭且自动上锁,全天门锁行为合理。", "推理步骤4: 温度趋势正常——凌晨约 23°C,随日出逐步升至中午峰值约 25.9°C,午后回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。各房间温度一致性好,无异常局部升温(排除火灾隐患)。", "推理步骤5: 灶具使用模式合理——早晨 07:04 开灶做早餐、06:55 关灶(此处时间顺序显示 06:55 先关灶可能是前一天残留状态或预热操作),晚间 18:33 开灶做晚餐、19:27 关灶,时长约 54 分钟,属正常烹饪范围。烟雾报警器全天未触发。", "推理步骤6: 洗碗机 19:33 启动(晚餐后),洗衣机和漏水传感器全天无异常事件。儿童房窗帘早晨打开(06:19)、晚上关闭(21:19),作息规律正常。"], "key_evidence": ["厨房温度传感器在 06:56、07:05、18:34、19:28 四次报告 MeasuredValue = None,均与灶具操作时间相关但不应出现空值", "凌晨 02:30-02:40 客厅和玄关出现活动,但入户门锁/门磁未触发,灯为主动操作,判断为住户起夜", "全天入户门锁操作均为 Manual 开锁 + Auto 上锁,模式正常", "烟雾报警器、漏水传感器全天无告警"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的安装位置和工作状态,确认是否因距灶具过近导致超量程或通信故障,必要时更换或重新定位", "考虑为厨房温度传感器设置 None 值告警规则,当连续出现空值时及时通知住户", "凌晨活动虽判断为正常起夜,但建议开启夜间异常活动提醒(如超过一定时长的深夜活动),以便区分住户行为和潜在入侵", "确认 06:55 灶具关闭事件是否为前一晚遗留状态——如果灶具在夜间处于开启状态则存在安全隐患,建议增加灶具长时间开启的自动告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 37.80214524269104, "api_error": null} {"episode_id": "SQ4_TP_C_0780", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0780.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261409, "scenario_id": "INS-05", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "kids_room", "injection_time": "2026-06-26T15:53:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及入户门在 16:17 解锁后长时间未见重新上锁记录。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏分析——凌晨无人活动,06:10 儿童房先起床,06:22 主卧起床,06:34-06:49 洗漱做早餐,07:47 全家出门并自动锁门。15:53 有人回家(密码开锁 UserIndex=1),16:17 第二人手动开门回家,18:10 第三人回家后开灯开空调做晚饭。22:50 关灯关空调、入主卧就寝、自动锁门。这是典型的三口之家(两大人一小孩)工作日作息,整体模式正常。\",\n \"推理步骤2: 厨房温度传感器异常——在 06:50:04、07:22:00、18:31:00、19:00:00 四次报告 MeasuredValue = None。正常传感器不应返回空值。06:50 和 18:31 恰好在灶具开启后不久出现,可能是高温导致传感器读数溢出或通信中断;07:22 灶具已关闭仍报 None,说明传感器恢复有延迟。虽然后续(如 07:30、19:00 第二条)恢复了正常读数,但反复出现 None 值表明该传感器工作状态不稳定,存在故障隐患。\",\n \"推理步骤3: 厨房窗户状态分析——07:21:30 早餐后厨房窗户打开(StateValue=False 表示开启),18:59:30 晚餐后再次打开。但整个日志中未见厨房窗户关闭(StateValue=True)的记录。如果窗户确实一直处于开启状态,在夜间无人看管时存在一定安全隐患(入侵风险、雨水进入等),不过也可能是通风需要的正常行为。\",\n \"推理步骤4: 门锁状态分析——07:47 出门时门锁自动上锁(LockState=1),15:53 密码开锁回家但日志未显示随后上锁,16:17 手动开锁(LockState=2 即未锁)后同样未见上锁记录,直到 22:50 才自动上锁。白天家中有人时门未上锁属于常见行为,不构成严重威胁,但值得关注。\",\n \"推理步骤5: 温度趋势正常——全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。18:10 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,也完全合理。无异常高温或骤变。\",\n \"推理步骤6: 烟雾报警器和漏水传感器在整个日志周期内均无触发记录,火灾和水患风险排除。\",\n \"推理步骤7: 所有门锁操作均为合法方式(手动、密码 UserIndex=1、自动),无异常开锁尝试或未知用户操作,入侵风险低。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:50:04、07:22:00、18:31:00、19:00:00 四次报告 MeasuredValue = None,表明传感器工作不稳定\",\n \"厨房窗户在 07:21:30 和 18:59:30 两次打开,但全天日志中未见关闭记录\",\n \"入户门在 16:17 手动解锁后至 22:50 才自动上锁,中间约 6.5 小时处于未锁定状态(家中有人)\",\n \"烟雾报警器和漏水传感器全天无告警,火灾和水患风险排除\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温干扰导致读数异常,考虑调整传感器安装位置使其远离灶具热源,或更换耐高温型号\",\n \"确认厨房窗户当前是否仍处于开启状态,夜间建议关闭以防止安全隐患;可设置自动化规则在就寝时检查并提醒关闭\",\n \"建议设置入户门自动上锁策略(如开锁后 5 分钟无操作自动上锁),避免长时间处于未锁定状态\",\n \"考虑为厨房温度传感器设置 None 值告警规则,当传感器连续返回空值时及时通知住户排查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及入户门在 16:17 解锁后长时间未见重新上锁记录。", "reasoning": ["推理步骤1: 整体生活节奏分析——凌晨无人活动,06:10 儿童房先起床,06:22 主卧起床,06:34-06:49 洗漱做早餐,07:47 全家出门并自动锁门。15:53 有人回家(密码开锁 UserIndex=1),16:17 第二人手动开门回家,18:10 第三人回家后开灯开空调做晚饭。22:50 关灯关空调、入主卧就寝、自动锁门。这是典型的三口之家(两大人一小孩)工作日作息,整体模式正常。", "推理步骤2: 厨房温度传感器异常——在 06:50:04、07:22:00、18:31:00、19:00:00 四次报告 MeasuredValue = None。正常传感器不应返回空值。06:50 和 18:31 恰好在灶具开启后不久出现,可能是高温导致传感器读数溢出或通信中断;07:22 灶具已关闭仍报 None,说明传感器恢复有延迟。虽然后续(如 07:30、19:00 第二条)恢复了正常读数,但反复出现 None 值表明该传感器工作状态不稳定,存在故障隐患。", "推理步骤3: 厨房窗户状态分析——07:21:30 早餐后厨房窗户打开(StateValue=False 表示开启),18:59:30 晚餐后再次打开。但整个日志中未见厨房窗户关闭(StateValue=True)的记录。如果窗户确实一直处于开启状态,在夜间无人看管时存在一定安全隐患(入侵风险、雨水进入等),不过也可能是通风需要的正常行为。", "推理步骤4: 门锁状态分析——07:47 出门时门锁自动上锁(LockState=1),15:53 密码开锁回家但日志未显示随后上锁,16:17 手动开锁(LockState=2 即未锁)后同样未见上锁记录,直到 22:50 才自动上锁。白天家中有人时门未上锁属于常见行为,不构成严重威胁,但值得关注。", "推理步骤5: 温度趋势正常——全屋温度从凌晨约 23°C 逐步升至中午约 25.8°C,下午回落,晚间降至约 23.3°C,符合夏季自然温度变化曲线。18:10 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,也完全合理。无异常高温或骤变。", "推理步骤6: 烟雾报警器和漏水传感器在整个日志周期内均无触发记录,火灾和水患风险排除。", "推理步骤7: 所有门锁操作均为合法方式(手动、密码 UserIndex=1、自动),无异常开锁尝试或未知用户操作,入侵风险低。"], "key_evidence": ["厨房温度传感器在 06:50:04、07:22:00、18:31:00、19:00:00 四次报告 MeasuredValue = None,表明传感器工作不稳定", "厨房窗户在 07:21:30 和 18:59:30 两次打开,但全天日志中未见关闭记录", "入户门在 16:17 手动解锁后至 22:50 才自动上锁,中间约 6.5 小时处于未锁定状态(家中有人)", "烟雾报警器和漏水传感器全天无告警,火灾和水患风险排除"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温干扰导致读数异常,考虑调整传感器安装位置使其远离灶具热源,或更换耐高温型号", "确认厨房窗户当前是否仍处于开启状态,夜间建议关闭以防止安全隐患;可设置自动化规则在就寝时检查并提醒关闭", "建议设置入户门自动上锁策略(如开锁后 5 分钟无操作自动上锁),避免长时间处于未锁定状态", "考虑为厨房温度传感器设置 None 值告警规则,当传感器连续返回空值时及时通知住户排查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.388012170791626, "api_error": null} {"episode_id": "SQ4_TP_C_0782", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0782.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261411, "scenario_id": "FG-01", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-08T08:35:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"08:35 灶具在无人看管状态下开启,厨房温度5分钟内从24.58°C飙升至35°C,触发烟雾报警器;同时厨房温度传感器存在间歇性故障,削弱了持续监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 07:23 住户出门后门锁自动上锁,主卧运动传感器在08:35显示无人(Occupancy=0),此时家中仅儿童房在16:34才有人回来,说明07:23~16:34期间家中大概率无人。\",\n \"推理步骤2: 08:35 厨房灶具被开启(OnOff=True),但此时无任何房间运动传感器显示有人活动,灶具在无人看管的情况下运行,这是严重的火灾隐患。\",\n \"推理步骤3: 08:40 厨房温度从正常的24.58°C(2458)急剧升至28.61°C(2861),08:45进一步飙升至35°C(3500),5分钟内升温超过10°C,远超正常烹饪温升速率。\",\n \"推理步骤4: 08:50 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认存在烟雾/火灾风险。\",\n \"推理步骤5: 日志中未见灶具关闭记录(下一次灶具操作是18:19的重新开启),也未见任何人响应烟雾报警,说明该事件发生在无人在家期间,报警后无人处置。\",\n \"推理步骤6: 厨房温度传感器在06:50、07:24、18:20、19:00多次报告MeasuredValue=None,表明传感器存在间歇性故障或通信中断,这会影响温度异常的及时检测。\",\n \"推理步骤7: 09:00厨房温度回落至24.92°C,说明此次事件可能是干烧/食物烧焦后自然降温或灶具自动保护关闭,但日志未明确记录关闭动作,存在数据缺失风险。\"\n ],\n \"key_evidence\": [\n \"08:35 灶具开启时主卧运动传感器显示Occupancy=0,全屋无运动传感器触发,家中无人\",\n \"08:40 厨房温度2861(28.61°C),08:45飙升至3500(35°C),5分钟内异常升温超10°C\",\n \"08:50 厨房烟雾报警器触发: SmokeState=1, ExpressedState=1, SmokeAlarm事件\",\n \"灶具开启后日志中无对应的关闭记录,无人响应烟雾报警\",\n \"厨房温度传感器多次报告None值(06:50, 07:24, 18:20, 19:00),存在间歇性故障\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房灶具当前状态,确认是否已安全关闭;如仍在运行,远程关闭灶具\",\n \"检查08:50烟雾报警事件的后续处理情况,确认是否存在残留火灾隐患(烧焦物、油烟残留等)\",\n \"排查厨房温度传感器间歇性报告None的故障原因,可能是传感器供电不稳或无线通信干扰,必要时更换传感器\",\n \"设置自动化规则:当灶具开启且全屋无人(所有Occupancy=0)时,自动关闭灶具并发送告警通知\",\n \"设置自动化规则:当烟雾报警触发时,自动关闭灶具、打开厨房窗户通风、并向住户手机推送紧急通知\",\n \"考虑为灶具增加无人看管超时自动关闭功能(如开启超过30分钟无操作则自动断电)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "08:35 灶具在无人看管状态下开启,厨房温度5分钟内从24.58°C飙升至35°C,触发烟雾报警器;同时厨房温度传感器存在间歇性故障,削弱了持续监测能力。", "reasoning": ["推理步骤1: 07:23 住户出门后门锁自动上锁,主卧运动传感器在08:35显示无人(Occupancy=0),此时家中仅儿童房在16:34才有人回来,说明07:23~16:34期间家中大概率无人。", "推理步骤2: 08:35 厨房灶具被开启(OnOff=True),但此时无任何房间运动传感器显示有人活动,灶具在无人看管的情况下运行,这是严重的火灾隐患。", "推理步骤3: 08:40 厨房温度从正常的24.58°C(2458)急剧升至28.61°C(2861),08:45进一步飙升至35°C(3500),5分钟内升温超过10°C,远超正常烹饪温升速率。", "推理步骤4: 08:50 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认存在烟雾/火灾风险。", "推理步骤5: 日志中未见灶具关闭记录(下一次灶具操作是18:19的重新开启),也未见任何人响应烟雾报警,说明该事件发生在无人在家期间,报警后无人处置。", "推理步骤6: 厨房温度传感器在06:50、07:24、18:20、19:00多次报告MeasuredValue=None,表明传感器存在间歇性故障或通信中断,这会影响温度异常的及时检测。", "推理步骤7: 09:00厨房温度回落至24.92°C,说明此次事件可能是干烧/食物烧焦后自然降温或灶具自动保护关闭,但日志未明确记录关闭动作,存在数据缺失风险。"], "key_evidence": ["08:35 灶具开启时主卧运动传感器显示Occupancy=0,全屋无运动传感器触发,家中无人", "08:40 厨房温度2861(28.61°C),08:45飙升至3500(35°C),5分钟内异常升温超10°C", "08:50 厨房烟雾报警器触发: SmokeState=1, ExpressedState=1, SmokeAlarm事件", "灶具开启后日志中无对应的关闭记录,无人响应烟雾报警", "厨房温度传感器多次报告None值(06:50, 07:24, 18:20, 19:00),存在间歇性故障"], "recommended_actions": ["立即检查厨房灶具当前状态,确认是否已安全关闭;如仍在运行,远程关闭灶具", "检查08:50烟雾报警事件的后续处理情况,确认是否存在残留火灾隐患(烧焦物、油烟残留等)", "排查厨房温度传感器间歇性报告None的故障原因,可能是传感器供电不稳或无线通信干扰,必要时更换传感器", "设置自动化规则:当灶具开启且全屋无人(所有Occupancy=0)时,自动关闭灶具并发送告警通知", "设置自动化规则:当烟雾报警触发时,自动关闭灶具、打开厨房窗户通风、并向住户手机推送紧急通知", "考虑为灶具增加无人看管超时自动关闭功能(如开启超过30分钟无操作则自动断电)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.628317832946777, "api_error": null} {"episode_id": "SQ4_TP_C_0786", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0786.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261415, "scenario_id": "DF-01", "total_events": 202, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-14T06:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"主卧温度传感器存在双重上报异常和数值固化现象,疑似设备故障或被篡改。\",\n \"reasoning\": [\n \"推理步骤1: 6月14日全天,客厅、主卧、儿童房、厨房四个温度传感器均以标准格式 TemperatureMeasurement.MeasuredValue 每30分钟上报一次,温度曲线呈现一致的日间升温、夜间降温自然规律(夜间约22.9°C,午间峰值约25.8°C),这部分属于正常行为。\",\n \"推理步骤2: 但 master_bedroom_temp_sensor 在6月14日出现了4次额外的非标准格式上报(仅写 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),分别在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280)。这些值与同一时刻标准上报的值存在明显偏差(如08:00标准值2464 vs 异常值2350,差异1.14°C;12:00标准值2573 vs 异常值2510,差异0.63°C),说明该传感器存在双通道/双协议上报问题。\",\n \"推理步骤3: 更严重的是,从6月15日开始,master_bedroom_temp_sensor 不再有标准格式的上报,仅剩非标准格式的上报,且数值完全固化为2350(23.5°C),在6月15日的08:00、12:00、18:00、22:00以及6月16日的08:00、12:00共6次上报中值完全不变。正常温度传感器应随环境温度波动,固定值说明传感器已失效或进入故障模式。\",\n \"推理步骤4: 上报频率也从正常的每30分钟一次退化为大约每6小时一次,进一步印证设备工作状态异常。\",\n \"推理步骤5: 其他三个温度传感器在6月14日全天表现正常且相互一致,排除了全局性网络或平台故障的可能,问题定位在 master_bedroom_temp_sensor 单个设备上。\"\n ],\n \"key_evidence\": [\n \"master_bedroom_temp_sensor 在6月14日出现4次非标准属性路径上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),值与标准上报存在偏差\",\n \"6月15日起该传感器标准格式上报完全消失,仅剩非标准格式,且数值固化为2350不再变化\",\n \"上报频率从每30分钟退化为约每6小时一次\",\n \"同期其他三个温度传感器工作完全正常,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"立即检查主卧温度传感器的物理状态和供电情况,尝试重启或重新配对设备\",\n \"检查该传感器的固件版本,确认是否需要更新;非标准属性路径可能是固件bug导致的协议降级\",\n \"在传感器恢复前,主卧空调如有依赖该传感器的自动化规则应暂时切换为手动控制,避免因错误温度数据导致空调异常运行\",\n \"若重启无效,建议更换该传感器,因为温度监测失效会影响主卧的舒适性控制和潜在的安全告警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "主卧温度传感器存在双重上报异常和数值固化现象,疑似设备故障或被篡改。", "reasoning": ["推理步骤1: 6月14日全天,客厅、主卧、儿童房、厨房四个温度传感器均以标准格式 TemperatureMeasurement.MeasuredValue 每30分钟上报一次,温度曲线呈现一致的日间升温、夜间降温自然规律(夜间约22.9°C,午间峰值约25.8°C),这部分属于正常行为。", "推理步骤2: 但 master_bedroom_temp_sensor 在6月14日出现了4次额外的非标准格式上报(仅写 MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),分别在 08:00(2350)、12:00(2510)、18:00(2400)、22:00(2280)。这些值与同一时刻标准上报的值存在明显偏差(如08:00标准值2464 vs 异常值2350,差异1.14°C;12:00标准值2573 vs 异常值2510,差异0.63°C),说明该传感器存在双通道/双协议上报问题。", "推理步骤3: 更严重的是,从6月15日开始,master_bedroom_temp_sensor 不再有标准格式的上报,仅剩非标准格式的上报,且数值完全固化为2350(23.5°C),在6月15日的08:00、12:00、18:00、22:00以及6月16日的08:00、12:00共6次上报中值完全不变。正常温度传感器应随环境温度波动,固定值说明传感器已失效或进入故障模式。", "推理步骤4: 上报频率也从正常的每30分钟一次退化为大约每6小时一次,进一步印证设备工作状态异常。", "推理步骤5: 其他三个温度传感器在6月14日全天表现正常且相互一致,排除了全局性网络或平台故障的可能,问题定位在 master_bedroom_temp_sensor 单个设备上。"], "key_evidence": ["master_bedroom_temp_sensor 在6月14日出现4次非标准属性路径上报(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),值与标准上报存在偏差", "6月15日起该传感器标准格式上报完全消失,仅剩非标准格式,且数值固化为2350不再变化", "上报频率从每30分钟退化为约每6小时一次", "同期其他三个温度传感器工作完全正常,排除系统性故障"], "recommended_actions": ["立即检查主卧温度传感器的物理状态和供电情况,尝试重启或重新配对设备", "检查该传感器的固件版本,确认是否需要更新;非标准属性路径可能是固件bug导致的协议降级", "在传感器恢复前,主卧空调如有依赖该传感器的自动化规则应暂时切换为手动控制,避免因错误温度数据导致空调异常运行", "若重启无效,建议更换该传感器,因为温度监测失效会影响主卧的舒适性控制和潜在的安全告警能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.234639644622803, "api_error": null} {"episode_id": "SQ4_TP_C_0793", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0793.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261422, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-06T11:58:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁连续两次上锁失败并触发锁定告警(AlarmCode=0),表明门锁可能存在机械故障或卡死。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据方面,四个房间全天温度走势一致——凌晨约22.9-23.1°C,午间峰值约25.8-25.9°C,夜间回落至23.3°C左右,符合夏季自然昼夜温差规律,无任何房间出现异常升温或骤降,排除火灾风险和空调故障。\",\n \"推理步骤2: 在11:58:00,系统向入户门锁发送了 LockDoor 指令,5秒后门锁报告 LockState=2(未锁定/Not Fully Locked)。随即在11:58:10再次发送 LockDoor 指令,11:58:15再次报告 LockState=2,仍未成功上锁。\",\n \"推理步骤3: 紧接着在11:58:15触发了 DoorLockAlarm 事件,AlarmCode=0 对应 Matter DoorLock Cluster 中的 'LockJammed'(锁舌卡死)告警,说明门锁机械结构无法正常闭合。\",\n \"推理步骤4: 整个日志中没有任何运动传感器、门窗接触传感器、烟雾报警器、漏水传感器的异常事件,排除入侵、火灾、漏水等其他威胁。\",\n \"推理步骤5: 门锁卡死意味着入户门当前可能处于未锁定状态,存在物理安全隐患——如果住户外出,门未上锁会增加入侵风险。\"\n ],\n \"key_evidence\": [\n \"11:58:00 和 11:58:10 连续两次 LockDoor 指令均未能成功上锁,LockState 始终为 2(未完全锁定)\",\n \"11:58:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁舌卡死告警\",\n \"全天温度数据正常,无其他传感器报警事件\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁机械状态,查看锁舌是否被异物卡住或门框是否变形导致无法闭合\",\n \"在门锁修复前,确认入户门已通过其他方式(如手动反锁、安全链)锁好,避免安全空窗\",\n \"如门锁反复出现 LockJammed 告警,建议联系锁具厂商进行维修或更换锁体\",\n \"检查门锁电池电量,低电量有时也会导致电机驱动力不足而无法推动锁舌到位\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁连续两次上锁失败并触发锁定告警(AlarmCode=0),表明门锁可能存在机械故障或卡死。", "reasoning": ["推理步骤1: 温度数据方面,四个房间全天温度走势一致——凌晨约22.9-23.1°C,午间峰值约25.8-25.9°C,夜间回落至23.3°C左右,符合夏季自然昼夜温差规律,无任何房间出现异常升温或骤降,排除火灾风险和空调故障。", "推理步骤2: 在11:58:00,系统向入户门锁发送了 LockDoor 指令,5秒后门锁报告 LockState=2(未锁定/Not Fully Locked)。随即在11:58:10再次发送 LockDoor 指令,11:58:15再次报告 LockState=2,仍未成功上锁。", "推理步骤3: 紧接着在11:58:15触发了 DoorLockAlarm 事件,AlarmCode=0 对应 Matter DoorLock Cluster 中的 'LockJammed'(锁舌卡死)告警,说明门锁机械结构无法正常闭合。", "推理步骤4: 整个日志中没有任何运动传感器、门窗接触传感器、烟雾报警器、漏水传感器的异常事件,排除入侵、火灾、漏水等其他威胁。", "推理步骤5: 门锁卡死意味着入户门当前可能处于未锁定状态,存在物理安全隐患——如果住户外出,门未上锁会增加入侵风险。"], "key_evidence": ["11:58:00 和 11:58:10 连续两次 LockDoor 指令均未能成功上锁,LockState 始终为 2(未完全锁定)", "11:58:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 锁舌卡死告警", "全天温度数据正常,无其他传感器报警事件"], "recommended_actions": ["立即检查入户门锁机械状态,查看锁舌是否被异物卡住或门框是否变形导致无法闭合", "在门锁修复前,确认入户门已通过其他方式(如手动反锁、安全链)锁好,避免安全空窗", "如门锁反复出现 LockJammed 告警,建议联系锁具厂商进行维修或更换锁体", "检查门锁电池电量,低电量有时也会导致电机驱动力不足而无法推动锁舌到位"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.82208752632141, "api_error": null} {"episode_id": "SQ4_TP_C_0794", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0794.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261423, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "second_bedroom", "injection_time": "2026-06-20T19:05:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁或异常情况。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度变化呈现典型的夏季昼夜曲线:凌晨0:00-5:30维持在22.9-23.1°C左右,6:00起随日出逐步升温,12:00-12:30达到峰值约25.7-25.8°C,午后缓慢回落,至23:30降回约23.3°C。各房间温度高度一致,无单一房间异常升温(排除火灾隐患),波动幅度合理。\",\n \"推理步骤2: 入户事件分析——19:05用户通过门锁正常开锁进入(LockOperationType=1表示解锁,OperationSource=3表示密码/凭证开锁,UserIndex=1为已注册用户)。随后入户门传感器显示门打开(False)再关闭(True),玄关运动传感器检测到人,接着客厅和次卧运动传感器依次触发,符合住户回家后在室内活动的正常动线。\",\n \"推理步骤3: 无任何报警类事件——烟雾报警器(厨房、客厅)未触发,漏水传感器(厨房、主卫、次卫)未触发,所有门窗传感器除入户门正常开关外无异常状态变化。整个日志中没有出现未授权开锁、深夜异常运动、设备故障或环境危险信号。\",\n \"推理步骤4: 时间合理性——19:05回家属于正常下班时间,且全天白天无人在家(无运动传感器触发),符合工作日住户外出的生活模式。\"\n ],\n \"key_evidence\": [\n \"全天温度曲线呈正常昼夜变化,各房间一致,无异常升温或骤变\",\n \"19:05入户门通过已注册用户(UserIndex=1)凭证解锁,开门-关门-室内活动动线连贯合理\",\n \"全天无烟雾报警、漏水报警、未授权开锁或异常时段运动检测事件\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何措施,家庭安全状态良好\",\n \"建议关注夏季午间室内峰值温度已接近25.8°C,如持续升高可考虑设置空调自动开启规则以保持舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁或异常情况。", "reasoning": ["推理步骤1: 温度数据分析——四个传感器(客厅、主卧、儿童房、厨房)全天温度变化呈现典型的夏季昼夜曲线:凌晨0:00-5:30维持在22.9-23.1°C左右,6:00起随日出逐步升温,12:00-12:30达到峰值约25.7-25.8°C,午后缓慢回落,至23:30降回约23.3°C。各房间温度高度一致,无单一房间异常升温(排除火灾隐患),波动幅度合理。", "推理步骤2: 入户事件分析——19:05用户通过门锁正常开锁进入(LockOperationType=1表示解锁,OperationSource=3表示密码/凭证开锁,UserIndex=1为已注册用户)。随后入户门传感器显示门打开(False)再关闭(True),玄关运动传感器检测到人,接着客厅和次卧运动传感器依次触发,符合住户回家后在室内活动的正常动线。", "推理步骤3: 无任何报警类事件——烟雾报警器(厨房、客厅)未触发,漏水传感器(厨房、主卫、次卫)未触发,所有门窗传感器除入户门正常开关外无异常状态变化。整个日志中没有出现未授权开锁、深夜异常运动、设备故障或环境危险信号。", "推理步骤4: 时间合理性——19:05回家属于正常下班时间,且全天白天无人在家(无运动传感器触发),符合工作日住户外出的生活模式。"], "key_evidence": ["全天温度曲线呈正常昼夜变化,各房间一致,无异常升温或骤变", "19:05入户门通过已注册用户(UserIndex=1)凭证解锁,开门-关门-室内活动动线连贯合理", "全天无烟雾报警、漏水报警、未授权开锁或异常时段运动检测事件"], "recommended_actions": ["当前无需采取任何措施,家庭安全状态良好", "建议关注夏季午间室内峰值温度已接近25.8°C,如持续升高可考虑设置空调自动开启规则以保持舒适度"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.142707347869873, "api_error": null} {"episode_id": "SQ4_TP_C_0796", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0796.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261425, "scenario_id": "BA-05", "total_events": 257, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-25T14:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;同时入户门在16:00开锁后长时间未关闭,14:43客厅出现无对应开门记录的运动检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:43:10、06:51:00、18:45:00、19:05:00共4次报告 MeasuredValue = None。每次都发生在灶具使用前后,说明传感器可能受高温影响出现间歇性故障,无法正常采集数据。这意味着在灶具工作期间厨房缺少有效的温度监控,存在火灾风险盲区。\",\n \"推理步骤2: 16:00入户门锁被手动开锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),之后有人进入儿童房。但日志中直到18:11再次开锁前,没有出现关门(StateValue=True)或上锁记录。这意味着入户门可能在16:00至18:11之间处于未关闭或未上锁状态,持续约2小时,存在安全隐患。\",\n \"推理步骤3: 14:43客厅运动传感器检测到有人(Occupancy=1),但此时家中应无人——早上07:44全家出门并锁门,下一次开门记录是16:00。没有对应的入户门开启事件,可能是传感器误报,也可能存在未经正门进入的情况。不过考虑到没有其他门窗传感器触发,误报的可能性更大。\",\n \"推理步骤4: 厨房窗户在06:50:30和19:04:30两次被打开(StateValue=False),但日志中没有对应的关闭记录(StateValue=True)。如果窗户确实一直开着,在家人外出期间(07:44-16:00)厨房窗户处于开启状态,存在一定的入侵风险。\",\n \"推理步骤5: 其余行为模式正常——早晨起床、做早餐、孩子上学/出门、傍晚回家、做晚饭、洗碗机运行、晚间就寝、门锁自动上锁,温度随日照自然升降(夜间约23°C,午间峰值约25.8°C),均符合夏季三口之家的典型生活规律。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:43:10、06:51:00、18:45:00、19:05:00 四次报告 MeasuredValue = None,均发生在灶具开关前后\",\n \"16:00:00 front_door_lock 开锁、16:00:02 门打开,但直到 18:11 再次开锁前无关门/上锁记录,入户门疑似长时间未关\",\n \"14:43 living_room_occupancy 检测到占用,但当时家中无人(07:44已出门锁门,16:00才回来),无对应门窗开启事件\",\n \"kitchen_window_contact 两次报告 StateValue=False(开启),但日志中无关闭记录,外出期间窗户可能一直开着\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器,排查其在灶具使用时报告 None 的原因,确保烹饪期间温度监控不中断\",\n \"检查入户门锁的自动上锁策略,建议设置门开超时未关闭时发送告警通知\",\n \"排查14:43客厅运动传感器的误报原因(宠物、光线变化、传感器灵敏度),必要时调整灵敏度或增加摄像头交叉验证\",\n \"养成外出前检查厨房窗户关闭的习惯,或增加自动化规则:离家模式下检测到窗户未关时发送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;同时入户门在16:00开锁后长时间未关闭,14:43客厅出现无对应开门记录的运动检测。", "reasoning": ["推理步骤1: 厨房温度传感器在06:43:10、06:51:00、18:45:00、19:05:00共4次报告 MeasuredValue = None。每次都发生在灶具使用前后,说明传感器可能受高温影响出现间歇性故障,无法正常采集数据。这意味着在灶具工作期间厨房缺少有效的温度监控,存在火灾风险盲区。", "推理步骤2: 16:00入户门锁被手动开锁(LockOperationType=1),门传感器显示门被打开(StateValue=False),之后有人进入儿童房。但日志中直到18:11再次开锁前,没有出现关门(StateValue=True)或上锁记录。这意味着入户门可能在16:00至18:11之间处于未关闭或未上锁状态,持续约2小时,存在安全隐患。", "推理步骤3: 14:43客厅运动传感器检测到有人(Occupancy=1),但此时家中应无人——早上07:44全家出门并锁门,下一次开门记录是16:00。没有对应的入户门开启事件,可能是传感器误报,也可能存在未经正门进入的情况。不过考虑到没有其他门窗传感器触发,误报的可能性更大。", "推理步骤4: 厨房窗户在06:50:30和19:04:30两次被打开(StateValue=False),但日志中没有对应的关闭记录(StateValue=True)。如果窗户确实一直开着,在家人外出期间(07:44-16:00)厨房窗户处于开启状态,存在一定的入侵风险。", "推理步骤5: 其余行为模式正常——早晨起床、做早餐、孩子上学/出门、傍晚回家、做晚饭、洗碗机运行、晚间就寝、门锁自动上锁,温度随日照自然升降(夜间约23°C,午间峰值约25.8°C),均符合夏季三口之家的典型生活规律。"], "key_evidence": ["kitchen_temp_sensor 在 06:43:10、06:51:00、18:45:00、19:05:00 四次报告 MeasuredValue = None,均发生在灶具开关前后", "16:00:00 front_door_lock 开锁、16:00:02 门打开,但直到 18:11 再次开锁前无关门/上锁记录,入户门疑似长时间未关", "14:43 living_room_occupancy 检测到占用,但当时家中无人(07:44已出门锁门,16:00才回来),无对应门窗开启事件", "kitchen_window_contact 两次报告 StateValue=False(开启),但日志中无关闭记录,外出期间窗户可能一直开着"], "recommended_actions": ["检修或更换厨房温度传感器,排查其在灶具使用时报告 None 的原因,确保烹饪期间温度监控不中断", "检查入户门锁的自动上锁策略,建议设置门开超时未关闭时发送告警通知", "排查14:43客厅运动传感器的误报原因(宠物、光线变化、传感器灵敏度),必要时调整灵敏度或增加摄像头交叉验证", "养成外出前检查厨房窗户关闭的习惯,或增加自动化规则:离家模式下检测到窗户未关时发送提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.402936458587646, "api_error": null} {"episode_id": "SQ4_TP_C_0801", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0801.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261430, "scenario_id": "FG-01", "total_events": 199, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-20T22:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"深夜厨房灶具无人看管运行,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:52 厨房灶具被开启(OnOff=True),同一时刻客厅运动传感器显示无人(Occupancy=0),表明住户可能已不在公共区域活动,深夜近23点开灶本身就是非典型行为。\",\n \"推理步骤2: 全天厨房温度在 22.9°C~25.8°C 之间正常波动。但灶具开启仅5分钟后(22:57),厨房温度从约 23.5°C 骤升至 31.32°C,10分钟后(23:02)进一步飙升至 35.0°C,温升幅度超过 11°C,远超正常烹饪引起的环境温度变化。\",\n \"推理步骤3: 23:07 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认现场已产生烟雾,这与温度异常飙升形成强关联证据链,指向灶具上可能有食物或油脂起火/干烧。\",\n \"推理步骤4: 23:00 的定时温度采样显示厨房温度回落至 23.39°C,与 23:02 的 35.0°C 存在时序矛盾——这说明 23:00 的数据是常规半小时轮询,而 22:57 和 23:02 是异常触发的即时上报,实际厨房局部温度在灶具附近已非常高。\",\n \"推理步骤5: 日志中未见灶具关闭(OnOff=False)的记录,也未见任何运动传感器在厨房附近区域检测到有人响应报警,说明灶具可能仍在无人看管状态下持续运行。\"\n ],\n \"key_evidence\": [\n \"22:52 厨房灶具开启,同时客厅无人(Occupancy=0),深夜无人看管用灶\",\n \"22:57 厨房温度骤升至 31.32°C,23:02 进一步升至 35.0°C,5分钟内温升超过 11°C\",\n \"23:07 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1),确认产生烟雾\",\n \"日志中始终未出现灶具关闭记录(OnOff=False),灶具可能仍在运行\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface OnOff → False)\",\n \"通过手机推送、短信或语音等方式紧急通知住户,确认是否有人在家并前往厨房查看\",\n \"如住户无响应,考虑联系物业或紧急联系人前往现场确认情况\",\n \"检查厨房窗户传感器状态,如窗户关闭建议远程开启通风(若支持),帮助排烟散热\",\n \"事后排查灶具被开启的原因(误触、儿童操作、自动化规则误触发等),建议为灶具增加深夜时段自动锁定或无人看管超时自动关闭的安全策略\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "深夜厨房灶具无人看管运行,厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 22:52 厨房灶具被开启(OnOff=True),同一时刻客厅运动传感器显示无人(Occupancy=0),表明住户可能已不在公共区域活动,深夜近23点开灶本身就是非典型行为。", "推理步骤2: 全天厨房温度在 22.9°C~25.8°C 之间正常波动。但灶具开启仅5分钟后(22:57),厨房温度从约 23.5°C 骤升至 31.32°C,10分钟后(23:02)进一步飙升至 35.0°C,温升幅度超过 11°C,远超正常烹饪引起的环境温度变化。", "推理步骤3: 23:07 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm事件),确认现场已产生烟雾,这与温度异常飙升形成强关联证据链,指向灶具上可能有食物或油脂起火/干烧。", "推理步骤4: 23:00 的定时温度采样显示厨房温度回落至 23.39°C,与 23:02 的 35.0°C 存在时序矛盾——这说明 23:00 的数据是常规半小时轮询,而 22:57 和 23:02 是异常触发的即时上报,实际厨房局部温度在灶具附近已非常高。", "推理步骤5: 日志中未见灶具关闭(OnOff=False)的记录,也未见任何运动传感器在厨房附近区域检测到有人响应报警,说明灶具可能仍在无人看管状态下持续运行。"], "key_evidence": ["22:52 厨房灶具开启,同时客厅无人(Occupancy=0),深夜无人看管用灶", "22:57 厨房温度骤升至 31.32°C,23:02 进一步升至 35.0°C,5分钟内温升超过 11°C", "23:07 厨房烟雾报警器触发 SmokeAlarm 事件(SmokeState=1),确认产生烟雾", "日志中始终未出现灶具关闭记录(OnOff=False),灶具可能仍在运行"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface OnOff → False)", "通过手机推送、短信或语音等方式紧急通知住户,确认是否有人在家并前往厨房查看", "如住户无响应,考虑联系物业或紧急联系人前往现场确认情况", "检查厨房窗户传感器状态,如窗户关闭建议远程开启通风(若支持),帮助排烟散热", "事后排查灶具被开启的原因(误触、儿童操作、自动化规则误触发等),建议为灶具增加深夜时段自动锁定或无人看管超时自动关闭的安全策略"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.935816287994385, "api_error": null} {"episode_id": "SQ4_TP_C_0802", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0802.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261431, "scenario_id": "WD-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-13T07:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水。\",\n \"reasoning\": [\n \"推理步骤1: 07:49 洗碗机启动(OperationalState = 1),07:54 厨房漏水传感器报警(StateValue = True),两者仅相隔5分钟,时间高度关联。\",\n \"推理步骤2: 07:54 洗碗机仍处于运行状态(OperationalState = 1),说明漏水并非洗碗机正常结束排水导致,而是运行过程中发生了水泄漏。\",\n \"推理步骤3: 在整个日志时间范围内,漏水传感器的 StateValue 未恢复为 False,说明漏水状况可能持续存在,未被处理。\",\n \"推理步骤4: 温度数据方面,全屋四个传感器呈现一致的日间升温、夜间降温规律(凌晨约22.9°C,午间峰值约25.8°C),属于夏季正常昼夜温度波动,无异常热源迹象。\",\n \"推理步骤5: 除洗碗机和漏水传感器外,日志中无其他设备状态变化事件(门锁、烟雾报警器、运动传感器等均无触发),排除入侵、火灾等其他威胁。\"\n ],\n \"key_evidence\": [\n \"07:54 厨房漏水传感器触发:kitchen_water_leak | StateValue = True\",\n \"07:49 洗碗机启动:kitchen_dishwasher | OperationalState = 1,漏水发生在洗碗机运行仅5分钟后\",\n \"日志中漏水传感器未恢复为 False,表明漏水可能仍在持续\"\n ],\n \"recommended_actions\": [\n \"立即前往厨房检查洗碗机周围是否有积水,确认漏水来源(进水管、排水管或机身密封)\",\n \"远程或手动停止洗碗机运行,关闭洗碗机供水阀门以防止漏水扩大\",\n \"检查厨房地面及橱柜底部是否有水渍蔓延,防止浸泡损坏地板或电气线路\",\n \"漏水处理完毕后复位漏水传感器,观察是否再次触发以排除传感器误报的可能\",\n \"如洗碗机本体存在密封老化或管路松动,安排维修后再恢复使用\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水。", "reasoning": ["推理步骤1: 07:49 洗碗机启动(OperationalState = 1),07:54 厨房漏水传感器报警(StateValue = True),两者仅相隔5分钟,时间高度关联。", "推理步骤2: 07:54 洗碗机仍处于运行状态(OperationalState = 1),说明漏水并非洗碗机正常结束排水导致,而是运行过程中发生了水泄漏。", "推理步骤3: 在整个日志时间范围内,漏水传感器的 StateValue 未恢复为 False,说明漏水状况可能持续存在,未被处理。", "推理步骤4: 温度数据方面,全屋四个传感器呈现一致的日间升温、夜间降温规律(凌晨约22.9°C,午间峰值约25.8°C),属于夏季正常昼夜温度波动,无异常热源迹象。", "推理步骤5: 除洗碗机和漏水传感器外,日志中无其他设备状态变化事件(门锁、烟雾报警器、运动传感器等均无触发),排除入侵、火灾等其他威胁。"], "key_evidence": ["07:54 厨房漏水传感器触发:kitchen_water_leak | StateValue = True", "07:49 洗碗机启动:kitchen_dishwasher | OperationalState = 1,漏水发生在洗碗机运行仅5分钟后", "日志中漏水传感器未恢复为 False,表明漏水可能仍在持续"], "recommended_actions": ["立即前往厨房检查洗碗机周围是否有积水,确认漏水来源(进水管、排水管或机身密封)", "远程或手动停止洗碗机运行,关闭洗碗机供水阀门以防止漏水扩大", "检查厨房地面及橱柜底部是否有水渍蔓延,防止浸泡损坏地板或电气线路", "漏水处理完毕后复位漏水传感器,观察是否再次触发以排除传感器误报的可能", "如洗碗机本体存在密封老化或管路松动,安排维修后再恢复使用"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.677367210388184, "api_error": null} {"episode_id": "SQ4_TP_C_0804", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0804.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261433, "scenario_id": "FG-01", "total_events": 263, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-29T21:58:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人操作的深夜异常开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 21:58 厨房灶具被开启(kitchen_cook_surface OnOff = True),但此时全家人的活动模式显示住户正在准备就寝——客厅灯在 22:13 关闭、儿童房灯早在 20:58 已关闭、主卧窗帘关闭,且主卫运动传感器同一时刻显示无人(Occupancy=0),没有任何厨房区域或餐厅区域的运动传感器触发,说明无人在厨房操作灶具。\",\n \"推理步骤2: 灶具开启后,厨房温度从 22:00 的 2355(约23.55°C)在 5 分钟内飙升至 22:03 的 2944(约29.44°C),再到 22:08 的 3500(约35.00°C),10 分钟内升温近 12°C,这是极其异常的升温速率,远超正常烹饪或环境变化。\",\n \"推理步骤3: 22:13 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认厨房已产生烟雾,与温度异常飙升形成强关联,指向明火或干烧风险。\",\n \"推理步骤4: 报警触发后,住户似乎被惊醒——22:13:11 主卧运动传感器检测到活动,但随后的操作令人担忧:主卧窗帘被关闭(10000=全关)、客厅灯和空调关闭、主卧灯关闭,入户门在 22:13:22 被自动上锁(LockState=1),没有看到任何人前往厨房关闭灶具或处理火情的迹象。\",\n \"推理步骤5: 日志中始终没有出现 kitchen_cook_surface OnOff = False 的记录,说明灶具在报警后仍处于开启状态,火灾风险持续存在。\",\n \"推理步骤6: 附带异常——厨房温度传感器在当天两次烹饪期间(07:05、07:12 和 18:26、18:56)报告了 MeasuredValue = None,表明该传感器存在间歇性故障,可能影响温度监控的可靠性。\",\n \"推理步骤7: 21:58 的灶具开启事件日志格式异常(OnOff = True 而非标准的 OnOff.OnOff = True),可能暗示该操作来源非正常(如设备故障、自动化规则误触发或远程误操作)。\"\n ],\n \"key_evidence\": [\n \"21:58 厨房灶具在无人在场的情况下被开启(kitchen_cook_surface OnOff = True),同时无厨房/餐厅运动传感器触发\",\n \"厨房温度在 10 分钟内从 23.55°C 飙升至 35.00°C(22:00→22:03→22:08)\",\n \"22:13 厨房烟雾报警器触发(SmokeState=1, Event: SmokeAlarm)\",\n \"日志中无灶具关闭记录,灶具可能仍在运行\",\n \"厨房温度传感器当天多次报告 None 值,存在间歇性故障\",\n \"16:17 入户门开锁后未见重新上锁记录,直到 22:13 才自动上锁——期间入户门可能处于未锁状态\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),这是最紧急的操作\",\n \"确认家中人员是否安全,检查是否需要拨打 119 火警电话\",\n \"打开厨房窗户通风(当前 kitchen_window_contact 状态未知,最后记录为 18:55 打开),确保烟雾排出\",\n \"检查厨房烟雾报警器当前状态,确认烟雾是否已消散\",\n \"排查灶具异常开启的原因:检查是否存在自动化规则误触发、远程控制误操作或设备固件故障\",\n \"维修或更换厨房温度传感器,解决间歇性报告 None 值的问题,确保温度监控可靠\",\n \"建议为灶具增加安全规则:深夜时段(22:00-06:00)禁止远程/自动开启,或开启后无人活动超过一定时间自动关闭\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人操作的深夜异常开启,导致厨房温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 21:58 厨房灶具被开启(kitchen_cook_surface OnOff = True),但此时全家人的活动模式显示住户正在准备就寝——客厅灯在 22:13 关闭、儿童房灯早在 20:58 已关闭、主卧窗帘关闭,且主卫运动传感器同一时刻显示无人(Occupancy=0),没有任何厨房区域或餐厅区域的运动传感器触发,说明无人在厨房操作灶具。", "推理步骤2: 灶具开启后,厨房温度从 22:00 的 2355(约23.55°C)在 5 分钟内飙升至 22:03 的 2944(约29.44°C),再到 22:08 的 3500(约35.00°C),10 分钟内升温近 12°C,这是极其异常的升温速率,远超正常烹饪或环境变化。", "推理步骤3: 22:13 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认厨房已产生烟雾,与温度异常飙升形成强关联,指向明火或干烧风险。", "推理步骤4: 报警触发后,住户似乎被惊醒——22:13:11 主卧运动传感器检测到活动,但随后的操作令人担忧:主卧窗帘被关闭(10000=全关)、客厅灯和空调关闭、主卧灯关闭,入户门在 22:13:22 被自动上锁(LockState=1),没有看到任何人前往厨房关闭灶具或处理火情的迹象。", "推理步骤5: 日志中始终没有出现 kitchen_cook_surface OnOff = False 的记录,说明灶具在报警后仍处于开启状态,火灾风险持续存在。", "推理步骤6: 附带异常——厨房温度传感器在当天两次烹饪期间(07:05、07:12 和 18:26、18:56)报告了 MeasuredValue = None,表明该传感器存在间歇性故障,可能影响温度监控的可靠性。", "推理步骤7: 21:58 的灶具开启事件日志格式异常(OnOff = True 而非标准的 OnOff.OnOff = True),可能暗示该操作来源非正常(如设备故障、自动化规则误触发或远程误操作)。"], "key_evidence": ["21:58 厨房灶具在无人在场的情况下被开启(kitchen_cook_surface OnOff = True),同时无厨房/餐厅运动传感器触发", "厨房温度在 10 分钟内从 23.55°C 飙升至 35.00°C(22:00→22:03→22:08)", "22:13 厨房烟雾报警器触发(SmokeState=1, Event: SmokeAlarm)", "日志中无灶具关闭记录,灶具可能仍在运行", "厨房温度传感器当天多次报告 None 值,存在间歇性故障", "16:17 入户门开锁后未见重新上锁记录,直到 22:13 才自动上锁——期间入户门可能处于未锁状态"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),这是最紧急的操作", "确认家中人员是否安全,检查是否需要拨打 119 火警电话", "打开厨房窗户通风(当前 kitchen_window_contact 状态未知,最后记录为 18:55 打开),确保烟雾排出", "检查厨房烟雾报警器当前状态,确认烟雾是否已消散", "排查灶具异常开启的原因:检查是否存在自动化规则误触发、远程控制误操作或设备固件故障", "维修或更换厨房温度传感器,解决间歇性报告 None 值的问题,确保温度监控可靠", "建议为灶具增加安全规则:深夜时段(22:00-06:00)禁止远程/自动开启,或开启后无人活动超过一定时间自动关闭"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.4067645072937, "api_error": null} {"episode_id": "SQ4_TP_C_0805", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0805.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261434, "scenario_id": "INS-01", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-09T04:50:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时儿童房窗户凌晨异常开启需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:08、07:23、18:15、18:55 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温环境可能导致传感器读数异常或传感器本身存在故障。\",\n \"推理步骤2: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合工作。如果传感器持续在烹饪时失效,一旦发生真正的火灾或过热情况,系统将无法通过温度数据及时预警。\",\n \"推理步骤3: 04:50 儿童房窗户传感器报告 StateValue=False(窗户打开),随后 04:50:05 儿童房检测到有人活动,04:50:30 主卧也检测到活动并开灯。凌晨近5点窗户被打开较为异常,但考虑到儿童房随即有人、主卧大人也被惊醒响应,更可能是孩子起夜开窗或窗户被风吹开后家长前去查看,非入侵行为。\",\n \"推理步骤4: 入户门锁操作均为正常模式——07:38 手动开锁出门后自动上锁(早晨出门),16:23 手动开锁进门(下午放学/回家),18:02 手动开锁进门(傍晚回家),22:41 确认门已关闭并自动上锁(睡前)。全天门锁行为与家庭作息完全吻合。\",\n \"推理步骤5: 全屋温度变化呈现正常的昼夜曲线:凌晨约 22.9-23.1°C,中午升至 25.5-25.9°C 的峰值,傍晚逐步回落。18:02 开启客厅空调(制冷模式 SystemMode=3)后温度加速下降,符合夏季使用空调的正常场景。\",\n \"推理步骤6: 其他设备行为均正常——洗碗机 19:37 启动、儿童房 21:01 关灯拉窗帘(孩子睡觉)、厨房做饭后开窗通风、各房间灯光随人员活动开关,无异常模式。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:08、07:23、18:15、18:55 四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"04:50 凌晨儿童房窗户打开(StateValue=False),但随即儿童房和主卧均检测到人员活动,家长已响应\",\n \"厨房烟雾报警器全天未触发任何告警事件\",\n \"入户门锁全天操作记录与家庭三口之家的作息规律一致(早出、午归、晚归、睡前锁门)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热失效,考虑调整传感器安装位置使其远离灶具热源\",\n \"如传感器持续在烹饪时报 None,建议更换耐高温型号或增加备用传感器,确保厨房火灾预警能力不受影响\",\n \"确认儿童房窗户是否有安全锁扣,防止幼儿在夜间自行打开窗户造成坠落风险\",\n \"建议为厨房温度传感器设置离线/异常告警规则,当连续报告 None 时主动通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时儿童房窗户凌晨异常开启需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:08、07:23、18:15、18:55 四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明高温环境可能导致传感器读数异常或传感器本身存在故障。", "推理步骤2: 厨房温度传感器是厨房安全监控的重要组成部分,与烟雾报警器配合工作。如果传感器持续在烹饪时失效,一旦发生真正的火灾或过热情况,系统将无法通过温度数据及时预警。", "推理步骤3: 04:50 儿童房窗户传感器报告 StateValue=False(窗户打开),随后 04:50:05 儿童房检测到有人活动,04:50:30 主卧也检测到活动并开灯。凌晨近5点窗户被打开较为异常,但考虑到儿童房随即有人、主卧大人也被惊醒响应,更可能是孩子起夜开窗或窗户被风吹开后家长前去查看,非入侵行为。", "推理步骤4: 入户门锁操作均为正常模式——07:38 手动开锁出门后自动上锁(早晨出门),16:23 手动开锁进门(下午放学/回家),18:02 手动开锁进门(傍晚回家),22:41 确认门已关闭并自动上锁(睡前)。全天门锁行为与家庭作息完全吻合。", "推理步骤5: 全屋温度变化呈现正常的昼夜曲线:凌晨约 22.9-23.1°C,中午升至 25.5-25.9°C 的峰值,傍晚逐步回落。18:02 开启客厅空调(制冷模式 SystemMode=3)后温度加速下降,符合夏季使用空调的正常场景。", "推理步骤6: 其他设备行为均正常——洗碗机 19:37 启动、儿童房 21:01 关灯拉窗帘(孩子睡觉)、厨房做饭后开窗通风、各房间灯光随人员活动开关,无异常模式。"], "key_evidence": ["厨房温度传感器在 07:08、07:23、18:15、18:55 四次报告 MeasuredValue = None,均发生在灶具使用前后", "04:50 凌晨儿童房窗户打开(StateValue=False),但随即儿童房和主卧均检测到人员活动,家长已响应", "厨房烟雾报警器全天未触发任何告警事件", "入户门锁全天操作记录与家庭三口之家的作息规律一致(早出、午归、晚归、睡前锁门)"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热失效,考虑调整传感器安装位置使其远离灶具热源", "如传感器持续在烹饪时报 None,建议更换耐高温型号或增加备用传感器,确保厨房火灾预警能力不受影响", "确认儿童房窗户是否有安全锁扣,防止幼儿在夜间自行打开窗户造成坠落风险", "建议为厨房温度传感器设置离线/异常告警规则,当连续报告 None 时主动通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.656936168670654, "api_error": null} {"episode_id": "SQ4_TP_C_0807", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0807.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261436, "scenario_id": "FG-03", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-27T10:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"客厅烟雾报警器在10:23触发了一氧化碳(CO)报警,存在一氧化碳中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 在10:23,客厅烟雾报警器(living_room_smoke_alarm)报告 COState=1(一氧化碳警告状态)、ExpressedState=2(CO报警激活),并触发了 COAlarm 事件,表明检测到一氧化碳浓度超标。\",\n \"推理步骤2: 日志中没有任何后续事件将 COState 恢复为0或将 ExpressedState 恢复为正常,说明截至日志结束时CO报警仍未解除,问题可能持续存在。\",\n \"推理步骤3: 厨房烟雾报警器(kitchen_smoke_alarm)未触发,且厨房灶具(kitchen_cook_surface)无使用记录,排除了烹饪导致的误报可能。CO来源不明,需要排查燃气设备或外部泄漏。\",\n \"推理步骤4: 温度数据方面,全屋各房间温度走势高度一致——夜间约23°C,白天随气温升至约25.8°C后回落,属于夏季正常昼夜温度波动,未见局部异常升温,排除火灾隐患。\",\n \"推理步骤5: 除CO报警外,整日无门锁、门窗传感器、运动传感器、漏水传感器等任何其他设备事件,入侵和漏水风险可排除。\"\n ],\n \"key_evidence\": [\n \"10:23 living_room_smoke_alarm COState=1,ExpressedState=2,触发 COAlarm 事件\",\n \"整日日志中无 COState 恢复为0的记录,报警状态未解除\",\n \"厨房灶具和厨房烟雾报警器均无异常事件,CO来源不明\"\n ],\n \"recommended_actions\": [\n \"立即开窗通风,所有人员撤离至室外安全区域,一氧化碳无色无味,中毒风险极高\",\n \"拨打燃气公司或119排查CO泄漏源(燃气管道、热水器、壁挂炉等)\",\n \"在确认CO浓度恢复安全前,不要返回室内居住\",\n \"检查客厅及相邻区域是否有燃气设备或通风不良的燃烧源\",\n \"事后建议在厨房和其他有燃气设备的房间增设独立CO探测器,提升覆盖范围\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "客厅烟雾报警器在10:23触发了一氧化碳(CO)报警,存在一氧化碳中毒风险。", "reasoning": ["推理步骤1: 在10:23,客厅烟雾报警器(living_room_smoke_alarm)报告 COState=1(一氧化碳警告状态)、ExpressedState=2(CO报警激活),并触发了 COAlarm 事件,表明检测到一氧化碳浓度超标。", "推理步骤2: 日志中没有任何后续事件将 COState 恢复为0或将 ExpressedState 恢复为正常,说明截至日志结束时CO报警仍未解除,问题可能持续存在。", "推理步骤3: 厨房烟雾报警器(kitchen_smoke_alarm)未触发,且厨房灶具(kitchen_cook_surface)无使用记录,排除了烹饪导致的误报可能。CO来源不明,需要排查燃气设备或外部泄漏。", "推理步骤4: 温度数据方面,全屋各房间温度走势高度一致——夜间约23°C,白天随气温升至约25.8°C后回落,属于夏季正常昼夜温度波动,未见局部异常升温,排除火灾隐患。", "推理步骤5: 除CO报警外,整日无门锁、门窗传感器、运动传感器、漏水传感器等任何其他设备事件,入侵和漏水风险可排除。"], "key_evidence": ["10:23 living_room_smoke_alarm COState=1,ExpressedState=2,触发 COAlarm 事件", "整日日志中无 COState 恢复为0的记录,报警状态未解除", "厨房灶具和厨房烟雾报警器均无异常事件,CO来源不明"], "recommended_actions": ["立即开窗通风,所有人员撤离至室外安全区域,一氧化碳无色无味,中毒风险极高", "拨打燃气公司或119排查CO泄漏源(燃气管道、热水器、壁挂炉等)", "在确认CO浓度恢复安全前,不要返回室内居住", "检查客厅及相邻区域是否有燃气设备或通风不良的燃烧源", "事后建议在厨房和其他有燃气设备的房间增设独立CO探测器,提升覆盖范围"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.178983211517334, "api_error": null} {"episode_id": "SQ4_TP_C_0808", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0808.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261437, "scenario_id": "CH-03", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-03", "scenario_name": "儿童深夜活动", "category": "child_specific", "is_anomaly": true, "threat_type": "child_nighttime_wandering", "key_evidence": ["凌晨时段儿童房活动 → 离开房间去其他区域", "家长卧室无活动(不是家长带着孩子)", "低龄儿童深夜独自活动有安全风险(摔倒、误触电器等)"], "expected_response": "通知家长(轻柔方式),建议查看孩子情况", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-15T02:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨全家休息,06:15 起床洗漱做早餐,07:22 出门上班/上学并自动锁门,16:26 孩子先回家,17:41 大人回家,22:37 就寝锁门,符合三口之家的典型作息。\",\n \"推理步骤2: 入侵风险排除——入户门在 07:22 和 22:37 两次确认关闭并自动上锁(LockState=1),16:26 和 17:41 的开锁均为 Manual 手动操作,无异常开锁源(如远程、未知PIN等),玄关运动传感器与开门事件时间吻合。\",\n \"推理步骤3: 凌晨 01:30 儿童房检测到运动并开灯,01:35 离开后 01:36 客厅检测到运动,推测孩子起夜去客厅(如喝水/上厕所),属正常行为。\",\n \"推理步骤4: 厨房温度传感器在 07:00:02、07:14:00、18:18:00、19:26:00 共四次报告 MeasuredValue = None。前两次发生在早餐灶具使用期间,后两次发生在晚餐灶具使用期间。虽然灶具附近温度波动可能干扰传感器,但连续出现 None 值(而非异常高温数值)更像是传感器通信故障或硬件异常,而非正常的温度超量程行为。\",\n \"推理步骤5: 厨房窗户传感器在 07:13:30 和 19:25:30 两次报告 StateValue=False(窗户打开),但整个日志中未见对应的关闭事件(StateValue=True)。做饭后开窗通风合理,但如果窗户在夜间仍保持打开状态,存在安全隐患(尤其是家人已就寝)。\",\n \"推理步骤6: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.8°C(12:30 左右),傍晚逐步回落,各房间温度一致,无局部异常升温,火灾风险低。\",\n \"推理步骤7: 烟雾报警器、漏水传感器全天无告警事件,洗碗机正常启动运行,客厅空调在 17:41 开启制冷(SystemMode=3)并在 22:37 关闭,均属正常操作。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:02、07:14:00、18:18:00、19:26:00 四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"kitchen_window_contact 在 07:13:30 和 19:25:30 报告 StateValue=False(开窗),但全天日志中无对应的关闭(StateValue=True)事件\",\n \"其余所有安全类传感器(烟雾报警器、漏水传感器、门锁、门窗传感器)均无异常告警\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁探头并确认其与 Matter 网络的连接稳定性,必要时更换传感器\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间就寝前应关闭窗户以确保安全\",\n \"考虑为厨房温度传感器设置 None 值告警自动化规则,在传感器离线或数据异常时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨全家休息,06:15 起床洗漱做早餐,07:22 出门上班/上学并自动锁门,16:26 孩子先回家,17:41 大人回家,22:37 就寝锁门,符合三口之家的典型作息。", "推理步骤2: 入侵风险排除——入户门在 07:22 和 22:37 两次确认关闭并自动上锁(LockState=1),16:26 和 17:41 的开锁均为 Manual 手动操作,无异常开锁源(如远程、未知PIN等),玄关运动传感器与开门事件时间吻合。", "推理步骤3: 凌晨 01:30 儿童房检测到运动并开灯,01:35 离开后 01:36 客厅检测到运动,推测孩子起夜去客厅(如喝水/上厕所),属正常行为。", "推理步骤4: 厨房温度传感器在 07:00:02、07:14:00、18:18:00、19:26:00 共四次报告 MeasuredValue = None。前两次发生在早餐灶具使用期间,后两次发生在晚餐灶具使用期间。虽然灶具附近温度波动可能干扰传感器,但连续出现 None 值(而非异常高温数值)更像是传感器通信故障或硬件异常,而非正常的温度超量程行为。", "推理步骤5: 厨房窗户传感器在 07:13:30 和 19:25:30 两次报告 StateValue=False(窗户打开),但整个日志中未见对应的关闭事件(StateValue=True)。做饭后开窗通风合理,但如果窗户在夜间仍保持打开状态,存在安全隐患(尤其是家人已就寝)。", "推理步骤6: 温度趋势正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.8°C(12:30 左右),傍晚逐步回落,各房间温度一致,无局部异常升温,火灾风险低。", "推理步骤7: 烟雾报警器、漏水传感器全天无告警事件,洗碗机正常启动运行,客厅空调在 17:41 开启制冷(SystemMode=3)并在 22:37 关闭,均属正常操作。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:02、07:14:00、18:18:00、19:26:00 四次报告 MeasuredValue = None,均发生在灶具使用前后", "kitchen_window_contact 在 07:13:30 和 19:25:30 报告 StateValue=False(开窗),但全天日志中无对应的关闭(StateValue=True)事件", "其余所有安全类传感器(烟雾报警器、漏水传感器、门锁、门窗传感器)均无异常告警"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁探头并确认其与 Matter 网络的连接稳定性,必要时更换传感器", "确认厨房窗户当前是否仍处于打开状态,夜间就寝前应关闭窗户以确保安全", "考虑为厨房温度传感器设置 None 值告警自动化规则,在传感器离线或数据异常时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.49782657623291, "api_error": null} {"episode_id": "SQ4_TP_C_0813", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0813.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261442, "scenario_id": "DF-05", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "DF-05", "scenario_name": "烟雾报警器硬件故障", "category": "device_fault", "is_anomaly": true, "threat_type": "safety_device_failure", "key_evidence": ["HardwareFaultAlert = true,设备自检发现硬件问题"], "expected_response": "通知住户该区域烟雾报警器失灵,建议立即更换,期间注意防火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-10T09:37:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器发生硬件故障,同时厨房温度传感器多次报告 null 值,存在消防安全监控盲区。\",\n \"reasoning\": [\n \"推理步骤1: 09:37 厨房烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件,表明该设备自检发现硬件级故障,已无法正常执行烟雾/CO 检测功能。\",\n \"推理步骤2: 厨房温度传感器在 06:59、07:23、18:27、19:02 四次报告 MeasuredValue=None。这些时间点均紧跟灶具开启或关闭操作,说明传感器在厨房温度变化较大时出现读数丢失,可能存在传感器故障或受灶具热源干扰。\",\n \"推理步骤3: 烟雾报警器故障 + 温度传感器间歇性失效,意味着厨房——家庭中火灾风险最高的区域——同时丧失了两道安全监测手段,形成消防监控盲区。\",\n \"推理步骤4: 其余设备行为均属正常:凌晨全屋温度约 22.9-23.1°C 平稳波动;06:29 起居室活动符合家庭成员起床模式;07:30 出门时关灯、手动开锁出门后自动上锁;16:27 孩子放学回家、17:43 大人下班回家的入户模式合理;晚间做饭、用餐、洗碗机运行、21:10 孩子关灯睡觉、22:33 大人关灯锁门睡觉,均为典型家庭作息。\",\n \"推理步骤5: 入户门锁全天操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。漏水传感器全天无报警,排除水患风险。\"\n ],\n \"key_evidence\": [\n \"09:37 kitchen_smoke_alarm 上报 HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault(),烟雾报警器硬件故障\",\n \"kitchen_temp_sensor 在 06:59、07:23、18:27、19:02 四次报告 MeasuredValue=None,温度传感器间歇性失效\",\n \"烟雾报警器故障后整日未恢复(无后续恢复事件),厨房消防监控处于持续失效状态\",\n \"厨房当日两次使用灶具(06:58-07:22、18:26-19:01),在报警器故障期间仍有明火操作\"\n ],\n \"recommended_actions\": [\n \"立即检查或更换厨房烟雾报警器(kitchen_smoke_alarm),在修复前避免无人看管的明火操作\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置和工作状态,排查其在灶具使用时读数丢失的原因\",\n \"在厨房烟雾报警器修复前,可考虑将客厅烟雾报警器(living_room_smoke_alarm)的灵敏度适当提高,作为临时补偿\",\n \"建议为关键安全设备(烟雾报警器、漏水传感器)配置硬件故障自动通知规则,确保故障第一时间推送到住户手机\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器发生硬件故障,同时厨房温度传感器多次报告 null 值,存在消防安全监控盲区。", "reasoning": ["推理步骤1: 09:37 厨房烟雾报警器上报 HardwareFaultAlert=True、ExpressedState=5 并触发 HardwareFault 事件,表明该设备自检发现硬件级故障,已无法正常执行烟雾/CO 检测功能。", "推理步骤2: 厨房温度传感器在 06:59、07:23、18:27、19:02 四次报告 MeasuredValue=None。这些时间点均紧跟灶具开启或关闭操作,说明传感器在厨房温度变化较大时出现读数丢失,可能存在传感器故障或受灶具热源干扰。", "推理步骤3: 烟雾报警器故障 + 温度传感器间歇性失效,意味着厨房——家庭中火灾风险最高的区域——同时丧失了两道安全监测手段,形成消防监控盲区。", "推理步骤4: 其余设备行为均属正常:凌晨全屋温度约 22.9-23.1°C 平稳波动;06:29 起居室活动符合家庭成员起床模式;07:30 出门时关灯、手动开锁出门后自动上锁;16:27 孩子放学回家、17:43 大人下班回家的入户模式合理;晚间做饭、用餐、洗碗机运行、21:10 孩子关灯睡觉、22:33 大人关灯锁门睡觉,均为典型家庭作息。", "推理步骤5: 入户门锁全天操作均为 Manual 开锁 + Auto 自动上锁,无异常远程解锁或暴力开锁事件,排除入侵风险。漏水传感器全天无报警,排除水患风险。"], "key_evidence": ["09:37 kitchen_smoke_alarm 上报 HardwareFaultAlert=True, ExpressedState=5, Event:HardwareFault(),烟雾报警器硬件故障", "kitchen_temp_sensor 在 06:59、07:23、18:27、19:02 四次报告 MeasuredValue=None,温度传感器间歇性失效", "烟雾报警器故障后整日未恢复(无后续恢复事件),厨房消防监控处于持续失效状态", "厨房当日两次使用灶具(06:58-07:22、18:26-19:01),在报警器故障期间仍有明火操作"], "recommended_actions": ["立即检查或更换厨房烟雾报警器(kitchen_smoke_alarm),在修复前避免无人看管的明火操作", "检查厨房温度传感器(kitchen_temp_sensor)的安装位置和工作状态,排查其在灶具使用时读数丢失的原因", "在厨房烟雾报警器修复前,可考虑将客厅烟雾报警器(living_room_smoke_alarm)的灵敏度适当提高,作为临时补偿", "建议为关键安全设备(烟雾报警器、漏水传感器)配置硬件故障自动通知规则,确保故障第一时间推送到住户手机"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.126342296600342, "api_error": null} {"episode_id": "SQ4_TP_C_0816", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0816.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261445, "scenario_id": "FG-03", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-28T01:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"凌晨1:21客厅一氧化碳报警器触发CO警报,深夜时段住户可能处于睡眠状态,存在一氧化碳中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 在01:21,客厅烟雾/CO报警器报告 COState=1(Warning级别)、ExpressedState=2(COAlarm),并触发了 COAlarm 事件,表明检测到一氧化碳浓度异常升高。\",\n \"推理步骤2: 事件发生在凌晨1:21,属于深夜睡眠时段,住户极可能处于熟睡状态,对CO泄漏的感知能力极低,中毒风险显著增大。\",\n \"推理步骤3: 检查温度数据,CO报警前后各房间温度均在22.9°C~23.1°C范围内正常波动,未出现异常升温,排除明火/火灾的可能性。厨房烟雾报警器未触发,厨房灶具无使用记录,说明CO来源并非厨房明火烹饪。\",\n \"推理步骤4: 日志中未见住户对该报警做出任何响应动作(如开灯、开门、开窗等),报警后无任何设备状态变化,说明报警可能未被住户察觉。\",\n \"推理步骤5: CO泄漏可能来源包括:燃气热水器排烟不畅、燃气管道微漏、或外部CO渗入。无论来源如何,CO在密闭夜间环境中积聚对人体健康构成严重威胁。\",\n \"推理步骤6: 整日温度变化呈正常昼夜曲线(夜间约23°C,午间峰值约25.9°C),各房间温度高度一致,温度传感器工作正常,不存在设备故障导致的误报迹象。\"\n ],\n \"key_evidence\": [\n \"01:21 living_room_smoke_alarm COState=1(CO警告状态)\",\n \"01:21 living_room_smoke_alarm ExpressedState=2(CO报警激活)\",\n \"01:21 living_room_smoke_alarm 触发 COAlarm 事件\",\n \"报警发生在凌晨深夜时段,日志中无任何住户响应动作\",\n \"厨房灶具无使用记录,厨房烟雾报警器未触发,排除烹饪引起\"\n ],\n \"recommended_actions\": [\n \"立即唤醒住户并通知所有家庭成员撤离至通风处,尤其注意儿童房的孩子\",\n \"打开所有门窗进行通风,特别是客厅和相邻区域\",\n \"切断家中燃气总阀,排查燃气热水器、壁挂炉等可能的CO泄漏源\",\n \"拨打燃气公司紧急热线或119请求专业检测\",\n \"如有住户出现头晕、恶心、头痛等症状,立即拨打120急救电话\",\n \"在CO来源查明并排除前,不要在室内使用任何燃气设备\",\n \"事后建议在主卧和儿童房增设独立CO报警器,提升夜间预警覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "凌晨1:21客厅一氧化碳报警器触发CO警报,深夜时段住户可能处于睡眠状态,存在一氧化碳中毒风险。", "reasoning": ["推理步骤1: 在01:21,客厅烟雾/CO报警器报告 COState=1(Warning级别)、ExpressedState=2(COAlarm),并触发了 COAlarm 事件,表明检测到一氧化碳浓度异常升高。", "推理步骤2: 事件发生在凌晨1:21,属于深夜睡眠时段,住户极可能处于熟睡状态,对CO泄漏的感知能力极低,中毒风险显著增大。", "推理步骤3: 检查温度数据,CO报警前后各房间温度均在22.9°C~23.1°C范围内正常波动,未出现异常升温,排除明火/火灾的可能性。厨房烟雾报警器未触发,厨房灶具无使用记录,说明CO来源并非厨房明火烹饪。", "推理步骤4: 日志中未见住户对该报警做出任何响应动作(如开灯、开门、开窗等),报警后无任何设备状态变化,说明报警可能未被住户察觉。", "推理步骤5: CO泄漏可能来源包括:燃气热水器排烟不畅、燃气管道微漏、或外部CO渗入。无论来源如何,CO在密闭夜间环境中积聚对人体健康构成严重威胁。", "推理步骤6: 整日温度变化呈正常昼夜曲线(夜间约23°C,午间峰值约25.9°C),各房间温度高度一致,温度传感器工作正常,不存在设备故障导致的误报迹象。"], "key_evidence": ["01:21 living_room_smoke_alarm COState=1(CO警告状态)", "01:21 living_room_smoke_alarm ExpressedState=2(CO报警激活)", "01:21 living_room_smoke_alarm 触发 COAlarm 事件", "报警发生在凌晨深夜时段,日志中无任何住户响应动作", "厨房灶具无使用记录,厨房烟雾报警器未触发,排除烹饪引起"], "recommended_actions": ["立即唤醒住户并通知所有家庭成员撤离至通风处,尤其注意儿童房的孩子", "打开所有门窗进行通风,特别是客厅和相邻区域", "切断家中燃气总阀,排查燃气热水器、壁挂炉等可能的CO泄漏源", "拨打燃气公司紧急热线或119请求专业检测", "如有住户出现头晕、恶心、头痛等症状,立即拨打120急救电话", "在CO来源查明并排除前,不要在室内使用任何燃气设备", "事后建议在主卧和儿童房增设独立CO报警器,提升夜间预警覆盖"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.603841304779053, "api_error": null} {"episode_id": "SQ4_TP_C_0818", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0818.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261447, "scenario_id": "BA-05", "total_events": 257, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-11T15:54:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:59、07:22、18:29、19:03 四次报告 MeasuredValue = None,均发生在灶具使用前后。传感器在高温环境下反复丢失读数,说明设备可能存在耐热性不足或连接不稳定的故障。\",\n \"推理步骤2: 厨房窗户传感器在 07:21:30 报告 StateValue = False(窗户打开),之后整天日志中未出现 StateValue = True 的关闭记录。晚间 19:02:30 再次报告 StateValue = False(再次打开或仍处于打开状态)。家人 07:30 出门后厨房窗户一直处于开启状态,存在安防隐患。\",\n \"推理步骤3: 其余设备行为均符合正常家庭作息——凌晨无人活动,06:11 起床、07:30 出门上班/上学、16:29 孩子放学回家、18:07 大人下班回家、22:14 就寝锁门,生活节奏合理。\",\n \"推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、强制),无入侵迹象。\",\n \"推理步骤5: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约23分钟、晚餐约34分钟),无火灾或水灾风险。\",\n \"推理步骤6: 温度趋势整体正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:00-12:30),傍晚回落,符合夏季自然温度曲线。06:00 各房间温度同步跳升约 1°C 可能是空调定时关闭或自然升温的正常波动。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:59、07:22、18:29、19:03 四次报告 MeasuredValue = None,均与灶具开关时间高度关联\",\n \"kitchen_window_contact 在 07:21:30 报告 StateValue = False(开窗),全天日志中未见关闭记录,家人外出期间厨房窗户持续敞开\",\n \"所有门锁操作均为正常手动开锁和自动上锁,无异常入侵痕迹\",\n \"烟雾报警器、漏水传感器全天无任何告警事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换耐高温型号或调整安装位置\",\n \"设置自动化规则:出门锁门后若厨房窗户仍处于打开状态,发送提醒通知\",\n \"考虑为厨房窗户加装限位器,做饭通风时可半开但不至于完全敞开,兼顾通风与安防\",\n \"对温度传感器报告 None 值的情况设置告警规则,连续两次 None 即推送设备故障通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:59、07:22、18:29、19:03 四次报告 MeasuredValue = None,均发生在灶具使用前后。传感器在高温环境下反复丢失读数,说明设备可能存在耐热性不足或连接不稳定的故障。", "推理步骤2: 厨房窗户传感器在 07:21:30 报告 StateValue = False(窗户打开),之后整天日志中未出现 StateValue = True 的关闭记录。晚间 19:02:30 再次报告 StateValue = False(再次打开或仍处于打开状态)。家人 07:30 出门后厨房窗户一直处于开启状态,存在安防隐患。", "推理步骤3: 其余设备行为均符合正常家庭作息——凌晨无人活动,06:11 起床、07:30 出门上班/上学、16:29 孩子放学回家、18:07 大人下班回家、22:14 就寝锁门,生活节奏合理。", "推理步骤4: 入户门锁操作均为 Manual 开锁 + Auto 自动上锁,未出现异常开锁方式(如远程、强制),无入侵迹象。", "推理步骤5: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约23分钟、晚餐约34分钟),无火灾或水灾风险。", "推理步骤6: 温度趋势整体正常——夜间约 22.9-23.1°C,白天随气温升至峰值约 25.9°C(12:00-12:30),傍晚回落,符合夏季自然温度曲线。06:00 各房间温度同步跳升约 1°C 可能是空调定时关闭或自然升温的正常波动。"], "key_evidence": ["kitchen_temp_sensor 在 06:59、07:22、18:29、19:03 四次报告 MeasuredValue = None,均与灶具开关时间高度关联", "kitchen_window_contact 在 07:21:30 报告 StateValue = False(开窗),全天日志中未见关闭记录,家人外出期间厨房窗户持续敞开", "所有门锁操作均为正常手动开锁和自动上锁,无异常入侵痕迹", "烟雾报警器、漏水传感器全天无任何告警事件"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换耐高温型号或调整安装位置", "设置自动化规则:出门锁门后若厨房窗户仍处于打开状态,发送提醒通知", "考虑为厨房窗户加装限位器,做饭通风时可半开但不至于完全敞开,兼顾通风与安防", "对温度传感器报告 None 值的情况设置告警规则,连续两次 None 即推送设备故障通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.611577033996582, "api_error": null} {"episode_id": "SQ4_TP_C_0821", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0821.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261450, "scenario_id": "CH-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T04:17:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且凌晨 4:18 灶具在无人操作厨房的情况下被开启并持续近 3 小时,存在设备故障与潜在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、07:30、18:35、19:11 四次报告 MeasuredValue = None,说明传感器间歇性失联或故障。这意味着在灶具使用期间,厨房温度无法被可靠监测,削弱了火灾预警能力。\",\n \"推理步骤2: 凌晨 04:17 儿童房检测到短暂运动(1分钟),04:18:15 客厅检测到运动,04:18:30 厨房灶具被开启。但此后灶具一直保持开启状态直到 07:29 才关闭,持续约 3 小时 11 分钟。凌晨时段长时间无人看管灶具运行是显著的火灾隐患。\",\n \"推理步骤3: 对比两次灶具使用——凌晨那次开启后无厨房灯亮起、无餐厅活动,直到 06:45 才有人正式进入厨房开灯并再次操作灶具,说明凌晨 04:18 的灶具开启很可能是误触、儿童操作或自动化规则误触发,而非正常烹饪。\",\n \"推理步骤4: 16:19 入户门开锁后未见关门/锁门记录(BooleanState 未恢复 True、LockState 未恢复 1),直到 22:20 才确认门关闭并自动上锁。这段约 6 小时的时间内入户门处于未锁/未关状态,存在入侵风险。不过考虑到家中有人活动,这可能是住户有意为之(等待其他家庭成员回来),风险等级中等。\",\n \"推理步骤5: 厨房窗户在 07:29:30 被打开后,日志中未见关闭记录(无 StateValue = True),同样 19:10:30 再次打开后也未见关闭。长时间窗户敞开在无人时段可能带来安全隐患,但结合做饭通风的场景属于合理行为。\",\n \"推理步骤6: 其余设备行为模式正常——早晨起床、出门上班/上学、下午回家、晚间做饭就餐、睡前关灯锁门,符合三口之家(两大人一小孩)的典型作息。温度曲线呈现正常的日间升温夜间降温趋势。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None(06:46、07:30、18:35、19:11),传感器工作不稳定\",\n \"凌晨 04:18:30 灶具被开启,持续运行至 07:29 共约 3 小时,期间无厨房灯光和明确的人员活动\",\n \"04:17 儿童房短暂检测到运动后客厅出现运动,随即灶具开启——疑似儿童误操作或自动化误触发\",\n \"入户门从 16:19 开锁后至 22:20 才重新关闭上锁,约 6 小时未锁门\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器,确保灶具使用期间温度监测可靠运行\",\n \"排查凌晨 04:18 灶具开启的原因:检查是否存在自动化规则误触发,或为灶具增加儿童锁/夜间禁用策略\",\n \"为灶具设置无人看管超时自动关闭机制(如开启超过 30 分钟且厨房无运动则告警或自动关闭)\",\n \"考虑为入户门设置未锁超时提醒(如超过 10 分钟未关门则推送通知)\",\n \"检查厨房窗户传感器日志,确认窗户是否在夜间已关闭,必要时增加离家/睡眠模式下的窗户状态检查\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且凌晨 4:18 灶具在无人操作厨房的情况下被开启并持续近 3 小时,存在设备故障与潜在火灾风险。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、07:30、18:35、19:11 四次报告 MeasuredValue = None,说明传感器间歇性失联或故障。这意味着在灶具使用期间,厨房温度无法被可靠监测,削弱了火灾预警能力。", "推理步骤2: 凌晨 04:17 儿童房检测到短暂运动(1分钟),04:18:15 客厅检测到运动,04:18:30 厨房灶具被开启。但此后灶具一直保持开启状态直到 07:29 才关闭,持续约 3 小时 11 分钟。凌晨时段长时间无人看管灶具运行是显著的火灾隐患。", "推理步骤3: 对比两次灶具使用——凌晨那次开启后无厨房灯亮起、无餐厅活动,直到 06:45 才有人正式进入厨房开灯并再次操作灶具,说明凌晨 04:18 的灶具开启很可能是误触、儿童操作或自动化规则误触发,而非正常烹饪。", "推理步骤4: 16:19 入户门开锁后未见关门/锁门记录(BooleanState 未恢复 True、LockState 未恢复 1),直到 22:20 才确认门关闭并自动上锁。这段约 6 小时的时间内入户门处于未锁/未关状态,存在入侵风险。不过考虑到家中有人活动,这可能是住户有意为之(等待其他家庭成员回来),风险等级中等。", "推理步骤5: 厨房窗户在 07:29:30 被打开后,日志中未见关闭记录(无 StateValue = True),同样 19:10:30 再次打开后也未见关闭。长时间窗户敞开在无人时段可能带来安全隐患,但结合做饭通风的场景属于合理行为。", "推理步骤6: 其余设备行为模式正常——早晨起床、出门上班/上学、下午回家、晚间做饭就餐、睡前关灯锁门,符合三口之家(两大人一小孩)的典型作息。温度曲线呈现正常的日间升温夜间降温趋势。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["厨房温度传感器 4 次报告 None(06:46、07:30、18:35、19:11),传感器工作不稳定", "凌晨 04:18:30 灶具被开启,持续运行至 07:29 共约 3 小时,期间无厨房灯光和明确的人员活动", "04:17 儿童房短暂检测到运动后客厅出现运动,随即灶具开启——疑似儿童误操作或自动化误触发", "入户门从 16:19 开锁后至 22:20 才重新关闭上锁,约 6 小时未锁门"], "recommended_actions": ["立即检修或更换厨房温度传感器,确保灶具使用期间温度监测可靠运行", "排查凌晨 04:18 灶具开启的原因:检查是否存在自动化规则误触发,或为灶具增加儿童锁/夜间禁用策略", "为灶具设置无人看管超时自动关闭机制(如开启超过 30 分钟且厨房无运动则告警或自动关闭)", "考虑为入户门设置未锁超时提醒(如超过 10 分钟未关门则推送通知)", "检查厨房窗户传感器日志,确认窗户是否在夜间已关闭,必要时增加离家/睡眠模式下的窗户状态检查"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.62762475013733, "api_error": null} {"episode_id": "SQ4_TP_C_0823", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0823.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261452, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T07:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"客厅温度传感器疑似被劫持或固件故障,持续发送格式异常的固定值报告;厨房温度传感器间歇性报告 None 值。\",\n \"reasoning\": [\n \"推理步骤1: 客厅温度传感器(living_room_temp_sensor)在正常的 TemperatureMeasurement.MeasuredValue 上报之外,额外出现了缺少 Cluster 前缀的异常格式报告 'MeasuredValue = 2350'(08:00、12:00、18:00、22:00),且这些值与同时刻正常上报值存在明显偏差(如 08:00 正常值 2463 vs 异常值 2350,12:00 正常值 2587 vs 异常值 2510)。\",\n \"推理步骤2: 更关键的是,从 6月17日起,该传感器仅剩异常格式的报告(MeasuredValue = 2350),且值完全固定不变(6月17日 08:00/12:00/18:00/22:00 和 6月18日 08:00/12:00 全部为 2350),不再有正常的 TemperatureMeasurement.MeasuredValue 上报。真实温度不可能在跨越两天、不同时段保持完全一致,这强烈暗示传感器固件故障、通信模块异常,或被恶意篡改为发送固定伪造数据。\",\n \"推理步骤3: 厨房温度传感器在灶具使用后多次报告 MeasuredValue = None(07:00:08、07:08:00、18:19:00、19:08:00),虽然可能与灶具高温导致传感器短暂超量程有关,但 None 值意味着系统在这些时段失去了厨房温度监控能力,存在火灾风险盲区。\",\n \"推理步骤4: 厨房窗户传感器在 07:07:30 和 19:07:30 报告 StateValue=False(窗户打开),但日志中没有对应的关闭事件(StateValue=True),意味着厨房窗户可能一直处于打开状态,或关闭事件丢失。这本身不是高风险,但结合传感器异常,说明系统数据完整性存在问题。\",\n \"推理步骤5: 其余家庭活动模式正常——早晨 6 点起床、7:25 出门上锁、16:29 孩子放学回家、18:12 大人回家做饭、20:49 孩子就寝、22:21 大人就寝并锁门,门锁操作均为 Manual/Auto 且开关配对完整,不存在入侵迹象。\"\n ],\n \"key_evidence\": [\n \"living_room_temp_sensor 从 6月16日 08:00 起出现格式异常的 'MeasuredValue'(无 Cluster 前缀)报告,数值与正常通道偏差显著\",\n \"6月17日至6月18日,living_room_temp_sensor 仅有异常格式报告且值固定为 2350,持续超过 24 小时未变化,正常上报通道完全消失\",\n \"kitchen_temp_sensor 在灶具使用期间 4 次报告 MeasuredValue = None,丧失温度监控能力\",\n \"kitchen_window_contact 两次报告打开(StateValue=False)但无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"立即检查客厅温度传感器:检查固件版本、通信日志和设备证书,排除是否被恶意篡改或存在固件 bug,必要时重置或更换设备\",\n \"检查客厅温度传感器的 Matter 通信链路,确认异常格式报告(缺少 Cluster 前缀)的来源,排查是否有未授权设备伪装上报\",\n \"检修厨房温度传感器,确认其耐高温规格是否满足灶具使用场景,考虑调整安装位置或更换耐高温型号\",\n \"核实厨房窗户传感器状态,确认窗户实际开关情况,检查传感器电池和信号质量\",\n \"在传感器修复前,增加人工巡检频率,特别关注客厅和厨房区域的温度异常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "客厅温度传感器疑似被劫持或固件故障,持续发送格式异常的固定值报告;厨房温度传感器间歇性报告 None 值。", "reasoning": ["推理步骤1: 客厅温度传感器(living_room_temp_sensor)在正常的 TemperatureMeasurement.MeasuredValue 上报之外,额外出现了缺少 Cluster 前缀的异常格式报告 'MeasuredValue = 2350'(08:00、12:00、18:00、22:00),且这些值与同时刻正常上报值存在明显偏差(如 08:00 正常值 2463 vs 异常值 2350,12:00 正常值 2587 vs 异常值 2510)。", "推理步骤2: 更关键的是,从 6月17日起,该传感器仅剩异常格式的报告(MeasuredValue = 2350),且值完全固定不变(6月17日 08:00/12:00/18:00/22:00 和 6月18日 08:00/12:00 全部为 2350),不再有正常的 TemperatureMeasurement.MeasuredValue 上报。真实温度不可能在跨越两天、不同时段保持完全一致,这强烈暗示传感器固件故障、通信模块异常,或被恶意篡改为发送固定伪造数据。", "推理步骤3: 厨房温度传感器在灶具使用后多次报告 MeasuredValue = None(07:00:08、07:08:00、18:19:00、19:08:00),虽然可能与灶具高温导致传感器短暂超量程有关,但 None 值意味着系统在这些时段失去了厨房温度监控能力,存在火灾风险盲区。", "推理步骤4: 厨房窗户传感器在 07:07:30 和 19:07:30 报告 StateValue=False(窗户打开),但日志中没有对应的关闭事件(StateValue=True),意味着厨房窗户可能一直处于打开状态,或关闭事件丢失。这本身不是高风险,但结合传感器异常,说明系统数据完整性存在问题。", "推理步骤5: 其余家庭活动模式正常——早晨 6 点起床、7:25 出门上锁、16:29 孩子放学回家、18:12 大人回家做饭、20:49 孩子就寝、22:21 大人就寝并锁门,门锁操作均为 Manual/Auto 且开关配对完整,不存在入侵迹象。"], "key_evidence": ["living_room_temp_sensor 从 6月16日 08:00 起出现格式异常的 'MeasuredValue'(无 Cluster 前缀)报告,数值与正常通道偏差显著", "6月17日至6月18日,living_room_temp_sensor 仅有异常格式报告且值固定为 2350,持续超过 24 小时未变化,正常上报通道完全消失", "kitchen_temp_sensor 在灶具使用期间 4 次报告 MeasuredValue = None,丧失温度监控能力", "kitchen_window_contact 两次报告打开(StateValue=False)但无对应关闭记录"], "recommended_actions": ["立即检查客厅温度传感器:检查固件版本、通信日志和设备证书,排除是否被恶意篡改或存在固件 bug,必要时重置或更换设备", "检查客厅温度传感器的 Matter 通信链路,确认异常格式报告(缺少 Cluster 前缀)的来源,排查是否有未授权设备伪装上报", "检修厨房温度传感器,确认其耐高温规格是否满足灶具使用场景,考虑调整安装位置或更换耐高温型号", "核实厨房窗户传感器状态,确认窗户实际开关情况,检查传感器电池和信号质量", "在传感器修复前,增加人工巡检频率,特别关注客厅和厨房区域的温度异常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.1734402179718, "api_error": null} {"episode_id": "SQ4_TP_C_0824", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0824.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261453, "scenario_id": "DF-04", "total_events": 197, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-14T18:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"入户门锁在短时间内连续两次上锁失败并触发锁具告警,可能存在门锁故障或物理干扰。\",\n \"reasoning\": [\n \"推理步骤1: 18:53:00 发出 LockDoor 指令,5秒后 LockState=2(未完全上锁/Unlocked),表明上锁操作未成功。\",\n \"推理步骤2: 18:53:10 再次发出 LockDoor 指令,5秒后 LockState 仍为2,且同时触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 在 Matter DoorLock Cluster 中对应 LockJammed(锁舌卡住),说明门锁机械结构可能被卡住或受阻。\",\n \"推理步骤3: 两次连续上锁尝试均失败,间隔仅10秒,属于短时间内重复失败模式,排除偶发通信延迟的可能性,更倾向于机械故障或门框/锁舌对位问题。\",\n \"推理步骤4: 日志中没有入户门接触传感器(front_door_contact)的开关记录,也没有玄关运动传感器的触发记录,说明没有明显的入侵迹象,更可能是设备自身故障而非外部撬锁。\",\n \"推理步骤5: 温度数据方面,全天各房间温度在22.9°C至25.9°C之间随日照自然升降,各传感器读数一致且无突变,属于夏季正常温度曲线,无火灾或暖通异常迹象。\",\n \"推理步骤6: 除门锁事件外,无烟雾报警、漏水报警、异常运动检测等其他告警事件,整体家庭环境安全。\"\n ],\n \"key_evidence\": [\n \"18:53:05 和 18:53:15 两次 LockState=2(未上锁),表明连续两次上锁指令均未成功执行\",\n \"18:53:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 告警,指示锁舌卡住\",\n \"两次上锁尝试间隔仅10秒,属于异常重复失败模式\",\n \"无入户门开合传感器或玄关运动传感器触发记录,排除入侵可能性\"\n ],\n \"recommended_actions\": [\n \"立即检查入户门锁的锁舌和门框对位情况,清除可能的异物或机械卡阻\",\n \"手动测试门锁的上锁/开锁功能,确认是否能正常闭合\",\n \"若机械检查无异常,考虑门锁电机或传感器模块老化,联系厂商维修或更换\",\n \"在门锁修复前,确保通过其他方式(如手动反锁、安全链)保障入户门安全\",\n \"检查门锁固件版本,如有可用更新则进行升级\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "入户门锁在短时间内连续两次上锁失败并触发锁具告警,可能存在门锁故障或物理干扰。", "reasoning": ["推理步骤1: 18:53:00 发出 LockDoor 指令,5秒后 LockState=2(未完全上锁/Unlocked),表明上锁操作未成功。", "推理步骤2: 18:53:10 再次发出 LockDoor 指令,5秒后 LockState 仍为2,且同时触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 在 Matter DoorLock Cluster 中对应 LockJammed(锁舌卡住),说明门锁机械结构可能被卡住或受阻。", "推理步骤3: 两次连续上锁尝试均失败,间隔仅10秒,属于短时间内重复失败模式,排除偶发通信延迟的可能性,更倾向于机械故障或门框/锁舌对位问题。", "推理步骤4: 日志中没有入户门接触传感器(front_door_contact)的开关记录,也没有玄关运动传感器的触发记录,说明没有明显的入侵迹象,更可能是设备自身故障而非外部撬锁。", "推理步骤5: 温度数据方面,全天各房间温度在22.9°C至25.9°C之间随日照自然升降,各传感器读数一致且无突变,属于夏季正常温度曲线,无火灾或暖通异常迹象。", "推理步骤6: 除门锁事件外,无烟雾报警、漏水报警、异常运动检测等其他告警事件,整体家庭环境安全。"], "key_evidence": ["18:53:05 和 18:53:15 两次 LockState=2(未上锁),表明连续两次上锁指令均未成功执行", "18:53:15 触发 DoorLockAlarm(AlarmCode=0),即 LockJammed 告警,指示锁舌卡住", "两次上锁尝试间隔仅10秒,属于异常重复失败模式", "无入户门开合传感器或玄关运动传感器触发记录,排除入侵可能性"], "recommended_actions": ["立即检查入户门锁的锁舌和门框对位情况,清除可能的异物或机械卡阻", "手动测试门锁的上锁/开锁功能,确认是否能正常闭合", "若机械检查无异常,考虑门锁电机或传感器模块老化,联系厂商维修或更换", "在门锁修复前,确保通过其他方式(如手动反锁、安全链)保障入户门安全", "检查门锁固件版本,如有可用更新则进行升级"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.66157841682434, "api_error": null} {"episode_id": "SQ4_TP_C_0828", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0828.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261457, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-09T06:39:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"主卧温度传感器在06:39出现异常高温读数(35.97°C→32.00°C),随后客厅烟雾报警器于06:49触发,存在火灾风险或严重设备故障。\",\n \"reasoning\": [\n \"推理步骤1: 06:00前所有房间温度稳定在22.9~24.1°C范围内,属于正常夜间室温。06:00整体温度跳升至约24°C,符合夏季清晨自然升温。\",\n \"推理步骤2: 06:39主卧温度传感器突然报告3597(即35.97°C),较前一次读数(06:30的23.90°C)在9分钟内飙升约12°C,这在正常居住环境中不可能发生。06:44再次报告3200(32.00°C),虽有所下降但仍远超正常值。\",\n \"推理步骤3: 06:49客厅烟雾报警器触发(SmokeState=1),这与主卧异常高温事件在时间上高度关联(间隔仅10分钟),提示可能存在烟雾或热源扩散。\",\n \"推理步骤4: 07:00主卧温度恢复至24.32°C,烟雾报警器之后未见持续报警记录,说明事件可能已被处置或为短暂性热源(如电器短路、局部起火后扑灭)。但日志中未见明确的报警解除事件。\",\n \"推理步骤5: 厨房温度传感器在07:00和07:01连续两次报告None值,18:19和19:06也出现None值,提示该传感器存在间歇性故障,但这与主卧高温事件无直接关联。\",\n \"推理步骤6: 厨房灶具在06:59关闭、07:00:39重新开启,结合06:49烟雾报警触发的时间线,存在烹饪引发烟雾的可能性,但无法解释主卧温度飙升至35.97°C的现象。\",\n \"推理步骤7: 入户门在07:29正常开锁-关门-自动上锁,16:28和18:06的进出模式也正常(开锁→开门→运动检测→关门→上锁),未发现入侵迹象。\",\n \"推理步骤8: 其余设备行为均符合三口之家的日常作息模式:早起、做饭、出门、放学回家、晚餐、睡觉,无异常。\"\n ],\n \"key_evidence\": [\n \"06:39 master_bedroom_temp_sensor 读数3597(35.97°C),9分钟内从23.90°C飙升12°C\",\n \"06:44 master_bedroom_temp_sensor 读数3200(32.00°C),仍远超正常室温\",\n \"06:49 living_room_smoke_alarm SmokeState=1 烟雾报警触发\",\n \"07:00 主卧温度恢复正常(24.32°C),但日志中未见烟雾报警解除记录\",\n \"厨房温度传感器多次报告None值(07:00、07:01、18:19、19:06),存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即检查主卧是否存在过热源(电器故障、电线短路、取暖设备异常等),排除火灾隐患\",\n \"检查客厅烟雾报警器当前状态,确认报警是否已解除;如仍在报警状态需立即排查烟雾来源\",\n \"检查主卧温度传感器是否存在硬件故障(异常高温读数也可能是传感器本身故障导致的误报,但与烟雾报警的时间关联性使其不能被忽视)\",\n \"维修或更换厨房温度传感器,其间歇性返回None值表明设备工作不稳定\",\n \"建议在主卧增设烟雾报警器,当前主卧无独立烟雾检测设备,仅靠客厅报警器覆盖不足\",\n \"检查厨房烹饪时的通风情况,确保油烟不会扩散触发其他区域的烟雾报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "主卧温度传感器在06:39出现异常高温读数(35.97°C→32.00°C),随后客厅烟雾报警器于06:49触发,存在火灾风险或严重设备故障。", "reasoning": ["推理步骤1: 06:00前所有房间温度稳定在22.9~24.1°C范围内,属于正常夜间室温。06:00整体温度跳升至约24°C,符合夏季清晨自然升温。", "推理步骤2: 06:39主卧温度传感器突然报告3597(即35.97°C),较前一次读数(06:30的23.90°C)在9分钟内飙升约12°C,这在正常居住环境中不可能发生。06:44再次报告3200(32.00°C),虽有所下降但仍远超正常值。", "推理步骤3: 06:49客厅烟雾报警器触发(SmokeState=1),这与主卧异常高温事件在时间上高度关联(间隔仅10分钟),提示可能存在烟雾或热源扩散。", "推理步骤4: 07:00主卧温度恢复至24.32°C,烟雾报警器之后未见持续报警记录,说明事件可能已被处置或为短暂性热源(如电器短路、局部起火后扑灭)。但日志中未见明确的报警解除事件。", "推理步骤5: 厨房温度传感器在07:00和07:01连续两次报告None值,18:19和19:06也出现None值,提示该传感器存在间歇性故障,但这与主卧高温事件无直接关联。", "推理步骤6: 厨房灶具在06:59关闭、07:00:39重新开启,结合06:49烟雾报警触发的时间线,存在烹饪引发烟雾的可能性,但无法解释主卧温度飙升至35.97°C的现象。", "推理步骤7: 入户门在07:29正常开锁-关门-自动上锁,16:28和18:06的进出模式也正常(开锁→开门→运动检测→关门→上锁),未发现入侵迹象。", "推理步骤8: 其余设备行为均符合三口之家的日常作息模式:早起、做饭、出门、放学回家、晚餐、睡觉,无异常。"], "key_evidence": ["06:39 master_bedroom_temp_sensor 读数3597(35.97°C),9分钟内从23.90°C飙升12°C", "06:44 master_bedroom_temp_sensor 读数3200(32.00°C),仍远超正常室温", "06:49 living_room_smoke_alarm SmokeState=1 烟雾报警触发", "07:00 主卧温度恢复正常(24.32°C),但日志中未见烟雾报警解除记录", "厨房温度传感器多次报告None值(07:00、07:01、18:19、19:06),存在设备故障"], "recommended_actions": ["立即检查主卧是否存在过热源(电器故障、电线短路、取暖设备异常等),排除火灾隐患", "检查客厅烟雾报警器当前状态,确认报警是否已解除;如仍在报警状态需立即排查烟雾来源", "检查主卧温度传感器是否存在硬件故障(异常高温读数也可能是传感器本身故障导致的误报,但与烟雾报警的时间关联性使其不能被忽视)", "维修或更换厨房温度传感器,其间歇性返回None值表明设备工作不稳定", "建议在主卧增设烟雾报警器,当前主卧无独立烟雾检测设备,仅靠客厅报警器覆盖不足", "检查厨房烹饪时的通风情况,确保油烟不会扩散触发其他区域的烟雾报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.3096981048584, "api_error": null} {"episode_id": "SQ4_TP_C_0830", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0830.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261459, "scenario_id": "DF-06", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-23T02:58:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;凌晨 2:58 客厅窗帘在无人活动时被操作,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:39、07:19、18:32、19:14 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久,说明传感器可能受高温或油烟影响出现间歇性故障。虽然 07:30 和 19:30 的读数恢复正常,但反复出现 None 值表明传感器工作不稳定。\",\n \"推理步骤2: 凌晨 02:58 客厅窗帘(living_room_window_1)收到 DownOrClose 指令并开始运动(OperationalStatus = 0b000010,位置移动到 50%),但此时全屋无任何运动传感器触发、无灯光操作、无门锁活动,所有住户应处于深睡状态。这可能是定时自动化规则触发,也可能是远程误操作或未授权访问。\",\n \"推理步骤3: 入户门在 07:17 手动开锁后 3 秒内关门并自动上锁,16:30 开锁进入后未见关门/上锁记录直到 22:26 才确认门关闭并自动上锁——中间约 6 小时入户门可能处于未关闭状态。18:07 又有一次开锁进入,同样未见即时关门记录。虽然这可能是家庭成员进出的正常行为,但长时间门未关闭存在安全隐患。\",\n \"推理步骤4: 其余行为模式正常——06:01 主卧起床、06:11 儿童房起床、06:38 厨房做早餐、07:17 出门、16:30 孩子放学回家、18:07 大人下班回家、18:31 做晚餐、19:13 餐厅用餐、21:15 孩子睡觉、22:26 大人睡觉,符合典型三口之家的作息规律。\",\n \"推理步骤5: 温度趋势正常,夜间约 23°C,白天升至约 25-26°C,中午峰值约 25.8°C,傍晚逐步回落。18:07 开启客厅空调(制冷模式 SystemMode=3)后温度从 24.5°C 降至 22:00 的 23.6°C,表现合理。无烟雾报警、无漏水报警触发。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:39、07:19、18:32、19:14 四次报告 MeasuredValue = None,均与灶具操作时间相关\",\n \"02:58 客厅窗帘在全屋无人活动状态下收到 DownOrClose 指令并执行运动\",\n \"16:30 入户门开锁后至 22:26 期间未见 front_door_contact StateValue=True(关门)记录,门可能长时间未关闭\",\n \"07:17 厨房窗户和 19:13 厨房窗户被打开(StateValue=False),但日志中未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换或重新定位传感器\",\n \"排查凌晨 02:58 客厅窗帘操作的来源:检查是否存在定时自动化规则,若无则审查智能家居平台的远程访问日志,排除未授权控制的可能\",\n \"建议为入户门设置未关闭超时提醒(如开门超过 5 分钟未关闭则推送告警),避免长时间门户敞开\",\n \"确认厨房窗户当前是否已关闭,日志中两次打开均无对应关闭记录,夜间应确保窗户关好\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;凌晨 2:58 客厅窗帘在无人活动时被操作,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:39、07:19、18:32、19:14 共四次报告 MeasuredValue = None。每次都发生在灶具开启或关闭后不久,说明传感器可能受高温或油烟影响出现间歇性故障。虽然 07:30 和 19:30 的读数恢复正常,但反复出现 None 值表明传感器工作不稳定。", "推理步骤2: 凌晨 02:58 客厅窗帘(living_room_window_1)收到 DownOrClose 指令并开始运动(OperationalStatus = 0b000010,位置移动到 50%),但此时全屋无任何运动传感器触发、无灯光操作、无门锁活动,所有住户应处于深睡状态。这可能是定时自动化规则触发,也可能是远程误操作或未授权访问。", "推理步骤3: 入户门在 07:17 手动开锁后 3 秒内关门并自动上锁,16:30 开锁进入后未见关门/上锁记录直到 22:26 才确认门关闭并自动上锁——中间约 6 小时入户门可能处于未关闭状态。18:07 又有一次开锁进入,同样未见即时关门记录。虽然这可能是家庭成员进出的正常行为,但长时间门未关闭存在安全隐患。", "推理步骤4: 其余行为模式正常——06:01 主卧起床、06:11 儿童房起床、06:38 厨房做早餐、07:17 出门、16:30 孩子放学回家、18:07 大人下班回家、18:31 做晚餐、19:13 餐厅用餐、21:15 孩子睡觉、22:26 大人睡觉,符合典型三口之家的作息规律。", "推理步骤5: 温度趋势正常,夜间约 23°C,白天升至约 25-26°C,中午峰值约 25.8°C,傍晚逐步回落。18:07 开启客厅空调(制冷模式 SystemMode=3)后温度从 24.5°C 降至 22:00 的 23.6°C,表现合理。无烟雾报警、无漏水报警触发。"], "key_evidence": ["kitchen_temp_sensor 在 06:39、07:19、18:32、19:14 四次报告 MeasuredValue = None,均与灶具操作时间相关", "02:58 客厅窗帘在全屋无人活动状态下收到 DownOrClose 指令并执行运动", "16:30 入户门开锁后至 22:26 期间未见 front_door_contact StateValue=True(关门)记录,门可能长时间未关闭", "07:17 厨房窗户和 19:13 厨房窗户被打开(StateValue=False),但日志中未见关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时更换或重新定位传感器", "排查凌晨 02:58 客厅窗帘操作的来源:检查是否存在定时自动化规则,若无则审查智能家居平台的远程访问日志,排除未授权控制的可能", "建议为入户门设置未关闭超时提醒(如开门超过 5 分钟未关闭则推送告警),避免长时间门户敞开", "确认厨房窗户当前是否已关闭,日志中两次打开均无对应关闭记录,夜间应确保窗户关好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.556127309799194, "api_error": null} {"episode_id": "SQ4_TP_C_0831", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0831.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261460, "scenario_id": "BA-05", "total_events": 257, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "BA-05", "scenario_name": "假期/出差模式中出现活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "intrusion_during_vacation", "key_evidence": ["住户已知不在家(连续多天无活动模式)", "突然出现活动信号", "无门锁操作记录——不是通过正门合法进入", "极高可能性是入侵"], "expected_response": "紧急入侵警报", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-30T12:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时入户门在15:59开锁进入后未及时关门上锁,存在安全疏忽。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:53、07:00、18:13、19:17 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明灶具工作产生的高温可能导致传感器读数异常或传感器本身存在故障。\",\n \"推理步骤2: 07:00 时刻出现了两条厨房温度记录——先是 None,随后是 2420。这种同一时刻先 None 后恢复的行为进一步表明传感器在灶具工作期间不稳定,可能是间歇性故障。\",\n \"推理步骤3: 15:59 入户门通过手动方式解锁(LockOperationType=1),门打开(StateValue=False),有人进入(entrance_occupancy=1,随后 kids_room_occupancy=1),但日志中直到 22:48:34 才出现门关闭(StateValue=True)和自动上锁。这意味着入户门在近7小时内处于未锁定状态,期间家中有人但门未关好,存在入侵风险。\",\n \"推理步骤4: 整体温度趋势正常——凌晨约23°C,午间升至约25.8°C,晚间回落至约23.3°C,符合夏季自然温度变化规律,无火灾或异常热源迹象。\",\n \"推理步骤5: 其余设备行为均符合正常家庭作息:早晨6点起床、7:29出门上锁、15:59孩子放学回家、18:20大人回家做饭、20:50孩子就寝、22:48全家入睡锁门。烟雾报警器和漏水传感器全天无告警,洗碗机正常运行。\",\n \"推理步骤6: 厨房窗户在 06:59:30 和 19:16:30 两次打开(StateValue=False),均在灶具关闭后,属于做饭后通风的正常行为,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:53、07:00、18:13、19:17 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"15:59 入户门解锁开门后,直到 22:48 才出现关门上锁记录,中间约7小时门可能未锁\",\n \"厨房窗户两次打开(06:59:30、19:16:30)但日志中无对应关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换\",\n \"设置入户门未锁定超时提醒(如开门超过5分钟未上锁则推送告警),避免长时间门户大开\",\n \"确认厨房窗户当前状态,如仍处于打开状态且夜间无人看管,建议关闭以防安全隐患\",\n \"考虑为灶具区域增加独立的耐高温温度传感器,与现有传感器形成冗余监测\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;同时入户门在15:59开锁进入后未及时关门上锁,存在安全疏忽。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:53、07:00、18:13、19:17 四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明灶具工作产生的高温可能导致传感器读数异常或传感器本身存在故障。", "推理步骤2: 07:00 时刻出现了两条厨房温度记录——先是 None,随后是 2420。这种同一时刻先 None 后恢复的行为进一步表明传感器在灶具工作期间不稳定,可能是间歇性故障。", "推理步骤3: 15:59 入户门通过手动方式解锁(LockOperationType=1),门打开(StateValue=False),有人进入(entrance_occupancy=1,随后 kids_room_occupancy=1),但日志中直到 22:48:34 才出现门关闭(StateValue=True)和自动上锁。这意味着入户门在近7小时内处于未锁定状态,期间家中有人但门未关好,存在入侵风险。", "推理步骤4: 整体温度趋势正常——凌晨约23°C,午间升至约25.8°C,晚间回落至约23.3°C,符合夏季自然温度变化规律,无火灾或异常热源迹象。", "推理步骤5: 其余设备行为均符合正常家庭作息:早晨6点起床、7:29出门上锁、15:59孩子放学回家、18:20大人回家做饭、20:50孩子就寝、22:48全家入睡锁门。烟雾报警器和漏水传感器全天无告警,洗碗机正常运行。", "推理步骤6: 厨房窗户在 06:59:30 和 19:16:30 两次打开(StateValue=False),均在灶具关闭后,属于做饭后通风的正常行为,但日志中未见关闭记录,需确认窗户是否仍处于打开状态。"], "key_evidence": ["厨房温度传感器在 06:53、07:00、18:13、19:17 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "15:59 入户门解锁开门后,直到 22:48 才出现关门上锁记录,中间约7小时门可能未锁", "厨房窗户两次打开(06:59:30、19:16:30)但日志中无对应关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰;如传感器本身故障,建议更换", "设置入户门未锁定超时提醒(如开门超过5分钟未上锁则推送告警),避免长时间门户大开", "确认厨房窗户当前状态,如仍处于打开状态且夜间无人看管,建议关闭以防安全隐患", "考虑为灶具区域增加独立的耐高温温度传感器,与现有传感器形成冗余监测"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.624174118041992, "api_error": null} {"episode_id": "SQ4_TP_C_0833", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0833.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261462, "scenario_id": "DF-01", "total_events": 266, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kids_room", "injection_time": "2026-06-01T01:37:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"儿童房温度传感器存在双重上报异常(疑似固件故障或被篡改),厨房温度传感器多次报告 null 值,厨房窗户在做饭后未关闭。\",\n \"reasoning\": [\n \"推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)存在两套并行的温度上报——一套是正常的 TemperatureMeasurement.MeasuredValue(随全屋温度同步波动,如 06:00 约 2409、12:00 约 2573),另一套是缺少 Cluster 前缀的 MeasuredValue(08:00=2350, 12:00=2510, 18:00=2400, 22:00=2280),后者的数值与前者明显不一致,且上报格式不符合 Matter 协议标准(缺少 TemperatureMeasurement 前缀)。\",\n \"推理步骤2: 更关键的是,从 6月2日起,正常的 TemperatureMeasurement.MeasuredValue 上报完全消失,只剩下异常格式的 MeasuredValue,且值固定为 2350 不再变化(6月2日 08:00/12:00/18:00/22:00 和 6月3日 08:00/12:00 全部为 2350)。一个真实的温度传感器不可能在跨越两天、不同时段下保持完全相同的读数,这强烈指向传感器故障(卡死/固件异常)。\",\n \"推理步骤3: 厨房温度传感器在 07:06、07:16、18:11、19:01 四次报告 MeasuredValue = None(空值),均发生在灶具使用前后。虽然灶具使用可能导致传感器短暂异常,但正常传感器不应返回 null,这表明传感器可能存在耐高温性能问题或通信故障。\",\n \"推理步骤4: 厨房窗户在 07:15:30 被打开(StateValue=False),之后日志中没有关闭记录。19:00:30 再次出现打开事件,同样没有关闭记录。全家人 22:15 已就寝锁门,厨房窗户仍处于开启状态,存在安全隐患。\",\n \"推理步骤5: 入户门在 15:58 开锁进入后,日志中没有关门/锁门记录,直到 22:15:20 才确认门关闭并自动上锁。17:58 再次开门进入,同样没有立即关门记录。虽然最终在 22:15 完成了锁门,但长时间未锁门存在入侵风险。不过考虑到家中有人活动,这可能是住户习惯。\",\n \"推理步骤6: 其余设备行为均属正常——全屋温度随昼夜自然波动(夜间约 22-23°C,午间峰值约 25.8°C);住户作息合理(06:10 起床、07:11 出门、15:58 孩子放学回家、17:58 大人下班回家、22:15 就寝);灶具使用时间合理;门锁操作均为手动开锁+自动上锁,无异常开锁事件。\"\n ],\n \"key_evidence\": [\n \"kids_room_temp_sensor 从 6月1日起出现非标准格式的 MeasuredValue 上报(缺少 TemperatureMeasurement 前缀),与正常上报数值不一致\",\n \"6月2日起 kids_room_temp_sensor 正常上报消失,异常上报值固定为 2350 持续两天不变,传感器明显卡死\",\n \"kitchen_temp_sensor 在 07:06、07:16、18:11、19:01 四次返回 None 空值\",\n \"厨房窗户(kitchen_window_contact)在 07:15 和 19:00 两次打开后均无关闭记录,至日终仍为开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查儿童房温度传感器:重启设备或重新配网,确认固件版本是否需要更新。该传感器已完全失效(读数卡死),无法提供有效的环境监测\",\n \"检查儿童房温度传感器是否被第三方篡改:异常的非标准格式上报可能是固件被修改的迹象,建议核实设备固件完整性\",\n \"检修厨房温度传感器:多次返回 null 值说明传感器在高温环境下工作不稳定,建议更换耐高温型号或调整安装位置远离灶具\",\n \"关闭厨房窗户:当前厨房窗户处于开启状态,夜间无人时应关闭以防止入侵风险和蚊虫进入\",\n \"建议设置自动化规则:在入户门锁定(就寝模式)时自动检查所有窗户传感器状态,如有未关闭窗户则发出提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "儿童房温度传感器存在双重上报异常(疑似固件故障或被篡改),厨房温度传感器多次报告 null 值,厨房窗户在做饭后未关闭。", "reasoning": ["推理步骤1: 儿童房温度传感器(kids_room_temp_sensor)存在两套并行的温度上报——一套是正常的 TemperatureMeasurement.MeasuredValue(随全屋温度同步波动,如 06:00 约 2409、12:00 约 2573),另一套是缺少 Cluster 前缀的 MeasuredValue(08:00=2350, 12:00=2510, 18:00=2400, 22:00=2280),后者的数值与前者明显不一致,且上报格式不符合 Matter 协议标准(缺少 TemperatureMeasurement 前缀)。", "推理步骤2: 更关键的是,从 6月2日起,正常的 TemperatureMeasurement.MeasuredValue 上报完全消失,只剩下异常格式的 MeasuredValue,且值固定为 2350 不再变化(6月2日 08:00/12:00/18:00/22:00 和 6月3日 08:00/12:00 全部为 2350)。一个真实的温度传感器不可能在跨越两天、不同时段下保持完全相同的读数,这强烈指向传感器故障(卡死/固件异常)。", "推理步骤3: 厨房温度传感器在 07:06、07:16、18:11、19:01 四次报告 MeasuredValue = None(空值),均发生在灶具使用前后。虽然灶具使用可能导致传感器短暂异常,但正常传感器不应返回 null,这表明传感器可能存在耐高温性能问题或通信故障。", "推理步骤4: 厨房窗户在 07:15:30 被打开(StateValue=False),之后日志中没有关闭记录。19:00:30 再次出现打开事件,同样没有关闭记录。全家人 22:15 已就寝锁门,厨房窗户仍处于开启状态,存在安全隐患。", "推理步骤5: 入户门在 15:58 开锁进入后,日志中没有关门/锁门记录,直到 22:15:20 才确认门关闭并自动上锁。17:58 再次开门进入,同样没有立即关门记录。虽然最终在 22:15 完成了锁门,但长时间未锁门存在入侵风险。不过考虑到家中有人活动,这可能是住户习惯。", "推理步骤6: 其余设备行为均属正常——全屋温度随昼夜自然波动(夜间约 22-23°C,午间峰值约 25.8°C);住户作息合理(06:10 起床、07:11 出门、15:58 孩子放学回家、17:58 大人下班回家、22:15 就寝);灶具使用时间合理;门锁操作均为手动开锁+自动上锁,无异常开锁事件。"], "key_evidence": ["kids_room_temp_sensor 从 6月1日起出现非标准格式的 MeasuredValue 上报(缺少 TemperatureMeasurement 前缀),与正常上报数值不一致", "6月2日起 kids_room_temp_sensor 正常上报消失,异常上报值固定为 2350 持续两天不变,传感器明显卡死", "kitchen_temp_sensor 在 07:06、07:16、18:11、19:01 四次返回 None 空值", "厨房窗户(kitchen_window_contact)在 07:15 和 19:00 两次打开后均无关闭记录,至日终仍为开启状态"], "recommended_actions": ["立即检查儿童房温度传感器:重启设备或重新配网,确认固件版本是否需要更新。该传感器已完全失效(读数卡死),无法提供有效的环境监测", "检查儿童房温度传感器是否被第三方篡改:异常的非标准格式上报可能是固件被修改的迹象,建议核实设备固件完整性", "检修厨房温度传感器:多次返回 null 值说明传感器在高温环境下工作不稳定,建议更换耐高温型号或调整安装位置远离灶具", "关闭厨房窗户:当前厨房窗户处于开启状态,夜间无人时应关闭以防止入侵风险和蚊虫进入", "建议设置自动化规则:在入户门锁定(就寝模式)时自动检查所有窗户传感器状态,如有未关闭窗户则发出提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.72631812095642, "api_error": null} {"episode_id": "SQ4_TP_C_0836", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0836.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261465, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-12T09:58:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,且厨房烟雾报警器电池低电量,存在设备故障风险,可能导致火灾预警能力下降。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:38、06:53、18:31、19:14 四次报告 MeasuredValue = None,表明传感器在灶具使用期间反复出现读数丢失,这不是正常行为,可能是传感器受热损坏或通信故障。\",\n \"推理步骤2: 2026-06-11T09:58 厨房烟雾报警器报告 BatteryAlert = 1(低电量警告)。烟雾报警器是厨房安全的关键设备,电池不足会降低火灾检测能力。\",\n \"推理步骤3: 10:08 厨房温度传感器突然飙升至 3063(约30.6°C),比同时段其他房间高出约5°C,随后烟雾报警器报告 SmokeState = 0(正常),说明虽然当时未发生火灾,但灶具无人看管时温度异常升高是潜在风险。\",\n \"推理步骤4: 09:58 灶具被远程或自动开启,但日志中无人在家(07:42 全家出门、门锁上锁),直到 16:26 才有人回来。灶具在无人期间运行了约53分钟(09:58-10:08期间温度飙升),这是明显的安全隐患。\",\n \"推理步骤5: 其余行为模式正常——早晨起床、做早餐、出门上班/上学、下午孩子回家、晚间大人回家做饭、睡前关灯锁门,均符合三口之家的日常作息。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间4次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池低电量\",\n \"09:58 灶具开启时家中无人(07:42已出门锁门),10:08 厨房温度飙升至3063(30.6°C)\",\n \"10:08 kitchen_smoke_alarm SmokeState = 0 虽未触发报警,但传感器电池低+温度传感器故障组合降低了安全冗余\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾检测能力正常\",\n \"检查厨房温度传感器,排查多次报告 None 的原因(可能需要更换或重新安装到远离热源的位置)\",\n \"排查灶具在无人时被开启的原因——检查是否存在误触发的自动化规则或定时任务,建议设置离家模式下禁止灶具启动的安全策略\",\n \"考虑为灶具添加无人看管超时自动关闭的安全规则(如运行超过30分钟且无厨房运动检测时自动关闭)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,且厨房烟雾报警器电池低电量,存在设备故障风险,可能导致火灾预警能力下降。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:38、06:53、18:31、19:14 四次报告 MeasuredValue = None,表明传感器在灶具使用期间反复出现读数丢失,这不是正常行为,可能是传感器受热损坏或通信故障。", "推理步骤2: 2026-06-11T09:58 厨房烟雾报警器报告 BatteryAlert = 1(低电量警告)。烟雾报警器是厨房安全的关键设备,电池不足会降低火灾检测能力。", "推理步骤3: 10:08 厨房温度传感器突然飙升至 3063(约30.6°C),比同时段其他房间高出约5°C,随后烟雾报警器报告 SmokeState = 0(正常),说明虽然当时未发生火灾,但灶具无人看管时温度异常升高是潜在风险。", "推理步骤4: 09:58 灶具被远程或自动开启,但日志中无人在家(07:42 全家出门、门锁上锁),直到 16:26 才有人回来。灶具在无人期间运行了约53分钟(09:58-10:08期间温度飙升),这是明显的安全隐患。", "推理步骤5: 其余行为模式正常——早晨起床、做早餐、出门上班/上学、下午孩子回家、晚间大人回家做饭、睡前关灯锁门,均符合三口之家的日常作息。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间4次报告 MeasuredValue = None,传感器工作异常", "kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池低电量", "09:58 灶具开启时家中无人(07:42已出门锁门),10:08 厨房温度飙升至3063(30.6°C)", "10:08 kitchen_smoke_alarm SmokeState = 0 虽未触发报警,但传感器电池低+温度传感器故障组合降低了安全冗余"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾检测能力正常", "检查厨房温度传感器,排查多次报告 None 的原因(可能需要更换或重新安装到远离热源的位置)", "排查灶具在无人时被开启的原因——检查是否存在误触发的自动化规则或定时任务,建议设置离家模式下禁止灶具启动的安全策略", "考虑为灶具添加无人看管超时自动关闭的安全规则(如运行超过30分钟且无厨房运动检测时自动关闭)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.276580095291138, "api_error": null} {"episode_id": "SQ4_TP_C_0837", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0837.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261466, "scenario_id": "CH-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "CH-02", "scenario_name": "儿童进入危险区域操作危险设备", "category": "child_specific", "is_anomaly": true, "threat_type": "child_safety_hazard", "key_evidence": ["活动轨迹:儿童房 → 厨房", "厨房灶具被开启", "无成人在厨房(厨房 occupancy 信号模式+其他房间的 occupancy 信号表明成人不在厨房)", "如果灶具有 OffOnly 限制,理论上不能远程开启——这意味着是物理操作"], "expected_response": "立即通知家长,如可能则远程关闭灶具(OffOnly命令)", "difficulty": "medium", "target_room": "dining_room", "injection_time": "2026-06-16T13:35:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时下午无人在家期间灶具被开启,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:02、07:04、18:14、19:29 四次报告 MeasuredValue = None,表明传感器间歇性失效。该传感器紧邻灶具和烟雾报警器,是厨房火灾预警链的关键一环,故障会削弱安全保障。\",\n \"推理步骤2: 13:36:30 厨房灶具被开启(OnOff = True),但此时家庭处于外出状态(07:42 全家出门、门锁上锁),直到 16:34 才有人回家。在长达近3小时的时间里灶具处于开启状态且无人看管,这是明显的火灾风险。虽然 13:35-13:36 儿童房和餐厅有短暂的运动检测,但没有入户门开锁记录,可能是宠物活动或传感器误触发,不能确认有成人在场监管灶具。\",\n \"推理步骤3: 厨房窗户传感器在 07:03:30 报告 StateValue = False(窗户打开),之后在 19:28:30 再次报告 False(仍然打开或再次打开),但日志中没有关闭记录。全天外出期间厨房窗户保持打开状态,虽然不是高危问题,但结合灶具无人看管的情况增加了风险。\",\n \"推理步骤4: 其余设备行为均属正常:早晨 06:02 起床、07:42 出门上锁、16:34 孩子回家、17:58 大人回家、22:29 就寝锁门,符合典型三口之家的作息规律。温度曲线呈现正常的日间升温、夜间降温趋势。门锁的开锁/上锁操作均有对应的门磁和运动传感器联动,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None 值(07:02、07:04、18:14、19:29),指示传感器间歇性故障\",\n \"13:36:30 灶具开启,但 07:42 全家已出门且门锁上锁,至 16:34 才有人回家,期间无入户门开锁记录\",\n \"13:35-13:36 儿童房/餐厅有短暂运动检测但无对应的入户门操作,无法确认有人在场看管灶具\",\n \"厨房窗户全天处于打开状态,外出期间未关闭\"\n ],\n \"recommended_actions\": [\n \"尽快检修或更换厨房温度传感器,确保厨房火灾预警链完整可靠\",\n \"排查 13:36 灶具开启的原因:检查是否存在定时任务、自动化规则或远程误操作,如有宠物需防止其误触灶具开关\",\n \"建议设置自动化规则:当全家外出(门锁上锁且无室内运动)时,禁止灶具开启或自动关闭灶具并发送告警\",\n \"建议设置离家模式自动关闭厨房窗户或发出提醒,避免外出时窗户长时间敞开\",\n \"考虑为灶具添加无人看管超时自动关闭功能(如开启超过一定时间且无厨房运动检测则自动断电)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时下午无人在家期间灶具被开启,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:02、07:04、18:14、19:29 四次报告 MeasuredValue = None,表明传感器间歇性失效。该传感器紧邻灶具和烟雾报警器,是厨房火灾预警链的关键一环,故障会削弱安全保障。", "推理步骤2: 13:36:30 厨房灶具被开启(OnOff = True),但此时家庭处于外出状态(07:42 全家出门、门锁上锁),直到 16:34 才有人回家。在长达近3小时的时间里灶具处于开启状态且无人看管,这是明显的火灾风险。虽然 13:35-13:36 儿童房和餐厅有短暂的运动检测,但没有入户门开锁记录,可能是宠物活动或传感器误触发,不能确认有成人在场监管灶具。", "推理步骤3: 厨房窗户传感器在 07:03:30 报告 StateValue = False(窗户打开),之后在 19:28:30 再次报告 False(仍然打开或再次打开),但日志中没有关闭记录。全天外出期间厨房窗户保持打开状态,虽然不是高危问题,但结合灶具无人看管的情况增加了风险。", "推理步骤4: 其余设备行为均属正常:早晨 06:02 起床、07:42 出门上锁、16:34 孩子回家、17:58 大人回家、22:29 就寝锁门,符合典型三口之家的作息规律。温度曲线呈现正常的日间升温、夜间降温趋势。门锁的开锁/上锁操作均有对应的门磁和运动传感器联动,无入侵迹象。"], "key_evidence": ["厨房温度传感器 4 次报告 None 值(07:02、07:04、18:14、19:29),指示传感器间歇性故障", "13:36:30 灶具开启,但 07:42 全家已出门且门锁上锁,至 16:34 才有人回家,期间无入户门开锁记录", "13:35-13:36 儿童房/餐厅有短暂运动检测但无对应的入户门操作,无法确认有人在场看管灶具", "厨房窗户全天处于打开状态,外出期间未关闭"], "recommended_actions": ["尽快检修或更换厨房温度传感器,确保厨房火灾预警链完整可靠", "排查 13:36 灶具开启的原因:检查是否存在定时任务、自动化规则或远程误操作,如有宠物需防止其误触灶具开关", "建议设置自动化规则:当全家外出(门锁上锁且无室内运动)时,禁止灶具开启或自动关闭灶具并发送告警", "建议设置离家模式自动关闭厨房窗户或发出提醒,避免外出时窗户长时间敞开", "考虑为灶具添加无人看管超时自动关闭功能(如开启超过一定时间且无厨房运动检测则自动断电)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.511882305145264, "api_error": null} {"episode_id": "SQ4_TP_C_0839", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0839.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261468, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "balcony", "injection_time": "2026-06-12T19:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:20开锁后长时间未关闭/未上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:44、07:31、18:24、19:18 四次报告 MeasuredValue = None,每次都紧跟在灶具开启或厨房窗户打开之后。正常传感器不应因环境变化而返回 None,这表明传感器可能存在间歇性故障或受灶具热源干扰导致读数溢出。\",\n \"推理步骤2: 16:20 入户门解锁并打开(contact=False),有人进入后前往儿童房,但日志中直到 17:40 下一次开门事件之前,没有记录到 front_door_contact 恢复为 True 或门锁重新上锁。这意味着入户门可能在约1小时20分钟内处于未关闭/未上锁状态,存在入侵风险。\",\n \"推理步骤3: 19:51 的开门事件使用了 OperationSource=3(远程/密码)且带有 UserIndex=1,属于已注册用户操作,本身不异常。但随后 entrance_occupancy 和 living_room_occupancy 几乎同时触发,且有人进入次卧,说明有多人进入,结合已注册用户身份判断为正常回家行为。\",\n \"推理步骤4: 整体温度趋势合理——凌晨约22.9°C,中午升至约25.8°C,晚间回落至约23.3°C,符合夏季自然温度变化曲线。各房间温差在合理范围内,无异常热源迹象。\",\n \"推理步骤5: 灶具两次使用(06:43-07:30 早餐、18:23-19:17 晚餐)时长合理,烟雾报警器全天无触发,厨房窗户在做饭后打开通风属正常行为。\",\n \"推理步骤6: 家庭作息模式正常:约06:18起床,07:17出门上班/上学,16:20孩子放学回家,17:40大人回家,21:18孩子就寝,22:47大人就寝。所有灯光、窗帘操作与此作息吻合。\",\n \"推理步骤7: 漏水传感器(厨房、主卫、次卫)全天无报警,烟雾/CO报警器无触发,洗碗机和洗衣机运行状态正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:44、07:31、18:24、19:18 四次报告 MeasuredValue = None,与灶具操作或窗户开关时间高度关联\",\n \"16:20:02 front_door_contact = False(门开),直到 17:40 才有下一次入户门事件,期间无关门/上锁记录\",\n \"22:47:19 front_door_contact = True 后自动上锁,说明系统具备自动锁门功能,但白天未生效\",\n \"07:30 和 19:17 厨房窗户打开(contact=False)后均无关闭记录,厨房窗户可能整夜处于打开状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:多次返回 None 值表明传感器可能故障或安装位置受灶具热辐射影响过大,建议检修或重新定位\",\n \"排查入户门自动锁门策略:16:20 开门后长时间未关闭/上锁,建议设置开门超时自动提醒或自动上锁规则\",\n \"确认厨房窗户状态:日志中厨房窗户两次打开但无关闭记录,夜间开窗可能带来安全隐患,建议增加窗户长时间未关闭的提醒\",\n \"建议为次卫增加运动传感器:次卫灯在 06:57 开启但无运动传感器确认人员存在,也无关灯记录,无法判断是否存在灯光遗忘问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:20开锁后长时间未关闭/未上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:44、07:31、18:24、19:18 四次报告 MeasuredValue = None,每次都紧跟在灶具开启或厨房窗户打开之后。正常传感器不应因环境变化而返回 None,这表明传感器可能存在间歇性故障或受灶具热源干扰导致读数溢出。", "推理步骤2: 16:20 入户门解锁并打开(contact=False),有人进入后前往儿童房,但日志中直到 17:40 下一次开门事件之前,没有记录到 front_door_contact 恢复为 True 或门锁重新上锁。这意味着入户门可能在约1小时20分钟内处于未关闭/未上锁状态,存在入侵风险。", "推理步骤3: 19:51 的开门事件使用了 OperationSource=3(远程/密码)且带有 UserIndex=1,属于已注册用户操作,本身不异常。但随后 entrance_occupancy 和 living_room_occupancy 几乎同时触发,且有人进入次卧,说明有多人进入,结合已注册用户身份判断为正常回家行为。", "推理步骤4: 整体温度趋势合理——凌晨约22.9°C,中午升至约25.8°C,晚间回落至约23.3°C,符合夏季自然温度变化曲线。各房间温差在合理范围内,无异常热源迹象。", "推理步骤5: 灶具两次使用(06:43-07:30 早餐、18:23-19:17 晚餐)时长合理,烟雾报警器全天无触发,厨房窗户在做饭后打开通风属正常行为。", "推理步骤6: 家庭作息模式正常:约06:18起床,07:17出门上班/上学,16:20孩子放学回家,17:40大人回家,21:18孩子就寝,22:47大人就寝。所有灯光、窗帘操作与此作息吻合。", "推理步骤7: 漏水传感器(厨房、主卫、次卫)全天无报警,烟雾/CO报警器无触发,洗碗机和洗衣机运行状态正常。"], "key_evidence": ["厨房温度传感器在 06:44、07:31、18:24、19:18 四次报告 MeasuredValue = None,与灶具操作或窗户开关时间高度关联", "16:20:02 front_door_contact = False(门开),直到 17:40 才有下一次入户门事件,期间无关门/上锁记录", "22:47:19 front_door_contact = True 后自动上锁,说明系统具备自动锁门功能,但白天未生效", "07:30 和 19:17 厨房窗户打开(contact=False)后均无关闭记录,厨房窗户可能整夜处于打开状态"], "recommended_actions": ["检查厨房温度传感器:多次返回 None 值表明传感器可能故障或安装位置受灶具热辐射影响过大,建议检修或重新定位", "排查入户门自动锁门策略:16:20 开门后长时间未关闭/上锁,建议设置开门超时自动提醒或自动上锁规则", "确认厨房窗户状态:日志中厨房窗户两次打开但无关闭记录,夜间开窗可能带来安全隐患,建议增加窗户长时间未关闭的提醒", "建议为次卫增加运动传感器:次卫灯在 06:57 开启但无运动传感器确认人员存在,也无关灯记录,无法判断是否存在灯光遗忘问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.458529472351074, "api_error": null} {"episode_id": "SQ4_TP_C_0845", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_C_0845.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261474, "scenario_id": "WD-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-28T18:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水或管路故障。\",\n \"reasoning\": [\n \"推理步骤1: 18:26 洗碗机启动(OperationalState = 1),这是正常的晚餐后使用行为。\",\n \"推理步骤2: 18:31 厨房漏水传感器报告 StateValue = True,距洗碗机启动仅 5 分钟,时间高度关联。\",\n \"推理步骤3: 18:31 洗碗机仍处于运行状态(OperationalState = 1),说明漏水并非因设备正常排水结束导致,而是运行过程中发生的异常渗漏。\",\n \"推理步骤4: 在整个日志时间范围内,厨房温度传感器未出现异常飙升,烟雾报警器也未触发,可排除火灾风险,问题聚焦于水患。\",\n \"推理步骤5: 漏水报警后日志中未出现 StateValue = False 的恢复事件,说明截至日志结束时漏水状态持续存在,未被处理。\",\n \"推理步骤6: 其余所有房间的温度数据呈现正常的昼夜变化曲线(夜间约 23°C,午间峰值约 25.8°C),各房间温度一致,无异常偏差,家庭整体环境正常。\"\n ],\n \"key_evidence\": [\n \"18:26 洗碗机启动(OperationalState = 1)\",\n \"18:31 厨房漏水传感器触发(StateValue = True),与洗碗机运行时间高度吻合\",\n \"漏水状态在后续日志中未恢复为 False,表明漏水持续未解除\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机,停止进水以防止漏水扩大\",\n \"如有智能水阀,关闭厨房供水总阀\",\n \"尽快前往厨房现场检查洗碗机进水管、排水管及底部密封情况\",\n \"检查厨房地面积水范围,防止水渗透到橱柜底部或相邻房间造成二次损害\",\n \"漏水排除后对洗碗机进行维修检查,确认密封圈和管路连接无老化破损再恢复使用\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房漏水传感器在洗碗机运行期间触发报警,疑似洗碗机漏水或管路故障。", "reasoning": ["推理步骤1: 18:26 洗碗机启动(OperationalState = 1),这是正常的晚餐后使用行为。", "推理步骤2: 18:31 厨房漏水传感器报告 StateValue = True,距洗碗机启动仅 5 分钟,时间高度关联。", "推理步骤3: 18:31 洗碗机仍处于运行状态(OperationalState = 1),说明漏水并非因设备正常排水结束导致,而是运行过程中发生的异常渗漏。", "推理步骤4: 在整个日志时间范围内,厨房温度传感器未出现异常飙升,烟雾报警器也未触发,可排除火灾风险,问题聚焦于水患。", "推理步骤5: 漏水报警后日志中未出现 StateValue = False 的恢复事件,说明截至日志结束时漏水状态持续存在,未被处理。", "推理步骤6: 其余所有房间的温度数据呈现正常的昼夜变化曲线(夜间约 23°C,午间峰值约 25.8°C),各房间温度一致,无异常偏差,家庭整体环境正常。"], "key_evidence": ["18:26 洗碗机启动(OperationalState = 1)", "18:31 厨房漏水传感器触发(StateValue = True),与洗碗机运行时间高度吻合", "漏水状态在后续日志中未恢复为 False,表明漏水持续未解除"], "recommended_actions": ["立即远程关闭洗碗机,停止进水以防止漏水扩大", "如有智能水阀,关闭厨房供水总阀", "尽快前往厨房现场检查洗碗机进水管、排水管及底部密封情况", "检查厨房地面积水范围,防止水渗透到橱柜底部或相邻房间造成二次损害", "漏水排除后对洗碗机进行维修检查,确认密封圈和管路连接无老化破损再恢复使用"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.41775941848755, "api_error": null} {"episode_id": "SQ4_TP_D_0722", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0722.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261351, "scenario_id": "EL-05", "total_events": 215, "anomaly_events_count": 11}, "ground_truth": {"scenario_id": "EL-05", "scenario_name": "夜间频繁起夜", "category": "elderly_specific", "is_anomaly": true, "threat_type": "health_concern", "key_evidence": ["一晚4次以上卧室→卫生间往返", "间隔越来越短", "可能的健康问题:泌尿系统感染、前列腺问题、糖尿病等"], "expected_response": "非紧急但需要记录,建议子女/看护者关注,如连续多天则建议就医", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T07:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致厨房火灾风险无法被及时监测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(06:03、10:53、17:01),且在灶具关闭后仍持续报告 None(06:27、11:26、17:40),直到下一个整点周期才恢复正常数值。这说明传感器在灶具使用前后均出现读数丢失。\",\n \"推理步骤2: 该现象在一天内三次灶具使用中100%复现,具有高度规律性,排除偶发通信故障的可能,更像是传感器本身在特定温度区间出现量程溢出或硬件保护性断连。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在烹饪(最高风险时段)恰好失效,一旦发生干烧或油烟起火,系统将无法通过温度异常触发报警,形成监测盲区。\",\n \"推理步骤4: 除传感器问题外,其余设备行为均属正常——老人05:33起床、07:02出门、08:40回家、12:27午休、14:10起床、20:28洗漱、20:53就寝,作息规律合理;入户门在外出和就寝时均正确上锁;烟雾报警器未触发;无漏水报警;无入侵迹象。\",\n \"推理步骤5: 入户门在08:40开锁进入后,直到20:53就寝时才记录到锁定事件,期间未见明确的关门上锁记录。虽然可能是老人在家期间未锁门属于个人习惯,但对独居老人而言存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:03、06:27、10:53、11:26、17:01、17:40),灶具关闭后仍无法立即恢复\",\n \"该故障模式在一天内三次烹饪中完全复现,具有确定性规律\",\n \"08:40入户门开锁后至20:53期间无门锁上锁记录,入户门可能长时间处于未锁状态\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确认其工作温度范围是否满足烹饪场景需求,必要时将传感器安装位置远离灶具直接热源\",\n \"在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为烹饪期间的替代监测手段\",\n \"为独居老人设置入户门未锁提醒规则:若门锁在解锁后超过一定时间未重新上锁,自动推送提醒或触发自动上锁\",\n \"考虑为厨房灶具增加超时自动关闭功能,防止老人忘记关火\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致厨房火灾风险无法被及时监测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内就报告 MeasuredValue = None(06:03、10:53、17:01),且在灶具关闭后仍持续报告 None(06:27、11:26、17:40),直到下一个整点周期才恢复正常数值。这说明传感器在灶具使用前后均出现读数丢失。", "推理步骤2: 该现象在一天内三次灶具使用中100%复现,具有高度规律性,排除偶发通信故障的可能,更像是传感器本身在特定温度区间出现量程溢出或硬件保护性断连。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在烹饪(最高风险时段)恰好失效,一旦发生干烧或油烟起火,系统将无法通过温度异常触发报警,形成监测盲区。", "推理步骤4: 除传感器问题外,其余设备行为均属正常——老人05:33起床、07:02出门、08:40回家、12:27午休、14:10起床、20:28洗漱、20:53就寝,作息规律合理;入户门在外出和就寝时均正确上锁;烟雾报警器未触发;无漏水报警;无入侵迹象。", "推理步骤5: 入户门在08:40开锁进入后,直到20:53就寝时才记录到锁定事件,期间未见明确的关门上锁记录。虽然可能是老人在家期间未锁门属于个人习惯,但对独居老人而言存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(06:03、06:27、10:53、11:26、17:01、17:40),灶具关闭后仍无法立即恢复", "该故障模式在一天内三次烹饪中完全复现,具有确定性规律", "08:40入户门开锁后至20:53期间无门锁上锁记录,入户门可能长时间处于未锁状态"], "recommended_actions": ["检查或更换厨房温度传感器,确认其工作温度范围是否满足烹饪场景需求,必要时将传感器安装位置远离灶具直接热源", "在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为烹饪期间的替代监测手段", "为独居老人设置入户门未锁提醒规则:若门锁在解锁后超过一定时间未重新上锁,自动推送提醒或触发自动上锁", "考虑为厨房灶具增加超时自动关闭功能,防止老人忘记关火"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.5741868019104, "api_error": null} {"episode_id": "SQ4_TP_D_0724", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0724.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-06T00:00:00", "seed": 20261353, "scenario_id": "EL-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "EL-06", "scenario_name": "忘记锁门", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unlocked_door_unattended", "key_evidence": ["住户出门(所有 occupancy=0)", "门已关(contact=Closed)但锁未锁(LockState=Unlocked)", "超过合理时间(10分钟)仍未自动锁定,且 AutoRelockTime 可能未启用"], "expected_response": "通知老人远程锁门,或自动锁门", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-06T05:05:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温或火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息分析——老人约 05:05 起床(入户门锁解锁事件),05:33 进入卧室开灯,05:40 去卫生间,06:06 进厨房做早餐,06:57 出门,08:40 回家,12:33 午休,14:04 起床,17:03 做晚餐,19:27 在客厅看电视(灯光调暗至 13/254),20:27 洗漱,20:48 回卧室就寝。这是一个非常规律、合理的独居老人日常作息,无异常行为模式。\",\n \"推理步骤2: 入侵分析——05:05 的开锁事件(LockOperationType=1 即解锁)后门很快关闭并在 05:15 重新上锁,06:57 手动开锁出门后自动上锁,08:40 回家开门,20:48 门锁确认关闭并自动上锁。所有门锁操作均与运动传感器和住户活动轨迹吻合,无未授权入侵迹象。\",\n \"推理步骤3: 灶具使用安全分析——三次使用灶具:06:06-06:33(约27分钟)、10:53-11:33(约40分钟)、17:03-17:37(约34分钟),每次使用后均正常关闭,且均有厨房运动传感器检测到人在场(Occupancy=1),使用时长合理,烟雾报警器全天无触发,无火灾风险。\",\n \"推理步骤4: 厨房温度传感器异常——在灶具每次开启后约1分钟,kitchen_temp_sensor 均报告 MeasuredValue = None(06:07、06:34、10:54、11:34、17:04、17:38),共出现6次。这些 None 值集中出现在灶具开关前后,说明传感器可能在高温环境下出现读数溢出或通信故障。灶具关闭后,下一个半小时整点读数恢复正常,说明传感器并非永久损坏,但在关键的烹饪高温时段无法提供有效温度数据,这是一个安全隐患。\",\n \"推理步骤5: 温度趋势分析——全天温度变化符合夏季自然规律:凌晨最低(客厅约23.0°C,卧室约21.9°C),午后最高(客厅约25.9°C,卧室约24.9°C),傍晚逐渐回落。卧室始终比客厅低约1°C,符合朝向或窗帘遮挡的物理特征。无异常温升,无火灾迹象。\",\n \"推理步骤6: 漏水与烟雾——全天未见 bathroom_water_leak、kitchen_water_leak、kitchen_smoke_alarm、living_room_smoke_alarm 有任何触发事件,水电安全正常。\",\n \"推理步骤7: 健康关注——老人全天活动轨迹连贯,无长时间无运动检测的空白期(除正常午休 12:33-14:04 约1.5小时),卫生间使用时长合理(早晨约26分钟,晚间约21分钟),无跌倒或长时间滞留迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启/关闭前后共6次报告 MeasuredValue = None(06:07、06:34、10:54、11:34、17:04、17:38),在烹饪高温时段无法提供有效温度监测\",\n \"灶具三次使用均正常关闭,厨房有人在场,烟雾报警器未触发,实际火灾风险低\",\n \"老人全天生活作息规律,门锁操作与活动轨迹完全吻合,无入侵或健康异常迹象\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置\",\n \"在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为灶具使用期间的备用安全监测手段\",\n \"考虑为灶具添加自动超时关闭规则(如连续使用超过45分钟自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致无法及时发现厨房高温或火灾隐患。", "reasoning": ["推理步骤1: 整体生活作息分析——老人约 05:05 起床(入户门锁解锁事件),05:33 进入卧室开灯,05:40 去卫生间,06:06 进厨房做早餐,06:57 出门,08:40 回家,12:33 午休,14:04 起床,17:03 做晚餐,19:27 在客厅看电视(灯光调暗至 13/254),20:27 洗漱,20:48 回卧室就寝。这是一个非常规律、合理的独居老人日常作息,无异常行为模式。", "推理步骤2: 入侵分析——05:05 的开锁事件(LockOperationType=1 即解锁)后门很快关闭并在 05:15 重新上锁,06:57 手动开锁出门后自动上锁,08:40 回家开门,20:48 门锁确认关闭并自动上锁。所有门锁操作均与运动传感器和住户活动轨迹吻合,无未授权入侵迹象。", "推理步骤3: 灶具使用安全分析——三次使用灶具:06:06-06:33(约27分钟)、10:53-11:33(约40分钟)、17:03-17:37(约34分钟),每次使用后均正常关闭,且均有厨房运动传感器检测到人在场(Occupancy=1),使用时长合理,烟雾报警器全天无触发,无火灾风险。", "推理步骤4: 厨房温度传感器异常——在灶具每次开启后约1分钟,kitchen_temp_sensor 均报告 MeasuredValue = None(06:07、06:34、10:54、11:34、17:04、17:38),共出现6次。这些 None 值集中出现在灶具开关前后,说明传感器可能在高温环境下出现读数溢出或通信故障。灶具关闭后,下一个半小时整点读数恢复正常,说明传感器并非永久损坏,但在关键的烹饪高温时段无法提供有效温度数据,这是一个安全隐患。", "推理步骤5: 温度趋势分析——全天温度变化符合夏季自然规律:凌晨最低(客厅约23.0°C,卧室约21.9°C),午后最高(客厅约25.9°C,卧室约24.9°C),傍晚逐渐回落。卧室始终比客厅低约1°C,符合朝向或窗帘遮挡的物理特征。无异常温升,无火灾迹象。", "推理步骤6: 漏水与烟雾——全天未见 bathroom_water_leak、kitchen_water_leak、kitchen_smoke_alarm、living_room_smoke_alarm 有任何触发事件,水电安全正常。", "推理步骤7: 健康关注——老人全天活动轨迹连贯,无长时间无运动检测的空白期(除正常午休 12:33-14:04 约1.5小时),卫生间使用时长合理(早晨约26分钟,晚间约21分钟),无跌倒或长时间滞留迹象。"], "key_evidence": ["厨房温度传感器在灶具开启/关闭前后共6次报告 MeasuredValue = None(06:07、06:34、10:54、11:34、17:04、17:38),在烹饪高温时段无法提供有效温度监测", "灶具三次使用均正常关闭,厨房有人在场,烟雾报警器未触发,实际火灾风险低", "老人全天生活作息规律,门锁操作与活动轨迹完全吻合,无入侵或健康异常迹象"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置", "在传感器修复前,建议加强厨房烟雾报警器的灵敏度设置,作为灶具使用期间的备用安全监测手段", "考虑为灶具添加自动超时关闭规则(如连续使用超过45分钟自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.64278721809387, "api_error": null} {"episode_id": "SQ4_TP_D_0729", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0729.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261358, "scenario_id": "EL-07", "total_events": 205, "anomaly_events_count": 1}, "ground_truth": {"scenario_id": "EL-07", "scenario_name": "长时间未归家", "category": "elderly_specific", "is_anomaly": true, "threat_type": "prolonged_absence", "key_evidence": ["出门时间已知(LockOperation 事件)", "预期回家时间已过但无 LockOperation 解锁事件", "偏离日常规律超过1小时"], "expected_response": "9:30开始尝试联系,10:00后联系紧急联系人", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-28T18:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在外出期间曾被解锁且长时间未关闭,需关注安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:08、06:40、11:00、11:35、17:00、17:34),虽然灶具使用期间高温可能导致传感器超量程,但灶具关闭后(如 06:39 关灶、06:40 仍报 None)依然出现 None,说明传感器可能存在间歇性故障或响应延迟问题。对于独居老人家庭,厨房温度监测是防火安全的关键环节,传感器不可靠会导致火灾风险无法及时发现。\",\n \"推理步骤2: 07:00 入户门锁记录了一次 LockOperation(LockOperationType=1)(解锁),但没有对应的门传感器开关事件、没有运动传感器触发、也没有 OperationSource 字段。老人 06:56 已出门并自动上锁,此时门从外部被解锁却无人进入,来源不明。虽然可能是远程操作或系统误报,但在独居老人场景下值得关注。随后 08:30 老人手动开锁回家,期间门处于解锁状态长达约 1.5 小时。\",\n \"推理步骤3: 08:30 老人回家后,入户门传感器显示 StateValue=False(门开),但直到 20:41:18 才记录到 StateValue=True(门关)并自动上锁。这意味着入户门可能在整个白天处于未关闭状态长达约 12 小时。对于独居老人,这是一个显著的入侵风险敞口。不过也可能是门传感器在中间状态变化时未上报事件。\",\n \"推理步骤4: 老人的日常作息模式本身是正常的——05:31 起床、06:07 做早餐、06:56 出门、08:30 回家、12:27 午休、14:04 起床、16:59 做晚餐、20:35 洗漱、20:41 就寝。三餐规律,灶具使用时长合理(早餐约 32 分钟、午餐约 35 分钟、晚餐约 34 分钟),未触发烟雾报警器,无漏水报警。\",\n \"推理步骤5: 温度趋势正常,符合夏季昼夜温差规律:夜间约 22-23°C,午间峰值约 25.8°C,傍晚逐步回落。卧室始终比客厅低约 1°C,符合朝向或通风差异。全天未使用空调。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:08、06:40、11:00、11:35、17:00、17:34 共 6 次报告 MeasuredValue = None,部分发生在灶具已关闭之后\",\n \"07:00 入户门锁记录解锁事件 LockOperationType=1,无 OperationSource、无门传感器和运动传感器联动,来源不明\",\n \"08:30 入户门打开(StateValue=False)后,直到 20:41:18 才记录关闭(StateValue=True),中间无任何门状态变化记录,疑似门长时间未关或传感器漏报\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致超量程或传感器本身故障,必要时更换耐高温型号或调整安装位置\",\n \"排查 07:00 入户门解锁事件的来源,检查是否存在远程解锁记录、定时任务或门锁固件异常,确认无未授权访问\",\n \"确认入户门传感器是否正常工作,排查 08:30 至 20:41 期间门是否确实未关闭;如确认长时间敞开,建议设置门未关超时告警(如超过 10 分钟未关门则推送提醒)\",\n \"考虑为独居老人增加「长时间无活动告警」规则,如某区域运动传感器超过设定时间无触发则通知紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在外出期间曾被解锁且长时间未关闭,需关注安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:08、06:40、11:00、11:35、17:00、17:34),虽然灶具使用期间高温可能导致传感器超量程,但灶具关闭后(如 06:39 关灶、06:40 仍报 None)依然出现 None,说明传感器可能存在间歇性故障或响应延迟问题。对于独居老人家庭,厨房温度监测是防火安全的关键环节,传感器不可靠会导致火灾风险无法及时发现。", "推理步骤2: 07:00 入户门锁记录了一次 LockOperation(LockOperationType=1)(解锁),但没有对应的门传感器开关事件、没有运动传感器触发、也没有 OperationSource 字段。老人 06:56 已出门并自动上锁,此时门从外部被解锁却无人进入,来源不明。虽然可能是远程操作或系统误报,但在独居老人场景下值得关注。随后 08:30 老人手动开锁回家,期间门处于解锁状态长达约 1.5 小时。", "推理步骤3: 08:30 老人回家后,入户门传感器显示 StateValue=False(门开),但直到 20:41:18 才记录到 StateValue=True(门关)并自动上锁。这意味着入户门可能在整个白天处于未关闭状态长达约 12 小时。对于独居老人,这是一个显著的入侵风险敞口。不过也可能是门传感器在中间状态变化时未上报事件。", "推理步骤4: 老人的日常作息模式本身是正常的——05:31 起床、06:07 做早餐、06:56 出门、08:30 回家、12:27 午休、14:04 起床、16:59 做晚餐、20:35 洗漱、20:41 就寝。三餐规律,灶具使用时长合理(早餐约 32 分钟、午餐约 35 分钟、晚餐约 34 分钟),未触发烟雾报警器,无漏水报警。", "推理步骤5: 温度趋势正常,符合夏季昼夜温差规律:夜间约 22-23°C,午间峰值约 25.8°C,傍晚逐步回落。卧室始终比客厅低约 1°C,符合朝向或通风差异。全天未使用空调。"], "key_evidence": ["厨房温度传感器在 06:08、06:40、11:00、11:35、17:00、17:34 共 6 次报告 MeasuredValue = None,部分发生在灶具已关闭之后", "07:00 入户门锁记录解锁事件 LockOperationType=1,无 OperationSource、无门传感器和运动传感器联动,来源不明", "08:30 入户门打开(StateValue=False)后,直到 20:41:18 才记录关闭(StateValue=True),中间无任何门状态变化记录,疑似门长时间未关或传感器漏报"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致超量程或传感器本身故障,必要时更换耐高温型号或调整安装位置", "排查 07:00 入户门解锁事件的来源,检查是否存在远程解锁记录、定时任务或门锁固件异常,确认无未授权访问", "确认入户门传感器是否正常工作,排查 08:30 至 20:41 期间门是否确实未关闭;如确认长时间敞开,建议设置门未关超时告警(如超过 10 分钟未关门则推送提醒)", "考虑为独居老人增加「长时间无活动告警」规则,如某区域运动传感器超过设定时间无触发则通知紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.635770082473755, "api_error": null} {"episode_id": "SQ4_TP_D_0733", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0733.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261362, "scenario_id": "EL-02", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-02", "scenario_name": "居家意外(任意位置跌倒/晕倒)", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall_or_medical_emergency", "key_evidence": ["最后一次运动在非卧室房间(如客厅、厨房)", "随后异常长时间无任何活动", "不在正常午睡时段(比如上午10点或下午4点)"], "expected_response": "紧急联系老人,如无应答联系紧急联系人或120", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-11T10:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:27起床、06:04做早餐、06:59出门、08:26回家、12:23午休、16:51做晚餐、20:55就寝,符合独居老人的典型日常模式。\",\n \"推理步骤2: 入侵排查——08:26老人回家时入户门解锁、开门、玄关和客厅检测到人,但门未关闭(front_door_contact 未恢复 True),直到20:55就寝时才记录到门关闭并自动上锁。这意味着老人白天在家期间入户门可能一直处于未锁定/未关闭状态,对独居老人存在一定安全隐患,但更可能是生活习惯而非入侵。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:04-06:25、10:59-11:33、16:51-17:25),kitchen_temp_sensor 均在灶具开启后立即报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None,随后在下一个30分钟整点才恢复正常数值。传感器在最需要监测温度的烹饪时段失效,这是一个显著的设备故障模式。\",\n \"推理步骤4: 温度趋势正常——三个房间的温度均呈现合理的日间升温、夜间降温曲线(夜间约22°C,午间峰值约25.7°C),无异常温升,排除火灾风险。\",\n \"推理步骤5: 无漏水、无烟雾报警触发,卫生间和其他传感器工作正常。\",\n \"推理步骤6: 综合评估——最主要的风险是厨房温度传感器在烹饪期间反复失效。对于独居老人,灶具使用是最高火灾风险场景,此时温度监测缺失可能延误异常高温的发现。次要风险是白天入户门长时间未锁。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间(06:05、11:00、16:52)均报告 MeasuredValue = None,灶具关闭后(06:26、11:34、17:26)再次报告 None,呈现规律性故障模式\",\n \"08:26入户门解锁开门后,front_door_contact 未记录关门(StateValue = True),直到20:55才记录关门上锁,白天约12.5小时门可能未锁\",\n \"老人全天活动轨迹连贯合理:起床→洗漱→做饭→出门→回家→午休→做饭→看电视→洗漱→就寝,无异常人员活动\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——该传感器可能因灶具热辐射或蒸汽导致间歇性故障,建议调整安装位置(远离灶具直接热源)或更换耐高温型号\",\n \"在厨房温度传感器修复前,建议设置灶具使用时长自动提醒(如超过30分钟未关闭则告警),作为补偿性安全措施\",\n \"建议配置入户门长时间未锁提醒——老人白天在家时门未锁超过一定时间(如1小时)自动推送提醒,提升独居安全性\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:27起床、06:04做早餐、06:59出门、08:26回家、12:23午休、16:51做晚餐、20:55就寝,符合独居老人的典型日常模式。", "推理步骤2: 入侵排查——08:26老人回家时入户门解锁、开门、玄关和客厅检测到人,但门未关闭(front_door_contact 未恢复 True),直到20:55就寝时才记录到门关闭并自动上锁。这意味着老人白天在家期间入户门可能一直处于未锁定/未关闭状态,对独居老人存在一定安全隐患,但更可能是生活习惯而非入侵。", "推理步骤3: 厨房温度传感器异常——灶具三次使用期间(06:04-06:25、10:59-11:33、16:51-17:25),kitchen_temp_sensor 均在灶具开启后立即报告 MeasuredValue = None,且在灶具关闭后约1分钟再次报告 None,随后在下一个30分钟整点才恢复正常数值。传感器在最需要监测温度的烹饪时段失效,这是一个显著的设备故障模式。", "推理步骤4: 温度趋势正常——三个房间的温度均呈现合理的日间升温、夜间降温曲线(夜间约22°C,午间峰值约25.7°C),无异常温升,排除火灾风险。", "推理步骤5: 无漏水、无烟雾报警触发,卫生间和其他传感器工作正常。", "推理步骤6: 综合评估——最主要的风险是厨房温度传感器在烹饪期间反复失效。对于独居老人,灶具使用是最高火灾风险场景,此时温度监测缺失可能延误异常高温的发现。次要风险是白天入户门长时间未锁。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间(06:05、11:00、16:52)均报告 MeasuredValue = None,灶具关闭后(06:26、11:34、17:26)再次报告 None,呈现规律性故障模式", "08:26入户门解锁开门后,front_door_contact 未记录关门(StateValue = True),直到20:55才记录关门上锁,白天约12.5小时门可能未锁", "老人全天活动轨迹连贯合理:起床→洗漱→做饭→出门→回家→午休→做饭→看电视→洗漱→就寝,无异常人员活动"], "recommended_actions": ["检查或更换厨房温度传感器——该传感器可能因灶具热辐射或蒸汽导致间歇性故障,建议调整安装位置(远离灶具直接热源)或更换耐高温型号", "在厨房温度传感器修复前,建议设置灶具使用时长自动提醒(如超过30分钟未关闭则告警),作为补偿性安全措施", "建议配置入户门长时间未锁提醒——老人白天在家时门未锁超过一定时间(如1小时)自动推送提醒,提升独居安全性", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.064454555511475, "api_error": null} {"episode_id": "SQ4_TP_D_0734", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0734.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261363, "scenario_id": "EL-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-01", "scenario_name": "卫生间疑似跌倒", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall", "key_evidence": ["老人进入卫生间(灯开+运动触发)", "运动传感器因PIR超时归零(人倒在地上不动),但灯仍开着", "随后30分钟+全屋完全无活动", "卫生间是老人跌倒高发区域(地滑)", "跟正常午睡的区别:午睡在卧室且会先关灯"], "expected_response": "中等紧急度警报,尝试通过语音/通知联系老人,如无回应建议联系紧急联系人", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-16T22:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"独居老人深夜卫生间活动异常:22:49 卫生间传感器检测到进入后仅5秒即显示无人,且卫生间灯未关闭,同时入户门在老人回卧室后始终未上锁,存在跌倒或身体不适的可能。\",\n \"reasoning\": [\n \"推理步骤1: 老人全天作息规律清晰——05:33起床、06:56出门、08:31回家、12:32午休、13:59起床、20:37就寝,生活节奏正常。\",\n \"推理步骤2: 22:49 卫生间运动传感器触发 Occupancy=1,但仅5秒后(22:49:05)即变为 Occupancy=0,这个时间极短,正常如厕或洗漱不可能在5秒内完成。可能的解释:老人进入后摔倒或倒地,脱离了传感器的检测范围,导致传感器误判为无人。\",\n \"推理步骤3: 卫生间灯在22:49开启后,直到日志结束(23:30)都没有关闭记录。对比早晨(05:38-05:53,15分钟)和晚间(20:32-20:37,5分钟)的正常使用模式,灯都会在离开时关闭。此次灯持续亮着超过40分钟未关闭,异常。\",\n \"推理步骤4: 22:49之后直到日志结束,卧室和其他房间均无任何运动传感器触发,说明老人没有返回卧室或移动到其他区域,这与正常夜间如厕后回床的行为不符。\",\n \"推理步骤5: 08:31老人回家时,入户门传感器显示门打开(StateValue=False)但之后没有关门和上锁记录,直到20:37才出现门关闭和自动上锁。这意味着白天约12小时入户门处于未锁状态,对独居老人存在安全隐患。\",\n \"推理步骤6: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(05:54、06:27、11:00、11:41、17:05、17:38),每次都在灶具开关前后出现,可能是高温导致传感器短暂超量程,属于设备特性而非故障,但值得关注。\",\n \"推理步骤7: 综合22:49的异常短暂占用、灯未关闭、之后无任何活动迹象,高度怀疑老人在卫生间发生了跌倒或突发健康问题。\"\n ],\n \"key_evidence\": [\n \"22:49:00 卫生间 Occupancy=1,仅5秒后22:49:05 Occupancy=0,占用时间异常短暂\",\n \"22:49 卫生间灯开启后直到日志结束(23:30+)未关闭,持续亮灯超过40分钟\",\n \"22:49之后全屋无任何运动传感器触发,老人未返回卧室\",\n \"对比当天正常卫生间使用模式(早晨15分钟、晚间5分钟),此次行为模式明显异常\",\n \"08:31回家后入户门长时间未上锁(至20:37),独居安全隐患\"\n ],\n \"recommended_actions\": [\n \"立即通过语音或视频设备呼叫老人确认是否安全,若无响应应通知紧急联系人前往查看卫生间\",\n \"联系紧急联系人或社区服务人员上门确认老人状况,重点检查卫生间\",\n \"建议在卫生间加装紧急求助按钮或拉绳报警器,便于老人跌倒时求助\",\n \"设置卫生间占用超时告警规则:若灯亮超过20分钟且无运动检测,自动通知紧急联系人\",\n \"排查厨房温度传感器在灶具使用时频繁报告 None 的问题,确认是否需要调整安装位置或更换耐高温型号\",\n \"配置入户门未锁超时提醒,建议门未锁超过10分钟自动发送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "health_concern", "threat_description": "独居老人深夜卫生间活动异常:22:49 卫生间传感器检测到进入后仅5秒即显示无人,且卫生间灯未关闭,同时入户门在老人回卧室后始终未上锁,存在跌倒或身体不适的可能。", "reasoning": ["推理步骤1: 老人全天作息规律清晰——05:33起床、06:56出门、08:31回家、12:32午休、13:59起床、20:37就寝,生活节奏正常。", "推理步骤2: 22:49 卫生间运动传感器触发 Occupancy=1,但仅5秒后(22:49:05)即变为 Occupancy=0,这个时间极短,正常如厕或洗漱不可能在5秒内完成。可能的解释:老人进入后摔倒或倒地,脱离了传感器的检测范围,导致传感器误判为无人。", "推理步骤3: 卫生间灯在22:49开启后,直到日志结束(23:30)都没有关闭记录。对比早晨(05:38-05:53,15分钟)和晚间(20:32-20:37,5分钟)的正常使用模式,灯都会在离开时关闭。此次灯持续亮着超过40分钟未关闭,异常。", "推理步骤4: 22:49之后直到日志结束,卧室和其他房间均无任何运动传感器触发,说明老人没有返回卧室或移动到其他区域,这与正常夜间如厕后回床的行为不符。", "推理步骤5: 08:31老人回家时,入户门传感器显示门打开(StateValue=False)但之后没有关门和上锁记录,直到20:37才出现门关闭和自动上锁。这意味着白天约12小时入户门处于未锁状态,对独居老人存在安全隐患。", "推理步骤6: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(05:54、06:27、11:00、11:41、17:05、17:38),每次都在灶具开关前后出现,可能是高温导致传感器短暂超量程,属于设备特性而非故障,但值得关注。", "推理步骤7: 综合22:49的异常短暂占用、灯未关闭、之后无任何活动迹象,高度怀疑老人在卫生间发生了跌倒或突发健康问题。"], "key_evidence": ["22:49:00 卫生间 Occupancy=1,仅5秒后22:49:05 Occupancy=0,占用时间异常短暂", "22:49 卫生间灯开启后直到日志结束(23:30+)未关闭,持续亮灯超过40分钟", "22:49之后全屋无任何运动传感器触发,老人未返回卧室", "对比当天正常卫生间使用模式(早晨15分钟、晚间5分钟),此次行为模式明显异常", "08:31回家后入户门长时间未上锁(至20:37),独居安全隐患"], "recommended_actions": ["立即通过语音或视频设备呼叫老人确认是否安全,若无响应应通知紧急联系人前往查看卫生间", "联系紧急联系人或社区服务人员上门确认老人状况,重点检查卫生间", "建议在卫生间加装紧急求助按钮或拉绳报警器,便于老人跌倒时求助", "设置卫生间占用超时告警规则:若灯亮超过20分钟且无运动检测,自动通知紧急联系人", "排查厨房温度传感器在灶具使用时频繁报告 None 的问题,确认是否需要调整安装位置或更换耐高温型号", "配置入户门未锁超时提醒,建议门未锁超过10分钟自动发送通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.52923130989075, "api_error": null} {"episode_id": "SQ4_TP_D_0751", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0751.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261380, "scenario_id": "EL-04", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-04", "scenario_name": "起床时间异常推迟", "category": "elderly_specific", "is_anomaly": true, "threat_type": "abnormal_inactivity", "key_evidence": ["与老人的日常作息规律(daily_routines 中的 elderly 画像)显著偏离", "不是周末睡懒觉(老人每天作息一样)", "全屋完全无活动信号"], "expected_response": "上午8点后联系老人确认状况", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-11T23:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致火灾预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:37起床,05:45洗漱,05:58做早餐,06:52出门,08:29回家,12:21午休,14:10起床,16:57做晚餐,20:28洗漱,20:46就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入侵排查——全天仅有两次开门记录(06:52出门、08:29回家),门锁均为手动开锁后自动上锁,且08:29回家时入户门未关闭(front_door_contact StateValue=False 后无 True),直到20:46才确认门关闭上锁。这段时间老人在家中活动,属于正常情况,但长时间未关门值得关注。\",\n \"推理步骤3: 厨房温度传感器异常——灶具三次使用(05:58-06:22、11:01-11:37、16:57-17:25),每次开火后约30秒传感器即报告 MeasuredValue=None,关火后约1分钟再次报告 None,随后在下一个整点/半点周期才恢复正常数值。这说明传感器在灶具工作时持续失效。\",\n \"推理步骤4: 传感器失效的安全隐患——厨房温度传感器是火灾预警链的重要一环,如果灶具使用时传感器无法提供温度读数,系统将无法通过温度异常升高来提前发现干烧、油锅过热等危险情况,只能依赖烟雾报警器作为最后防线。对独居老人而言,这增加了厨房火灾风险。\",\n \"推理步骤5: 温度趋势正常——全天温度随自然昼夜变化,夜间约22-23°C,午间峰值约25.8°C,各房间温差合理(卧室略低于客厅和厨房),无异常高温或低温。\",\n \"推理步骤6: 其他设备状态正常——漏水传感器无报警,烟雾报警器无触发,窗户传感器无异常开合,空调未使用(夏初温度尚可),所有运动传感器与老人活动轨迹一致。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue=None(05:59、06:23、11:02、11:38、16:58、17:26),共6次异常读数\",\n \"08:29回家后入户门传感器显示 StateValue=False(门开),直到20:46才记录 StateValue=True(门关),期间约12小时门可能未完全关闭\",\n \"烟雾报警器全天未触发,说明尚未发生实际火灾事件,但传感器故障削弱了预警能力\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——当前传感器可能因安装位置过于靠近灶具而受高温干扰,建议将其移至远离灶具但仍能监测厨房整体温度的位置,或更换耐高温型号\",\n \"确认入户门传感器工作状态——检查 front_door_contact 传感器是否准确反映门的开关状态,排除传感器本身故障的可能;如果老人确实习惯白天不关门,建议设置长时间未关门的提醒\",\n \"为厨房灶具增加自动关火保护——考虑到独居老人的安全,建议配置灶具超时自动关闭规则(如连续使用超过30分钟未操作则提醒或关闭),降低忘记关火的风险\",\n \"确保烟雾报警器定期自检——在温度传感器不可靠的情况下,烟雾报警器是厨房安全的最后防线,应确认其电池电量和功能正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致火灾预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:37起床,05:45洗漱,05:58做早餐,06:52出门,08:29回家,12:21午休,14:10起床,16:57做晚餐,20:28洗漱,20:46就寝,符合独居老人的典型日常规律。", "推理步骤2: 入侵排查——全天仅有两次开门记录(06:52出门、08:29回家),门锁均为手动开锁后自动上锁,且08:29回家时入户门未关闭(front_door_contact StateValue=False 后无 True),直到20:46才确认门关闭上锁。这段时间老人在家中活动,属于正常情况,但长时间未关门值得关注。", "推理步骤3: 厨房温度传感器异常——灶具三次使用(05:58-06:22、11:01-11:37、16:57-17:25),每次开火后约30秒传感器即报告 MeasuredValue=None,关火后约1分钟再次报告 None,随后在下一个整点/半点周期才恢复正常数值。这说明传感器在灶具工作时持续失效。", "推理步骤4: 传感器失效的安全隐患——厨房温度传感器是火灾预警链的重要一环,如果灶具使用时传感器无法提供温度读数,系统将无法通过温度异常升高来提前发现干烧、油锅过热等危险情况,只能依赖烟雾报警器作为最后防线。对独居老人而言,这增加了厨房火灾风险。", "推理步骤5: 温度趋势正常——全天温度随自然昼夜变化,夜间约22-23°C,午间峰值约25.8°C,各房间温差合理(卧室略低于客厅和厨房),无异常高温或低温。", "推理步骤6: 其他设备状态正常——漏水传感器无报警,烟雾报警器无触发,窗户传感器无异常开合,空调未使用(夏初温度尚可),所有运动传感器与老人活动轨迹一致。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue=None(05:59、06:23、11:02、11:38、16:58、17:26),共6次异常读数", "08:29回家后入户门传感器显示 StateValue=False(门开),直到20:46才记录 StateValue=True(门关),期间约12小时门可能未完全关闭", "烟雾报警器全天未触发,说明尚未发生实际火灾事件,但传感器故障削弱了预警能力"], "recommended_actions": ["检查或更换厨房温度传感器——当前传感器可能因安装位置过于靠近灶具而受高温干扰,建议将其移至远离灶具但仍能监测厨房整体温度的位置,或更换耐高温型号", "确认入户门传感器工作状态——检查 front_door_contact 传感器是否准确反映门的开关状态,排除传感器本身故障的可能;如果老人确实习惯白天不关门,建议设置长时间未关门的提醒", "为厨房灶具增加自动关火保护——考虑到独居老人的安全,建议配置灶具超时自动关闭规则(如连续使用超过30分钟未操作则提醒或关闭),降低忘记关火的风险", "确保烟雾报警器定期自检——在温度传感器不可靠的情况下,烟雾报警器是厨房安全的最后防线,应确认其电池电量和功能正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.998905897140503, "api_error": null} {"episode_id": "SQ4_TP_D_0752", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0752.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261381, "scenario_id": "EL-03", "total_events": 210, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "EL-03", "scenario_name": "忘记关火", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unattended_cooking_elderly", "key_evidence": ["灶具开着 + 厨房无人 + 老人在其他房间", "跟 FG-01 类似但在老人场景下更危险(认知衰退风险更高)"], "expected_response": "立即语音提醒老人关火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-14T10:39:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时存在一次异常高温读数(31.95°C),需排查传感器健康状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了 6 次 MeasuredValue = None 的记录(05:57、06:31、10:59、11:28、17:05、17:21),每次都发生在灶具开启或关闭前后。正常传感器不应频繁丢失读数,这可能是传感器受热干扰、通信链路不稳定或设备本身故障。\",\n \"推理步骤2: 在 10:59 的日志中,厨房温度传感器先报告 None,随后立即报告 MeasuredValue = 3195(即 31.95°C),而同一时段客厅和卧室温度分别约为 25.5°C 和 24.5°C。虽然灶具使用会导致厨房局部升温,但传感器从 None 跳变到异常高值的模式不正常,可能是传感器数据抖动或采样错误。\",\n \"推理步骤3: 老人的日常活动模式本身是正常的——05:28 起床、05:49 如厕、05:56 做早餐、06:51 出门、08:37 回家、12:27 午休、14:07 起床、17:04 做晚餐、20:37 就寝,符合独居老人的典型作息规律。\",\n \"推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件,排除入侵风险。06:51 出门后门自动上锁,08:37 回家手动开锁,逻辑合理。\",\n \"推理步骤5: 20:37 出现了一条门锁确认关闭和门传感器确认关闭的日志,但此时老人已在卧室准备就寝,说明这是自动检查/确认门已锁好的状态,属于正常安全行为。\",\n \"推理步骤6: 灶具使用时间合理(早餐约 34 分钟、午餐约 28 分钟、晚餐约 16 分钟),且每次使用后均正常关闭,烟雾报警器全天无触发,排除火灾风险。\",\n \"推理步骤7: 全天温度趋势合理——夜间约 22-23°C,午间峰值约 25-26°C,符合夏季自然温度变化。漏水传感器全天无报警,窗户传感器无异常开合。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器一天内 6 次报告 MeasuredValue = None(05:57、06:31、10:59、11:28、17:05、17:21),均与灶具操作时间高度关联\",\n \"10:59 厨房温度传感器从 None 跳变至 3195(31.95°C),比同时段其他房间高出约 7°C,且前后读数不连续\",\n \"除传感器异常外,老人作息规律正常,门锁/烟雾/漏水等安全设备全天无异常触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新定位传感器\",\n \"检查厨房温度传感器的通信链路质量和电池电量,频繁 None 值可能是设备电量不足或 Matter 网络连接不稳定\",\n \"如传感器持续出现 None 值,建议更换设备或增加一个冗余温度传感器以确保厨房温度监控不中断\",\n \"考虑为灶具设置最长连续使用时间告警(如超过 40 分钟未关闭则提醒),作为独居老人的额外安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或通信异常;同时存在一次异常高温读数(31.95°C),需排查传感器健康状态。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了 6 次 MeasuredValue = None 的记录(05:57、06:31、10:59、11:28、17:05、17:21),每次都发生在灶具开启或关闭前后。正常传感器不应频繁丢失读数,这可能是传感器受热干扰、通信链路不稳定或设备本身故障。", "推理步骤2: 在 10:59 的日志中,厨房温度传感器先报告 None,随后立即报告 MeasuredValue = 3195(即 31.95°C),而同一时段客厅和卧室温度分别约为 25.5°C 和 24.5°C。虽然灶具使用会导致厨房局部升温,但传感器从 None 跳变到异常高值的模式不正常,可能是传感器数据抖动或采样错误。", "推理步骤3: 老人的日常活动模式本身是正常的——05:28 起床、05:49 如厕、05:56 做早餐、06:51 出门、08:37 回家、12:27 午休、14:07 起床、17:04 做晚餐、20:37 就寝,符合独居老人的典型作息规律。", "推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件,排除入侵风险。06:51 出门后门自动上锁,08:37 回家手动开锁,逻辑合理。", "推理步骤5: 20:37 出现了一条门锁确认关闭和门传感器确认关闭的日志,但此时老人已在卧室准备就寝,说明这是自动检查/确认门已锁好的状态,属于正常安全行为。", "推理步骤6: 灶具使用时间合理(早餐约 34 分钟、午餐约 28 分钟、晚餐约 16 分钟),且每次使用后均正常关闭,烟雾报警器全天无触发,排除火灾风险。", "推理步骤7: 全天温度趋势合理——夜间约 22-23°C,午间峰值约 25-26°C,符合夏季自然温度变化。漏水传感器全天无报警,窗户传感器无异常开合。"], "key_evidence": ["厨房温度传感器一天内 6 次报告 MeasuredValue = None(05:57、06:31、10:59、11:28、17:05、17:21),均与灶具操作时间高度关联", "10:59 厨房温度传感器从 None 跳变至 3195(31.95°C),比同时段其他房间高出约 7°C,且前后读数不连续", "除传感器异常外,老人作息规律正常,门锁/烟雾/漏水等安全设备全天无异常触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,必要时重新定位传感器", "检查厨房温度传感器的通信链路质量和电池电量,频繁 None 值可能是设备电量不足或 Matter 网络连接不稳定", "如传感器持续出现 None 值,建议更换设备或增加一个冗余温度传感器以确保厨房温度监控不中断", "考虑为灶具设置最长连续使用时间告警(如超过 40 分钟未关闭则提醒),作为独居老人的额外安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.93225622177124, "api_error": null} {"episode_id": "SQ4_TP_D_0756", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0756.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-19T00:00:00", "seed": 20261385, "scenario_id": "BA-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-19T16:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时凌晨 2:30 出现异常活动且入户门在老人外出后长时间未锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None(05:59、06:33、11:03、11:38、17:01、17:30),共计6次。灶具工作时恰恰是最需要温度监控的时段,传感器此时失效意味着无法及时发现厨房过热或火灾隐患。这对独居老人尤其危险。\",\n \"推理步骤2: 凌晨 02:30-02:40 出现一组异常活动——客厅、厨房、玄关依次检测到人体存在,客厅灯和厨房灯被打开。对于独居老人来说,凌晨 2:30 起床并在多个房间活动可能是正常的(如起夜、喝水),但也需要关注是否为身体不适导致的异常起夜。值得注意的是这些灯在之后没有关闭记录直到早晨,说明老人可能忘记关灯或身体不适后未返回。\",\n \"推理步骤3: 08:37 入户门被手动解锁、门被打开,但之后没有关门(front_door_contact 未恢复为 True)和重新上锁的记录,直到 20:47 才出现门关闭和自动上锁。这意味着入户门可能从早上 8:37 到晚上 20:47 处于未锁甚至未关状态长达约12小时。对独居老人住宅而言,这是明显的安全隐患。\",\n \"推理步骤4: 老人的整体作息模式基本正常——05:37 起床、三餐规律做饭(06:00/11:00/17:00)、12:32 午休拉窗帘、20:47 就寝。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.7°C)。烟雾报警器和漏水传感器全天无报警,说明没有火灾或漏水事件。\",\n \"推理步骤5: 综合来看,最主要的风险是厨房温度传感器在灶具使用时反复失效(设备故障),以及入户门长时间未锁(安全隐患)。凌晨异常活动需持续观察但单次不构成高威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(05:59、06:33、11:03、11:38、17:01、17:30),表明传感器在高温监控关键时段失效\",\n \"08:37 入户门手动解锁并打开(front_door_contact = False),但直到 20:47 才记录到门关闭(StateValue = True)和自动上锁(LockState = 1),中间约12小时无关门/上锁记录\",\n \"凌晨 02:30-02:40 客厅、厨房、玄关依次检测到活动并开灯,独居老人深夜多房间活动属异常模式\",\n \"06:51 老人首次外出时门正常开关锁(8秒内完成),但 08:37 第二次开门后缺少关门记录,两次行为不一致\"\n ],\n \"recommended_actions\": [\n \"立即检修或更换厨房温度传感器(kitchen_temp_sensor),确保灶具使用期间温度监控正常工作,这是独居老人厨房安全的关键防线\",\n \"为入户门锁配置「长时间未锁定」自动提醒规则,例如门解锁超过5分钟未重新上锁时向紧急联系人发送通知\",\n \"关注凌晨异常活动模式,如连续多日出现凌晨 2-3 点起床活动,建议通知家属或社区关怀人员了解老人健康状况\",\n \"建议为厨房灶具增加「无人看管自动关闭」规则——当厨房运动传感器超过一定时间无人且灶具仍开启时自动断气/断电并报警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险;同时凌晨 2:30 出现异常活动且入户门在老人外出后长时间未锁。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None(05:59、06:33、11:03、11:38、17:01、17:30),共计6次。灶具工作时恰恰是最需要温度监控的时段,传感器此时失效意味着无法及时发现厨房过热或火灾隐患。这对独居老人尤其危险。", "推理步骤2: 凌晨 02:30-02:40 出现一组异常活动——客厅、厨房、玄关依次检测到人体存在,客厅灯和厨房灯被打开。对于独居老人来说,凌晨 2:30 起床并在多个房间活动可能是正常的(如起夜、喝水),但也需要关注是否为身体不适导致的异常起夜。值得注意的是这些灯在之后没有关闭记录直到早晨,说明老人可能忘记关灯或身体不适后未返回。", "推理步骤3: 08:37 入户门被手动解锁、门被打开,但之后没有关门(front_door_contact 未恢复为 True)和重新上锁的记录,直到 20:47 才出现门关闭和自动上锁。这意味着入户门可能从早上 8:37 到晚上 20:47 处于未锁甚至未关状态长达约12小时。对独居老人住宅而言,这是明显的安全隐患。", "推理步骤4: 老人的整体作息模式基本正常——05:37 起床、三餐规律做饭(06:00/11:00/17:00)、12:32 午休拉窗帘、20:47 就寝。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.7°C)。烟雾报警器和漏水传感器全天无报警,说明没有火灾或漏水事件。", "推理步骤5: 综合来看,最主要的风险是厨房温度传感器在灶具使用时反复失效(设备故障),以及入户门长时间未锁(安全隐患)。凌晨异常活动需持续观察但单次不构成高威胁。"], "key_evidence": ["厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(05:59、06:33、11:03、11:38、17:01、17:30),表明传感器在高温监控关键时段失效", "08:37 入户门手动解锁并打开(front_door_contact = False),但直到 20:47 才记录到门关闭(StateValue = True)和自动上锁(LockState = 1),中间约12小时无关门/上锁记录", "凌晨 02:30-02:40 客厅、厨房、玄关依次检测到活动并开灯,独居老人深夜多房间活动属异常模式", "06:51 老人首次外出时门正常开关锁(8秒内完成),但 08:37 第二次开门后缺少关门记录,两次行为不一致"], "recommended_actions": ["立即检修或更换厨房温度传感器(kitchen_temp_sensor),确保灶具使用期间温度监控正常工作,这是独居老人厨房安全的关键防线", "为入户门锁配置「长时间未锁定」自动提醒规则,例如门解锁超过5分钟未重新上锁时向紧急联系人发送通知", "关注凌晨异常活动模式,如连续多日出现凌晨 2-3 点起床活动,建议通知家属或社区关怀人员了解老人健康状况", "建议为厨房灶具增加「无人看管自动关闭」规则——当厨房运动传感器超过一定时间无人且灶具仍开启时自动断气/断电并报警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.223581790924072, "api_error": null} {"episode_id": "SQ4_TP_D_0757", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0757.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261386, "scenario_id": "EL-04", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-04", "scenario_name": "起床时间异常推迟", "category": "elderly_specific", "is_anomaly": true, "threat_type": "abnormal_inactivity", "key_evidence": ["与老人的日常作息规律(daily_routines 中的 elderly 画像)显著偏离", "不是周末睡懒觉(老人每天作息一样)", "全屋完全无活动信号"], "expected_response": "上午8点后联系老人确认状况", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-03T11:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时老人外出期间入户门未上锁约1.5小时,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约1分钟内(05:51、11:00、16:52)以及灶具关闭后约1分钟内(06:22、11:30、17:23)均报告 MeasuredValue = None,三次使用灶具均复现此问题,说明这不是偶发故障,而是传感器在灶具工作前后的系统性失效。\",\n \"推理步骤2: 厨房温度传感器是厨房安全的重要一环,与烟雾报警器配合可检测火灾风险。如果传感器在烹饪(最需要温度监控的时段)期间失效,一旦发生灶具过热或火灾,系统将无法通过温度异常及时预警,对独居老人尤其危险。\",\n \"推理步骤3: 老人 07:02 手动开锁出门,门在6秒后关闭并自动上锁,这是正常的。但 08:32 老人回家时手动开锁进门后,日志中没有门关闭(StateValue=True)和自动上锁的记录,直到 20:48 才出现门锁关闭和上锁事件。这意味着入户门可能在 08:32 至 20:48 之间长时间处于未锁定状态(约12小时),对独居老人存在入侵风险。\",\n \"推理步骤4: 老人的日常作息模式正常——05:39起床、05:42洗漱、05:50做早餐、07:02外出、08:32回家、10:59做午餐、12:25午休、14:07起床、16:51做晚餐、20:36洗漱、20:48就寝,活动节奏合理,未发现健康异常信号。\",\n \"推理步骤5: 温度数据整体合理,夜间约22°C,午间峰值约25.8°C,符合6月初的气温规律。卧室始终比客厅/厨房低约1°C,符合朝向或窗帘遮挡的预期。无烟雾报警、无漏水报警触发,无入侵迹象。\",\n \"推理步骤6: 19:36 客厅灯亮度被调至 CurrentLevel=32(约12.5%),这是老人傍晚看电视或休息时的低亮度使用,属于正常行为。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 None 值(05:51、06:22、11:00、11:30、16:52、17:23),共6次异常读数,100%与灶具开关操作关联\",\n \"08:32 老人回家开锁进门后,日志中缺少 front_door_contact StateValue=True(门关闭)和自动上锁记录,直到 20:48:15 才出现门关闭和上锁事件,门可能长时间未锁\",\n \"烟雾报警器和漏水传感器全天无触发,排除火灾和水灾风险\",\n \"老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,未出现长时间无活动的异常间隔\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:该传感器在灶具使用时系统性失效,可能是受高温干扰或硬件老化,建议将传感器安装位置远离灶具热源,或更换耐高温型号\",\n \"检查入户门锁和门磁传感器:确认 08:32 回家后门是否确实未关闭/未上锁,排查门磁传感器是否漏报事件,必要时校准或更换\",\n \"为入户门设置「长时间未锁定」自动提醒规则:如门锁处于解锁状态超过5分钟且无人在玄关,自动发送通知给老人或家属\",\n \"建议为厨房灶具设置烹饪超时自动关闭规则(如超过30分钟未手动操作则关闭),作为温度传感器失效期间的安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效;同时老人外出期间入户门未上锁约1.5小时,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约1分钟内(05:51、11:00、16:52)以及灶具关闭后约1分钟内(06:22、11:30、17:23)均报告 MeasuredValue = None,三次使用灶具均复现此问题,说明这不是偶发故障,而是传感器在灶具工作前后的系统性失效。", "推理步骤2: 厨房温度传感器是厨房安全的重要一环,与烟雾报警器配合可检测火灾风险。如果传感器在烹饪(最需要温度监控的时段)期间失效,一旦发生灶具过热或火灾,系统将无法通过温度异常及时预警,对独居老人尤其危险。", "推理步骤3: 老人 07:02 手动开锁出门,门在6秒后关闭并自动上锁,这是正常的。但 08:32 老人回家时手动开锁进门后,日志中没有门关闭(StateValue=True)和自动上锁的记录,直到 20:48 才出现门锁关闭和上锁事件。这意味着入户门可能在 08:32 至 20:48 之间长时间处于未锁定状态(约12小时),对独居老人存在入侵风险。", "推理步骤4: 老人的日常作息模式正常——05:39起床、05:42洗漱、05:50做早餐、07:02外出、08:32回家、10:59做午餐、12:25午休、14:07起床、16:51做晚餐、20:36洗漱、20:48就寝,活动节奏合理,未发现健康异常信号。", "推理步骤5: 温度数据整体合理,夜间约22°C,午间峰值约25.8°C,符合6月初的气温规律。卧室始终比客厅/厨房低约1°C,符合朝向或窗帘遮挡的预期。无烟雾报警、无漏水报警触发,无入侵迹象。", "推理步骤6: 19:36 客厅灯亮度被调至 CurrentLevel=32(约12.5%),这是老人傍晚看电视或休息时的低亮度使用,属于正常行为。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 None 值(05:51、06:22、11:00、11:30、16:52、17:23),共6次异常读数,100%与灶具开关操作关联", "08:32 老人回家开锁进门后,日志中缺少 front_door_contact StateValue=True(门关闭)和自动上锁记录,直到 20:48:15 才出现门关闭和上锁事件,门可能长时间未锁", "烟雾报警器和漏水传感器全天无触发,排除火灾和水灾风险", "老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,未出现长时间无活动的异常间隔"], "recommended_actions": ["检修或更换厨房温度传感器:该传感器在灶具使用时系统性失效,可能是受高温干扰或硬件老化,建议将传感器安装位置远离灶具热源,或更换耐高温型号", "检查入户门锁和门磁传感器:确认 08:32 回家后门是否确实未关闭/未上锁,排查门磁传感器是否漏报事件,必要时校准或更换", "为入户门设置「长时间未锁定」自动提醒规则:如门锁处于解锁状态超过5分钟且无人在玄关,自动发送通知给老人或家属", "建议为厨房灶具设置烹饪超时自动关闭规则(如超过30分钟未手动操作则关闭),作为温度传感器失效期间的安全兜底"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.87081217765808, "api_error": null} {"episode_id": "SQ4_TP_D_0763", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0763.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261392, "scenario_id": "BA-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-29T06:01:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨2:30-2:40有异常活动迹象:客厅、厨房、玄关依次触发运动和灯光,但卧室无人离开记录,且入户门未开启,疑似有人在屋内活动或设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 独居老人正常作息下,凌晨0:00-5:30期间卧室运动传感器无任何触发,说明住户一直在卧室睡觉。\",\n \"推理步骤2: 但在02:30-02:40期间,客厅运动传感器(02:30)、厨房运动传感器(02:32)、客厅灯(02:35)、厨房灯(02:37)、玄关运动传感器(02:40)依次被触发,呈现从客厅→厨房→玄关的移动轨迹。\",\n \"推理步骤3: 卧室运动传感器直到05:37才首次触发,说明住户在02:30时段并未起床。这段活动不是住户本人产生的。\",\n \"推理步骤4: 入户门传感器和门锁在该时段无任何开锁/开门记录,排除了有人从正门进入的可能,但不排除窗户或其他途径进入(客厅窗户传感器无报告不代表未被绕过)。\",\n \"推理步骤5: 另一种可能是宠物或传感器误触发,但三个不同房间的传感器在10分钟内依次触发,且灯也被打开(灯的开启可能是联动自动化),模式较为规律,不像随机误报。\",\n \"推理步骤6: 附带发现——厨房温度传感器在灶具使用期间多次报告 None 值,属于设备故障/干扰问题,但不构成安全威胁。\"\n ],\n \"key_evidence\": [\n \"02:30 客厅运动传感器触发、02:32 厨房运动传感器触发、02:35 客厅灯开启、02:37 厨房灯开启、02:40 玄关运动传感器触发\",\n \"卧室运动传感器在00:00-05:37期间无任何触发记录,住户未起床\",\n \"入户门锁和门传感器在该时段无开启记录\",\n \"厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(设备故障)\"\n ],\n \"recommended_actions\": [\n \"立即查看该时段的摄像头录像(如有),确认是否有陌生人进入\",\n \"检查客厅和厨房窗户是否有被撬开或未关闭的痕迹\",\n \"检查是否存在自动化规则在凌晨误触发灯光和传感器的可能\",\n \"建议为窗户加装接触传感器报警联动,并在玄关/客厅增设摄像头\",\n \"安排维修或更换厨房温度传感器,解决灶具使用时读数丢失的问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "凌晨2:30-2:40有异常活动迹象:客厅、厨房、玄关依次触发运动和灯光,但卧室无人离开记录,且入户门未开启,疑似有人在屋内活动或设备异常。", "reasoning": ["推理步骤1: 独居老人正常作息下,凌晨0:00-5:30期间卧室运动传感器无任何触发,说明住户一直在卧室睡觉。", "推理步骤2: 但在02:30-02:40期间,客厅运动传感器(02:30)、厨房运动传感器(02:32)、客厅灯(02:35)、厨房灯(02:37)、玄关运动传感器(02:40)依次被触发,呈现从客厅→厨房→玄关的移动轨迹。", "推理步骤3: 卧室运动传感器直到05:37才首次触发,说明住户在02:30时段并未起床。这段活动不是住户本人产生的。", "推理步骤4: 入户门传感器和门锁在该时段无任何开锁/开门记录,排除了有人从正门进入的可能,但不排除窗户或其他途径进入(客厅窗户传感器无报告不代表未被绕过)。", "推理步骤5: 另一种可能是宠物或传感器误触发,但三个不同房间的传感器在10分钟内依次触发,且灯也被打开(灯的开启可能是联动自动化),模式较为规律,不像随机误报。", "推理步骤6: 附带发现——厨房温度传感器在灶具使用期间多次报告 None 值,属于设备故障/干扰问题,但不构成安全威胁。"], "key_evidence": ["02:30 客厅运动传感器触发、02:32 厨房运动传感器触发、02:35 客厅灯开启、02:37 厨房灯开启、02:40 玄关运动传感器触发", "卧室运动传感器在00:00-05:37期间无任何触发记录,住户未起床", "入户门锁和门传感器在该时段无开启记录", "厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(设备故障)"], "recommended_actions": ["立即查看该时段的摄像头录像(如有),确认是否有陌生人进入", "检查客厅和厨房窗户是否有被撬开或未关闭的痕迹", "检查是否存在自动化规则在凌晨误触发灯光和传感器的可能", "建议为窗户加装接触传感器报警联动,并在玄关/客厅增设摄像头", "安排维修或更换厨房温度传感器,解决灶具使用时读数丢失的问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.001811504364014, "api_error": null} {"episode_id": "SQ4_TP_D_0769", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0769.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-25T00:00:00", "seed": 20261398, "scenario_id": "EL-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "EL-01", "scenario_name": "卫生间疑似跌倒", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall", "key_evidence": ["老人进入卫生间(灯开+运动触发)", "运动传感器因PIR超时归零(人倒在地上不动),但灯仍开着", "随后30分钟+全屋完全无活动", "卫生间是老人跌倒高发区域(地滑)", "跟正常午睡的区别:午睡在卧室且会先关灯"], "expected_response": "中等紧急度警报,尝试通过语音/通知联系老人,如无回应建议联系紧急联系人", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-25T20:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒~1分钟内,MeasuredValue 变为 None(05:58、06:28、11:01、11:37、16:56、17:30),共出现6次。这表明传感器在灶具工作产生热量时反复失效或超量程。\",\n \"推理步骤2: 该 None 值并非网络断连——同一时刻客厅和卧室温度传感器正常上报数据,且厨房传感器在灶具关闭、温度回落后又能恢复正常读数,说明问题与灶具使用时的高温环境直接相关。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用(最需要监测的时段)时恰好失效,一旦发生干烧或油温过高,系统将无法通过温度异常触发预警,形成监控盲区。\",\n \"推理步骤4: 除传感器问题外,老人整体生活作息正常——05:34起床、07:07外出、08:22回家、12:23午休、14:05起床、20:38就寝,门锁开关和运动传感器的时序合理,无入侵迹象。\",\n \"推理步骤5: 入户门在08:22开锁进入后直到20:38才确认上锁(LockState=1),中间约12小时门锁状态未明确记录为已锁,但考虑到老人在家活动且无异常运动事件,这属于低风险观察点。\",\n \"推理步骤6: 20:57卫生间出现一次极短暂的占用(5秒内从占用变为无人),可能是传感器误触发或老人短暂经过,结合之后无进一步异常,不构成健康威胁信号。\",\n \"推理步骤7: 全天温度曲线呈正常的日间升温、夜间降温趋势(卧室约22.0°C~24.8°C,客厅约22.9°C~25.9°C),未出现异常高温,烟雾报警器全天无触发,无漏水报警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(05:58、06:28、11:01、11:37、16:56、17:30),每次均与 kitchen_cook_surface 开关时间高度关联\",\n \"同时段客厅和卧室温度传感器数据正常,排除全局网络故障\",\n \"灶具关闭后厨房传感器均能恢复正常读数,说明故障与高温环境触发有关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或热损坏,必要时重新定位或更换耐高温型号\",\n \"在传感器修复前,建议将厨房烟雾报警器灵敏度适当提高,作为灶具使用期间的替代安全保障\",\n \"考虑为灶具增加自动关火定时功能(如超过30分钟未操作自动断气/断电),降低独居老人忘关灶具的风险\",\n \"确认入户门锁的自动上锁策略是否正常生效,建议设置老人在家时门锁自动落锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒~1分钟内,MeasuredValue 变为 None(05:58、06:28、11:01、11:37、16:56、17:30),共出现6次。这表明传感器在灶具工作产生热量时反复失效或超量程。", "推理步骤2: 该 None 值并非网络断连——同一时刻客厅和卧室温度传感器正常上报数据,且厨房传感器在灶具关闭、温度回落后又能恢复正常读数,说明问题与灶具使用时的高温环境直接相关。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用(最需要监测的时段)时恰好失效,一旦发生干烧或油温过高,系统将无法通过温度异常触发预警,形成监控盲区。", "推理步骤4: 除传感器问题外,老人整体生活作息正常——05:34起床、07:07外出、08:22回家、12:23午休、14:05起床、20:38就寝,门锁开关和运动传感器的时序合理,无入侵迹象。", "推理步骤5: 入户门在08:22开锁进入后直到20:38才确认上锁(LockState=1),中间约12小时门锁状态未明确记录为已锁,但考虑到老人在家活动且无异常运动事件,这属于低风险观察点。", "推理步骤6: 20:57卫生间出现一次极短暂的占用(5秒内从占用变为无人),可能是传感器误触发或老人短暂经过,结合之后无进一步异常,不构成健康威胁信号。", "推理步骤7: 全天温度曲线呈正常的日间升温、夜间降温趋势(卧室约22.0°C~24.8°C,客厅约22.9°C~25.9°C),未出现异常高温,烟雾报警器全天无触发,无漏水报警。"], "key_evidence": ["厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(05:58、06:28、11:01、11:37、16:56、17:30),每次均与 kitchen_cook_surface 开关时间高度关联", "同时段客厅和卧室温度传感器数据正常,排除全局网络故障", "灶具关闭后厨房传感器均能恢复正常读数,说明故障与高温环境触发有关"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超出测量量程或热损坏,必要时重新定位或更换耐高温型号", "在传感器修复前,建议将厨房烟雾报警器灵敏度适当提高,作为灶具使用期间的替代安全保障", "考虑为灶具增加自动关火定时功能(如超过30分钟未操作自动断气/断电),降低独居老人忘关灶具的风险", "确认入户门锁的自动上锁策略是否正常生效,建议设置老人在家时门锁自动落锁"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.659530639648438, "api_error": null} {"episode_id": "SQ4_TP_D_0771", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0771.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20261400, "scenario_id": "INS-01", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-01T01:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具开启期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒)连续出现 MeasuredValue = None 的情况,分别发生在 05:54、06:33、10:51、16:57、17:30 共5次。这表明传感器在灶具工作时反复失效。\",\n \"推理步骤2: 灶具开启正是最需要温度监控的时刻——如果灶具引发过热或火灾,温度传感器恰好处于失效状态,将无法触发预警。对于独居老人家庭,这是一个严重的安全盲区。\",\n \"推理步骤3: 凌晨 01:19 卧室窗户传感器报告 StateValue=False(窗户打开),随后卧室和厨房运动传感器被触发。考虑到这是独居老人,凌晨1点起夜去厨房属于可解释行为(起夜喝水等),且未触发入户门或其他入侵指标,判断为正常活动。\",\n \"推理步骤4: 08:24 入户门解锁开门后未再关门(未见 front_door_contact StateValue=True 的关门记录),直到 20:48 才出现 StateValue=True。这意味着入户门可能从早上8:24到晚上20:48处于未关闭状态长达约12小时,对独居老人存在安全隐患。\",\n \"推理步骤5: 老人的整体作息模式基本正常——05:34起床、05:48洗漱、05:53做早餐、06:52出门、08:24回家、12:29午休、14:02起床、16:56做晚餐、20:38洗漱、20:48就寝。生活规律合理,未发现长时间无活动的健康异常信号。\",\n \"推理步骤6: 温度数据整体呈现正常的昼夜变化曲线(夜间约22°C,午间峰值约25.9°C),各房间温差合理,无异常高温或骤变,排除火灾和暖通设备故障。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间5次报告 MeasuredValue = None(05:54、06:33、10:51、16:57、17:30),传感器在最需要监控的时刻失效\",\n \"入户门在 08:24 解锁开门后,直到 20:48 才记录到关门状态(StateValue=True),期间约12小时可能处于未关闭状态\",\n \"凌晨 01:19 卧室窗户打开并伴随卧室和厨房运动检测,但无入侵相关证据(门锁未被操作、玄关无触发)\"\n ],\n \"recommended_actions\": [\n \"尽快检修或更换厨房温度传感器,排查是否因灶具热辐射或蒸汽导致传感器间歇性故障\",\n \"在厨房温度传感器修复前,建议设置灶具使用时长自动提醒或超时自动关闭规则,防止无监控状态下的过热风险\",\n \"配置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免独居老人忘记关门带来的安全风险\",\n \"建议为厨房烟雾报警器设置定期自检,作为温度传感器失效时的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具开启期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/过热无法被及时检测。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(约30秒)连续出现 MeasuredValue = None 的情况,分别发生在 05:54、06:33、10:51、16:57、17:30 共5次。这表明传感器在灶具工作时反复失效。", "推理步骤2: 灶具开启正是最需要温度监控的时刻——如果灶具引发过热或火灾,温度传感器恰好处于失效状态,将无法触发预警。对于独居老人家庭,这是一个严重的安全盲区。", "推理步骤3: 凌晨 01:19 卧室窗户传感器报告 StateValue=False(窗户打开),随后卧室和厨房运动传感器被触发。考虑到这是独居老人,凌晨1点起夜去厨房属于可解释行为(起夜喝水等),且未触发入户门或其他入侵指标,判断为正常活动。", "推理步骤4: 08:24 入户门解锁开门后未再关门(未见 front_door_contact StateValue=True 的关门记录),直到 20:48 才出现 StateValue=True。这意味着入户门可能从早上8:24到晚上20:48处于未关闭状态长达约12小时,对独居老人存在安全隐患。", "推理步骤5: 老人的整体作息模式基本正常——05:34起床、05:48洗漱、05:53做早餐、06:52出门、08:24回家、12:29午休、14:02起床、16:56做晚餐、20:38洗漱、20:48就寝。生活规律合理,未发现长时间无活动的健康异常信号。", "推理步骤6: 温度数据整体呈现正常的昼夜变化曲线(夜间约22°C,午间峰值约25.9°C),各房间温差合理,无异常高温或骤变,排除火灾和暖通设备故障。"], "key_evidence": ["厨房温度传感器在灶具开启期间5次报告 MeasuredValue = None(05:54、06:33、10:51、16:57、17:30),传感器在最需要监控的时刻失效", "入户门在 08:24 解锁开门后,直到 20:48 才记录到关门状态(StateValue=True),期间约12小时可能处于未关闭状态", "凌晨 01:19 卧室窗户打开并伴随卧室和厨房运动检测,但无入侵相关证据(门锁未被操作、玄关无触发)"], "recommended_actions": ["尽快检修或更换厨房温度传感器,排查是否因灶具热辐射或蒸汽导致传感器间歇性故障", "在厨房温度传感器修复前,建议设置灶具使用时长自动提醒或超时自动关闭规则,防止无监控状态下的过热风险", "配置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免独居老人忘记关门带来的安全风险", "建议为厨房烟雾报警器设置定期自检,作为温度传感器失效时的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.671514987945557, "api_error": null} {"episode_id": "SQ4_TP_D_0785", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0785.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-01T00:00:00", "seed": 20261414, "scenario_id": "INS-02", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T08:49:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"08:49 入户门锁遭受连续4次错误解锁尝试并触发强制入侵报警,住户已外出,存在非法入侵风险。\",\n \"reasoning\": [\n \"推理步骤1: 老人于 07:09 手动开锁出门(LockOperationType=1 解锁, OperationSource=Manual),门传感器短暂开关后自动上锁,符合外出行为。\",\n \"推理步骤2: 08:29 老人回家,手动开锁进入,客厅运动传感器和灯光随即触发,确认住户在家。\",\n \"推理步骤3: 08:49:00 至 08:49:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1 表示凭证无效,OperationSource=3 表示远程/外部来源),间隔仅 10-15 秒,呈现典型的暴力尝试解锁模式。\",\n \"推理步骤4: 08:49:50 门锁触发 DoorLockAlarm(AlarmCode=3),AlarmCode=3 对应\"强制入侵报警\"(Force Door Open / Wrong Code Entry Limit),说明门锁自身已判定为入侵威胁。\",\n \"推理步骤5: 此时住户已在家(08:29 回家后客厅有活动),外部仍有人反复尝试错误凭证开锁,排除住户自身操作失误的可能性。\",\n \"推理步骤6: 附带发现——厨房温度传感器在灶具开关前后多次报告 MeasuredValue=None(05:57、06:32、10:58、11:39、16:55、17:21),属于设备故障,传感器在灶具使用期间无法正常读数,存在安全监测盲区。\"\n ],\n \"key_evidence\": [\n \"08:49:00-08:49:40 连续 4 次 LockOperationError(OperationError=1, OperationSource=3),凭证无效且来源为外部\",\n \"08:49:50 触发 DoorLockAlarm(AlarmCode=3) 强制入侵报警\",\n \"08:29 住户已回家在室内,排除自身误操作\",\n \"厨房温度传感器多次报告 None 值,存在设备故障\"\n ],\n \"recommended_actions\": [\n \"立即确认住户安全状况,通过紧急联系人或语音设备联系老人\",\n \"检查入户门锁及门口监控录像,确认 08:49 时段是否有可疑人员\",\n \"如无法确认安全,立即通知社区安保或报警\",\n \"检查门锁远程访问权限,排查是否有未授权的凭证或被泄露的密码/PIN码\",\n \"考虑临时禁用远程解锁功能,仅保留物理钥匙和手动操作\",\n \"尽快检修或更换厨房温度传感器,消除灶具使用期间的监测盲区,对独居老人的用火安全至关重要\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"08:49 入户门锁遭受连续4次错误解锁尝试并触发强制入侵报警,住户已外出,存在非法入侵风险。\",\n \"reasoning\": [\n \"推理步骤1: 老人于 07:09 手动开锁出门(LockOperationType=1 解锁, OperationSource=Manual),门传感器短暂开关后自动上锁,符合外出行为。\",\n \"推理步骤2: 08:29 老人回家,手动开锁进入,客厅运动传感器和灯光随即触发,确认住户在家。\",\n \"推理步骤3: 08:49:00 至 08:49:40 期间,入户门锁连续产生 4 次 LockOperationError(OperationError=1 表示凭证无效,OperationSource=3 表示远程/外部来源),间隔仅 10-15 秒,呈现典型的暴力尝试解锁模式。\",\n \"推理步骤4: 08:"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 23.260384798049927, "api_error": null} {"episode_id": "SQ4_TP_D_0784", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0784.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261413, "scenario_id": "EL-03", "total_events": 210, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "EL-03", "scenario_name": "忘记关火", "category": "elderly_specific", "is_anomaly": true, "threat_type": "unattended_cooking_elderly", "key_evidence": ["灶具开着 + 厨房无人 + 老人在其他房间", "跟 FG-01 类似但在老人场景下更危险(认知衰退风险更高)"], "expected_response": "立即语音提醒老人关火", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-28T03:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨3:55灶具在无人看管状态下持续运行,且厨房温度传感器多次报告None值,存在火灾隐患和设备故障双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨03:55厨房灶具开启,03:55有人体存在,但04:05人离开厨房进入客厅,灶具仍保持开启状态。04:15灶具仍报告OnOff=True,此时厨房温度飙升至30.86°C(MeasuredValue=3086),远高于同期其他房间的约22°C,说明灶具在无人看管下持续加热。\",\n \"推理步骤2: 凌晨3:55开灶的时间极为异常。独居老人在凌晨近4点使用灶具,可能是睡眠障碍、意识模糊或认知问题的表现,且离开厨房后忘记关灶,进一步印证这一判断。\",\n \"推理步骤3: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:59、06:36、10:57、11:41、17:05、17:35),共出现6次。这不是正常的温度读数,表明传感器可能因高温或故障导致读数丢失,设备健康状态存疑。\",\n \"推理步骤4: 04:15的温度尖峰(30.86°C)之后,04:30厨房温度回落至23.02°C,说明灶具可能在04:15至04:30之间被自动关闭或温度传感器读数异常。但日志中没有灶具关闭的记录,直到06:35才记录到灶具关闭,意味着灶具可能从03:55持续运行到06:35,长达约2小时40分钟。\",\n \"推理步骤5: 08:30老人回家后入户门未关闭——日志显示front_door_contact=False(门开),之后没有记录门关闭,直到20:52才出现StateValue=True(门关闭)。入户门在白天长时间处于开启状态,对独居老人存在安全隐患。\",\n \"推理步骤6: 整体生活模式基本正常:早起(05:28)、三餐做饭、午休(12:30-13:51)、晚间就寝(20:52),但凌晨异常用灶和传感器故障是需要重点关注的问题。\"\n ],\n \"key_evidence\": [\n \"03:55灶具开启 → 04:05人离开厨房 → 灶具无人看管持续运行至06:35,长达约2小时40分钟\",\n \"04:15厨房温度飙升至30.86°C(3086),远超正常室温\",\n \"厨房温度传感器在灶具使用期间6次报告MeasuredValue=None,疑似设备故障\",\n \"凌晨3:55使用灶具属于极度异常的时间点,独居老人可能存在认知或睡眠问题\",\n \"08:30入户门开启后直到20:52才关闭,白天长时间门户大开\"\n ],\n \"recommended_actions\": [\n \"立即检修厨房温度传感器,排查多次报告None值的故障原因,确保火灾预警能力正常\",\n \"为厨房灶具设置无人看管自动关闭规则:当厨房运动传感器超过10分钟无人时,自动关闭灶具并发送告警\",\n \"关注老人凌晨异常活动模式,建议家属或护理人员了解老人近期睡眠和认知状况,必要时就医评估\",\n \"设置入户门长时间未关闭告警(如超过15分钟),防止安全隐患\",\n \"建议在厨房烟雾报警器基础上增加燃气泄漏检测器,提升厨房安全冗余\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨3:55灶具在无人看管状态下持续运行,且厨房温度传感器多次报告None值,存在火灾隐患和设备故障双重风险。", "reasoning": ["推理步骤1: 凌晨03:55厨房灶具开启,03:55有人体存在,但04:05人离开厨房进入客厅,灶具仍保持开启状态。04:15灶具仍报告OnOff=True,此时厨房温度飙升至30.86°C(MeasuredValue=3086),远高于同期其他房间的约22°C,说明灶具在无人看管下持续加热。", "推理步骤2: 凌晨3:55开灶的时间极为异常。独居老人在凌晨近4点使用灶具,可能是睡眠障碍、意识模糊或认知问题的表现,且离开厨房后忘记关灶,进一步印证这一判断。", "推理步骤3: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(05:59、06:36、10:57、11:41、17:05、17:35),共出现6次。这不是正常的温度读数,表明传感器可能因高温或故障导致读数丢失,设备健康状态存疑。", "推理步骤4: 04:15的温度尖峰(30.86°C)之后,04:30厨房温度回落至23.02°C,说明灶具可能在04:15至04:30之间被自动关闭或温度传感器读数异常。但日志中没有灶具关闭的记录,直到06:35才记录到灶具关闭,意味着灶具可能从03:55持续运行到06:35,长达约2小时40分钟。", "推理步骤5: 08:30老人回家后入户门未关闭——日志显示front_door_contact=False(门开),之后没有记录门关闭,直到20:52才出现StateValue=True(门关闭)。入户门在白天长时间处于开启状态,对独居老人存在安全隐患。", "推理步骤6: 整体生活模式基本正常:早起(05:28)、三餐做饭、午休(12:30-13:51)、晚间就寝(20:52),但凌晨异常用灶和传感器故障是需要重点关注的问题。"], "key_evidence": ["03:55灶具开启 → 04:05人离开厨房 → 灶具无人看管持续运行至06:35,长达约2小时40分钟", "04:15厨房温度飙升至30.86°C(3086),远超正常室温", "厨房温度传感器在灶具使用期间6次报告MeasuredValue=None,疑似设备故障", "凌晨3:55使用灶具属于极度异常的时间点,独居老人可能存在认知或睡眠问题", "08:30入户门开启后直到20:52才关闭,白天长时间门户大开"], "recommended_actions": ["立即检修厨房温度传感器,排查多次报告None值的故障原因,确保火灾预警能力正常", "为厨房灶具设置无人看管自动关闭规则:当厨房运动传感器超过10分钟无人时,自动关闭灶具并发送告警", "关注老人凌晨异常活动模式,建议家属或护理人员了解老人近期睡眠和认知状况,必要时就医评估", "设置入户门长时间未关闭告警(如超过15分钟),防止安全隐患", "建议在厨房烟雾报警器基础上增加燃气泄漏检测器,提升厨房安全冗余"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.18360733985901, "api_error": null} {"episode_id": "SQ4_TP_D_0787", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0787.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261416, "scenario_id": "BA-03", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "BA-03", "scenario_name": "异常高频设备交互", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "abnormal_device_interaction", "key_evidence": ["1分钟内多次灯光开关", "可能原因:智能家居系统被入侵/远程控制;设备自动化规则冲突;或电路问题", "也可能是恐慌信号(住户通过反复开关灯试图引起注意)"], "expected_response": "通知住户检查是否有人误操作或系统异常", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-21T04:57:00", "variant": "TP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;凌晨灯光快速反复开关疑似电气异常;入户门在外出后长时间未锁(08:34开门后至20:54才确认上锁)。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:06、06:29、10:57、11:35、16:55、17:21),共出现6次。虽然灶具工作时高温可能导致传感器超量程,但 None 值意味着传感器未能返回有效读数,这可能是传感器故障或通信中断,对独居老人的厨房安全监控构成隐患。\",\n \"推理步骤2: 04:57 时段客厅灯在10秒内快速开关3次(True→False→True→False→True),卧室灯也出现短暂开关。此时为凌晨近5点,无运动传感器触发记录。这种快速闪烁模式可能是电气线路不稳定、智能开关故障,或老人夜间起身误触,但缺少对应的运动传感器事件令人关注。\",\n \"推理步骤3: 08:34 入户门被手动解锁并打开(LockOperationType=1, StateValue=False),之后无关门和上锁记录,直到 20:54 才出现门锁上锁事件。这意味着入户门可能在整个白天处于未锁定状态。对独居老人而言,这是一个安全隐患。\",\n \"推理步骤4: 老人的整体生活作息基本正常——05:34起床、06:05如厕后做早餐、06:58出门(晨练)、08:34回家、12:21午休、14:05起床、16:54做晚餐、20:26洗漱、20:54就寝。三餐规律,活动轨迹连贯,未发现长时间无活动的健康异常信号。\",\n \"推理步骤5: 温度数据整体正常,呈现夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),各房间温度协调一致,无异常高温或火灾迹象。门锁、窗户、漏水传感器、烟雾报警器均未触发告警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:06、06:29、10:57、11:35、16:55、17:21共6次报告 MeasuredValue = None,均与灶具使用时段重合\",\n \"04:57:00-04:57:10 客厅灯在10秒内开关3次,04:57:12-04:57:14 卧室灯短暂开关,期间无运动传感器触发\",\n \"08:34 入户门手动解锁开门后,无关门上锁记录,直到20:54才自动上锁,中间约12小时门锁状态不明\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温导致超量程或传感器本身故障,必要时更换耐高温型号或调整安装位置\",\n \"排查凌晨04:57客厅灯和卧室灯快速闪烁的原因,检查智能开关固件版本、电气线路稳定性,排除电气安全隐患\",\n \"为入户门锁配置「开门未锁定超时提醒」规则,例如门锁解锁超过5分钟未重新上锁时,向老人或家属手机推送提醒\",\n \"考虑为独居老人增加跌倒检测或紧急呼叫设备,提升夜间和卫生间等高风险区域的安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;凌晨灯光快速反复开关疑似电气异常;入户门在外出后长时间未锁(08:34开门后至20:54才确认上锁)。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:06、06:29、10:57、11:35、16:55、17:21),共出现6次。虽然灶具工作时高温可能导致传感器超量程,但 None 值意味着传感器未能返回有效读数,这可能是传感器故障或通信中断,对独居老人的厨房安全监控构成隐患。", "推理步骤2: 04:57 时段客厅灯在10秒内快速开关3次(True→False→True→False→True),卧室灯也出现短暂开关。此时为凌晨近5点,无运动传感器触发记录。这种快速闪烁模式可能是电气线路不稳定、智能开关故障,或老人夜间起身误触,但缺少对应的运动传感器事件令人关注。", "推理步骤3: 08:34 入户门被手动解锁并打开(LockOperationType=1, StateValue=False),之后无关门和上锁记录,直到 20:54 才出现门锁上锁事件。这意味着入户门可能在整个白天处于未锁定状态。对独居老人而言,这是一个安全隐患。", "推理步骤4: 老人的整体生活作息基本正常——05:34起床、06:05如厕后做早餐、06:58出门(晨练)、08:34回家、12:21午休、14:05起床、16:54做晚餐、20:26洗漱、20:54就寝。三餐规律,活动轨迹连贯,未发现长时间无活动的健康异常信号。", "推理步骤5: 温度数据整体正常,呈现夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),各房间温度协调一致,无异常高温或火灾迹象。门锁、窗户、漏水传感器、烟雾报警器均未触发告警。"], "key_evidence": ["厨房温度传感器在06:06、06:29、10:57、11:35、16:55、17:21共6次报告 MeasuredValue = None,均与灶具使用时段重合", "04:57:00-04:57:10 客厅灯在10秒内开关3次,04:57:12-04:57:14 卧室灯短暂开关,期间无运动传感器触发", "08:34 入户门手动解锁开门后,无关门上锁记录,直到20:54才自动上锁,中间约12小时门锁状态不明"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的工作状态,确认是否因灶具高温导致超量程或传感器本身故障,必要时更换耐高温型号或调整安装位置", "排查凌晨04:57客厅灯和卧室灯快速闪烁的原因,检查智能开关固件版本、电气线路稳定性,排除电气安全隐患", "为入户门锁配置「开门未锁定超时提醒」规则,例如门锁解锁超过5分钟未重新上锁时,向老人或家属手机推送提醒", "考虑为独居老人增加跌倒检测或紧急呼叫设备,提升夜间和卫生间等高风险区域的安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.19743776321411, "api_error": null} {"episode_id": "SQ4_TP_D_0788", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0788.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261417, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-29T16:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现严重故障:灶具使用期间持续报告 null 值,且 6月30日起完全停止正常上报,仅以固定值 2350 重复输出,丧失真实监测能力,对独居老人构成安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间(06:08-06:33、11:08-11:40、17:07-17:33)均报告 MeasuredValue = None,说明传感器在高温环境下无法正常采集数据,可能存在硬件故障或量程溢出问题。\",\n \"推理步骤2: 在 6月29日正常周期上报中,kitchen_temp_sensor 同时出现两种格式的数据——'TemperatureMeasurement.MeasuredValue' 和不带 Cluster 前缀的 'MeasuredValue'(08:00、12:00、18:00、22:00),后者数值始终偏低约 60-100 个单位,疑似传感器固件异常导致双重上报或数据通道混乱。\",\n \"推理步骤3: 从 6月30日 08:00 起,厨房温度传感器完全停止了正常的 TemperatureMeasurement.MeasuredValue 上报,仅剩异常格式的 'MeasuredValue = 2350' 以固定值重复出现(6/30 四次、7/1 两次),数值完全不随时间和环境变化,明确表明传感器已卡死或离线,输出的是缓存/默认值而非实测数据。\",\n \"推理步骤4: 客厅和卧室温度传感器在 6月30日及之后也完全没有数据上报,结合厨房传感器的异常,可能存在网络网关故障或系统级问题,但厨房传感器的固定值输出是最危险的——它给出了'看似正常'的假数据,可能掩盖真实的高温或火灾风险。\",\n \"推理步骤5: 对于独居老人家庭,厨房是火灾高发区域。温度传感器失效意味着灶具忘关、油温过高等危险情况无法被及时检测和报警,烟雾报警器虽然存在但属于最后一道防线,温度异常的早期预警能力已经丧失。\",\n \"推理步骤6: 6月29日的日常行为模式本身是正常的——老人 05:39 起床、三餐规律做饭、12:32 午休、20:37 就寝、门锁正常使用且自动上锁,入户门在外出和回家时状态一致,无入侵迹象。但设备层面的故障是真实且严重的。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间三次报告 None(06:09、11:09、17:08),灶具关闭后一分钟再次报告 None(06:34、11:41、17:34),高温场景下完全失效\",\n \"6月30日起 kitchen_temp_sensor 仅输出固定值 MeasuredValue=2350(不带 TemperatureMeasurement Cluster 前缀),连续 6 次读数完全相同,不随昼夜温度变化,确认传感器已卡死\",\n \"6月29日出现双重上报现象:08:00 同时上报 2455 和 2350、12:00 同时上报 2575 和 2510、18:00 同时上报 2459 和 2400、22:00 同时上报 2350 和 2280,格式和数值均不一致\",\n \"6月30日和7月1日客厅、卧室温度传感器无任何数据上报,整个温度监测体系可能已部分瘫痪\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器硬件状态,尝试重启或重新配网,若无法恢复则尽快更换\",\n \"检查智能家居网关/Hub 的运行状态和网络连接,排查 6月30日起多个传感器停止上报的系统级原因\",\n \"在厨房温度传感器修复前,为老人设置灶具使用时长自动提醒或超时自动关闭规则,防止忘关灶具\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的替代安全保障\",\n \"考虑为独居老人增加定时健康签到机制——当所有传感器长时间无活动数据时,自动通知紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现严重故障:灶具使用期间持续报告 null 值,且 6月30日起完全停止正常上报,仅以固定值 2350 重复输出,丧失真实监测能力,对独居老人构成安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间(06:08-06:33、11:08-11:40、17:07-17:33)均报告 MeasuredValue = None,说明传感器在高温环境下无法正常采集数据,可能存在硬件故障或量程溢出问题。", "推理步骤2: 在 6月29日正常周期上报中,kitchen_temp_sensor 同时出现两种格式的数据——'TemperatureMeasurement.MeasuredValue' 和不带 Cluster 前缀的 'MeasuredValue'(08:00、12:00、18:00、22:00),后者数值始终偏低约 60-100 个单位,疑似传感器固件异常导致双重上报或数据通道混乱。", "推理步骤3: 从 6月30日 08:00 起,厨房温度传感器完全停止了正常的 TemperatureMeasurement.MeasuredValue 上报,仅剩异常格式的 'MeasuredValue = 2350' 以固定值重复出现(6/30 四次、7/1 两次),数值完全不随时间和环境变化,明确表明传感器已卡死或离线,输出的是缓存/默认值而非实测数据。", "推理步骤4: 客厅和卧室温度传感器在 6月30日及之后也完全没有数据上报,结合厨房传感器的异常,可能存在网络网关故障或系统级问题,但厨房传感器的固定值输出是最危险的——它给出了'看似正常'的假数据,可能掩盖真实的高温或火灾风险。", "推理步骤5: 对于独居老人家庭,厨房是火灾高发区域。温度传感器失效意味着灶具忘关、油温过高等危险情况无法被及时检测和报警,烟雾报警器虽然存在但属于最后一道防线,温度异常的早期预警能力已经丧失。", "推理步骤6: 6月29日的日常行为模式本身是正常的——老人 05:39 起床、三餐规律做饭、12:32 午休、20:37 就寝、门锁正常使用且自动上锁,入户门在外出和回家时状态一致,无入侵迹象。但设备层面的故障是真实且严重的。"], "key_evidence": ["厨房温度传感器在灶具运行期间三次报告 None(06:09、11:09、17:08),灶具关闭后一分钟再次报告 None(06:34、11:41、17:34),高温场景下完全失效", "6月30日起 kitchen_temp_sensor 仅输出固定值 MeasuredValue=2350(不带 TemperatureMeasurement Cluster 前缀),连续 6 次读数完全相同,不随昼夜温度变化,确认传感器已卡死", "6月29日出现双重上报现象:08:00 同时上报 2455 和 2350、12:00 同时上报 2575 和 2510、18:00 同时上报 2459 和 2400、22:00 同时上报 2350 和 2280,格式和数值均不一致", "6月30日和7月1日客厅、卧室温度传感器无任何数据上报,整个温度监测体系可能已部分瘫痪"], "recommended_actions": ["立即检查厨房温度传感器硬件状态,尝试重启或重新配网,若无法恢复则尽快更换", "检查智能家居网关/Hub 的运行状态和网络连接,排查 6月30日起多个传感器停止上报的系统级原因", "在厨房温度传感器修复前,为老人设置灶具使用时长自动提醒或超时自动关闭规则,防止忘关灶具", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的替代安全保障", "考虑为独居老人增加定时健康签到机制——当所有传感器长时间无活动数据时,自动通知紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.258874654769897, "api_error": null} {"episode_id": "SQ4_TP_D_0795", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0795.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261424, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T17:04:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在17:04至17:34期间持续三次报告漏水,且无人在卫生间活动,存在真实漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 卫生间漏水传感器在17:04、17:14、17:34连续三次报告StateValue=True,表明漏水状态持续至少30分钟未消除。\",\n \"推理步骤2: 在该时间段内,卫生间运动传感器无任何占用记录(上一次卫生间活动在06:08结束),说明无人在场发现或处理漏水。老人当时在厨房做饭(16:51灶具开启),对卫生间情况不知情。\",\n \"推理步骤3: 漏水持续30分钟且无人干预,对于独居老人家庭,可能导致地面积水引发滑倒风险,或造成楼下渗水等财产损失。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:09、06:23、11:10、11:41、16:52、17:30),属于设备故障或传感器受热干扰,虽非紧急安全威胁,但影响厨房安全监测能力。\",\n \"推理步骤5: 其余行为模式正常——老人05:29起床、06:08做早餐、07:05外出、08:29回家、12:36午休、16:51做晚餐、20:48就寝,符合独居老人的典型日常作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。温度变化符合夏季昼夜规律。\"\n ],\n \"key_evidence\": [\n \"17:04 bathroom_water_leak StateValue=True(首次报警)\",\n \"17:14 bathroom_water_leak StateValue=True(10分钟后仍在漏水)\",\n \"17:34 bathroom_water_leak StateValue=True(30分钟后漏水未消除)\",\n \"该时段卫生间无人活动(bathroom_occupancy无占用记录),老人在厨房做饭无法察觉\",\n \"厨房温度传感器在灶具使用期间多次返回None,存在设备故障隐患\"\n ],\n \"recommended_actions\": [\n \"立即通知老人或其紧急联系人:卫生间存在漏水,需尽快检查水管、水龙头及马桶等可能的漏水源\",\n \"如系统支持,远程关闭卫生间总水阀以防止漏水扩大\",\n \"安排人员检查卫生间地面积水情况,防止老人进入时滑倒\",\n \"检修厨房温度传感器:灶具开启时传感器持续返回None,可能是传感器故障或安装位置不当,影响厨房火灾预警能力\",\n \"考虑为卫生间增加自动关水阀联动功能,当漏水传感器触发时自动切断水源\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在17:04至17:34期间持续三次报告漏水,且无人在卫生间活动,存在真实漏水风险。", "reasoning": ["推理步骤1: 卫生间漏水传感器在17:04、17:14、17:34连续三次报告StateValue=True,表明漏水状态持续至少30分钟未消除。", "推理步骤2: 在该时间段内,卫生间运动传感器无任何占用记录(上一次卫生间活动在06:08结束),说明无人在场发现或处理漏水。老人当时在厨房做饭(16:51灶具开启),对卫生间情况不知情。", "推理步骤3: 漏水持续30分钟且无人干预,对于独居老人家庭,可能导致地面积水引发滑倒风险,或造成楼下渗水等财产损失。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告MeasuredValue=None(06:09、06:23、11:10、11:41、16:52、17:30),属于设备故障或传感器受热干扰,虽非紧急安全威胁,但影响厨房安全监测能力。", "推理步骤5: 其余行为模式正常——老人05:29起床、06:08做早餐、07:05外出、08:29回家、12:36午休、16:51做晚餐、20:48就寝,符合独居老人的典型日常作息。入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象。温度变化符合夏季昼夜规律。"], "key_evidence": ["17:04 bathroom_water_leak StateValue=True(首次报警)", "17:14 bathroom_water_leak StateValue=True(10分钟后仍在漏水)", "17:34 bathroom_water_leak StateValue=True(30分钟后漏水未消除)", "该时段卫生间无人活动(bathroom_occupancy无占用记录),老人在厨房做饭无法察觉", "厨房温度传感器在灶具使用期间多次返回None,存在设备故障隐患"], "recommended_actions": ["立即通知老人或其紧急联系人:卫生间存在漏水,需尽快检查水管、水龙头及马桶等可能的漏水源", "如系统支持,远程关闭卫生间总水阀以防止漏水扩大", "安排人员检查卫生间地面积水情况,防止老人进入时滑倒", "检修厨房温度传感器:灶具开启时传感器持续返回None,可能是传感器故障或安装位置不当,影响厨房火灾预警能力", "考虑为卫生间增加自动关水阀联动功能,当漏水传感器触发时自动切断水源"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.87179446220398, "api_error": null} {"episode_id": "SQ4_TP_D_0791", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0791.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261420, "scenario_id": "EL-05", "total_events": 215, "anomaly_events_count": 11}, "ground_truth": {"scenario_id": "EL-05", "scenario_name": "夜间频繁起夜", "category": "elderly_specific", "is_anomaly": true, "threat_type": "health_concern", "key_evidence": ["一晚4次以上卧室→卫生间往返", "间隔越来越短", "可能的健康问题:泌尿系统感染、前列腺问题、糖尿病等"], "expected_response": "非紧急但需要记录,建议子女/看护者关注,如连续多天则建议就医", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-22T16:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时卫生间灯在 20:35 关闭后老人长时间未离开卫生间(至日志结束仍在内),需关注健康状况。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:53、06:22、10:56、11:31、17:00、17:26),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能存在间歇性故障或超量程异常。\",\n \"推理步骤2: 每次 None 值都与灶具操作高度相关——灶具开启后约30秒至1分钟出现 None,灶具关闭后约1分钟也出现 None。这暗示灶具产生的热量或电磁干扰可能导致传感器读数异常。如果传感器在真正发生火灾时也报告 None 而非高温,将无法触发安全告警,这对独居老人是严重的安全隐患。\",\n \"推理步骤3: 20:35 卫生间灯关闭,但 20:37 卫生间再次检测到占用且灯重新打开。从 20:37 到日志结束(23:30),没有任何卫生间占用结束或灯关闭的记录,也没有其他房间的活动记录。老人在卫生间停留近3小时无任何其他活动,对于独居老人而言这是异常的,可能存在跌倒或身体不适的风险。\",\n \"推理步骤4: 20:35:15 入户门传感器报告 StateValue = True(门关闭),随后门锁自动上锁,但之前没有对应的开门(StateValue = False)记录。这可能是门未完全关好后被风吹关,或传感器状态同步延迟,属于轻微异常。\",\n \"推理步骤5: 其余活动模式基本正常——老人 05:30 起床、早餐做饭约28分钟、07:00 出门、08:24 回家、12:20 午休关窗帘、13:56 起床、三餐规律做饭、20:35 准备就寝。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.8°C)。门锁操作正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器6次报告 None 值:05:53:07、06:22:00、10:56:00、11:31:00、17:00:00、17:26:00,均与灶具开关操作时间高度关联\",\n \"20:37 卫生间占用开始、灯打开后,直到日志结束(23:30)近3小时内无任何卫生间退出记录,也无其他房间活动\",\n \"20:35:15 入户门传感器报告关闭状态(True),但缺少对应的开门事件\"\n ],\n \"recommended_actions\": [\n \"立即检查老人状况:卫生间已持续占用近3小时且无其他活动,建议通过语音设备或紧急联系人确认老人是否安全\",\n \"检修或更换厨房温度传感器:该传感器在灶具使用时反复失效,可能导致火灾预警失灵。建议将传感器安装位置远离灶具热源,或更换耐高温型号\",\n \"为卫生间设置长时间占用告警规则:考虑到独居老人跌倒风险,建议卫生间占用超过30-45分钟时自动触发提醒通知紧急联系人\",\n \"检查入户门传感器状态同步是否正常,确认门锁与门磁传感器配合工作无误\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时卫生间灯在 20:35 关闭后老人长时间未离开卫生间(至日志结束仍在内),需关注健康状况。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:53、06:22、10:56、11:31、17:00、17:26),共出现6次。正常传感器即使在高温环境下也应报告数值而非 None,这表明传感器可能存在间歇性故障或超量程异常。", "推理步骤2: 每次 None 值都与灶具操作高度相关——灶具开启后约30秒至1分钟出现 None,灶具关闭后约1分钟也出现 None。这暗示灶具产生的热量或电磁干扰可能导致传感器读数异常。如果传感器在真正发生火灾时也报告 None 而非高温,将无法触发安全告警,这对独居老人是严重的安全隐患。", "推理步骤3: 20:35 卫生间灯关闭,但 20:37 卫生间再次检测到占用且灯重新打开。从 20:37 到日志结束(23:30),没有任何卫生间占用结束或灯关闭的记录,也没有其他房间的活动记录。老人在卫生间停留近3小时无任何其他活动,对于独居老人而言这是异常的,可能存在跌倒或身体不适的风险。", "推理步骤4: 20:35:15 入户门传感器报告 StateValue = True(门关闭),随后门锁自动上锁,但之前没有对应的开门(StateValue = False)记录。这可能是门未完全关好后被风吹关,或传感器状态同步延迟,属于轻微异常。", "推理步骤5: 其余活动模式基本正常——老人 05:30 起床、早餐做饭约28分钟、07:00 出门、08:24 回家、12:20 午休关窗帘、13:56 起床、三餐规律做饭、20:35 准备就寝。温度曲线符合夏季昼夜变化规律(夜间约22°C,午间峰值约25.8°C)。门锁操作正常,无入侵迹象。"], "key_evidence": ["厨房温度传感器6次报告 None 值:05:53:07、06:22:00、10:56:00、11:31:00、17:00:00、17:26:00,均与灶具开关操作时间高度关联", "20:37 卫生间占用开始、灯打开后,直到日志结束(23:30)近3小时内无任何卫生间退出记录,也无其他房间活动", "20:35:15 入户门传感器报告关闭状态(True),但缺少对应的开门事件"], "recommended_actions": ["立即检查老人状况:卫生间已持续占用近3小时且无其他活动,建议通过语音设备或紧急联系人确认老人是否安全", "检修或更换厨房温度传感器:该传感器在灶具使用时反复失效,可能导致火灾预警失灵。建议将传感器安装位置远离灶具热源,或更换耐高温型号", "为卫生间设置长时间占用告警规则:考虑到独居老人跌倒风险,建议卫生间占用超过30-45分钟时自动触发提醒通知紧急联系人", "检查入户门传感器状态同步是否正常,确认门锁与门磁传感器配合工作无误"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.947482109069824, "api_error": null} {"episode_id": "SQ4_TP_D_0798", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0798.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261427, "scenario_id": "WD-01", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-08T06:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在06:23触发报警,且截至日志结束未见复位,同时厨房温度传感器多次报告None值存在设备异常。\",\n \"reasoning\": [\n \"推理步骤1: 06:23卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。此时老人在厨房做饭(06:00-06:39厨房有占用和灶具使用),卫生间无人(06:01:21 bathroom_occupancy=0),漏水可能未被及时发现。\",\n \"推理步骤2: 在整个日志时间范围内(06:23至23:30),未见 bathroom_water_leak 恢复为 StateValue=False 的记录,说明漏水状态持续了超过17小时未解除,这是一个严重的持续性问题。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(06:01、06:40、10:58、11:38、16:52、17:41),共出现6次。虽然可能是灶具高温导致传感器暂时超量程,但频繁出现None值也可能表明传感器存在故障或受热损坏风险,需要关注。\",\n \"推理步骤4: 老人的日常活动模式基本正常——05:40起床、三餐规律做饭(06:00/10:57/16:51)、12:23午休、07:10外出/08:29回家、20:37就寝,生活节奏健康有序,未发现健康异常迹象。\",\n \"推理步骤5: 入侵风险方面,入户门的开锁/关锁操作均为手动或自动锁定,08:29回家后门锁正常上锁,20:37就寝前确认门锁为锁定状态(LockState=1),无异常开锁事件。\",\n \"推理步骤6: 温度趋势正常,符合夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),无异常温升,烟雾报警器全天未触发,无火灾风险。\"\n ],\n \"key_evidence\": [\n \"06:23:00 bathroom_water_leak StateValue=True 且触发 StateChange 事件,全天未见复位记录,漏水持续超过17小时\",\n \"漏水发生时卫生间无人(06:01:21 bathroom_occupancy=0),老人在厨房,可能未察觉漏水\",\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None,存在传感器异常\",\n \"老人全天活动轨迹正常,三餐规律,起居有序,无健康异常信号\"\n ],\n \"recommended_actions\": [\n \"立即通知老人或其紧急联系人检查卫生间漏水情况,长时间漏水可能导致地面湿滑(跌倒风险)、财产损失及霉菌滋生\",\n \"如有智能水阀,建议远程关闭卫生间供水管路以止损\",\n \"检查卫生间漏水传感器是否正常工作,确认是真实漏水还是传感器误报(鉴于持续时间极长,真实漏水可能性大)\",\n \"安排检修厨房温度传感器,确认其在灶具使用时频繁报告None的原因,必要时更换或调整安装位置远离热源\",\n \"考虑为卫生间漏水事件设置自动化规则:漏水触发时自动推送告警并联动关闭水阀\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在06:23触发报警,且截至日志结束未见复位,同时厨房温度传感器多次报告None值存在设备异常。", "reasoning": ["推理步骤1: 06:23卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True 并触发 StateChange 事件,表明检测到漏水。此时老人在厨房做饭(06:00-06:39厨房有占用和灶具使用),卫生间无人(06:01:21 bathroom_occupancy=0),漏水可能未被及时发现。", "推理步骤2: 在整个日志时间范围内(06:23至23:30),未见 bathroom_water_leak 恢复为 StateValue=False 的记录,说明漏水状态持续了超过17小时未解除,这是一个严重的持续性问题。", "推理步骤3: 厨房温度传感器在灶具开启后多次报告 MeasuredValue=None(06:01、06:40、10:58、11:38、16:52、17:41),共出现6次。虽然可能是灶具高温导致传感器暂时超量程,但频繁出现None值也可能表明传感器存在故障或受热损坏风险,需要关注。", "推理步骤4: 老人的日常活动模式基本正常——05:40起床、三餐规律做饭(06:00/10:57/16:51)、12:23午休、07:10外出/08:29回家、20:37就寝,生活节奏健康有序,未发现健康异常迹象。", "推理步骤5: 入侵风险方面,入户门的开锁/关锁操作均为手动或自动锁定,08:29回家后门锁正常上锁,20:37就寝前确认门锁为锁定状态(LockState=1),无异常开锁事件。", "推理步骤6: 温度趋势正常,符合夏季昼夜温差规律(夜间约22°C,午间峰值约25.8°C),无异常温升,烟雾报警器全天未触发,无火灾风险。"], "key_evidence": ["06:23:00 bathroom_water_leak StateValue=True 且触发 StateChange 事件,全天未见复位记录,漏水持续超过17小时", "漏水发生时卫生间无人(06:01:21 bathroom_occupancy=0),老人在厨房,可能未察觉漏水", "厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None,存在传感器异常", "老人全天活动轨迹正常,三餐规律,起居有序,无健康异常信号"], "recommended_actions": ["立即通知老人或其紧急联系人检查卫生间漏水情况,长时间漏水可能导致地面湿滑(跌倒风险)、财产损失及霉菌滋生", "如有智能水阀,建议远程关闭卫生间供水管路以止损", "检查卫生间漏水传感器是否正常工作,确认是真实漏水还是传感器误报(鉴于持续时间极长,真实漏水可能性大)", "安排检修厨房温度传感器,确认其在灶具使用时频繁报告None的原因,必要时更换或调整安装位置远离热源", "考虑为卫生间漏水事件设置自动化规则:漏水触发时自动推送告警并联动关闭水阀"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.559802532196045, "api_error": null} {"episode_id": "SQ4_TP_D_0803", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0803.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261432, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-13T11:45:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下持续运行导致温度骤升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 11:28 灶具关闭,老人在 11:30 前后仍在厨房区域。但 11:45 灶具再次开启时,厨房运动传感器 Occupancy=0,表明厨房内无人。\",\n \"推理步骤2: 灶具无人看管持续运行,厨房温度从 11:45 开始急剧攀升——11:50 达到 2805(28.05°C),11:55 飙升至 3500(35.00°C),相比同时段客厅/卧室温度(约25-26°C)异常偏高约10°C。\",\n \"推理步骤3: 12:00 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认已产生烟雾,火灾风险成立。\",\n \"推理步骤4: 烟雾报警触发后,日志中未见灶具关闭记录(kitchen_cook_surface OnOff=False),也未见老人返回厨房处理(厨房运动传感器无 Occupancy=1 记录),直到很久之后才有厨房活动,说明老人可能未及时察觉报警。\",\n \"推理步骤5: 12:22 老人关闭客厅灯进入卧室并关闭窗帘(午休),说明老人在烟雾报警后并未前往厨房处理,可能存在听力下降或未注意到报警的健康隐患。\",\n \"推理步骤6: 附带发现——厨房温度传感器在灶具开启期间多次报告 None 值(06:02、06:40、10:51、11:29、17:03、17:32),可能存在传感器在高温环境下读数异常或故障的问题,影响温度监控的可靠性。\",\n \"推理步骤7: 入户门在 08:38 开锁后,日志中未见对应的关门(front_door_contact StateValue=True)和上锁记录,直到 20:40 才自动上锁,意味着大门可能长时间处于未锁状态,存在入侵风险。\"\n ],\n \"key_evidence\": [\n \"11:45 灶具开启(OnOff=True)时厨房运动传感器 Occupancy=0,无人看管\",\n \"11:50 厨房温度 2805(28.05°C)→ 11:55 温度 3500(35.00°C),5分钟内飙升近7°C\",\n \"12:00 厨房烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm()\",\n \"烟雾报警后未见灶具关闭记录,也未见老人返回厨房\",\n \"12:22 老人进入卧室午休,未对烟雾报警做出响应\",\n \"08:38 入户门开锁后长时间未见上锁记录,直到 20:40 才锁定\",\n \"厨房温度传感器多次报告 None 值,传感器可靠性存疑\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具,并通过语音/电话通知老人确认安全状况\",\n \"联系紧急联系人或社区工作人员上门查看老人是否安全,确认是否存在听力或认知方面的健康问题\",\n \"为灶具增加无人自动关闭规则:当厨房 Occupancy=0 超过一定时间(如5分钟)自动断电\",\n \"检修厨房温度传感器,排查多次报告 None 值的故障原因,确保温度监控可靠\",\n \"为入户门增加未锁定超时提醒,避免大门长时间处于未上锁状态\",\n \"考虑为独居老人增加烟雾报警联动方案(如自动推送通知给家属、联动语音播报、自动拨打紧急电话)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下持续运行导致温度骤升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 11:28 灶具关闭,老人在 11:30 前后仍在厨房区域。但 11:45 灶具再次开启时,厨房运动传感器 Occupancy=0,表明厨房内无人。", "推理步骤2: 灶具无人看管持续运行,厨房温度从 11:45 开始急剧攀升——11:50 达到 2805(28.05°C),11:55 飙升至 3500(35.00°C),相比同时段客厅/卧室温度(约25-26°C)异常偏高约10°C。", "推理步骤3: 12:00 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, SmokeAlarm 事件),确认已产生烟雾,火灾风险成立。", "推理步骤4: 烟雾报警触发后,日志中未见灶具关闭记录(kitchen_cook_surface OnOff=False),也未见老人返回厨房处理(厨房运动传感器无 Occupancy=1 记录),直到很久之后才有厨房活动,说明老人可能未及时察觉报警。", "推理步骤5: 12:22 老人关闭客厅灯进入卧室并关闭窗帘(午休),说明老人在烟雾报警后并未前往厨房处理,可能存在听力下降或未注意到报警的健康隐患。", "推理步骤6: 附带发现——厨房温度传感器在灶具开启期间多次报告 None 值(06:02、06:40、10:51、11:29、17:03、17:32),可能存在传感器在高温环境下读数异常或故障的问题,影响温度监控的可靠性。", "推理步骤7: 入户门在 08:38 开锁后,日志中未见对应的关门(front_door_contact StateValue=True)和上锁记录,直到 20:40 才自动上锁,意味着大门可能长时间处于未锁状态,存在入侵风险。"], "key_evidence": ["11:45 灶具开启(OnOff=True)时厨房运动传感器 Occupancy=0,无人看管", "11:50 厨房温度 2805(28.05°C)→ 11:55 温度 3500(35.00°C),5分钟内飙升近7°C", "12:00 厨房烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm()", "烟雾报警后未见灶具关闭记录,也未见老人返回厨房", "12:22 老人进入卧室午休,未对烟雾报警做出响应", "08:38 入户门开锁后长时间未见上锁记录,直到 20:40 才锁定", "厨房温度传感器多次报告 None 值,传感器可靠性存疑"], "recommended_actions": ["立即远程关闭厨房灶具,并通过语音/电话通知老人确认安全状况", "联系紧急联系人或社区工作人员上门查看老人是否安全,确认是否存在听力或认知方面的健康问题", "为灶具增加无人自动关闭规则:当厨房 Occupancy=0 超过一定时间(如5分钟)自动断电", "检修厨房温度传感器,排查多次报告 None 值的故障原因,确保温度监控可靠", "为入户门增加未锁定超时提醒,避免大门长时间处于未上锁状态", "考虑为独居老人增加烟雾报警联动方案(如自动推送通知给家属、联动语音播报、自动拨打紧急电话)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.82725191116333, "api_error": null} {"episode_id": "SQ4_TP_D_0809", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0809.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261438, "scenario_id": "BA-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "BA-01", "scenario_name": "深夜异常多房间活动", "category": "behavioral_anomaly", "is_anomaly": true, "threat_type": "suspicious_nighttime_activity", "key_evidence": ["凌晨2:30-2:40短时间内多房间连续活动", "活动轨迹:客厅→厨房→玄关(像在搜索什么)", "卧室全程无活动(住户在睡觉),这些活动不是住户产生的", "注意区分:如果卧室先有活动再到其他房间,则可能是住户起夜"], "expected_response": "高优先级入侵警报", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-28T12:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨 02:30-02:40 客厅、厨房、玄关依次检测到运动并开灯,属于独居老人夜间起夜活动,但灯光在之后数小时未关闭(客厅灯 02:35 开启,直到 12:37 才关闭),说明老人可能忘记关灯,属于轻微习惯问题。\",\n \"推理步骤2: 厨房温度传感器在三次烹饪期间(05:54、11:03、16:58)以及灶具关闭后(06:23、11:23、17:31)均报告 MeasuredValue = None。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器存在故障或超量程异常。\",\n \"推理步骤3: 厨房灶具三次使用时长分别约为 28 分钟、20 分钟、33 分钟,均在合理烹饪时长范围内,且烟雾报警器未触发,说明没有实际火灾发生,但传感器失效意味着如果真正发生过热事件将无法被及时检测。\",\n \"推理步骤4: 08:38 入户门手动开锁、有人进入客厅开灯,但门未重新关闭(无 StateValue=True 记录直到 20:39),独居老人白天外出后入户门可能长时间未锁,存在一定安全隐患。不过考虑到老人 07:08 出门后 08:38 回来,可能是短暂外出返回,门在 20:39 才确认关闭上锁。\",\n \"推理步骤5: 整体生活模式(05:30 起床、三餐烹饪、12:37 午休、20:39 就寝)符合独居老人的正常作息,无入侵迹象,无漏水报警,无烟雾报警。主要风险集中在厨房温度传感器的可靠性问题。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:54、06:23、11:03、11:23、16:58、17:31 共 6 次报告 MeasuredValue = None\",\n \"入户门在 08:38 开锁后直到 20:39 才记录到关闭上锁状态\",\n \"凌晨 02:35 客厅灯开启后持续亮到 12:37(约 10 小时)\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确保其在灶具使用时能正常测量温度,保障火灾预警能力\",\n \"建议设置入户门长时间未锁的提醒规则,防止老人外出或在家时忘记锁门\",\n \"考虑为灯光设置自动关闭规则(如无人活动超过一定时间自动熄灯),避免长时间无意义亮灯\",\n \"鉴于独居老人场景,建议为厨房灶具增加超时自动断气/断电保护,作为传感器失效时的兜底措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰,削弱了厨房火灾预警能力。", "reasoning": ["推理步骤1: 凌晨 02:30-02:40 客厅、厨房、玄关依次检测到运动并开灯,属于独居老人夜间起夜活动,但灯光在之后数小时未关闭(客厅灯 02:35 开启,直到 12:37 才关闭),说明老人可能忘记关灯,属于轻微习惯问题。", "推理步骤2: 厨房温度传感器在三次烹饪期间(05:54、11:03、16:58)以及灶具关闭后(06:23、11:23、17:31)均报告 MeasuredValue = None。正常传感器即使在高温环境下也应返回数值而非 None,这表明传感器存在故障或超量程异常。", "推理步骤3: 厨房灶具三次使用时长分别约为 28 分钟、20 分钟、33 分钟,均在合理烹饪时长范围内,且烟雾报警器未触发,说明没有实际火灾发生,但传感器失效意味着如果真正发生过热事件将无法被及时检测。", "推理步骤4: 08:38 入户门手动开锁、有人进入客厅开灯,但门未重新关闭(无 StateValue=True 记录直到 20:39),独居老人白天外出后入户门可能长时间未锁,存在一定安全隐患。不过考虑到老人 07:08 出门后 08:38 回来,可能是短暂外出返回,门在 20:39 才确认关闭上锁。", "推理步骤5: 整体生活模式(05:30 起床、三餐烹饪、12:37 午休、20:39 就寝)符合独居老人的正常作息,无入侵迹象,无漏水报警,无烟雾报警。主要风险集中在厨房温度传感器的可靠性问题。"], "key_evidence": ["厨房温度传感器在 05:54、06:23、11:03、11:23、16:58、17:31 共 6 次报告 MeasuredValue = None", "入户门在 08:38 开锁后直到 20:39 才记录到关闭上锁状态", "凌晨 02:35 客厅灯开启后持续亮到 12:37(约 10 小时)"], "recommended_actions": ["检查或更换厨房温度传感器,确保其在灶具使用时能正常测量温度,保障火灾预警能力", "建议设置入户门长时间未锁的提醒规则,防止老人外出或在家时忘记锁门", "考虑为灯光设置自动关闭规则(如无人活动超过一定时间自动熄灯),避免长时间无意义亮灯", "鉴于独居老人场景,建议为厨房灶具增加超时自动断气/断电保护,作为传感器失效时的兜底措施"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.220739603042603, "api_error": null} {"episode_id": "SQ4_TP_D_0825", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0825.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261454, "scenario_id": "EL-02", "total_events": 206, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "EL-02", "scenario_name": "居家意外(任意位置跌倒/晕倒)", "category": "elderly_specific", "is_anomaly": true, "threat_type": "possible_fall_or_medical_emergency", "key_evidence": ["最后一次运动在非卧室房间(如客厅、厨房)", "随后异常长时间无任何活动", "不在正常午睡时段(比如上午10点或下午4点)"], "expected_response": "紧急联系老人,如无应答联系紧急联系人或120", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-15T10:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:31起床、05:38如厕、06:09做早餐、07:09出门、08:21回家、12:32午休、17:05做晚餐、20:41就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入侵风险排除——全天仅两次开门事件(07:09出门、08:21回家),均为手动操作后自动上锁,门锁状态与门磁传感器一致,无异常开锁或未关门情况。08:21回家后入户门确认关闭上锁(20:41再次确认 StateValue=True, LockState=1)。\",\n \"推理步骤3: 温度趋势正常——夜间各房间约22-23°C,白天随气温升高至25-26°C,午后逐渐回落,无异常温升,不存在火灾迹象。烟雾报警器全天无触发。\",\n \"推理步骤4: 关键异常发现——厨房温度传感器在灶具开启后均报告 MeasuredValue = None(06:10、06:37、11:01、11:33、17:06、17:40),共出现6次。每次都精确发生在灶具开启或关闭后约30秒到1分钟内,说明传感器在灶具工作产生的热量环境下无法正常读数。\",\n \"推理步骤5: 该故障的安全隐患在于:厨房温度传感器是检测异常高温(如灶具忘关、油锅起火)的重要手段。如果传感器在灶具使用时恰好失效,则无法通过温度异常触发预警,对独居老人尤其危险。\",\n \"推理步骤6: 漏水传感器全天无报警,窗户传感器状态正常,客厅烟雾报警器无触发,其余设备工作正常。\",\n \"推理步骤7: 老人活动间隔合理,无长时间无活动的异常静默期(最长间隔为午休约1.5小时),不存在跌倒或健康异常的明显迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:37、11:01、11:33、17:06、17:40),每次均与灶具开关事件高度关联\",\n \"灶具每次使用时长合理(早餐约27分钟、午餐约32分钟、晚餐约34分钟),老人均在场,烟雾报警器未触发,说明实际烹饪过程安全,但传感器监控存在盲区\",\n \"其余所有设备状态正常,生活作息规律,无入侵、漏水或火灾迹象\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,受热后超出量程导致读数为 None;考虑重新定位或更换耐高温型号\",\n \"在传感器修复前,为灶具设置自动关闭定时器(如超过45分钟未手动关闭则自动断气/断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全防线\",\n \"考虑为独居老人增加灶具使用提醒功能,在灶具开启超过设定时间后通过语音或手机推送提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致火灾/高温预警失效。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:31起床、05:38如厕、06:09做早餐、07:09出门、08:21回家、12:32午休、17:05做晚餐、20:41就寝,符合独居老人的典型日常规律。", "推理步骤2: 入侵风险排除——全天仅两次开门事件(07:09出门、08:21回家),均为手动操作后自动上锁,门锁状态与门磁传感器一致,无异常开锁或未关门情况。08:21回家后入户门确认关闭上锁(20:41再次确认 StateValue=True, LockState=1)。", "推理步骤3: 温度趋势正常——夜间各房间约22-23°C,白天随气温升高至25-26°C,午后逐渐回落,无异常温升,不存在火灾迹象。烟雾报警器全天无触发。", "推理步骤4: 关键异常发现——厨房温度传感器在灶具开启后均报告 MeasuredValue = None(06:10、06:37、11:01、11:33、17:06、17:40),共出现6次。每次都精确发生在灶具开启或关闭后约30秒到1分钟内,说明传感器在灶具工作产生的热量环境下无法正常读数。", "推理步骤5: 该故障的安全隐患在于:厨房温度传感器是检测异常高温(如灶具忘关、油锅起火)的重要手段。如果传感器在灶具使用时恰好失效,则无法通过温度异常触发预警,对独居老人尤其危险。", "推理步骤6: 漏水传感器全天无报警,窗户传感器状态正常,客厅烟雾报警器无触发,其余设备工作正常。", "推理步骤7: 老人活动间隔合理,无长时间无活动的异常静默期(最长间隔为午休约1.5小时),不存在跌倒或健康异常的明显迹象。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:37、11:01、11:33、17:06、17:40),每次均与灶具开关事件高度关联", "灶具每次使用时长合理(早餐约27分钟、午餐约32分钟、晚餐约34分钟),老人均在场,烟雾报警器未触发,说明实际烹饪过程安全,但传感器监控存在盲区", "其余所有设备状态正常,生活作息规律,无入侵、漏水或火灾迹象"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具,受热后超出量程导致读数为 None;考虑重新定位或更换耐高温型号", "在传感器修复前,为灶具设置自动关闭定时器(如超过45分钟未手动关闭则自动断气/断电),作为补偿性安全措施", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用安全防线", "考虑为独居老人增加灶具使用提醒功能,在灶具开启超过设定时间后通过语音或手机推送提醒"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.299419403076172, "api_error": null} {"episode_id": "SQ4_TP_D_0832", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0832.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261461, "scenario_id": "DF-04", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-04", "scenario_name": "门锁响应异常", "category": "device_fault", "is_anomaly": true, "threat_type": "lock_malfunction", "key_evidence": ["LockDoor 命令后 LockState 未变为 Locked", "DoorLockAlarm (LockJammed) 触发", "门锁故障意味着家庭物理安全降级"], "expected_response": "通知住户门锁可能卡住/故障,建议手动检查", "difficulty": "medium", "target_room": "entrance", "injection_time": "2026-06-07T10:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时门锁出现 DoorLockAlarm 告警事件,且入户门在老人外出后长时间未上锁。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:54、06:27、11:05、11:28、17:02、17:39),共出现6次。每次都与灶具使用时间高度重合,说明传感器可能在高温环境下工作异常或存在硬件故障。对于独居老人,厨房温度监控失效意味着无法及时发现灶具引发的过热或火灾风险。\",\n \"推理步骤2: 10:43 门锁连续收到两次 LockDoor 命令,锁状态均为 LockState=2(未锁定),随后触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这说明门锁在尝试上锁时未能成功,可能是机械故障或电量不足。\",\n \"推理步骤3: 老人 07:09 出门,门锁自动上锁(LockState=1)正常。但 08:22 回家后开锁(LockState=2),入户门直到 20:43 才重新上锁(LockState=1),中间超过12小时门锁处于未锁定状态,结合 10:43 的锁定失败告警,说明门锁可能存在故障导致无法正常上锁。\",\n \"推理步骤4: 老人的日常作息模式本身正常——05:32 起床如厕、05:53 做早餐、07:09 外出、08:22 回家、12:33 午休拉窗帘、14:09 起床、17:01 做晚餐、20:29 洗漱、20:43 就寝。活动节奏合理,未发现健康异常迹象。\",\n \"推理步骤5: 温度整体趋势正常,夜间约 22°C,午间峰值约 25.7°C,符合夏季室内温度变化规律。烟雾报警器和漏水传感器全天无告警,无火灾或漏水风险。\",\n \"推理步骤6: 卧室窗帘操作合理(早晨打开、午休关闭、午后打开、就寝关闭),客厅灯亮度在傍晚调至较低值(Level=27,约10%),符合老人用眼习惯。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:54、06:27、11:05、11:28、17:02、17:39)\",\n \"10:43:05 和 10:43:15 门锁两次执行 LockDoor 命令后 LockState 仍为 2(未锁定),并触发 DoorLockAlarm(AlarmCode=0)\",\n \"08:22 开锁至 20:43 上锁,门锁未锁定状态持续超过12小时\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器读数异常或通信中断,必要时更换耐高温型号或调整安装位置远离热源\",\n \"检查入户门锁的电池电量和机械部件,排查 DoorLockAlarm 告警原因,确保门锁能正常上锁\",\n \"考虑为门锁设置自动上锁策略(如开锁后若干分钟无操作自动上锁),避免独居老人长时间忘记锁门\",\n \"在厨房温度传感器故障期间,可依赖烟雾报警器作为备用安全保障,但应尽快修复温度监控能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时门锁出现 DoorLockAlarm 告警事件,且入户门在老人外出后长时间未上锁。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:54、06:27、11:05、11:28、17:02、17:39),共出现6次。每次都与灶具使用时间高度重合,说明传感器可能在高温环境下工作异常或存在硬件故障。对于独居老人,厨房温度监控失效意味着无法及时发现灶具引发的过热或火灾风险。", "推理步骤2: 10:43 门锁连续收到两次 LockDoor 命令,锁状态均为 LockState=2(未锁定),随后触发了 DoorLockAlarm(AlarmCode=0)。AlarmCode=0 通常表示锁定失败告警。这说明门锁在尝试上锁时未能成功,可能是机械故障或电量不足。", "推理步骤3: 老人 07:09 出门,门锁自动上锁(LockState=1)正常。但 08:22 回家后开锁(LockState=2),入户门直到 20:43 才重新上锁(LockState=1),中间超过12小时门锁处于未锁定状态,结合 10:43 的锁定失败告警,说明门锁可能存在故障导致无法正常上锁。", "推理步骤4: 老人的日常作息模式本身正常——05:32 起床如厕、05:53 做早餐、07:09 外出、08:22 回家、12:33 午休拉窗帘、14:09 起床、17:01 做晚餐、20:29 洗漱、20:43 就寝。活动节奏合理,未发现健康异常迹象。", "推理步骤5: 温度整体趋势正常,夜间约 22°C,午间峰值约 25.7°C,符合夏季室内温度变化规律。烟雾报警器和漏水传感器全天无告警,无火灾或漏水风险。", "推理步骤6: 卧室窗帘操作合理(早晨打开、午休关闭、午后打开、就寝关闭),客厅灯亮度在傍晚调至较低值(Level=27,约10%),符合老人用眼习惯。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(05:54、06:27、11:05、11:28、17:02、17:39)", "10:43:05 和 10:43:15 门锁两次执行 LockDoor 命令后 LockState 仍为 2(未锁定),并触发 DoorLockAlarm(AlarmCode=0)", "08:22 开锁至 20:43 上锁,门锁未锁定状态持续超过12小时"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器读数异常或通信中断,必要时更换耐高温型号或调整安装位置远离热源", "检查入户门锁的电池电量和机械部件,排查 DoorLockAlarm 告警原因,确保门锁能正常上锁", "考虑为门锁设置自动上锁策略(如开锁后若干分钟无操作自动上锁),避免独居老人长时间忘记锁门", "在厨房温度传感器故障期间,可依赖烟雾报警器作为备用安全保障,但应尽快修复温度监控能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.748476028442383, "api_error": null} {"episode_id": "SQ4_TP_D_0838", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0838.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261467, "scenario_id": "DF-01", "total_events": 214, "anomaly_events_count": 10}, "ground_truth": {"scenario_id": "DF-01", "scenario_name": "温度传感器读数固定(stuck-at)", "category": "device_fault", "is_anomaly": true, "threat_type": "sensor_stuck_at_fault", "key_evidence": ["Day1 温度有正常的日间波动(上午偏低、中午偏高、晚间回落)", "Day2 中午开始读数完全固定在 23.50°C", "连续24小时+完全无变化,真实温度不可能如此稳定"], "expected_response": "标记传感器可能故障,建议住户检查/更换", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-29T16:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器自6月30日起停止正常报告,疑似故障或离线,且6月29日期间多次报告None值,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 6月29日厨房温度传感器在灶具使用期间(06:01、10:51、11:23、16:52、17:33)多次报告 MeasuredValue = None,说明传感器在高温环境下读数异常丢失。\",\n \"推理步骤2: 6月29日同时出现两种格式的温度上报——正常的 TemperatureMeasurement.MeasuredValue 和异常的短格式 MeasuredValue(08:00、12:00、18:00、22:00),后者数值固定为2350或偏离正常值,疑似传感器固件异常或通信故障。\",\n \"推理步骤3: 从6月30日08:00起,厨房温度传感器仅以短格式 MeasuredValue = 2350 上报,且数值完全不变(6月30日4次、7月1日2次均为2350),不再有正常的 TemperatureMeasurement.MeasuredValue 报告。这表明传感器已卡死在固定值或已实质离线。\",\n \"推理步骤4: 同期(6月30日至7月1日)整个家庭无任何其他设备活动日志——无运动传感器触发、无灯光变化、无门锁操作,这对独居老人来说极不正常,可能意味着日志采集系统也存在问题,或老人不在家中。\",\n \"推理步骤5: 厨房是独居老人使用灶具的高风险区域,温度传感器失效意味着无法及时检测到过热或火灾隐患,安全监控存在盲区。\"\n ],\n \"key_evidence\": [\n \"6月30日至7月1日厨房温度传感器仅报告固定值 MeasuredValue = 2350,不再有正常 Cluster.Attribute 格式的温度数据\",\n \"6月29日灶具使用期间传感器多次报告 None 值,说明传感器在关键时刻无法正常工作\",\n \"6月30日起全屋无任何运动、灯光、门锁等活动日志,独居老人家庭连续超过24小时无活动迹象异常\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器状态,确认是否需要更换电池或重新配对设备\",\n \"联系老人或其紧急联系人,确认老人是否安全(6月30日起无任何居家活动迹象)\",\n \"检查智能家居网关/Hub的连接状态,排除系统级日志采集故障\",\n \"在传感器恢复前,建议老人避免无人看管使用灶具,或临时增加厨房烟雾报警器的灵敏度\",\n \"考虑为厨房增加冗余温度监测设备,避免单点故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器自6月30日起停止正常报告,疑似故障或离线,且6月29日期间多次报告None值,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 6月29日厨房温度传感器在灶具使用期间(06:01、10:51、11:23、16:52、17:33)多次报告 MeasuredValue = None,说明传感器在高温环境下读数异常丢失。", "推理步骤2: 6月29日同时出现两种格式的温度上报——正常的 TemperatureMeasurement.MeasuredValue 和异常的短格式 MeasuredValue(08:00、12:00、18:00、22:00),后者数值固定为2350或偏离正常值,疑似传感器固件异常或通信故障。", "推理步骤3: 从6月30日08:00起,厨房温度传感器仅以短格式 MeasuredValue = 2350 上报,且数值完全不变(6月30日4次、7月1日2次均为2350),不再有正常的 TemperatureMeasurement.MeasuredValue 报告。这表明传感器已卡死在固定值或已实质离线。", "推理步骤4: 同期(6月30日至7月1日)整个家庭无任何其他设备活动日志——无运动传感器触发、无灯光变化、无门锁操作,这对独居老人来说极不正常,可能意味着日志采集系统也存在问题,或老人不在家中。", "推理步骤5: 厨房是独居老人使用灶具的高风险区域,温度传感器失效意味着无法及时检测到过热或火灾隐患,安全监控存在盲区。"], "key_evidence": ["6月30日至7月1日厨房温度传感器仅报告固定值 MeasuredValue = 2350,不再有正常 Cluster.Attribute 格式的温度数据", "6月29日灶具使用期间传感器多次报告 None 值,说明传感器在关键时刻无法正常工作", "6月30日起全屋无任何运动、灯光、门锁等活动日志,独居老人家庭连续超过24小时无活动迹象异常"], "recommended_actions": ["立即检查厨房温度传感器状态,确认是否需要更换电池或重新配对设备", "联系老人或其紧急联系人,确认老人是否安全(6月30日起无任何居家活动迹象)", "检查智能家居网关/Hub的连接状态,排除系统级日志采集故障", "在传感器恢复前,建议老人避免无人看管使用灶具,或临时增加厨房烟雾报警器的灵敏度", "考虑为厨房增加冗余温度监测设备,避免单点故障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.19447946548462, "api_error": null} {"episode_id": "SQ4_TP_D_0842", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0842.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-04T00:00:00", "seed": 20261471, "scenario_id": "DF-06", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-06", "scenario_name": "窗帘电机卡住", "category": "device_fault", "is_anomaly": true, "threat_type": "actuator_stuck", "key_evidence": ["OperationalStatus 显示正在移动(closing)", "但 CurrentPositionLiftPercent100ths 数值长时间不变", "状态 vs 实际位置不一致"], "expected_response": "", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-04T20:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且客厅窗帘关闭指令后未完成到位(OperationalStatus 持续为运动中状态)。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后立即报告 MeasuredValue = None(05:58、06:38、11:05、11:24、17:09、17:32),共出现6次。这表明传感器在高温环境下可能存在读数溢出或通信故障。\",\n \"推理步骤2: 客厅窗帘在 20:46 收到 DownOrClose 指令后,OperationalStatus 持续为 0b000010(正在关闭),在 20:46:30 时位置仅到 50%,之后 20:47 仍在运动中,但日志中再无该设备的最终停止状态报告,可能存在窗帘卡住或电机故障。\",\n \"推理步骤3: 老人的日常作息模式正常——早起(05:23)、如厕、做早餐、出门(06:58)、回家(08:37)、午休(12:39-13:51)、做晚餐、睡前(20:49),活动轨迹连贯合理,无入侵或健康异常迹象。\",\n \"推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁;门锁在出门和回家后均正常自动上锁。\",\n \"推理步骤5: 温度整体趋势符合夏季日间升温、夜间降温的自然规律,无异常高温突变,烟雾报警器未触发,排除火灾风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None,传感器可能在高温下失效\",\n \"客厅窗帘 20:46 开始关闭,20:47 仍处于运动状态(OperationalStatus=0b000010),未见最终停止确认,可能卡住\",\n \"08:37 老人回家后入户门未关闭(front_door_contact 未报告 StateValue=True),直到 20:49 才出现门关闭状态确认,期间门可能处于未关状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,考虑更换耐高温型号或调整安装位置\",\n \"检查客厅窗帘电机及导轨是否存在卡阻,确认窗帘是否已正常关闭到位\",\n \"确认入户门在 08:37 回家后是否确实处于关闭状态,排查门磁传感器是否漏报,必要时提醒老人关门\",\n \"建议为厨房温度传感器设置离线/异常值告警,确保灶具使用期间仍有有效的温度监控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且客厅窗帘关闭指令后未完成到位(OperationalStatus 持续为运动中状态)。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后立即报告 MeasuredValue = None(05:58、06:38、11:05、11:24、17:09、17:32),共出现6次。这表明传感器在高温环境下可能存在读数溢出或通信故障。", "推理步骤2: 客厅窗帘在 20:46 收到 DownOrClose 指令后,OperationalStatus 持续为 0b000010(正在关闭),在 20:46:30 时位置仅到 50%,之后 20:47 仍在运动中,但日志中再无该设备的最终停止状态报告,可能存在窗帘卡住或电机故障。", "推理步骤3: 老人的日常作息模式正常——早起(05:23)、如厕、做早餐、出门(06:58)、回家(08:37)、午休(12:39-13:51)、做晚餐、睡前(20:49),活动轨迹连贯合理,无入侵或健康异常迹象。", "推理步骤4: 入户门的开锁/上锁操作均为 Manual 或 Auto 来源,无异常远程解锁;门锁在出门和回家后均正常自动上锁。", "推理步骤5: 温度整体趋势符合夏季日间升温、夜间降温的自然规律,无异常高温突变,烟雾报警器未触发,排除火灾风险。"], "key_evidence": ["厨房温度传感器在灶具运行期间6次报告 MeasuredValue = None,传感器可能在高温下失效", "客厅窗帘 20:46 开始关闭,20:47 仍处于运动状态(OperationalStatus=0b000010),未见最终停止确认,可能卡住", "08:37 老人回家后入户门未关闭(front_door_contact 未报告 StateValue=True),直到 20:49 才出现门关闭状态确认,期间门可能处于未关状态"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,考虑更换耐高温型号或调整安装位置", "检查客厅窗帘电机及导轨是否存在卡阻,确认窗帘是否已正常关闭到位", "确认入户门在 08:37 回家后是否确实处于关闭状态,排查门磁传感器是否漏报,必要时提醒老人关门", "建议为厨房温度传感器设置离线/异常值告警,确保灶具使用期间仍有有效的温度监控"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.809381008148193, "api_error": null} {"episode_id": "SQ4_TP_D_0844", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0844.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261473, "scenario_id": "FG-01", "total_events": 211, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-13T19:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:29 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),这与当天早、中、晚三次正常做饭时灶具开启均伴随 Occupancy=1 的模式完全不同。\",\n \"推理步骤2: 19:30 客厅运动传感器检测到老人在客厅(living_room_occupancy=1),且客厅灯被调暗至 Level=12,说明老人此时在客厅休息,并不在厨房。灶具在无人看管的情况下运行。\",\n \"推理步骤3: 厨房温度在 5 分钟内从正常的约 24.25°C(2425)飙升至 29.82°C(2982),再过 5 分钟升至 35.00°C(3500),升温速率远超正常烹饪时的温度变化(正常做饭期间厨房温度传感器甚至报告 None,说明被灶具热量干扰,但关火后迅速恢复正常值)。\",\n \"推理步骤4: 19:44 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认已产生烟雾,火灾风险成立。\",\n \"推理步骤5: 日志中未见灶具关闭记录(之前三次做饭均有明确的 OnOff=False 记录),也未见老人进入厨房处理的迹象,说明灶具可能持续处于开启状态直到烟雾报警后才被处理。\",\n \"推理步骤6: 额外关注——厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:10、06:24、10:55、11:25、16:54、17:26),这一反复出现的异常可能表明传感器在高温环境下存在故障或量程溢出问题,削弱了温度监控的可靠性。\"\n ],\n \"key_evidence\": [\n \"19:29 灶具开启时厨房 Occupancy=0(无人),而老人在客厅(living_room_occupancy=1)\",\n \"厨房温度 5 分钟内从 2425 飙升至 2982,10 分钟内升至 3500(约 35°C),升幅超过 10°C\",\n \"19:44 烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm\",\n \"灶具开启后日志中无对应的关闭记录(OnOff=False),与当天其他三次正常烹饪模式不一致\",\n \"厨房温度传感器在灶具使用期间多次报告 None,传感器可靠性存疑\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),并确认灶具已断电\",\n \"紧急联系老人确认其人身安全,若无法联系应通知紧急联系人或拨打 119\",\n \"检查厨房是否有明火或持续冒烟,必要时启动消防应急预案\",\n \"为灶具增加「无人自动关闭」安全规则:当厨房 Occupancy=0 超过 2 分钟时自动关闭灶具\",\n \"排查厨房温度传感器多次报告 None 的故障原因,必要时更换传感器以确保温度监控可靠\",\n \"考虑为独居老人安装灶具定时自动断电装置,作为额外的物理安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 19:29 厨房灶具开启(kitchen_cook_surface OnOff=True),但同一时刻厨房运动传感器显示无人(Occupancy=0),这与当天早、中、晚三次正常做饭时灶具开启均伴随 Occupancy=1 的模式完全不同。", "推理步骤2: 19:30 客厅运动传感器检测到老人在客厅(living_room_occupancy=1),且客厅灯被调暗至 Level=12,说明老人此时在客厅休息,并不在厨房。灶具在无人看管的情况下运行。", "推理步骤3: 厨房温度在 5 分钟内从正常的约 24.25°C(2425)飙升至 29.82°C(2982),再过 5 分钟升至 35.00°C(3500),升温速率远超正常烹饪时的温度变化(正常做饭期间厨房温度传感器甚至报告 None,说明被灶具热量干扰,但关火后迅速恢复正常值)。", "推理步骤4: 19:44 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认已产生烟雾,火灾风险成立。", "推理步骤5: 日志中未见灶具关闭记录(之前三次做饭均有明确的 OnOff=False 记录),也未见老人进入厨房处理的迹象,说明灶具可能持续处于开启状态直到烟雾报警后才被处理。", "推理步骤6: 额外关注——厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:10、06:24、10:55、11:25、16:54、17:26),这一反复出现的异常可能表明传感器在高温环境下存在故障或量程溢出问题,削弱了温度监控的可靠性。"], "key_evidence": ["19:29 灶具开启时厨房 Occupancy=0(无人),而老人在客厅(living_room_occupancy=1)", "厨房温度 5 分钟内从 2425 飙升至 2982,10 分钟内升至 3500(约 35°C),升幅超过 10°C", "19:44 烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm", "灶具开启后日志中无对应的关闭记录(OnOff=False),与当天其他三次正常烹饪模式不一致", "厨房温度传感器在灶具使用期间多次报告 None,传感器可靠性存疑"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),并确认灶具已断电", "紧急联系老人确认其人身安全,若无法联系应通知紧急联系人或拨打 119", "检查厨房是否有明火或持续冒烟,必要时启动消防应急预案", "为灶具增加「无人自动关闭」安全规则:当厨房 Occupancy=0 超过 2 分钟时自动关闭灶具", "排查厨房温度传感器多次报告 None 的故障原因,必要时更换传感器以确保温度监控可靠", "考虑为独居老人安装灶具定时自动断电装置,作为额外的物理安全保障"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.136927127838135, "api_error": null} {"episode_id": "SQ5_FP_A_1115", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1115.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261744, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "bedroom", "injection_time": "2026-06-18T19:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次数据丢失(None),疑似传感器故障;同时存在一次来源不明的门锁解锁事件。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2475(24.75°C)跳升至 2859(28.59°C),升幅近 4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋环境变化的可能。\",\n \"推理步骤2: 18:30 厨房温度仍高达 2851,但此时灶具尚未开启(灶具 18:46 才打开),说明这次高温读数并非烹饪导致,属于传感器异常。\",\n \"推理步骤3: 18:47 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集中断或硬件故障。19:00 恢复后读数回归正常范围(2425),进一步印证前面的高温是传感器异常而非真实环境温度。\",\n \"推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险,支持传感器故障的判断而非真实高温。\",\n \"推理步骤5: 19:22 入户门锁被解锁,事件显示 OperationSource=3(远程/网络操作)且 UserIndex=5。住户当时已在家中(18:20 已回家),需要确认 UserIndex=5 是否为已授权用户。若非已知用户,则存在未授权远程开锁的入侵风险。\",\n \"推理步骤6: 19:22 解锁后未见 front_door_contact 状态变化(门未被打开),且客厅运动传感器持续检测到有人,没有出现异常的多区域运动模式,因此实际入侵的可能性较低,但仍需核实。\",\n \"推理步骤7: 其余设备行为均符合正常生活模式——早晨起床、出门上班、傍晚回家、做饭、睡觉,温度曲线符合夏季昼夜变化规律,门锁自动上锁正常,无漏水报警。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 2475 骤升至 2859(+3.84°C),此时灶具未开启,客厅/卧室温度正常下降\",\n \"18:30 厨房温度仍为 2851,灶具直到 18:46 才开启,排除烹饪因素\",\n \"18:47 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)\",\n \"全天烟雾报警器无触发,排除真实火灾\",\n \"19:22 门锁通过 OperationSource=3(远程)被 UserIndex=5 解锁,但门未被打开(无 door_contact 状态变化)\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头或更换设备,消除间歇性故障和 None 读数问题\",\n \"核实门锁 UserIndex=5 的身份,若非已授权家庭成员,立即删除该用户凭证并更换门锁访问密码\",\n \"审查门锁远程访问日志,确认 OperationSource=3 的远程解锁渠道是否安全,考虑关闭不必要的远程开锁权限\",\n \"在厨房温度传感器修复前,可适当提高烟雾报警器的监控灵敏度,作为温度监测失效的补偿手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次数据丢失(None),疑似传感器故障;同时存在一次来源不明的门锁解锁事件。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2475(24.75°C)跳升至 2859(28.59°C),升幅近 4°C,而同一时刻客厅和卧室温度均在正常下降趋势中,排除全屋环境变化的可能。", "推理步骤2: 18:30 厨房温度仍高达 2851,但此时灶具尚未开启(灶具 18:46 才打开),说明这次高温读数并非烹饪导致,属于传感器异常。", "推理步骤3: 18:47 和 19:35 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据采集中断或硬件故障。19:00 恢复后读数回归正常范围(2425),进一步印证前面的高温是传感器异常而非真实环境温度。", "推理步骤4: 烟雾报警器全天无任何触发记录,排除火灾风险,支持传感器故障的判断而非真实高温。", "推理步骤5: 19:22 入户门锁被解锁,事件显示 OperationSource=3(远程/网络操作)且 UserIndex=5。住户当时已在家中(18:20 已回家),需要确认 UserIndex=5 是否为已授权用户。若非已知用户,则存在未授权远程开锁的入侵风险。", "推理步骤6: 19:22 解锁后未见 front_door_contact 状态变化(门未被打开),且客厅运动传感器持续检测到有人,没有出现异常的多区域运动模式,因此实际入侵的可能性较低,但仍需核实。", "推理步骤7: 其余设备行为均符合正常生活模式——早晨起床、出门上班、傍晚回家、做饭、睡觉,温度曲线符合夏季昼夜变化规律,门锁自动上锁正常,无漏水报警。"], "key_evidence": ["18:00 厨房温度从 2475 骤升至 2859(+3.84°C),此时灶具未开启,客厅/卧室温度正常下降", "18:30 厨房温度仍为 2851,灶具直到 18:46 才开启,排除烹饪因素", "18:47 和 19:35 厨房温度传感器两次报告 MeasuredValue = None(数据丢失)", "全天烟雾报警器无触发,排除真实火灾", "19:22 门锁通过 OperationSource=3(远程)被 UserIndex=5 解锁,但门未被打开(无 door_contact 状态变化)"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头或更换设备,消除间歇性故障和 None 读数问题", "核实门锁 UserIndex=5 的身份,若非已授权家庭成员,立即删除该用户凭证并更换门锁访问密码", "审查门锁远程访问日志,确认 OperationSource=3 的远程解锁渠道是否安全,考虑关闭不必要的远程开锁权限", "在厨房温度传感器修复前,可适当提高烟雾报警器的监控灵敏度,作为温度监测失效的补偿手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.272029638290405, "api_error": null} {"episode_id": "SQ4_TP_D_0847", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq4\\SQ4_TP_D_0847.json", "metadata": {"sq_type": "SQ4", "sq_name": "复合安全推理", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261476, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-18T01:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房烟雾报警器电池低电量告警,且厨房温度传感器在灶具使用期间多次报告 None 值,存在设备故障风险;同时凌晨 01:33 灶具异常开启需关注独居老人安全。\",\n \"reasoning\": [\n \"推理步骤1: 厨房烟雾报警器在 2026-06-17T01:33 报告 BatteryAlert=1,表示电池电量低。烟雾报警器是关键安全设备,电池不足会导致火灾时无法正常报警,对独居老人尤其危险。\",\n \"推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:10、06:25、11:09、11:30、17:11、17:39),共出现6次。这表明传感器在高温环境下可能存在故障或通信中断,无法正常监测厨房温度,削弱了火灾预警能力。\",\n \"推理步骤3: 凌晨 01:33 厨房灶具被开启(kitchen_cook_surface OnOff=True),10分钟后 01:43 厨房温度飙升至 30.39°C(3039),远高于同时段其他房间的 ~23°C。虽然 SmokeState=0 表示未触发烟雾报警,但凌晨 1:33 对独居老人来说是非常异常的做饭时间,且日志中没有记录灶具关闭事件,直到下一次 06:09 才有厨房活动记录,存在灶具长时间无人看管的可能。\",\n \"推理步骤4: 08:27 入户门解锁并有人进入客厅,但老人 07:01 才出门,出门仅约1.5小时后有人用手动方式开锁进入。结合独居场景,这可能是老人自己回家,也可能是访客。门在 07:01:10 自动上锁,08:27 手动解锁,操作方式一致(Manual),判断为老人本人回家的可能性较大,暂不构成入侵威胁。\",\n \"推理步骤5: 老人整体作息模式基本正常——05:23起床、06:09做早餐、07:01外出、08:27回家、11:08做午餐、12:20-13:56午休、17:10做晚餐、20:47就寝。生活规律合理,未发现长时间无活动等健康异常信号。\",\n \"推理步骤6: 综合来看,主要风险集中在两点:(1) 烟雾报警器电池低电量导致安全防护降级;(2) 厨房温度传感器频繁报 None 值,设备可靠性存疑。两者叠加意味着厨房的火灾监测能力严重削弱,对独居老人构成实质性安全隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-17T01:33 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量\",\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None(06:10、06:25、11:09、11:30、17:11、17:39),传感器疑似故障\",\n \"2026-06-18T01:33 凌晨灶具异常开启,01:43 厨房温度升至 30.39°C,无对应的灶具关闭记录直到下次使用\",\n \"烟雾报警器电池低 + 温度传感器故障 = 厨房火灾监测双重失效\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保火灾报警功能正常\",\n \"检查并维修/更换厨房温度传感器,排查其在灶具使用时频繁报 None 的原因(可能是高温干扰、通信故障或传感器老化)\",\n \"排查凌晨 01:33 灶具开启的原因——确认是否为老人误操作或设备误触发,考虑增加灶具使用时间限制或深夜自动断气/断电保护\",\n \"为独居老人场景增加灶具超时未关闭的自动告警规则(如开启超过30分钟且无人活动时自动提醒或关闭)\",\n \"考虑增加厨房区域的冗余安全监测手段,如额外的温度传感器或燃气泄漏检测器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房烟雾报警器电池低电量告警,且厨房温度传感器在灶具使用期间多次报告 None 值,存在设备故障风险;同时凌晨 01:33 灶具异常开启需关注独居老人安全。", "reasoning": ["推理步骤1: 厨房烟雾报警器在 2026-06-17T01:33 报告 BatteryAlert=1,表示电池电量低。烟雾报警器是关键安全设备,电池不足会导致火灾时无法正常报警,对独居老人尤其危险。", "推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:10、06:25、11:09、11:30、17:11、17:39),共出现6次。这表明传感器在高温环境下可能存在故障或通信中断,无法正常监测厨房温度,削弱了火灾预警能力。", "推理步骤3: 凌晨 01:33 厨房灶具被开启(kitchen_cook_surface OnOff=True),10分钟后 01:43 厨房温度飙升至 30.39°C(3039),远高于同时段其他房间的 ~23°C。虽然 SmokeState=0 表示未触发烟雾报警,但凌晨 1:33 对独居老人来说是非常异常的做饭时间,且日志中没有记录灶具关闭事件,直到下一次 06:09 才有厨房活动记录,存在灶具长时间无人看管的可能。", "推理步骤4: 08:27 入户门解锁并有人进入客厅,但老人 07:01 才出门,出门仅约1.5小时后有人用手动方式开锁进入。结合独居场景,这可能是老人自己回家,也可能是访客。门在 07:01:10 自动上锁,08:27 手动解锁,操作方式一致(Manual),判断为老人本人回家的可能性较大,暂不构成入侵威胁。", "推理步骤5: 老人整体作息模式基本正常——05:23起床、06:09做早餐、07:01外出、08:27回家、11:08做午餐、12:20-13:56午休、17:10做晚餐、20:47就寝。生活规律合理,未发现长时间无活动等健康异常信号。", "推理步骤6: 综合来看,主要风险集中在两点:(1) 烟雾报警器电池低电量导致安全防护降级;(2) 厨房温度传感器频繁报 None 值,设备可靠性存疑。两者叠加意味着厨房的火灾监测能力严重削弱,对独居老人构成实质性安全隐患。"], "key_evidence": ["2026-06-17T01:33 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池低电量", "厨房温度传感器在灶具使用期间6次报告 MeasuredValue=None(06:10、06:25、11:09、11:30、17:11、17:39),传感器疑似故障", "2026-06-18T01:33 凌晨灶具异常开启,01:43 厨房温度升至 30.39°C,无对应的灶具关闭记录直到下次使用", "烟雾报警器电池低 + 温度传感器故障 = 厨房火灾监测双重失效"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保火灾报警功能正常", "检查并维修/更换厨房温度传感器,排查其在灶具使用时频繁报 None 的原因(可能是高温干扰、通信故障或传感器老化)", "排查凌晨 01:33 灶具开启的原因——确认是否为老人误操作或设备误触发,考虑增加灶具使用时间限制或深夜自动断气/断电保护", "为独居老人场景增加灶具超时未关闭的自动告警规则(如开启超过30分钟且无人活动时自动提醒或关闭)", "考虑增加厨房区域的冗余安全监测手段,如额外的温度传感器或燃气泄漏检测器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.116487741470337, "api_error": null} {"episode_id": "SQ5_FP_A_1134", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1134.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261763, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "kitchen", "injection_time": "2026-06-25T08:30:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 None 空值,疑似传感器故障或受灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在 18:30 为 2463(约24.6°C),到 19:00 突然跳升至 2835(约28.4°C),30分钟内上升近 3.7°C,而同时段客厅和卧室温度仅正常微降,排除全屋环境突变。\",\n \"推理步骤2: 19:12 和 19:32 厨房温度传感器连续两次报告 MeasuredValue = None(空值),说明传感器在灶具使用期间出现读数丢失,这是典型的传感器过热保护或故障表现。\",\n \"推理步骤3: 19:00 的 2835 读数出现在灶具开启(19:11:30)之前,说明厨房温度在做饭前就已异常升高,可能是传感器本身漂移或安装位置受热源影响。19:30 读数 2842 进一步升高后出现 None,佐证传感器在高温下工作异常。\",\n \"推理步骤4: 灶具关闭(19:31)并开窗通风后,20:00 厨房温度恢复至 2404(约24.0°C),与客厅温度一致,说明实际环境温度并无持续异常,问题集中在传感器读数可靠性上。\",\n \"推理步骤5: 烟雾报警器全天未触发任何告警,排除火灾或燃气泄漏的可能性。\",\n \"推理步骤6: 其余事件均属正常生活模式——住户约 06:33 起床、07:11 出门上班、08:30 有一次门锁操作错误后成功开锁回家取物、18:28 下班回家、19:11 做饭、21:56 就寝,作息合理无入侵迹象。\",\n \"推理步骤7: 08:30 的 LockOperationError(错误码1,来源3=远程/密码)仅出现一次且 20 秒后由 UserIndex=1(户主)成功开锁,属于正常的密码输错或操作失误,不构成入侵威胁。\",\n \"推理步骤8: 入户门在住户外出和就寝时均处于关闭上锁状态(自动上锁),门窗传感器状态正常,无未授权进入迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.6°C 骤升至 ~28.4°C(2463→2835),与其他房间温度趋势不一致\",\n \"19:12 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失\",\n \"灶具关闭并开窗后温度迅速恢复正常(20:00 回到 2404),说明环境本身无持续热源异常\",\n \"烟雾报警器全天无告警,排除火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将传感器迁移至远离热源的位置\",\n \"排查厨房温度传感器硬件状态,连续两次 None 读数可能意味着传感器过热保护触发或硬件老化,必要时更换传感器\",\n \"持续观察后续几天厨房温度传感器是否再次出现 None 值或异常跳变,若反复出现则确认为设备故障需更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 None 空值,疑似传感器故障或受灶具高温干扰。", "reasoning": ["推理步骤1: 厨房温度在 18:30 为 2463(约24.6°C),到 19:00 突然跳升至 2835(约28.4°C),30分钟内上升近 3.7°C,而同时段客厅和卧室温度仅正常微降,排除全屋环境突变。", "推理步骤2: 19:12 和 19:32 厨房温度传感器连续两次报告 MeasuredValue = None(空值),说明传感器在灶具使用期间出现读数丢失,这是典型的传感器过热保护或故障表现。", "推理步骤3: 19:00 的 2835 读数出现在灶具开启(19:11:30)之前,说明厨房温度在做饭前就已异常升高,可能是传感器本身漂移或安装位置受热源影响。19:30 读数 2842 进一步升高后出现 None,佐证传感器在高温下工作异常。", "推理步骤4: 灶具关闭(19:31)并开窗通风后,20:00 厨房温度恢复至 2404(约24.0°C),与客厅温度一致,说明实际环境温度并无持续异常,问题集中在传感器读数可靠性上。", "推理步骤5: 烟雾报警器全天未触发任何告警,排除火灾或燃气泄漏的可能性。", "推理步骤6: 其余事件均属正常生活模式——住户约 06:33 起床、07:11 出门上班、08:30 有一次门锁操作错误后成功开锁回家取物、18:28 下班回家、19:11 做饭、21:56 就寝,作息合理无入侵迹象。", "推理步骤7: 08:30 的 LockOperationError(错误码1,来源3=远程/密码)仅出现一次且 20 秒后由 UserIndex=1(户主)成功开锁,属于正常的密码输错或操作失误,不构成入侵威胁。", "推理步骤8: 入户门在住户外出和就寝时均处于关闭上锁状态(自动上锁),门窗传感器状态正常,无未授权进入迹象。"], "key_evidence": ["19:00 厨房温度从 ~24.6°C 骤升至 ~28.4°C(2463→2835),与其他房间温度趋势不一致", "19:12 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,传感器读数丢失", "灶具关闭并开窗后温度迅速恢复正常(20:00 回到 2404),说明环境本身无持续热源异常", "烟雾报警器全天无告警,排除火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热干扰,建议将传感器迁移至远离热源的位置", "排查厨房温度传感器硬件状态,连续两次 None 读数可能意味着传感器过热保护触发或硬件老化,必要时更换传感器", "持续观察后续几天厨房温度传感器是否再次出现 None 值或异常跳变,若反复出现则确认为设备故障需更换"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.371050119400024, "api_error": null} {"episode_id": "SQ5_FP_A_1129", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1129.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261758, "scenario_id": "FG-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-24T09:23:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次 None 空值,疑似传感器故障或灶具周边散热异常。\",\n \"reasoning\": [\n \"推理步骤1: 09:23 灶具开启后,厨房温度在 09:28 飙升至 2700(27.00°C),09:53 达到 2750(27.50°C),但同时段的半小时定时读数(09:30 = 2489, 10:00 = 2529)却远低于这两个值,存在读数不一致的矛盾,提示传感器可能受灶具热辐射干扰或存在间歇性故障。\",\n \"推理步骤2: 18:00 住户尚未回家、灶具未开启的情况下,厨房温度突然跳升至 2870(28.70°C),而同时刻客厅仅 2462、卧室仅 2353,厨房比其他房间高出约 5°C,且 18:30 仍维持在 2853。这一异常高温无对应的设备操作事件,不合理。\",\n \"推理步骤3: 18:48 和 19:32 厨房温度传感器两次报告 MeasuredValue = None(空值),说明传感器在这两个时刻未能正常采集数据,属于设备异常。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。\",\n \"推理步骤4: 除厨房温度传感器外,其余设备行为均正常——住户 06:15 起床、07:35 出门上锁、18:05 回家开锁,门锁操作均为 Manual/Auto 且开关门时序合理;烟雾报警器全天未触发;漏水传感器无报警;入侵相关传感器无异常。\",\n \"推理步骤5: 22:33 卧室灯关闭、22:34 运动传感器归零后,22:42 卧室灯亮度被设为 46(约 18%),可能是住户在床上通过手机/语音设了小夜灯,属于正常行为。\",\n \"推理步骤6: 18:05 回家后入户门传感器 StateValue 一直未恢复为 True(关门),直到 21:56:48 才关门上锁。虽然这段时间门可能是虚掩的,但结合客厅有人活动(occupancy=1),更可能是传感器状态更新延迟或住户习惯未及时关门,不构成入侵威胁,但值得留意。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度异常飙升至 2870(28.70°C),无对应设备操作,比同时刻客厅高出约 4°C\",\n \"18:48 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,传感器数据采集中断\",\n \"09:28/09:53 灶具使用期间出现的高温读数(2700/2750)与同时段定时读数(2489/2529)存在矛盾\",\n \"18:05 入户门打开后近 4 小时(至 21:56)才记录关门状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器是否安装位置过于靠近灶具,清洁传感器并测试其工作状态,必要时更换\",\n \"排查厨房温度传感器 None 值的原因(固件版本、供电、通信链路),确认是否需要固件升级\",\n \"确认 18:00 厨房异常高温期间是否有其他热源(如烤箱、阳光直射),排除火灾隐患\",\n \"建议养成回家后及时关闭入户门的习惯,或设置入户门长时间未关闭的自动提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次 None 空值,疑似传感器故障或灶具周边散热异常。", "reasoning": ["推理步骤1: 09:23 灶具开启后,厨房温度在 09:28 飙升至 2700(27.00°C),09:53 达到 2750(27.50°C),但同时段的半小时定时读数(09:30 = 2489, 10:00 = 2529)却远低于这两个值,存在读数不一致的矛盾,提示传感器可能受灶具热辐射干扰或存在间歇性故障。", "推理步骤2: 18:00 住户尚未回家、灶具未开启的情况下,厨房温度突然跳升至 2870(28.70°C),而同时刻客厅仅 2462、卧室仅 2353,厨房比其他房间高出约 5°C,且 18:30 仍维持在 2853。这一异常高温无对应的设备操作事件,不合理。", "推理步骤3: 18:48 和 19:32 厨房温度传感器两次报告 MeasuredValue = None(空值),说明传感器在这两个时刻未能正常采集数据,属于设备异常。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。", "推理步骤4: 除厨房温度传感器外,其余设备行为均正常——住户 06:15 起床、07:35 出门上锁、18:05 回家开锁,门锁操作均为 Manual/Auto 且开关门时序合理;烟雾报警器全天未触发;漏水传感器无报警;入侵相关传感器无异常。", "推理步骤5: 22:33 卧室灯关闭、22:34 运动传感器归零后,22:42 卧室灯亮度被设为 46(约 18%),可能是住户在床上通过手机/语音设了小夜灯,属于正常行为。", "推理步骤6: 18:05 回家后入户门传感器 StateValue 一直未恢复为 True(关门),直到 21:56:48 才关门上锁。虽然这段时间门可能是虚掩的,但结合客厅有人活动(occupancy=1),更可能是传感器状态更新延迟或住户习惯未及时关门,不构成入侵威胁,但值得留意。"], "key_evidence": ["18:00 厨房温度异常飙升至 2870(28.70°C),无对应设备操作,比同时刻客厅高出约 4°C", "18:48 和 19:32 厨房温度传感器两次报告 MeasuredValue = None,传感器数据采集中断", "09:28/09:53 灶具使用期间出现的高温读数(2700/2750)与同时段定时读数(2489/2529)存在矛盾", "18:05 入户门打开后近 4 小时(至 21:56)才记录关门状态"], "recommended_actions": ["检查厨房温度传感器是否安装位置过于靠近灶具,清洁传感器并测试其工作状态,必要时更换", "排查厨房温度传感器 None 值的原因(固件版本、供电、通信链路),确认是否需要固件升级", "确认 18:00 厨房异常高温期间是否有其他热源(如烤箱、阳光直射),排除火灾隐患", "建议养成回家后及时关闭入户门的习惯,或设置入户门长时间未关闭的自动提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.89008092880249, "api_error": null} {"episode_id": "SQ5_FP_A_1141", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1141.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261770, "scenario_id": "WD-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-10T12:10:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及多次 None 值,疑似传感器故障;同时厨房窗户在住户做完饭后处于开启状态未关闭,存在轻微安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2494(约24.9°C)跳升至 2845(约28.5°C),升幅约3.5°C,而同一时刻灶具尚未开启(19:02:30 才开启),此跳变缺乏合理热源解释。\",\n \"推理步骤2: 19:03 和 19:31 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失或通信异常,这不是正常行为。\",\n \"推理步骤3: 19:30 灶具已关闭,但 19:30 的温度仍为 2844(约28.4°C),直到 20:00 才恢复到 2420(约24.2°C)。结合 None 值和异常跳变,更倾向于传感器本身故障而非真实温度异常。\",\n \"推理步骤4: 19:30:30 厨房窗户被打开(contact=False,推测为做饭后通风),但直到日志结束(23:30)都未见关闭事件,住户已于 22:41 入睡,窗户整夜开着存在安全隐患(入侵风险、夜间降温)。\",\n \"推理步骤5: 12:10 卫生间漏水传感器短暂触发(2分钟后恢复),同时有人在卫生间,判断为正常用水行为(如洗手溅水),非真实漏水。\",\n \"推理步骤6: 其余事件均符合正常生活模式——早晨起床、出门上班(07:12 关灯锁门)、傍晚回家(18:13 开门开灯开空调)、做饭、睡前关灯锁门,无入侵或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~2494 异常跳升至 2845,此时灶具尚未开启\",\n \"19:03 和 19:31 厨房温度传感器报告 MeasuredValue = None(两次读数丢失)\",\n \"19:30:30 厨房窗户打开后至日志结束(23:30)未见关闭事件,住户已入睡\",\n \"烟雾报警器全天未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁探头或重启设备,必要时更换传感器\",\n \"关闭厨房窗户或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户\",\n \"建议为厨房温度传感器设置 None 值告警,及时发现传感器离线或故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及多次 None 值,疑似传感器故障;同时厨房窗户在住户做完饭后处于开启状态未关闭,存在轻微安全隐患。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2494(约24.9°C)跳升至 2845(约28.5°C),升幅约3.5°C,而同一时刻灶具尚未开启(19:02:30 才开启),此跳变缺乏合理热源解释。", "推理步骤2: 19:03 和 19:31 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器读数丢失或通信异常,这不是正常行为。", "推理步骤3: 19:30 灶具已关闭,但 19:30 的温度仍为 2844(约28.4°C),直到 20:00 才恢复到 2420(约24.2°C)。结合 None 值和异常跳变,更倾向于传感器本身故障而非真实温度异常。", "推理步骤4: 19:30:30 厨房窗户被打开(contact=False,推测为做饭后通风),但直到日志结束(23:30)都未见关闭事件,住户已于 22:41 入睡,窗户整夜开着存在安全隐患(入侵风险、夜间降温)。", "推理步骤5: 12:10 卫生间漏水传感器短暂触发(2分钟后恢复),同时有人在卫生间,判断为正常用水行为(如洗手溅水),非真实漏水。", "推理步骤6: 其余事件均符合正常生活模式——早晨起床、出门上班(07:12 关灯锁门)、傍晚回家(18:13 开门开灯开空调)、做饭、睡前关灯锁门,无入侵或火灾迹象。"], "key_evidence": ["19:00 厨房温度从 ~2494 异常跳升至 2845,此时灶具尚未开启", "19:03 和 19:31 厨房温度传感器报告 MeasuredValue = None(两次读数丢失)", "19:30:30 厨房窗户打开后至日志结束(23:30)未见关闭事件,住户已入睡", "烟雾报警器全天未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁探头或重启设备,必要时更换传感器", "关闭厨房窗户或设置自动化规则:当住户进入睡眠模式时检查并提醒关闭所有窗户", "建议为厨房温度传感器设置 None 值告警,及时发现传感器离线或故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.16666555404663, "api_error": null} {"episode_id": "SQ5_FP_A_1140", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1140.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261769, "scenario_id": "FG-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-01T18:45:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次出现异常读数(突增至28.55°C/28.66°C)和 null 值,且存在不符合 Matter 协议规范的上报格式,疑似传感器故障或数据链路异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度在 18:00 突然从约 24.7°C 跳升至 28.55°C(MeasuredValue=2855),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.65°C / 23.62°C),排除全屋升温的可能。\",\n \"推理步骤2: 18:30 厨房温度继续报 28.66°C,但此时灶具尚未开启(灶具 OnOff=True 出现在 18:45/18:49),说明这次温度飙升并非烹饪导致,时间线不匹配。\",\n \"推理步骤3: 18:50 厨房温度传感器上报了一条 MeasuredValue=None(null 值),紧接着又以非标准格式 'MeasuredValue=2700' 上报(缺少 TemperatureMeasurement 前缀)。19:15 再次出现同样的非标准格式 'MeasuredValue=2750'。19:36 又出现一次 null 值。正常 Matter 设备不应产生 null 读数和格式不一致的上报。\",\n \"推理步骤4: 19:00 之后厨房温度恢复正常格式和数值(24.30°C),与客厅/卧室温度趋势一致,说明传感器可能间歇性故障。\",\n \"推理步骤5: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,灶具在 19:35 正常关闭,19:00 后厨房温度回归正常曲线。温度异常更可能是传感器自身问题而非真实环境温度突变。\",\n \"推理步骤6: 其余系统行为均正常——住户 06:45 起床、07:27 出门(门锁自动上锁)、18:08 回家(开灯开空调)、做饭、22:04 就寝,符合典型单人一室一厅的生活节奏。入户门锁操作均为 Manual/Auto,无异常开锁。漏水传感器和窗户传感器无异常事件。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突增至 2855(28.55°C),较前一读数 2474(24.74°C)跳升近 4°C,而灶具直到 18:45 才开启\",\n \"18:50 和 19:36 厨房温度传感器上报 MeasuredValue=None(null 值),属于异常读数\",\n \"18:50 和 19:15 出现非标准上报格式(缺少 'TemperatureMeasurement.' 前缀),可能是固件或通信异常\",\n \"18:30 厨房温度 2866(28.66°C)持续异常高,同时段客厅/卧室温度正常下降\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否存在松动、受潮或老化问题,必要时更换传感器\",\n \"检查该传感器的 Matter 固件版本,如有可用更新建议升级,以修复可能的上报格式 bug\",\n \"在传感器修复前,可临时设置规则:当厨房温度传感器上报 null 或单次跳变超过 3°C 时,发送告警通知而非直接触发联动动作,避免误触发\",\n \"确认厨房窗户传感器在 19:35 报告打开(StateValue=False)后是否已关闭——日志中未见关窗记录,夜间开窗可能存在安全隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次出现异常读数(突增至28.55°C/28.66°C)和 null 值,且存在不符合 Matter 协议规范的上报格式,疑似传感器故障或数据链路异常。", "reasoning": ["推理步骤1: 厨房温度在 18:00 突然从约 24.7°C 跳升至 28.55°C(MeasuredValue=2855),而同一时刻客厅和卧室温度仍在正常下降趋势中(24.65°C / 23.62°C),排除全屋升温的可能。", "推理步骤2: 18:30 厨房温度继续报 28.66°C,但此时灶具尚未开启(灶具 OnOff=True 出现在 18:45/18:49),说明这次温度飙升并非烹饪导致,时间线不匹配。", "推理步骤3: 18:50 厨房温度传感器上报了一条 MeasuredValue=None(null 值),紧接着又以非标准格式 'MeasuredValue=2700' 上报(缺少 TemperatureMeasurement 前缀)。19:15 再次出现同样的非标准格式 'MeasuredValue=2750'。19:36 又出现一次 null 值。正常 Matter 设备不应产生 null 读数和格式不一致的上报。", "推理步骤4: 19:00 之后厨房温度恢复正常格式和数值(24.30°C),与客厅/卧室温度趋势一致,说明传感器可能间歇性故障。", "推理步骤5: 排除火灾风险——厨房烟雾报警器全天未触发任何告警,灶具在 19:35 正常关闭,19:00 后厨房温度回归正常曲线。温度异常更可能是传感器自身问题而非真实环境温度突变。", "推理步骤6: 其余系统行为均正常——住户 06:45 起床、07:27 出门(门锁自动上锁)、18:08 回家(开灯开空调)、做饭、22:04 就寝,符合典型单人一室一厅的生活节奏。入户门锁操作均为 Manual/Auto,无异常开锁。漏水传感器和窗户传感器无异常事件。"], "key_evidence": ["18:00 厨房温度突增至 2855(28.55°C),较前一读数 2474(24.74°C)跳升近 4°C,而灶具直到 18:45 才开启", "18:50 和 19:36 厨房温度传感器上报 MeasuredValue=None(null 值),属于异常读数", "18:50 和 19:15 出现非标准上报格式(缺少 'TemperatureMeasurement.' 前缀),可能是固件或通信异常", "18:30 厨房温度 2866(28.66°C)持续异常高,同时段客厅/卧室温度正常下降"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否存在松动、受潮或老化问题,必要时更换传感器", "检查该传感器的 Matter 固件版本,如有可用更新建议升级,以修复可能的上报格式 bug", "在传感器修复前,可临时设置规则:当厨房温度传感器上报 null 或单次跳变超过 3°C 时,发送告警通知而非直接触发联动动作,避免误触发", "确认厨房窗户传感器在 19:35 报告打开(StateValue=False)后是否已关闭——日志中未见关窗记录,夜间开窗可能存在安全隐患"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.432942390441895, "api_error": null} {"episode_id": "SQ5_FP_A_1144", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1144.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261773, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "bedroom", "injection_time": "2026-06-22T11:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和多次 None 值,疑似传感器故障或受到灶具高温干扰。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:27 起床,07:10 出门(手动开锁、自动回锁),18:10 回家,19:03 做饭,22:33 关灯就寝,符合典型上班族一日节奏。\",\n \"推理步骤2: 入侵风险排查——07:10 出门时门锁自动上锁(LockState=1);11:11 有一次 UserIndex=5 的远程/密码开锁事件,但随后客厅有人体存在且开灯,可能是家政或家人,且 18:10 住户正常回家时门锁状态正常,无未授权开锁迹象。不过 11:11 的开锁事件值得住户确认 UserIndex=5 的身份。\",\n \"推理步骤3: 厨房温度传感器异常——19:00 时厨房温度突然从约 24.8°C 跳升至 28.44°C,而灶具(cook_surface)直到 19:03 才开启。灶具开启前温度就已异常升高,时间上不匹配。\",\n \"推理步骤4: 19:04 和 19:49 厨房温度传感器两次报告 MeasuredValue = None,说明传感器读数丢失或溢出,这是明确的设备异常信号。\",\n \"推理步骤5: 19:30 厨房温度仍高达 28.32°C,而 19:48 灶具关闭、开窗通风后,20:00 温度回落至 24.04°C。传感器在灶具关闭后恢复正常读数,说明可能是高温环境导致传感器间歇性故障。\",\n \"推理步骤6: 火灾风险排查——厨房烟雾报警器(kitchen_smoke_alarm)全天无任何触发事件,做饭时段温度虽高但在合理烹饪范围内(28°C 为环境温度非明火温度),灶具正常关闭,无持续高温,火灾风险低。\",\n \"推理步骤7: 漏水/其他风险排查——卫生间漏水传感器无报警,洗碗机正常启动运行,所有门窗传感器状态变化合理,无异常。\",\n \"推理步骤8: 21:59 入户门确认关闭(StateValue=True)并自动上锁(LockState=1),夜间安全状态良好。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.8°C 骤升至 28.44°C,此时灶具尚未开启(19:03 才开启),温度跳变缺乏合理热源解释\",\n \"19:04 和 19:49 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数异常丢失\",\n \"11:11 入户门通过 UserIndex=5 远程/密码开锁,需确认该用户身份是否为授权人员\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换传感器\",\n \"排查厨房温度传感器固件版本及硬件状态,None 值可能意味着传感器老化或通信故障,建议进行设备诊断\",\n \"确认 11:11 开锁事件中 UserIndex=5 的身份,如非授权用户应立即删除该凭证并检查门锁访问日志\",\n \"建议为门锁设置未知用户开锁时的即时推送通知,提升入侵预警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和多次 None 值,疑似传感器故障或受到灶具高温干扰。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:27 起床,07:10 出门(手动开锁、自动回锁),18:10 回家,19:03 做饭,22:33 关灯就寝,符合典型上班族一日节奏。", "推理步骤2: 入侵风险排查——07:10 出门时门锁自动上锁(LockState=1);11:11 有一次 UserIndex=5 的远程/密码开锁事件,但随后客厅有人体存在且开灯,可能是家政或家人,且 18:10 住户正常回家时门锁状态正常,无未授权开锁迹象。不过 11:11 的开锁事件值得住户确认 UserIndex=5 的身份。", "推理步骤3: 厨房温度传感器异常——19:00 时厨房温度突然从约 24.8°C 跳升至 28.44°C,而灶具(cook_surface)直到 19:03 才开启。灶具开启前温度就已异常升高,时间上不匹配。", "推理步骤4: 19:04 和 19:49 厨房温度传感器两次报告 MeasuredValue = None,说明传感器读数丢失或溢出,这是明确的设备异常信号。", "推理步骤5: 19:30 厨房温度仍高达 28.32°C,而 19:48 灶具关闭、开窗通风后,20:00 温度回落至 24.04°C。传感器在灶具关闭后恢复正常读数,说明可能是高温环境导致传感器间歇性故障。", "推理步骤6: 火灾风险排查——厨房烟雾报警器(kitchen_smoke_alarm)全天无任何触发事件,做饭时段温度虽高但在合理烹饪范围内(28°C 为环境温度非明火温度),灶具正常关闭,无持续高温,火灾风险低。", "推理步骤7: 漏水/其他风险排查——卫生间漏水传感器无报警,洗碗机正常启动运行,所有门窗传感器状态变化合理,无异常。", "推理步骤8: 21:59 入户门确认关闭(StateValue=True)并自动上锁(LockState=1),夜间安全状态良好。"], "key_evidence": ["19:00 厨房温度从 ~24.8°C 骤升至 28.44°C,此时灶具尚未开启(19:03 才开启),温度跳变缺乏合理热源解释", "19:04 和 19:49 厨房温度传感器两次报告 MeasuredValue = None,表明传感器读数异常丢失", "11:11 入户门通过 UserIndex=5 远程/密码开锁,需确认该用户身份是否为授权人员"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰,必要时重新定位或更换传感器", "排查厨房温度传感器固件版本及硬件状态,None 值可能意味着传感器老化或通信故障,建议进行设备诊断", "确认 11:11 开锁事件中 UserIndex=5 的身份,如非授权用户应立即删除该凭证并检查门锁访问日志", "建议为门锁设置未知用户开锁时的即时推送通知,提升入侵预警能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.83959650993347, "api_error": null} {"episode_id": "SQ5_FP_A_1154", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1154.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261783, "scenario_id": "FG-01", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-18T09:00:00", "variant": "FP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 3.063260316848755, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ5_FP_A_1149", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1149.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261778, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-30T09:49:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和多次 None 值,且厨房窗户在做完饭后开启至今未关闭,存在设备故障及安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从约 2473(24.73°C)跳升至 2867(28.67°C),升幅近 4°C,而此时灶具尚未开启(18:59 才开),客厅和卧室温度同期无对应升幅,排除整体环境升温,该跳变属于传感器异常。\",\n \"推理步骤2: 18:30 厨房温度仍高达 2853(28.53°C),持续异常。随后 19:00 和 19:37 两次报告 MeasuredValue = None,表明传感器出现数据丢失或通信故障。19:00 同一时刻又报告了正常值 2434,说明传感器状态不稳定,可能存在间歇性故障。\",\n \"推理步骤3: 19:36 厨房窗户打开(StateValue=False),推测是做完饭后通风,但直到日志结束(23:30)未见关闭事件。住户 22:10 已回卧室准备就寝,厨房窗户整夜未关存在安全隐患(入侵风险、雨水进入等)。\",\n \"推理步骤4: 其余事件均属正常生活模式——凌晨至清晨各房间温度平稳;06:38 起床、07:14 出门并自动上锁;09:49 有一次门锁操作错误后成功开锁(OperationSource=3 为远程/密码开锁,UserIndex=1 为户主,属正常);18:01 回家开灯开空调、做饭、洗碗、22:10 就寝,生活节奏正常。\",\n \"推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门锁状态正常,排除火灾和入侵等高危威胁。核心问题集中在厨房温度传感器的异常行为和厨房窗户未关闭。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从约 24.73°C 骤升至 28.67°C,灶具尚未开启,客厅/卧室无对应升温\",\n \"18:30 厨房温度仍为 28.53°C,持续异常高位\",\n \"19:00 和 19:37 厨房温度传感器报告 MeasuredValue = None,出现数据丢失\",\n \"19:36 厨房窗户打开后直至 23:30 日志结束未见关闭事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁传感器或更换电池,必要时更换设备以消除异常读数和 None 值问题\",\n \"立即关闭厨房窗户,或设置自动化规则:就寝时检查所有窗户状态并提醒关闭\",\n \"建议为厨房温度传感器设置异常值告警阈值(如 30 分钟内温升超过 3°C 且灶具未开启时触发告警),以及 None 值连续出现时的故障通知\",\n \"考虑添加厨房窗户长时间未关闭的提醒规则(如超过 2 小时未关闭且无人在厨房时发送通知)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和多次 None 值,且厨房窗户在做完饭后开启至今未关闭,存在设备故障及安全隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从约 2473(24.73°C)跳升至 2867(28.67°C),升幅近 4°C,而此时灶具尚未开启(18:59 才开),客厅和卧室温度同期无对应升幅,排除整体环境升温,该跳变属于传感器异常。", "推理步骤2: 18:30 厨房温度仍高达 2853(28.53°C),持续异常。随后 19:00 和 19:37 两次报告 MeasuredValue = None,表明传感器出现数据丢失或通信故障。19:00 同一时刻又报告了正常值 2434,说明传感器状态不稳定,可能存在间歇性故障。", "推理步骤3: 19:36 厨房窗户打开(StateValue=False),推测是做完饭后通风,但直到日志结束(23:30)未见关闭事件。住户 22:10 已回卧室准备就寝,厨房窗户整夜未关存在安全隐患(入侵风险、雨水进入等)。", "推理步骤4: 其余事件均属正常生活模式——凌晨至清晨各房间温度平稳;06:38 起床、07:14 出门并自动上锁;09:49 有一次门锁操作错误后成功开锁(OperationSource=3 为远程/密码开锁,UserIndex=1 为户主,属正常);18:01 回家开灯开空调、做饭、洗碗、22:10 就寝,生活节奏正常。", "推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门锁状态正常,排除火灾和入侵等高危威胁。核心问题集中在厨房温度传感器的异常行为和厨房窗户未关闭。"], "key_evidence": ["18:00 厨房温度从约 24.73°C 骤升至 28.67°C,灶具尚未开启,客厅/卧室无对应升温", "18:30 厨房温度仍为 28.53°C,持续异常高位", "19:00 和 19:37 厨房温度传感器报告 MeasuredValue = None,出现数据丢失", "19:36 厨房窗户打开后直至 23:30 日志结束未见关闭事件"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁传感器或更换电池,必要时更换设备以消除异常读数和 None 值问题", "立即关闭厨房窗户,或设置自动化规则:就寝时检查所有窗户状态并提醒关闭", "建议为厨房温度传感器设置异常值告警阈值(如 30 分钟内温升超过 3°C 且灶具未开启时触发告警),以及 None 值连续出现时的故障通知", "考虑添加厨房窗户长时间未关闭的提醒规则(如超过 2 小时未关闭且无人在厨房时发送通知)"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.23066544532776, "api_error": null} {"episode_id": "SQ5_FP_A_1159", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1159.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261788, "scenario_id": "INS-02", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-25T14:40:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次 None 空值,疑似传感器故障或短暂环境异常。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 06:28 起床、07:37 出门上班、18:20 回家、22:41 就寝,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式。\",\n \"推理步骤2: 14:40 的一次 LockOperationError(OperationError=1, OperationSource=3 即密码/键盘)紧接着 20 秒后同一用户(UserIndex=1)成功解锁并进入客厅,属于输错一次密码后重试成功的正常场景,不构成入侵威胁。\",\n \"推理步骤3: 厨房温度传感器在 18:00 突然从约 2484(24.84°C)跳升至 2852(28.52°C),18:30 仍为 2859(28.59°C),但此时灶具尚未开启(18:53 才点火)。这一约 3.7°C 的突增无法用烹饪解释,且与客厅/卧室同时段的温度趋势相反(它们在下降)。\",\n \"推理步骤4: 厨房温度传感器在 18:54 和 19:26 两次报告 MeasuredValue = None(空值),说明传感器读数丢失。19:00 恢复后读数回落至 2438(24.38°C),与其他房间温度趋势重新一致。\",\n \"推理步骤5: 综合来看,18:00-18:54 期间厨房温度传感器的异常高温 + 空值组合,最可能的解释是传感器本身出现间歇性故障(接触不良、供电波动或固件异常),而非真实的环境温度骤升。不排除短暂外部热源影响(如阳光直射传感器),但两次 None 更指向设备问题。\",\n \"推理步骤6: 烟雾报警器全天无任何触发记录,排除火灾风险;漏水传感器无报警;入户门在住户不在家期间始终处于锁定状态,安防正常。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度从 ~24.8°C 骤升至 28.5°C,此时灶具未开且其他房间温度在下降\",\n \"18:54 和 19:26 厨房温度传感器两次报告 MeasuredValue = None(读数丢失)\",\n \"19:00 恢复后温度回落至 24.38°C,与全屋趋势重新一致,说明异常是暂时性的\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否受阳光直射或其他热源干扰\",\n \"检查该传感器的电池电量或供电状态,必要时重启或更换设备\",\n \"持续观察未来几天该传感器是否再次出现 None 空值或异常跳变,若反复出现建议更换传感器\",\n \"14:40 的门锁密码错误虽为正常误操作,建议定期查看门锁错误日志,若短时间内出现多次连续错误则需警惕\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次 None 空值,疑似传感器故障或短暂环境异常。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 06:28 起床、07:37 出门上班、18:20 回家、22:41 就寝,门锁开关、灯光、运动传感器的时序完全吻合单人一室一厅的日常模式。", "推理步骤2: 14:40 的一次 LockOperationError(OperationError=1, OperationSource=3 即密码/键盘)紧接着 20 秒后同一用户(UserIndex=1)成功解锁并进入客厅,属于输错一次密码后重试成功的正常场景,不构成入侵威胁。", "推理步骤3: 厨房温度传感器在 18:00 突然从约 2484(24.84°C)跳升至 2852(28.52°C),18:30 仍为 2859(28.59°C),但此时灶具尚未开启(18:53 才点火)。这一约 3.7°C 的突增无法用烹饪解释,且与客厅/卧室同时段的温度趋势相反(它们在下降)。", "推理步骤4: 厨房温度传感器在 18:54 和 19:26 两次报告 MeasuredValue = None(空值),说明传感器读数丢失。19:00 恢复后读数回落至 2438(24.38°C),与其他房间温度趋势重新一致。", "推理步骤5: 综合来看,18:00-18:54 期间厨房温度传感器的异常高温 + 空值组合,最可能的解释是传感器本身出现间歇性故障(接触不良、供电波动或固件异常),而非真实的环境温度骤升。不排除短暂外部热源影响(如阳光直射传感器),但两次 None 更指向设备问题。", "推理步骤6: 烟雾报警器全天无任何触发记录,排除火灾风险;漏水传感器无报警;入户门在住户不在家期间始终处于锁定状态,安防正常。"], "key_evidence": ["18:00 厨房温度从 ~24.8°C 骤升至 28.5°C,此时灶具未开且其他房间温度在下降", "18:54 和 19:26 厨房温度传感器两次报告 MeasuredValue = None(读数丢失)", "19:00 恢复后温度回落至 24.38°C,与全屋趋势重新一致,说明异常是暂时性的"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否受阳光直射或其他热源干扰", "检查该传感器的电池电量或供电状态,必要时重启或更换设备", "持续观察未来几天该传感器是否再次出现 None 空值或异常跳变,若反复出现建议更换传感器", "14:40 的门锁密码错误虽为正常误操作,建议定期查看门锁错误日志,若短时间内出现多次连续错误则需警惕"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.65328359603882, "api_error": null} {"episode_id": "SQ5_FP_A_1157", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1157.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261786, "scenario_id": "INS-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "living_room", "injection_time": "2026-06-10T11:52:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,需排查是否存在真实高温隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~24.7°C 跳升至 28.68°C,而同一时刻客厅和卧室温度均在正常下降趋势中(24.68°C / 23.55°C),跨房间温差不应如此剧烈。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.54°C,但此时灶具尚未开启(灶具 18:45:30 才开),排除烹饪导致的正常升温,该高温读数缺乏合理热源解释。\",\n \"推理步骤3: 18:46 和 19:37 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据采集中断或内部故障。结合之前的异常高温,高度怀疑传感器本身出现硬件或通信故障。\",\n \"推理步骤4: 19:00 之后厨房温度恢复到 24.29°C 并回归正常趋势,说明之前的 28°C+ 读数大概率是传感器异常而非真实环境温度。\",\n \"推理步骤5: 烟雾报警器全天未触发任何告警,进一步佐证厨房并未发生真实的火灾或过热事件。\",\n \"推理步骤6: 其余行为模式均正常——住户约 06:21 起床、07:39 出门上班(门锁手动开锁后自动回锁)、11:52 有访客通过远程/密码开锁(UserIndex=5)、18:15 住户回家、22:41 就寝,符合典型单人一室一厅的生活节奏。\",\n \"推理步骤7: 入户门在住户外出期间(07:39-18:15)保持锁定状态,11:52 的开锁事件有明确的用户索引,属于授权访问而非入侵。\",\n \"推理步骤8: 19:36 厨房窗户打开(通风散味)、洗碗机 19:52 启动,均为正常烹饪后行为。卧室窗帘早晚开合、灯光随人体感应联动,一切正常。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突增至 2868(28.68°C),较 17:30 的 2474(24.74°C)骤升近 4°C,同期客厅/卧室温度正常下降\",\n \"18:30 厨房温度仍为 2854(28.54°C),但灶具直到 18:45:30 才开启,无合理热源\",\n \"18:46:00 和 19:37:00 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据中断\",\n \"19:00 之后厨房温度恢复正常(2429 / 24.29°C),与客厅温度趋势重新一致\",\n \"全天烟雾报警器未触发任何事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如烤箱排气口),必要时更换传感器\",\n \"排查传感器通信链路,确认两次 None 读数是传感器端故障还是网络丢包导致\",\n \"在传感器修复前,可临时增加对厨房烟雾报警器状态的监控频率,作为温度监测的备份手段\",\n \"确认 UserIndex=5 的门锁用户身份是否为已知授权人员(如家政、快递代收等),如非预期访问应及时撤销该用户凭证\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数及两次数据丢失(None),疑似传感器故障,需排查是否存在真实高温隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~24.7°C 跳升至 28.68°C,而同一时刻客厅和卧室温度均在正常下降趋势中(24.68°C / 23.55°C),跨房间温差不应如此剧烈。", "推理步骤2: 18:30 厨房温度仍高达 28.54°C,但此时灶具尚未开启(灶具 18:45:30 才开),排除烹饪导致的正常升温,该高温读数缺乏合理热源解释。", "推理步骤3: 18:46 和 19:37 厨房温度传感器连续两次报告 MeasuredValue = None,表明传感器数据采集中断或内部故障。结合之前的异常高温,高度怀疑传感器本身出现硬件或通信故障。", "推理步骤4: 19:00 之后厨房温度恢复到 24.29°C 并回归正常趋势,说明之前的 28°C+ 读数大概率是传感器异常而非真实环境温度。", "推理步骤5: 烟雾报警器全天未触发任何告警,进一步佐证厨房并未发生真实的火灾或过热事件。", "推理步骤6: 其余行为模式均正常——住户约 06:21 起床、07:39 出门上班(门锁手动开锁后自动回锁)、11:52 有访客通过远程/密码开锁(UserIndex=5)、18:15 住户回家、22:41 就寝,符合典型单人一室一厅的生活节奏。", "推理步骤7: 入户门在住户外出期间(07:39-18:15)保持锁定状态,11:52 的开锁事件有明确的用户索引,属于授权访问而非入侵。", "推理步骤8: 19:36 厨房窗户打开(通风散味)、洗碗机 19:52 启动,均为正常烹饪后行为。卧室窗帘早晚开合、灯光随人体感应联动,一切正常。"], "key_evidence": ["18:00 厨房温度突增至 2868(28.68°C),较 17:30 的 2474(24.74°C)骤升近 4°C,同期客厅/卧室温度正常下降", "18:30 厨房温度仍为 2854(28.54°C),但灶具直到 18:45:30 才开启,无合理热源", "18:46:00 和 19:37:00 厨房温度传感器两次报告 MeasuredValue = None,表明传感器数据中断", "19:00 之后厨房温度恢复正常(2429 / 24.29°C),与客厅温度趋势重新一致", "全天烟雾报警器未触发任何事件"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如烤箱排气口),必要时更换传感器", "排查传感器通信链路,确认两次 None 读数是传感器端故障还是网络丢包导致", "在传感器修复前,可临时增加对厨房烟雾报警器状态的监控频率,作为温度监测的备份手段", "确认 UserIndex=5 的门锁用户身份是否为已知授权人员(如家政、快递代收等),如非预期访问应及时撤销该用户凭证"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.347420692443848, "api_error": null} {"episode_id": "SQ5_FP_B_1116", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1116.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261745, "scenario_id": "INS-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-17T22:51:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"住户已就寝并锁门后,22:51有未识别用户通过远程方式解锁入户门并进入室内,存在入侵风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:50住户完成就寝流程——关闭客厅主灯和空调、进入主卧、关闭主卧窗帘和灯,入户门传感器确认关闭(StateValue=True)且门锁自动上锁(LockOperationType=0, OperationSource=Auto, LockState=1)。\",\n \"推理步骤2: 仅1分钟后(22:51),入户门锁被再次解锁。此次解锁事件的参数异常:LockOperationType=1(解锁)、OperationSource=3(远程/遥控操作,非Manual也非Auto)、UserIndex=5(非户主常用用户)。\",\n \"推理步骤3: 解锁后玄关运动传感器(22:51:05)和客厅运动传感器(22:51:30)依次触发,说明确实有人从入口进入并移动到客厅。\",\n \"推理步骤4: 22:52客厅主灯被重新打开,但住户刚刚在22:50关灯就寝,不符合正常行为模式。\",\n \"推理步骤5: 对比当天两次正常出入(07:14手动开锁出门、16:34/18:19手动开锁回家),操作源均为Manual且无UserIndex参数,而此次为远程操作且携带UserIndex=5,与住户日常习惯明显不同。\",\n \"推理步骤6: 此外,厨房温度传感器在06:39和07:07、18:50和19:16多次报告MeasuredValue=None,存在设备故障的次要问题,但不影响入侵判断。\"\n ],\n \"key_evidence\": [\n \"22:50:22 入户门自动上锁(LockState=1),住户已就寝\",\n \"22:51:00 入户门被远程解锁(OperationSource=3, UserIndex=5),与住户日常手动操作模式不符\",\n \"22:51:05~22:51:30 玄关和客厅运动传感器依次触发,确认有人进入\",\n \"22:52:00 客厅主灯被重新打开,与住户刚关灯就寝矛盾\",\n \"当天正常出入均为Manual操作源,无UserIndex参数\"\n ],\n \"recommended_actions\": [\n \"立即通过手机向住户推送高优先级入侵警报,确认是否为本人或已知家庭成员操作\",\n \"若住户未确认,立即触发室内警报并联系物业或报警\",\n \"检查门锁UserIndex=5对应的用户身份,确认该凭证是否被授权,若不明则立即撤销该用户的远程访问权限\",\n \"审查门锁远程访问日志,排查凭证泄露或被盗用的可能性\",\n \"次要:检查厨房温度传感器多次报告None值的问题,可能需要维修或更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "住户已就寝并锁门后,22:51有未识别用户通过远程方式解锁入户门并进入室内,存在入侵风险。", "reasoning": ["推理步骤1: 22:50住户完成就寝流程——关闭客厅主灯和空调、进入主卧、关闭主卧窗帘和灯,入户门传感器确认关闭(StateValue=True)且门锁自动上锁(LockOperationType=0, OperationSource=Auto, LockState=1)。", "推理步骤2: 仅1分钟后(22:51),入户门锁被再次解锁。此次解锁事件的参数异常:LockOperationType=1(解锁)、OperationSource=3(远程/遥控操作,非Manual也非Auto)、UserIndex=5(非户主常用用户)。", "推理步骤3: 解锁后玄关运动传感器(22:51:05)和客厅运动传感器(22:51:30)依次触发,说明确实有人从入口进入并移动到客厅。", "推理步骤4: 22:52客厅主灯被重新打开,但住户刚刚在22:50关灯就寝,不符合正常行为模式。", "推理步骤5: 对比当天两次正常出入(07:14手动开锁出门、16:34/18:19手动开锁回家),操作源均为Manual且无UserIndex参数,而此次为远程操作且携带UserIndex=5,与住户日常习惯明显不同。", "推理步骤6: 此外,厨房温度传感器在06:39和07:07、18:50和19:16多次报告MeasuredValue=None,存在设备故障的次要问题,但不影响入侵判断。"], "key_evidence": ["22:50:22 入户门自动上锁(LockState=1),住户已就寝", "22:51:00 入户门被远程解锁(OperationSource=3, UserIndex=5),与住户日常手动操作模式不符", "22:51:05~22:51:30 玄关和客厅运动传感器依次触发,确认有人进入", "22:52:00 客厅主灯被重新打开,与住户刚关灯就寝矛盾", "当天正常出入均为Manual操作源,无UserIndex参数"], "recommended_actions": ["立即通过手机向住户推送高优先级入侵警报,确认是否为本人或已知家庭成员操作", "若住户未确认,立即触发室内警报并联系物业或报警", "检查门锁UserIndex=5对应的用户身份,确认该凭证是否被授权,若不明则立即撤销该用户的远程访问权限", "审查门锁远程访问日志,排查凭证泄露或被盗用的可能性", "次要:检查厨房温度传感器多次报告None值的问题,可能需要维修或更换"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.707918882369995, "api_error": null} {"episode_id": "SQ5_FP_A_1161", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_A_1161.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20261790, "scenario_id": "WD-01", "total_events": 188, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-14T20:10:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器存在多次读数异常(报告 None 及一次疑似跳变至 29.87°C),需要关注设备健康状态。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——住户约 08:17 起床、09:09 进厨房做早餐、12:07 做午餐、17:52 做晚餐、22:55 就寝,符合一室一厅单人居住的典型日常模式。\",\n \"推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:10、09:40、12:08、12:53、17:53、18:26),共计 6 次。虽然灶具使用时传感器可能因高温超量程而返回 None,但这种频繁的 None 值表明传感器可能存在耐热性不足或通信故障。\",\n \"推理步骤3: 12:00 厨房温度传感器报告 2987(29.87°C),而同一时刻客厅为 25.87°C、卧室为 24.72°C。厨房比其他房间高出约 4-5°C,且 12:07 灶具才开启,说明这个高温读数出现在灶具开启之前,属于异常跳变。12:30 再次报告 2987 也印证了传感器可能卡在了错误值上。\",\n \"推理步骤4: 20:10 卫生间漏水传感器短暂触发(2 分钟后恢复),同时有人在卫生间(occupancy=1、灯亮),判断为正常用水(洗澡/洗手)溅水触发,非真实漏水。\",\n \"推理步骤5: 入侵风险评估——入户门在 22:55 自动上锁(LockState=1, OperationSource=Auto),门传感器显示关闭(StateValue=True),全天无异常开门/解锁事件,无入侵迹象。\",\n \"推理步骤6: 火灾风险评估——厨房烟雾报警器全天未触发,灶具每次使用后均正常关闭,做饭后开窗通风(kitchen_window_contact=False),操作规范,无火灾风险。\",\n \"推理步骤7: 客厅空调在 10:03 开启制冷模式(SystemMode=3),对应当时室温约 25.19°C 且持续升高的趋势,属于合理操作。22:55 就寝时关闭,正常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 12:00 和 12:30 报告异常值 2987(29.87°C),灶具 12:07 才开启,该高温读数出现在烹饪前且数值偏离其他房间约 5°C\",\n \"厨房温度传感器全天共 6 次报告 MeasuredValue = None,均发生在灶具使用前后,频率偏高\",\n \"卫生间漏水传感器 20:10 触发但 20:12 即恢复,且同时段有人在卫生间活动\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认其是否距离灶具过近导致受热异常,建议将传感器移至远离热源的位置\",\n \"观察厨房温度传感器后续是否继续出现 None 值或异常跳变,若持续出现建议更换传感器或进行固件更新\",\n \"卫生间漏水传感器本次为短暂触发,无需立即处理,但建议持续监测——若未来在无人使用卫生间时触发,则需排查管道漏水\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器存在多次读数异常(报告 None 及一次疑似跳变至 29.87°C),需要关注设备健康状态。", "reasoning": ["推理步骤1: 整体生活作息正常——住户约 08:17 起床、09:09 进厨房做早餐、12:07 做午餐、17:52 做晚餐、22:55 就寝,符合一室一厅单人居住的典型日常模式。", "推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(09:10、09:40、12:08、12:53、17:53、18:26),共计 6 次。虽然灶具使用时传感器可能因高温超量程而返回 None,但这种频繁的 None 值表明传感器可能存在耐热性不足或通信故障。", "推理步骤3: 12:00 厨房温度传感器报告 2987(29.87°C),而同一时刻客厅为 25.87°C、卧室为 24.72°C。厨房比其他房间高出约 4-5°C,且 12:07 灶具才开启,说明这个高温读数出现在灶具开启之前,属于异常跳变。12:30 再次报告 2987 也印证了传感器可能卡在了错误值上。", "推理步骤4: 20:10 卫生间漏水传感器短暂触发(2 分钟后恢复),同时有人在卫生间(occupancy=1、灯亮),判断为正常用水(洗澡/洗手)溅水触发,非真实漏水。", "推理步骤5: 入侵风险评估——入户门在 22:55 自动上锁(LockState=1, OperationSource=Auto),门传感器显示关闭(StateValue=True),全天无异常开门/解锁事件,无入侵迹象。", "推理步骤6: 火灾风险评估——厨房烟雾报警器全天未触发,灶具每次使用后均正常关闭,做饭后开窗通风(kitchen_window_contact=False),操作规范,无火灾风险。", "推理步骤7: 客厅空调在 10:03 开启制冷模式(SystemMode=3),对应当时室温约 25.19°C 且持续升高的趋势,属于合理操作。22:55 就寝时关闭,正常。"], "key_evidence": ["厨房温度传感器在 12:00 和 12:30 报告异常值 2987(29.87°C),灶具 12:07 才开启,该高温读数出现在烹饪前且数值偏离其他房间约 5°C", "厨房温度传感器全天共 6 次报告 MeasuredValue = None,均发生在灶具使用前后,频率偏高", "卫生间漏水传感器 20:10 触发但 20:12 即恢复,且同时段有人在卫生间活动"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认其是否距离灶具过近导致受热异常,建议将传感器移至远离热源的位置", "观察厨房温度传感器后续是否继续出现 None 值或异常跳变,若持续出现建议更换传感器或进行固件更新", "卫生间漏水传感器本次为短暂触发,无需立即处理,但建议持续监测——若未来在无人使用卫生间时触发,则需排查管道漏水"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.162073373794556, "api_error": null} {"episode_id": "SQ5_FP_B_1122", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1122.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261751, "scenario_id": "INS-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-12T17:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:27 入户门开锁后未关门记录需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:43、07:19、18:50、19:06 四次报告 MeasuredValue = None,每次都与灶具开启/关闭时间高度相关,可能是高温干扰或传感器故障。\",\n \"推理步骤2: 16:27 入户门通过手动方式解锁并开门(StateValue=False),但日志中没有对应的关门(StateValue=True)和上锁记录,直到 17:56 有人通过 UserIndex=5 开锁进入。这意味着门在 16:27~17:56 约 90 分钟内可能处于未关闭状态,存在安全隐患。\",\n \"推理步骤3: 17:56 的开锁事件使用 OperationSource=3(远程/PIN码),UserIndex=5,随后有正常的入户活动(运动传感器触发、灯和空调开启),属于正常回家行为。\",\n \"推理步骤4: 整体温度曲线符合夏季日间升温、夜间降温的自然规律,无异常热源迹象。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。\",\n \"推理步骤5: 早晨 07:41 和晚间 22:39 的出门/就寝流程完整正常(关灯→开锁→开门→关门→自动上锁),无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:43、07:19、18:50、19:06 报告 MeasuredValue = None\",\n \"16:27 front_door_lock 解锁、front_door_contact 开门(StateValue=False),但无后续关门记录,直到 22:39 才出现 StateValue=True\",\n \"17:56 使用 OperationSource=3, UserIndex=5 开锁,与 16:27 的手动开锁为不同事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器安装位置,确认是否受灶具高温直接影响导致读数异常,必要时更换或重新定位传感器\",\n \"排查 16:27 开门事件:确认是否为住户本人操作(如短暂外出取快递),建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)\",\n \"确认 UserIndex=5 对应的用户身份是否为授权家庭成员\",\n \"建议为入户门添加「长时间未关闭」自动化告警规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时 16:27 入户门开锁后未关门记录需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:43、07:19、18:50、19:06 四次报告 MeasuredValue = None,每次都与灶具开启/关闭时间高度相关,可能是高温干扰或传感器故障。", "推理步骤2: 16:27 入户门通过手动方式解锁并开门(StateValue=False),但日志中没有对应的关门(StateValue=True)和上锁记录,直到 17:56 有人通过 UserIndex=5 开锁进入。这意味着门在 16:27~17:56 约 90 分钟内可能处于未关闭状态,存在安全隐患。", "推理步骤3: 17:56 的开锁事件使用 OperationSource=3(远程/PIN码),UserIndex=5,随后有正常的入户活动(运动传感器触发、灯和空调开启),属于正常回家行为。", "推理步骤4: 整体温度曲线符合夏季日间升温、夜间降温的自然规律,无异常热源迹象。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水风险。", "推理步骤5: 早晨 07:41 和晚间 22:39 的出门/就寝流程完整正常(关灯→开锁→开门→关门→自动上锁),无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:43、07:19、18:50、19:06 报告 MeasuredValue = None", "16:27 front_door_lock 解锁、front_door_contact 开门(StateValue=False),但无后续关门记录,直到 22:39 才出现 StateValue=True", "17:56 使用 OperationSource=3, UserIndex=5 开锁,与 16:27 的手动开锁为不同事件"], "recommended_actions": ["检查厨房温度传感器安装位置,确认是否受灶具高温直接影响导致读数异常,必要时更换或重新定位传感器", "排查 16:27 开门事件:确认是否为住户本人操作(如短暂外出取快递),建议设置门未关闭超时告警(如超过5分钟未关门则推送提醒)", "确认 UserIndex=5 对应的用户身份是否为授权家庭成员", "建议为入户门添加「长时间未关闭」自动化告警规则"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 21.182387351989746, "api_error": null} {"episode_id": "SQ5_FP_B_1124", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1124.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261753, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "second_bedroom", "injection_time": "2026-06-04T08:35:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.56°C,偏离同期其他房间约4°C),随后在18:52和19:38两次报告None值,表明传感器可能故障;同时厨房窗户在做完饭后打开但日志中未见关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 温度趋势分析——凌晨0:00至5:30,全屋四个传感器温度在22.9~23.1°C范围内同步波动,属于正常夜间降温。6:00起随日出逐步升温,至12:30达到峰值约25.8°C,下午逐步回落,整体曲线符合夏季自然温度变化规律。\",\n \"推理步骤2: 厨房温度异常——18:00时,客厅24.54°C、主卧24.64°C、次卧24.50°C,而厨房突然跳升至28.56°C,偏差约4°C。18:30厨房仍为28.57°C。但18:51灶具开启后,19:00厨房温度反而回落至24.25°C(与其他房间一致)。这种'灶具未开时高温、灶具开启后温度反降'的模式不合常理,高度怀疑传感器在18:00~18:30期间读数异常。\",\n \"推理步骤3: 传感器None值——18:52和19:38厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了读取失败。结合之前的异常高温读数,传感器很可能存在硬件故障或连接不稳定。\",\n \"推理步骤4: 厨房窗户未关闭——19:37:30厨房窗户传感器报告StateValue=False(窗户打开),此后直至日志结束(23:30)未见窗户关闭事件。住户已于22:03进入睡眠准备状态(关灯、关空调、锁门),厨房窗户在夜间保持开启存在安全隐患。\",\n \"推理步骤5: 入侵排除——08:35的开锁事件使用了OperationSource=3(远程/密码)且携带UserIndex=5,属于授权用户操作。18:08手动开锁后有正常的入户-客厅活动链(运动传感器、开灯、开空调),符合住户下班回家模式。07:17的出门序列(关灯→玄关运动→手动开锁→开关门→自动上锁)也完全正常。\",\n \"推理步骤6: 火灾风险排除——灶具18:51开启、19:37关闭,使用时长约46分钟属正常做饭。烟雾报警器全天无触发。19:00厨房温度已恢复正常,不存在持续高温。\",\n \"推理步骤7: 其他系统正常——卫生间漏水传感器无报警,洗碗机正常启动运行,门锁在无人时均处于锁定状态,全屋行为模式与单人居住的作息一致。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度28.56°C,同一时刻其他三个房间均在24.5~24.6°C,偏差约4°C\",\n \"18:30厨房温度28.57°C持续异常高\",\n \"18:52和19:38厨房温度传感器两次报告MeasuredValue=None(读取失败)\",\n \"19:37厨房窗户打开(StateValue=False)后至日志结束未见关闭事件\",\n \"22:03住户已执行睡前流程(关灯、关空调、确认门锁),但厨房窗户仍开启\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,检查其安装位置是否靠近热源(如冰箱散热口、管道),必要时更换传感器\",\n \"关闭厨房窗户:夜间窗户开启存在安全风险(入侵、雨水),建议立即关闭或设置自动化规则在睡眠模式时提醒关窗\",\n \"添加自动化规则:当温度传感器报告None值时触发告警通知,避免传感器静默失效导致火灾等风险无法被及时检测\",\n \"考虑为厨房窗户增加定时提醒:若窗户在22:00后仍处于打开状态,自动发送关窗提醒\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.56°C,偏离同期其他房间约4°C),随后在18:52和19:38两次报告None值,表明传感器可能故障;同时厨房窗户在做完饭后打开但日志中未见关闭记录。", "reasoning": ["推理步骤1: 温度趋势分析——凌晨0:00至5:30,全屋四个传感器温度在22.9~23.1°C范围内同步波动,属于正常夜间降温。6:00起随日出逐步升温,至12:30达到峰值约25.8°C,下午逐步回落,整体曲线符合夏季自然温度变化规律。", "推理步骤2: 厨房温度异常——18:00时,客厅24.54°C、主卧24.64°C、次卧24.50°C,而厨房突然跳升至28.56°C,偏差约4°C。18:30厨房仍为28.57°C。但18:51灶具开启后,19:00厨房温度反而回落至24.25°C(与其他房间一致)。这种'灶具未开时高温、灶具开启后温度反降'的模式不合常理,高度怀疑传感器在18:00~18:30期间读数异常。", "推理步骤3: 传感器None值——18:52和19:38厨房温度传感器两次报告MeasuredValue=None,说明传感器出现了读取失败。结合之前的异常高温读数,传感器很可能存在硬件故障或连接不稳定。", "推理步骤4: 厨房窗户未关闭——19:37:30厨房窗户传感器报告StateValue=False(窗户打开),此后直至日志结束(23:30)未见窗户关闭事件。住户已于22:03进入睡眠准备状态(关灯、关空调、锁门),厨房窗户在夜间保持开启存在安全隐患。", "推理步骤5: 入侵排除——08:35的开锁事件使用了OperationSource=3(远程/密码)且携带UserIndex=5,属于授权用户操作。18:08手动开锁后有正常的入户-客厅活动链(运动传感器、开灯、开空调),符合住户下班回家模式。07:17的出门序列(关灯→玄关运动→手动开锁→开关门→自动上锁)也完全正常。", "推理步骤6: 火灾风险排除——灶具18:51开启、19:37关闭,使用时长约46分钟属正常做饭。烟雾报警器全天无触发。19:00厨房温度已恢复正常,不存在持续高温。", "推理步骤7: 其他系统正常——卫生间漏水传感器无报警,洗碗机正常启动运行,门锁在无人时均处于锁定状态,全屋行为模式与单人居住的作息一致。"], "key_evidence": ["18:00厨房温度28.56°C,同一时刻其他三个房间均在24.5~24.6°C,偏差约4°C", "18:30厨房温度28.57°C持续异常高", "18:52和19:38厨房温度传感器两次报告MeasuredValue=None(读取失败)", "19:37厨房窗户打开(StateValue=False)后至日志结束未见关闭事件", "22:03住户已执行睡前流程(关灯、关空调、确认门锁),但厨房窗户仍开启"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,检查其安装位置是否靠近热源(如冰箱散热口、管道),必要时更换传感器", "关闭厨房窗户:夜间窗户开启存在安全风险(入侵、雨水),建议立即关闭或设置自动化规则在睡眠模式时提醒关窗", "添加自动化规则:当温度传感器报告None值时触发告警通知,避免传感器静默失效导致火灾等风险无法被及时检测", "考虑为厨房窗户增加定时提醒:若窗户在22:00后仍处于打开状态,自动发送关窗提醒"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.742153644561768, "api_error": null} {"episode_id": "SQ5_FP_B_1125", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1125.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261754, "scenario_id": "WD-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-09T13:56:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及数据丢失,可能存在传感器故障或短暂的厨房高温隐患。\",\n \"reasoning\": [\n \"推理步骤1: 全屋温度在 00:00-05:30 期间稳定在 22.9-23.1°C,06:00 起随日照自然上升,12:00-13:30 达到峰值约 25.7-25.9°C,之后逐步回落,整体趋势符合夏季昼夜温差规律,属正常。\",\n \"推理步骤2: 19:00 厨房温度传感器突然报告 2834(28.34°C),而同一时刻客厅/主卧/次卧均在 24.3-24.5°C 范围内,厨房与其他房间温差高达约 4°C。虽然 19:04 灶具开启可以解释部分升温,但 2834 的读数出现在灶具开启之前,说明要么传感器提前受到热源影响,要么读数本身存在异常跳变。\",\n \"推理步骤3: 19:05 和 19:30 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在灶具使用期间出现了数据丢失或通信中断。紧接着 19:30 又恢复报告 2840(28.40°C),随后 20:00 骤降回 2416(24.16°C),这种剧烈波动不符合正常的物理降温曲线。\",\n \"推理步骤4: 烟雾报警器全天未触发,灶具在 19:04-19:29 正常使用约 25 分钟后关闭,19:29 厨房窗户打开通风,说明并未发生火灾事件。但传感器的 None 值和异常跳变仍需关注。\",\n \"推理步骤5: 其他事件均属正常——06:32 起床如厕、07:33 出门上班(门锁手动开锁后自动回锁)、18:29 回家开灯开空调、13:56 卫生间漏水传感器短暂触发 2 分钟后恢复(有人在场,可能是正常用水溅水)、22:11 关灯锁门就寝。入侵风险不存在。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数突跳至 2834(28.34°C),比同时刻其他房间高出约 4°C,且此时灶具尚未开启\",\n \"19:05 和 19:30 厨房温度传感器连续报告 MeasuredValue = None,出现数据丢失\",\n \"19:30 恢复后读数为 2840(28.40°C),20:00 骤降至 2416(24.16°C),30 分钟内下降超 4°C,降温速率异常\",\n \"烟雾报警器全天未触发,排除火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数受热辐射干扰\",\n \"排查厨房温度传感器的通信连接稳定性,解决 None 值数据丢失问题(检查电池电量或 Matter 网络信号)\",\n \"如传感器持续出现异常读数和数据中断,建议更换传感器或重新校准\",\n \"卫生间漏水传感器虽然本次为短暂触发(2 分钟),建议留意后续是否反复触发,排除管道缓慢渗漏的可能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及数据丢失,可能存在传感器故障或短暂的厨房高温隐患。", "reasoning": ["推理步骤1: 全屋温度在 00:00-05:30 期间稳定在 22.9-23.1°C,06:00 起随日照自然上升,12:00-13:30 达到峰值约 25.7-25.9°C,之后逐步回落,整体趋势符合夏季昼夜温差规律,属正常。", "推理步骤2: 19:00 厨房温度传感器突然报告 2834(28.34°C),而同一时刻客厅/主卧/次卧均在 24.3-24.5°C 范围内,厨房与其他房间温差高达约 4°C。虽然 19:04 灶具开启可以解释部分升温,但 2834 的读数出现在灶具开启之前,说明要么传感器提前受到热源影响,要么读数本身存在异常跳变。", "推理步骤3: 19:05 和 19:30 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器在灶具使用期间出现了数据丢失或通信中断。紧接着 19:30 又恢复报告 2840(28.40°C),随后 20:00 骤降回 2416(24.16°C),这种剧烈波动不符合正常的物理降温曲线。", "推理步骤4: 烟雾报警器全天未触发,灶具在 19:04-19:29 正常使用约 25 分钟后关闭,19:29 厨房窗户打开通风,说明并未发生火灾事件。但传感器的 None 值和异常跳变仍需关注。", "推理步骤5: 其他事件均属正常——06:32 起床如厕、07:33 出门上班(门锁手动开锁后自动回锁)、18:29 回家开灯开空调、13:56 卫生间漏水传感器短暂触发 2 分钟后恢复(有人在场,可能是正常用水溅水)、22:11 关灯锁门就寝。入侵风险不存在。"], "key_evidence": ["19:00 厨房温度传感器读数突跳至 2834(28.34°C),比同时刻其他房间高出约 4°C,且此时灶具尚未开启", "19:05 和 19:30 厨房温度传感器连续报告 MeasuredValue = None,出现数据丢失", "19:30 恢复后读数为 2840(28.40°C),20:00 骤降至 2416(24.16°C),30 分钟内下降超 4°C,降温速率异常", "烟雾报警器全天未触发,排除火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致读数受热辐射干扰", "排查厨房温度传感器的通信连接稳定性,解决 None 值数据丢失问题(检查电池电量或 Matter 网络信号)", "如传感器持续出现异常读数和数据中断,建议更换传感器或重新校准", "卫生间漏水传感器虽然本次为短暂触发(2 分钟),建议留意后续是否反复触发,排除管道缓慢渗漏的可能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.863123178482056, "api_error": null} {"episode_id": "SQ5_FP_B_1127", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1127.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261756, "scenario_id": "INS-04", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-20T19:37:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在无人操作灶具的时段出现异常高温(约29.4-29.5°C),远超同期其他房间温度,存在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 分析温度趋势——全屋温度在凌晨约22.9-23.1°C,随日间升温至中午约25.5°C,傍晚回落,各房间温度走势高度一致,属于正常的昼夜温度变化。\",\n \"推理步骤2: 厨房温度在11:00突然跳升至2942(29.42°C),11:30继续升至2950(29.50°C),而同时段客厅/主卧/次卧温度仅约25.4-25.6°C,厨房比其他房间高出约4°C。\",\n \"推理步骤3: 检查灶具状态——09:50灶具已关闭,下一次开启是11:56。也就是说11:00-11:30期间灶具处于关闭状态,厨房不应出现如此高温。\",\n \"推理步骤4: 09:50关灶后厨房窗户被打开通风(09:50:30),10:00时厨房温度已恢复正常(25.30°C),10:30也正常(25.20°C)。但到11:00突然飙升至29.42°C,这不是烹饪余热。\",\n \"推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段未触发报警,但传感器未报警不等于没有风险——可能是热源尚未产生烟雾,或报警器存在故障。\",\n \"推理步骤6: 厨房温度传感器在灶具开启期间多次报告 None 值(09:15、09:51、11:57、12:42、17:53、18:28),这是灶具工作时的正常屏蔽行为。但11:00-11:30的高温发生在灶具关闭期间,传感器正常上报了数值,说明这是真实的环境温度读数。\",\n \"推理步骤7: 可能的原因包括:厨房内存在其他未受监控的热源、灶具虽显示关闭但实际未完全熄灭(燃气泄漏/电路故障)、或厨房温度传感器本身出现间歇性故障。无论哪种情况都需要排查。\"\n ],\n \"key_evidence\": [\n \"11:00 厨房温度 2942(29.42°C),同时客厅 2552(25.52°C),温差近4°C\",\n \"11:30 厨房温度 2950(29.50°C),同时客厅 2542(25.42°C),异常持续\",\n \"该时段灶具处于关闭状态(09:50关闭,11:56才重新开启),无合理热源解释\",\n \"12:00 灶具重新开启后厨房温度反而回落至 2584(25.84°C),进一步说明11:00-11:30的高温并非正常烹饪行为\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房是否存在未关闭的热源或电器异常发热情况\",\n \"检查灶具是否存在关闭不彻底的问题(如燃气阀门、电磁炉控制板故障)\",\n \"测试厨房烟雾报警器是否工作正常,确认其能在高温场景下及时触发\",\n \"检查厨房温度传感器是否存在间歇性故障导致读数偏高,可与独立温度计交叉验证\",\n \"考虑增加厨房燃气泄漏传感器以提升安全覆盖\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在无人操作灶具的时段出现异常高温(约29.4-29.5°C),远超同期其他房间温度,存在火灾隐患。", "reasoning": ["推理步骤1: 分析温度趋势——全屋温度在凌晨约22.9-23.1°C,随日间升温至中午约25.5°C,傍晚回落,各房间温度走势高度一致,属于正常的昼夜温度变化。", "推理步骤2: 厨房温度在11:00突然跳升至2942(29.42°C),11:30继续升至2950(29.50°C),而同时段客厅/主卧/次卧温度仅约25.4-25.6°C,厨房比其他房间高出约4°C。", "推理步骤3: 检查灶具状态——09:50灶具已关闭,下一次开启是11:56。也就是说11:00-11:30期间灶具处于关闭状态,厨房不应出现如此高温。", "推理步骤4: 09:50关灶后厨房窗户被打开通风(09:50:30),10:00时厨房温度已恢复正常(25.30°C),10:30也正常(25.20°C)。但到11:00突然飙升至29.42°C,这不是烹饪余热。", "推理步骤5: 厨房烟雾报警器(kitchen_smoke_alarm)在整个时段未触发报警,但传感器未报警不等于没有风险——可能是热源尚未产生烟雾,或报警器存在故障。", "推理步骤6: 厨房温度传感器在灶具开启期间多次报告 None 值(09:15、09:51、11:57、12:42、17:53、18:28),这是灶具工作时的正常屏蔽行为。但11:00-11:30的高温发生在灶具关闭期间,传感器正常上报了数值,说明这是真实的环境温度读数。", "推理步骤7: 可能的原因包括:厨房内存在其他未受监控的热源、灶具虽显示关闭但实际未完全熄灭(燃气泄漏/电路故障)、或厨房温度传感器本身出现间歇性故障。无论哪种情况都需要排查。"], "key_evidence": ["11:00 厨房温度 2942(29.42°C),同时客厅 2552(25.52°C),温差近4°C", "11:30 厨房温度 2950(29.50°C),同时客厅 2542(25.42°C),异常持续", "该时段灶具处于关闭状态(09:50关闭,11:56才重新开启),无合理热源解释", "12:00 灶具重新开启后厨房温度反而回落至 2584(25.84°C),进一步说明11:00-11:30的高温并非正常烹饪行为"], "recommended_actions": ["立即检查厨房是否存在未关闭的热源或电器异常发热情况", "检查灶具是否存在关闭不彻底的问题(如燃气阀门、电磁炉控制板故障)", "测试厨房烟雾报警器是否工作正常,确认其能在高温场景下及时触发", "检查厨房温度传感器是否存在间歇性故障导致读数偏高,可与独立温度计交叉验证", "考虑增加厨房燃气泄漏传感器以提升安全覆盖"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.68231964111328, "api_error": null} {"episode_id": "SQ5_FP_B_1131", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1131.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261760, "scenario_id": "WD-01", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-13T17:21:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.90°C),疑似传感器故障或受灶具热辐射干扰。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(09:05、09:46、12:10、12:54、17:52、18:34),每次都紧跟在灶具开启或关闭之后。其他三个温度传感器全天无任何 None 值,说明这不是系统级问题,而是该传感器特有的异常。\",\n \"推理步骤2: 12:00 时厨房温度传感器报告 2990(29.90°C),而同一时刻客厅 25.72°C、主卧 25.73°C、次卧 25.89°C,厨房比其他房间高出约 4°C。12:30 仍为 2981(29.81°C)。灶具在 12:09 才开启,仅 1 分钟内不可能让整个厨房升温 4°C,更可能是传感器受灶具热辐射直接影响或传感器本身读数漂移。\",\n \"推理步骤3: 全天温度趋势本身是正常的——凌晨约 23°C,午后峰值约 25.5-25.9°C(除厨房异常点外),晚间回落至 23°C 左右,符合夏季昼夜温差规律。\",\n \"推理步骤4: 卫生间漏水传感器在 17:21 触发,但当时有人在卫生间(occupancy=1、灯亮),且 2 分钟后漏水状态恢复 False,判断为正常用水(如洗澡/洗手溅水),非真实漏水。\",\n \"推理步骤5: 23:04 入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),此前客厅灯和空调关闭,属于住户睡前离开客厅、确认门锁的正常行为。\",\n \"推理步骤6: 其余设备行为均符合日常生活模式——早起用卫生间、早中晚三次做饭开灶具、做饭后开窗通风、午后开空调制冷、晚餐后启动洗碗机,无入侵或火灾迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器全天出现 5 次 MeasuredValue = None,均与灶具操作时间高度关联,其他传感器无此现象\",\n \"12:00 和 12:30 厨房温度异常飙升至 29.90°C / 29.81°C,比同时刻其他房间高约 4°C,且灶具刚开启 1 分钟不足以解释如此大的温差\",\n \"卫生间漏水告警持续仅 2 分钟且伴随有人活动,属短暂溅水误触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热辐射干扰;如有必要,将传感器迁移至远离热源的位置\",\n \"排查厨房温度传感器与灶具之间是否存在电磁干扰,灶具开关时传感器立即报 None 值,可能是供电或通信链路受干扰\",\n \"如传感器位置合理且干扰排除后仍频繁出现 None 值,建议更换该温度传感器\",\n \"卫生间漏水传感器目前工作正常,但建议定期检查其灵敏度设置,避免日常用水频繁误报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且在 12:00 出现异常高温读数(29.90°C),疑似传感器故障或受灶具热辐射干扰。", "reasoning": ["推理步骤1: 厨房温度传感器在一天中出现了 5 次 MeasuredValue = None 的情况(09:05、09:46、12:10、12:54、17:52、18:34),每次都紧跟在灶具开启或关闭之后。其他三个温度传感器全天无任何 None 值,说明这不是系统级问题,而是该传感器特有的异常。", "推理步骤2: 12:00 时厨房温度传感器报告 2990(29.90°C),而同一时刻客厅 25.72°C、主卧 25.73°C、次卧 25.89°C,厨房比其他房间高出约 4°C。12:30 仍为 2981(29.81°C)。灶具在 12:09 才开启,仅 1 分钟内不可能让整个厨房升温 4°C,更可能是传感器受灶具热辐射直接影响或传感器本身读数漂移。", "推理步骤3: 全天温度趋势本身是正常的——凌晨约 23°C,午后峰值约 25.5-25.9°C(除厨房异常点外),晚间回落至 23°C 左右,符合夏季昼夜温差规律。", "推理步骤4: 卫生间漏水传感器在 17:21 触发,但当时有人在卫生间(occupancy=1、灯亮),且 2 分钟后漏水状态恢复 False,判断为正常用水(如洗澡/洗手溅水),非真实漏水。", "推理步骤5: 23:04 入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),此前客厅灯和空调关闭,属于住户睡前离开客厅、确认门锁的正常行为。", "推理步骤6: 其余设备行为均符合日常生活模式——早起用卫生间、早中晚三次做饭开灶具、做饭后开窗通风、午后开空调制冷、晚餐后启动洗碗机,无入侵或火灾迹象。"], "key_evidence": ["厨房温度传感器全天出现 5 次 MeasuredValue = None,均与灶具操作时间高度关联,其他传感器无此现象", "12:00 和 12:30 厨房温度异常飙升至 29.90°C / 29.81°C,比同时刻其他房间高约 4°C,且灶具刚开启 1 分钟不足以解释如此大的温差", "卫生间漏水告警持续仅 2 分钟且伴随有人活动,属短暂溅水误触发"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热辐射干扰;如有必要,将传感器迁移至远离热源的位置", "排查厨房温度传感器与灶具之间是否存在电磁干扰,灶具开关时传感器立即报 None 值,可能是供电或通信链路受干扰", "如传感器位置合理且干扰排除后仍频繁出现 None 值,建议更换该温度传感器", "卫生间漏水传感器目前工作正常,但建议定期检查其灵敏度设置,避免日常用水频繁误报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.770878791809082, "api_error": null} {"episode_id": "SQ5_FP_B_1133", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1133.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261762, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-18T10:57:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.54°C),随后在18:49和19:29两次报告null值,表明传感器可能存在故障。\",\n \"reasoning\": [\n \"推理步骤1: 全天各房间温度走势一致,从凌晨约23°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化规律。\",\n \"推理步骤2: 18:00时,客厅/主卧/次卧温度均在24.57°C左右,但厨房温度传感器突然跳升至28.54°C(较其他房间高出约4°C),且此时灶具尚未开启(灶具在18:48才打开),无合理热源解释这一突变。\",\n \"推理步骤3: 18:30厨房温度继续维持在28.57°C的异常高位,而18:49和19:29两次读数报告为None(null),说明传感器出现了数据丢失或通信故障。\",\n \"推理步骤4: 19:00和19:30厨房温度恢复到24.31°C和24.35°C的正常范围,与其他房间一致,说明异常是暂时性的传感器故障而非真实环境温度异常。\",\n \"推理步骤5: 烟雾报警器全天未触发,排除火灾风险;灶具使用时间(18:48-19:28)约40分钟属正常烹饪时长。\",\n \"推理步骤6: 10:57有一次通过UserIndex=5的远程/密码开锁事件,但入户门锁未记录关门和上锁动作,且住户在家期间(客厅有人体感应),属于访客或家庭成员进入,暂无入侵迹象。\",\n \"推理步骤7: 其余设备行为(早起洗漱→出门→白天无人→傍晚回家→做饭→看电视→睡前关灯锁门)完全符合单人/双人上班族的日常作息模式。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突跳至2854(28.54°C),比同时刻其他房间高约4°C,且灶具尚未开启\",\n \"18:30 厨房温度仍为2857(28.57°C),持续异常\",\n \"18:49 和 19:29 厨房温度传感器报告 MeasuredValue = None,出现两次数据丢失\",\n \"19:00 之后厨房温度恢复正常范围,说明并非真实环境过热\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和电池电量,可能存在传感器老化或接触不良\",\n \"检查该传感器的无线信号强度和通信链路,null值可能由通信中断引起\",\n \"考虑重新校准或更换厨房温度传感器,确保其作为烟雾报警辅助监测手段的可靠性\",\n \"在传感器修复前,可临时加强对厨房烟雾报警器的依赖,确保其处于正常工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.54°C),随后在18:49和19:29两次报告null值,表明传感器可能存在故障。", "reasoning": ["推理步骤1: 全天各房间温度走势一致,从凌晨约23°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化规律。", "推理步骤2: 18:00时,客厅/主卧/次卧温度均在24.57°C左右,但厨房温度传感器突然跳升至28.54°C(较其他房间高出约4°C),且此时灶具尚未开启(灶具在18:48才打开),无合理热源解释这一突变。", "推理步骤3: 18:30厨房温度继续维持在28.57°C的异常高位,而18:49和19:29两次读数报告为None(null),说明传感器出现了数据丢失或通信故障。", "推理步骤4: 19:00和19:30厨房温度恢复到24.31°C和24.35°C的正常范围,与其他房间一致,说明异常是暂时性的传感器故障而非真实环境温度异常。", "推理步骤5: 烟雾报警器全天未触发,排除火灾风险;灶具使用时间(18:48-19:28)约40分钟属正常烹饪时长。", "推理步骤6: 10:57有一次通过UserIndex=5的远程/密码开锁事件,但入户门锁未记录关门和上锁动作,且住户在家期间(客厅有人体感应),属于访客或家庭成员进入,暂无入侵迹象。", "推理步骤7: 其余设备行为(早起洗漱→出门→白天无人→傍晚回家→做饭→看电视→睡前关灯锁门)完全符合单人/双人上班族的日常作息模式。"], "key_evidence": ["18:00 厨房温度突跳至2854(28.54°C),比同时刻其他房间高约4°C,且灶具尚未开启", "18:30 厨房温度仍为2857(28.57°C),持续异常", "18:49 和 19:29 厨房温度传感器报告 MeasuredValue = None,出现两次数据丢失", "19:00 之后厨房温度恢复正常范围,说明并非真实环境过热"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和电池电量,可能存在传感器老化或接触不良", "检查该传感器的无线信号强度和通信链路,null值可能由通信中断引起", "考虑重新校准或更换厨房温度传感器,确保其作为烟雾报警辅助监测手段的可靠性", "在传感器修复前,可临时加强对厨房烟雾报警器的依赖,确保其处于正常工作状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.989866495132446, "api_error": null} {"episode_id": "SQ5_FP_B_1135", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1135.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-25T00:00:00", "seed": 20261764, "scenario_id": "INS-02", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "master_bedroom", "injection_time": "2026-06-25T20:56:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,同时入户门锁记录了一次开锁失败事件,需关注设备健康状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 19:00 突然从 ~2456(24.56°C)跳升至 2842(28.42°C),升幅近 4°C,而同一时刻其他房间温度均在正常下降,排除全屋升温的可能。虽然 19:14 灶具开启可以解释厨房升温,但 2842 的读数出现在灶具开启之前(19:00),时间上不匹配。\",\n \"推理步骤2: 厨房温度传感器在 19:15 和 19:52 连续两次报告 MeasuredValue = None,说明传感器出现了读数丢失/故障。到 20:00 恢复为 2401 后读数恢复正常。结合 19:00 的异常跳变,该传感器可能存在间歇性故障。\",\n \"推理步骤3: 19:30 厨房温度仍为 2840(28.40°C),灶具此时已开启约 15 分钟,但烟雾报警器全天未触发,说明不存在火灾风险,更倾向于传感器本身读数异常。\",\n \"推理步骤4: 20:56 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/键盘操作失败),20 秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是密码输入错误,但仍需留意是否有未授权尝试。\",\n \"推理步骤5: 其余行为模式正常——早晨 06:44 起床洗漱、07:28 出门上班(门锁手动开→关门→自动上锁)、18:21 回家开灯开空调、19:14 做饭、21:59 关灯关空调就寝,符合单人上班族的典型作息。\",\n \"推理步骤6: 19:51 厨房窗户打开(通风散味)、洗碗机启动,均为做饭后的正常操作。但日志中未见厨房窗户关闭事件,截至日志结束窗户可能仍处于打开状态。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器异常跳变至 2842(28.42°C),灶具尚未开启,其他房间温度正常下降\",\n \"19:15 和 19:52 厨房温度传感器连续两次报告 MeasuredValue = None(读数丢失)\",\n \"19:30 厨房温度仍为 2840,与其他房间偏差约 4°C\",\n \"20:56 入户门锁远程开锁失败一次(LockOperationError),20 秒后成功开锁\",\n \"19:51 厨房窗户打开后日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁探头或更换电池,必要时更换传感器,防止因读数异常影响烟雾/火灾联动判断\",\n \"核实 20:56 的门锁开锁失败事件,确认是否为户主本人操作(如密码输错),排除未授权访问尝试\",\n \"确认厨房窗户当前是否仍处于打开状态,夜间开窗存在安全隐患,建议关闭或设置定时提醒\",\n \"建议为门锁连续失败尝试设置告警规则(如连续 3 次失败自动通知),提升入侵检测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,同时入户门锁记录了一次开锁失败事件,需关注设备健康状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 19:00 突然从 ~2456(24.56°C)跳升至 2842(28.42°C),升幅近 4°C,而同一时刻其他房间温度均在正常下降,排除全屋升温的可能。虽然 19:14 灶具开启可以解释厨房升温,但 2842 的读数出现在灶具开启之前(19:00),时间上不匹配。", "推理步骤2: 厨房温度传感器在 19:15 和 19:52 连续两次报告 MeasuredValue = None,说明传感器出现了读数丢失/故障。到 20:00 恢复为 2401 后读数恢复正常。结合 19:00 的异常跳变,该传感器可能存在间歇性故障。", "推理步骤3: 19:30 厨房温度仍为 2840(28.40°C),灶具此时已开启约 15 分钟,但烟雾报警器全天未触发,说明不存在火灾风险,更倾向于传感器本身读数异常。", "推理步骤4: 20:56 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/键盘操作失败),20 秒后同一来源以 UserIndex=1 成功开锁。单次失败可能是密码输入错误,但仍需留意是否有未授权尝试。", "推理步骤5: 其余行为模式正常——早晨 06:44 起床洗漱、07:28 出门上班(门锁手动开→关门→自动上锁)、18:21 回家开灯开空调、19:14 做饭、21:59 关灯关空调就寝,符合单人上班族的典型作息。", "推理步骤6: 19:51 厨房窗户打开(通风散味)、洗碗机启动,均为做饭后的正常操作。但日志中未见厨房窗户关闭事件,截至日志结束窗户可能仍处于打开状态。"], "key_evidence": ["19:00 厨房温度传感器异常跳变至 2842(28.42°C),灶具尚未开启,其他房间温度正常下降", "19:15 和 19:52 厨房温度传感器连续两次报告 MeasuredValue = None(读数丢失)", "19:30 厨房温度仍为 2840,与其他房间偏差约 4°C", "20:56 入户门锁远程开锁失败一次(LockOperationError),20 秒后成功开锁", "19:51 厨房窗户打开后日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁探头或更换电池,必要时更换传感器,防止因读数异常影响烟雾/火灾联动判断", "核实 20:56 的门锁开锁失败事件,确认是否为户主本人操作(如密码输错),排除未授权访问尝试", "确认厨房窗户当前是否仍处于打开状态,夜间开窗存在安全隐患,建议关闭或设置定时提醒", "建议为门锁连续失败尝试设置告警规则(如连续 3 次失败自动通知),提升入侵检测能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.817702054977417, "api_error": null} {"episode_id": "SQ5_FP_B_1136", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1136.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261765, "scenario_id": "INS-01", "total_events": 242, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "balcony", "injection_time": "2026-06-01T21:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:19开锁进入后长时间未关门/未上锁,直到22:19才关闭,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:51、07:31、18:25、19:09共4次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,虽然可能与灶具热辐射干扰有关,但传感器不应返回 None,这表明传感器可能存在故障或兼容性问题,会导致安全监测盲区(如无法及时发现厨房异常高温)。\",\n \"推理步骤2: 16:19入户门通过手动方式解锁(LockState=2),门传感器显示门打开(StateValue=False),但此后直到22:19:18才记录到门关闭(StateValue=True)并自动上锁。中间近6小时入户门处于开启/未锁状态,期间17:57又有一次开锁记录,说明有人进出,但门始终未关闭,这是一个明显的入户安全隐患。\",\n \"推理步骤3: 21:19的客厅事件序列(检测到人→开灯→窗帘打开→关灯→人离开)在5秒内完成占用状态从1变为0,时间极短但可解释为住户短暂经过客厅去阳台或其他区域,属于边缘正常行为。\",\n \"推理步骤4: 温度趋势整体正常——夜间约23°C,午间峰值约25.8°C,傍晚逐步回落,四个传感器走势一致,符合夏季自然温度变化规律,无火灾或异常热源迹象。\",\n \"推理步骤5: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约40分钟、晚餐约44分钟),洗碗机在晚餐后启动,洗衣机无异常,整体生活模式正常。\",\n \"推理步骤6: 入户门锁操作均为 Manual 或 Auto 来源,无异常的远程解锁或未知来源操作,排除入侵嫌疑,但长时间未关门本身就是风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:51、07:31、18:25、19:09四次报告 MeasuredValue = None,传感器工作异常\",\n \"16:19:02入户门打开(front_door_contact StateValue=False),直到22:19:18才关闭(StateValue=True),入户门敞开近6小时\",\n \"16:19开锁后无对应的关门/上锁记录,17:57再次开锁,说明门一直处于未关闭状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,确认是否因灶具热辐射导致传感器读数异常,必要时更换或重新定位传感器,避免安全监测盲区\",\n \"设置入户门长时间未关闭的告警规则(建议阈值5-10分钟),及时提醒住户关门上锁\",\n \"考虑为入户门添加自动关门器或设置未锁定超时自动提醒,防止因疏忽导致的安全风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门在16:19开锁进入后长时间未关门/未上锁,直到22:19才关闭,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在06:51、07:31、18:25、19:09共4次报告 MeasuredValue = None。每次都发生在灶具开启或关闭前后,虽然可能与灶具热辐射干扰有关,但传感器不应返回 None,这表明传感器可能存在故障或兼容性问题,会导致安全监测盲区(如无法及时发现厨房异常高温)。", "推理步骤2: 16:19入户门通过手动方式解锁(LockState=2),门传感器显示门打开(StateValue=False),但此后直到22:19:18才记录到门关闭(StateValue=True)并自动上锁。中间近6小时入户门处于开启/未锁状态,期间17:57又有一次开锁记录,说明有人进出,但门始终未关闭,这是一个明显的入户安全隐患。", "推理步骤3: 21:19的客厅事件序列(检测到人→开灯→窗帘打开→关灯→人离开)在5秒内完成占用状态从1变为0,时间极短但可解释为住户短暂经过客厅去阳台或其他区域,属于边缘正常行为。", "推理步骤4: 温度趋势整体正常——夜间约23°C,午间峰值约25.8°C,傍晚逐步回落,四个传感器走势一致,符合夏季自然温度变化规律,无火灾或异常热源迹象。", "推理步骤5: 烟雾报警器和漏水传感器全天无告警,灶具使用时间合理(早餐约40分钟、晚餐约44分钟),洗碗机在晚餐后启动,洗衣机无异常,整体生活模式正常。", "推理步骤6: 入户门锁操作均为 Manual 或 Auto 来源,无异常的远程解锁或未知来源操作,排除入侵嫌疑,但长时间未关门本身就是风险。"], "key_evidence": ["厨房温度传感器在06:51、07:31、18:25、19:09四次报告 MeasuredValue = None,传感器工作异常", "16:19:02入户门打开(front_door_contact StateValue=False),直到22:19:18才关闭(StateValue=True),入户门敞开近6小时", "16:19开锁后无对应的关门/上锁记录,17:57再次开锁,说明门一直处于未关闭状态"], "recommended_actions": ["检查厨房温度传感器,确认是否因灶具热辐射导致传感器读数异常,必要时更换或重新定位传感器,避免安全监测盲区", "设置入户门长时间未关闭的告警规则(建议阈值5-10分钟),及时提醒住户关门上锁", "考虑为入户门添加自动关门器或设置未锁定超时自动提醒,防止因疏忽导致的安全风险"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.866122484207153, "api_error": null} {"episode_id": "SQ5_FP_B_1138", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1138.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261767, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-29T16:02:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变和数据丢失,疑似传感器故障,可能影响厨房安全监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2833(28.33°C),而同一时刻其他房间温度均在 2430-2444 范围内,厨房与其他房间温差瞬间达到近 4°C,且此时灶具尚未开启(19:09 才开启),排除烹饪导致的正常升温。\",\n \"推理步骤2: 19:10 和 19:28 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器数据采集中断或通信异常。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2840(28.4°C),此时灶具已于 19:27 关闭,且厨房窗户已打开通风,按常理温度应在下降,但读数仍异常偏高。而到 20:00 读数骤降回 2417(24.17°C),与其他房间恢复一致,说明 19:00-19:30 期间的高温读数并非真实环境温度。\",\n \"推理步骤4: 烟雾报警器在整个时段内未触发任何告警事件,进一步排除了真实火灾或高温风险,佐证这是传感器自身故障而非环境异常。\",\n \"推理步骤5: 其余设备行为均属正常——早晨 07:11 住户出门(手动开锁、开关门、自动上锁)、16:02 有人通过密码/指纹回家(UserIndex=5)、18:08 另一住户回家后开灯开空调、19:09-19:27 正常烹饪、22:09 睡前关灯关空调锁门,整体生活节奏合理无异常。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数从 ~2460 异常跳升至 2833,灶具尚未开启,其他房间温度正常\",\n \"19:10 和 19:28 厨房温度传感器连续报告 MeasuredValue = None,数据采集中断\",\n \"19:30 灶具已关闭且窗户已开,传感器仍报 2840 高温;20:00 骤降回 2417,与其他房间一致\",\n \"全天烟雾报警器无任何告警事件\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否存在接触不良、受潮或老化问题\",\n \"清洁或重新校准厨房温度传感器,若问题持续建议更换设备\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段\",\n \"考虑为温度传感器设置合理性校验规则:当读数突变超过阈值或出现 None 值时自动告警,避免因传感器故障导致真实高温事件被漏报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变和数据丢失,疑似传感器故障,可能影响厨房安全监测能力。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从约 2460(24.6°C)跳升至 2833(28.33°C),而同一时刻其他房间温度均在 2430-2444 范围内,厨房与其他房间温差瞬间达到近 4°C,且此时灶具尚未开启(19:09 才开启),排除烹饪导致的正常升温。", "推理步骤2: 19:10 和 19:28 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器数据采集中断或通信异常。", "推理步骤3: 19:30 传感器恢复后读数为 2840(28.4°C),此时灶具已于 19:27 关闭,且厨房窗户已打开通风,按常理温度应在下降,但读数仍异常偏高。而到 20:00 读数骤降回 2417(24.17°C),与其他房间恢复一致,说明 19:00-19:30 期间的高温读数并非真实环境温度。", "推理步骤4: 烟雾报警器在整个时段内未触发任何告警事件,进一步排除了真实火灾或高温风险,佐证这是传感器自身故障而非环境异常。", "推理步骤5: 其余设备行为均属正常——早晨 07:11 住户出门(手动开锁、开关门、自动上锁)、16:02 有人通过密码/指纹回家(UserIndex=5)、18:08 另一住户回家后开灯开空调、19:09-19:27 正常烹饪、22:09 睡前关灯关空调锁门,整体生活节奏合理无异常。"], "key_evidence": ["19:00 厨房温度传感器读数从 ~2460 异常跳升至 2833,灶具尚未开启,其他房间温度正常", "19:10 和 19:28 厨房温度传感器连续报告 MeasuredValue = None,数据采集中断", "19:30 灶具已关闭且窗户已开,传感器仍报 2840 高温;20:00 骤降回 2417,与其他房间一致", "全天烟雾报警器无任何告警事件"], "recommended_actions": ["检查厨房温度传感器的硬件状态和安装位置,确认是否存在接触不良、受潮或老化问题", "清洁或重新校准厨房温度传感器,若问题持续建议更换设备", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常,作为厨房安全的主要监测手段", "考虑为温度传感器设置合理性校验规则:当读数突变超过阈值或出现 None 值时自动告警,避免因传感器故障导致真实高温事件被漏报"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.474227905273438, "api_error": null} {"episode_id": "SQ5_FP_B_1137", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1137.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261766, "scenario_id": "FG-01", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "balcony", "injection_time": "2026-06-26T22:19:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"22:19 住户已离开客厅且全屋处于睡前/无人活动状态时,厨房灶具被异常开启,厨房温度持续攀升至 27.5°C,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 18:24 回家,19:14 开始做饭(灶具开启),19:41 做饭结束(灶具关闭、开窗通风),这是正常的晚餐活动。\",\n \"推理步骤2: 21:58 住户关闭客厅灯、玄关灯、空调,入户门关闭并自动上锁,表明住户进入睡前状态,全屋活动基本停止。\",\n \"推理步骤3: 22:19 灶具再次被开启(kitchen_cook_surface OnOff = True),但此时客厅运动传感器显示无人(Occupancy = 0),没有任何厨房区域的人员活动记录,也没有厨房灯开启的记录——在黑暗中无人操作灶具极不正常。\",\n \"推理步骤4: 22:19 的灶具事件日志格式异常(OnOff = True 而非标准的 OnOff.OnOff = True),22:24 和 22:49 的厨房温度日志也使用了非标准格式(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),可能暗示这些事件来源异常(设备故障、固件问题或非授权操控)。\",\n \"推理步骤5: 22:24 厨房温度飙升至 2700(27.0°C),22:49 进一步升至 2750(27.5°C),而同时段其他房间温度均在 23.3°C 左右,厨房与全屋温差达 4°C 以上,且持续上升,说明灶具确实在持续加热。\",\n \"推理步骤6: 但 22:30 和 23:00 的定时温度采集中,厨房温度却显示为 2357/2332(约 23.5°C/23.3°C),与 22:24/22:49 的异常高温读数严重矛盾。这进一步印证厨房温度传感器可能存在故障或数据被篡改,无法可靠反映真实温度。\",\n \"推理步骤7: 19:00 时厨房温度曾出现一次异常跳变至 2829(28.29°C),19:15 和 19:42 两次报告 None 值,说明该传感器在此前已有不稳定表现,设备可靠性存疑。\",\n \"推理步骤8: 综合判断——无人状态下灶具被开启、厨房温度异常升高、传感器数据不一致、事件格式异常,构成明确的火灾风险场景。即使部分数据可能是传感器故障,灶具处于开启状态本身就是实质性危险。\"\n ],\n \"key_evidence\": [\n \"22:19 厨房灶具开启(kitchen_cook_surface OnOff = True),但无任何厨房人员活动或灯光开启记录\",\n \"22:19 客厅运动传感器显示无人(Occupancy = 0),21:58 全屋灯光和空调已关闭、入户门已锁\",\n \"22:24 厨房温度升至 2700(27.0°C),22:49 升至 2750(27.5°C),持续上升且远高于其他房间\",\n \"22:19 及后续事件使用非标准属性格式,与正常日志格式不一致\",\n \"厨房温度传感器此前已有异常表现:19:00 跳变至 2829,19:15 和 19:42 报告 None 值\",\n \"灶具开启后始终未见关闭记录,截至日志结束(23:30)仍可能处于运行状态\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除火灾隐患\",\n \"触发厨房烟雾报警器(kitchen_smoke_alarm)进行主动检测,确认是否已有烟雾产生\",\n \"向住户发送高优先级告警通知,提醒检查厨房实际情况\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的健康状态,排查 None 值和数据跳变的原因,必要时更换传感器\",\n \"审查灶具 22:19 开启事件的来源(OperationSource),排查是否存在设备故障、自动化规则误触发或未授权远程操控\",\n \"建议为灶具设置安全规则:当全屋无人活动超过一定时间后自动关闭灶具,防止类似情况再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "22:19 住户已离开客厅且全屋处于睡前/无人活动状态时,厨房灶具被异常开启,厨房温度持续攀升至 27.5°C,存在火灾风险。", "reasoning": ["推理步骤1: 住户于 18:24 回家,19:14 开始做饭(灶具开启),19:41 做饭结束(灶具关闭、开窗通风),这是正常的晚餐活动。", "推理步骤2: 21:58 住户关闭客厅灯、玄关灯、空调,入户门关闭并自动上锁,表明住户进入睡前状态,全屋活动基本停止。", "推理步骤3: 22:19 灶具再次被开启(kitchen_cook_surface OnOff = True),但此时客厅运动传感器显示无人(Occupancy = 0),没有任何厨房区域的人员活动记录,也没有厨房灯开启的记录——在黑暗中无人操作灶具极不正常。", "推理步骤4: 22:19 的灶具事件日志格式异常(OnOff = True 而非标准的 OnOff.OnOff = True),22:24 和 22:49 的厨房温度日志也使用了非标准格式(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),可能暗示这些事件来源异常(设备故障、固件问题或非授权操控)。", "推理步骤5: 22:24 厨房温度飙升至 2700(27.0°C),22:49 进一步升至 2750(27.5°C),而同时段其他房间温度均在 23.3°C 左右,厨房与全屋温差达 4°C 以上,且持续上升,说明灶具确实在持续加热。", "推理步骤6: 但 22:30 和 23:00 的定时温度采集中,厨房温度却显示为 2357/2332(约 23.5°C/23.3°C),与 22:24/22:49 的异常高温读数严重矛盾。这进一步印证厨房温度传感器可能存在故障或数据被篡改,无法可靠反映真实温度。", "推理步骤7: 19:00 时厨房温度曾出现一次异常跳变至 2829(28.29°C),19:15 和 19:42 两次报告 None 值,说明该传感器在此前已有不稳定表现,设备可靠性存疑。", "推理步骤8: 综合判断——无人状态下灶具被开启、厨房温度异常升高、传感器数据不一致、事件格式异常,构成明确的火灾风险场景。即使部分数据可能是传感器故障,灶具处于开启状态本身就是实质性危险。"], "key_evidence": ["22:19 厨房灶具开启(kitchen_cook_surface OnOff = True),但无任何厨房人员活动或灯光开启记录", "22:19 客厅运动传感器显示无人(Occupancy = 0),21:58 全屋灯光和空调已关闭、入户门已锁", "22:24 厨房温度升至 2700(27.0°C),22:49 升至 2750(27.5°C),持续上升且远高于其他房间", "22:19 及后续事件使用非标准属性格式,与正常日志格式不一致", "厨房温度传感器此前已有异常表现:19:00 跳变至 2829,19:15 和 19:42 报告 None 值", "灶具开启后始终未见关闭记录,截至日志结束(23:30)仍可能处于运行状态"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除火灾隐患", "触发厨房烟雾报警器(kitchen_smoke_alarm)进行主动检测,确认是否已有烟雾产生", "向住户发送高优先级告警通知,提醒检查厨房实际情况", "检查厨房温度传感器(kitchen_temp_sensor)的健康状态,排查 None 值和数据跳变的原因,必要时更换传感器", "审查灶具 22:19 开启事件的来源(OperationSource),排查是否存在设备故障、自动化规则误触发或未授权远程操控", "建议为灶具设置安全规则:当全屋无人活动超过一定时间后自动关闭灶具,防止类似情况再次发生"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.601935863494873, "api_error": null} {"episode_id": "SQ5_FP_B_1142", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1142.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261771, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "second_bedroom", "injection_time": "2026-06-28T19:30:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁或异常情况。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——所有房间温度在全天呈现一致的自然变化曲线:凌晨最低约22.9°C,中午达到峰值约25.9°C,傍晚后逐步回落至23.2°C。四个传感器走势高度同步,符合夏季(6月28日)典型的昼夜温差规律,无任何房间出现异常温升或温降。\",\n \"推理步骤2: 门锁事件分析——19:30和19:35分别有UserIndex=1和UserIndex=2通过密码/指纹(OperationSource=3)解锁入户门,LockOperationType=1表示正常解锁操作。两位注册用户在傍晚时段先后回家,时间合理、身份合法,属于典型的下班回家场景。\",\n \"推理步骤3: 安全设备静默确认——整个24小时内,烟雾报警器、漏水传感器、各窗户/阳台门传感器均无触发事件,说明无火灾风险、无漏水、无门窗异常开启。\",\n \"推理步骤4: 无异常设备行为——没有出现深夜门锁被未知用户开启、非授权操作源解锁、运动传感器在无人时段异常触发等可疑模式。所有记录的事件均在合理范围内。\"\n ],\n \"key_evidence\": [\n \"四个房间温度传感器全天走势同步,呈现正常的夏季昼夜温度曲线(约22.9°C~25.9°C),无异常温升\",\n \"19:30和19:35的两次门锁解锁均为注册用户(UserIndex 1和2)通过合法操作源(OperationSource=3)执行,时间符合日常回家习惯\",\n \"烟雾报警器、漏水传感器、门窗传感器全天无告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭运行状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁或异常情况。", "reasoning": ["推理步骤1: 温度数据分析——所有房间温度在全天呈现一致的自然变化曲线:凌晨最低约22.9°C,中午达到峰值约25.9°C,傍晚后逐步回落至23.2°C。四个传感器走势高度同步,符合夏季(6月28日)典型的昼夜温差规律,无任何房间出现异常温升或温降。", "推理步骤2: 门锁事件分析——19:30和19:35分别有UserIndex=1和UserIndex=2通过密码/指纹(OperationSource=3)解锁入户门,LockOperationType=1表示正常解锁操作。两位注册用户在傍晚时段先后回家,时间合理、身份合法,属于典型的下班回家场景。", "推理步骤3: 安全设备静默确认——整个24小时内,烟雾报警器、漏水传感器、各窗户/阳台门传感器均无触发事件,说明无火灾风险、无漏水、无门窗异常开启。", "推理步骤4: 无异常设备行为——没有出现深夜门锁被未知用户开启、非授权操作源解锁、运动传感器在无人时段异常触发等可疑模式。所有记录的事件均在合理范围内。"], "key_evidence": ["四个房间温度传感器全天走势同步,呈现正常的夏季昼夜温度曲线(约22.9°C~25.9°C),无异常温升", "19:30和19:35的两次门锁解锁均为注册用户(UserIndex 1和2)通过合法操作源(OperationSource=3)执行,时间符合日常回家习惯", "烟雾报警器、漏水传感器、门窗传感器全天无告警事件"], "recommended_actions": ["无需采取安全响应措施,家庭运行状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.473346948623657, "api_error": null} {"episode_id": "SQ5_FP_B_1143", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1143.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261772, "scenario_id": "INS-02", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-09T15:25:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,疑似设备故障;另有一次门锁操作错误记录,但后续正常解锁,整体入侵风险低。\",\n \"reasoning\": [\n \"推理步骤1: 全天温度变化趋势合理——凌晨约23°C,午间升至约25.8°C,夜间回落至约23.3°C,符合夏季自然温度曲线,无异常热源或火灾迹象。\",\n \"推理步骤2: 厨房温度传感器在06:39和06:58(早餐做饭期间)以及18:32和19:00(晚餐做饭期间)共4次报告 MeasuredValue = None。灶具开启时传感器应能正常读数,连续返回 None 说明传感器可能因高温或自身故障导致读数丢失。值得注意的是,到19:00的第二条记录时传感器又恢复了正常值(2426),说明故障是间歇性的。\",\n \"推理步骤3: 15:25 门锁出现一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),但20秒后同一来源以 UserIndex=1(已注册用户)成功解锁。单次失败后立即成功,最可能是输入密码错误或网络瞬断,不构成入侵威胁。\",\n \"推理步骤4: 住户作息模式清晰且一致——05:58主卧起床,06:38做早餐,07:41出门并自动上锁;15:25远程开锁(可能是家人回来),16:10再次手动开门;17:48回家开灯开空调,18:31做晚饭,22:40关灯锁门就寝。所有活动时间和顺序合理,无深夜异常闯入迹象。\",\n \"推理步骤5: 厨房窗户在做饭结束后打开(06:57、18:59 StateValue=False 表示窗户打开),属于通风的正常操作。但日志中未见窗户关闭记录,厨房窗户可能在夜间仍处于打开状态,存在轻微安全隐患。\",\n \"推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,洗碗机正常启动运行,无火灾或水灾风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在06:39、06:58、18:32、19:00四次报告 MeasuredValue = None,与灶具使用时段高度重合,指向传感器间歇性故障\",\n \"15:25:00 front_door_lock 报告 LockOperationError(OperationError=1, OperationSource=3),但15:25:20 同源用户(UserIndex=1)成功解锁,属单次误操作\",\n \"厨房窗户在06:57和18:59被打开后,日志中无关闭记录,夜间可能仍处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认其安装位置是否离灶具过近导致高温时读数异常,必要时更换设备\",\n \"确认厨房窗户状态:当前日志显示窗户在做饭后打开但未关闭,建议在就寝前检查并关闭厨房窗户,或设置自动化规则在夜间提醒关窗\",\n \"关注门锁错误日志:当前仅一次失败无需紧急处理,但建议开启门锁连续失败告警,若短时间内出现多次失败则触发安全通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,疑似设备故障;另有一次门锁操作错误记录,但后续正常解锁,整体入侵风险低。", "reasoning": ["推理步骤1: 全天温度变化趋势合理——凌晨约23°C,午间升至约25.8°C,夜间回落至约23.3°C,符合夏季自然温度曲线,无异常热源或火灾迹象。", "推理步骤2: 厨房温度传感器在06:39和06:58(早餐做饭期间)以及18:32和19:00(晚餐做饭期间)共4次报告 MeasuredValue = None。灶具开启时传感器应能正常读数,连续返回 None 说明传感器可能因高温或自身故障导致读数丢失。值得注意的是,到19:00的第二条记录时传感器又恢复了正常值(2426),说明故障是间歇性的。", "推理步骤3: 15:25 门锁出现一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码操作失败),但20秒后同一来源以 UserIndex=1(已注册用户)成功解锁。单次失败后立即成功,最可能是输入密码错误或网络瞬断,不构成入侵威胁。", "推理步骤4: 住户作息模式清晰且一致——05:58主卧起床,06:38做早餐,07:41出门并自动上锁;15:25远程开锁(可能是家人回来),16:10再次手动开门;17:48回家开灯开空调,18:31做晚饭,22:40关灯锁门就寝。所有活动时间和顺序合理,无深夜异常闯入迹象。", "推理步骤5: 厨房窗户在做饭结束后打开(06:57、18:59 StateValue=False 表示窗户打开),属于通风的正常操作。但日志中未见窗户关闭记录,厨房窗户可能在夜间仍处于打开状态,存在轻微安全隐患。", "推理步骤6: 烟雾报警器全天无触发,漏水传感器无报警,洗碗机正常启动运行,无火灾或水灾风险。"], "key_evidence": ["kitchen_temp_sensor 在06:39、06:58、18:32、19:00四次报告 MeasuredValue = None,与灶具使用时段高度重合,指向传感器间歇性故障", "15:25:00 front_door_lock 报告 LockOperationError(OperationError=1, OperationSource=3),但15:25:20 同源用户(UserIndex=1)成功解锁,属单次误操作", "厨房窗户在06:57和18:59被打开后,日志中无关闭记录,夜间可能仍处于开启状态"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认其安装位置是否离灶具过近导致高温时读数异常,必要时更换设备", "确认厨房窗户状态:当前日志显示窗户在做饭后打开但未关闭,建议在就寝前检查并关闭厨房窗户,或设置自动化规则在夜间提醒关窗", "关注门锁错误日志:当前仅一次失败无需紧急处理,但建议开启门锁连续失败告警,若短时间内出现多次失败则触发安全通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.86650538444519, "api_error": null} {"episode_id": "SQ5_FP_B_1148", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1148.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261777, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "living_room", "injection_time": "2026-06-27T19:27:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁或异常情况。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个区域的温度在全天呈现一致的自然变化曲线:凌晨最低约22.9°C,中午达到峰值约25.9°C,傍晚后逐步回落至23.3°C左右。这符合夏季(6月底)典型的昼夜温差规律,各区域温度高度同步,无单一房间异常升温的迹象。\",\n \"推理步骤2: 门锁事件分析——19:27 UserIndex=1 开锁,19:32 UserIndex=2 开锁,OperationSource=3 表示通过密码/指纹等正常方式开锁,LockOperationType=1 为正常解锁操作。两位住户在傍晚时段先后回家,间隔5分钟,完全符合下班回家的生活习惯。\",\n \"推理步骤3: 无异常设备事件——整天日志中未出现烟雾报警、漏水检测、异常运动传感器触发、窗户/阳台门异常开启等安全相关事件。所有传感器均在正常范围内工作。\",\n \"推理步骤4: 无入侵迹象——深夜时段(00:00-06:00)无任何门锁操作、运动传感器触发或门窗传感器状态变化,表明住宅在夜间处于安全的静止状态。\"\n ],\n \"key_evidence\": [\n \"全天四区域温度在22.9°C~25.9°C之间同步变化,符合自然昼夜温差规律,无异常热源\",\n \"19:27和19:32两次门锁解锁均为已注册用户(UserIndex 1和2)通过正常方式(OperationSource=3)操作,属于傍晚正常回家\",\n \"全天无烟雾报警、漏水检测、异常运动检测或门窗异常开启等安全事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁或异常情况。", "reasoning": ["推理步骤1: 温度数据分析——四个区域的温度在全天呈现一致的自然变化曲线:凌晨最低约22.9°C,中午达到峰值约25.9°C,傍晚后逐步回落至23.3°C左右。这符合夏季(6月底)典型的昼夜温差规律,各区域温度高度同步,无单一房间异常升温的迹象。", "推理步骤2: 门锁事件分析——19:27 UserIndex=1 开锁,19:32 UserIndex=2 开锁,OperationSource=3 表示通过密码/指纹等正常方式开锁,LockOperationType=1 为正常解锁操作。两位住户在傍晚时段先后回家,间隔5分钟,完全符合下班回家的生活习惯。", "推理步骤3: 无异常设备事件——整天日志中未出现烟雾报警、漏水检测、异常运动传感器触发、窗户/阳台门异常开启等安全相关事件。所有传感器均在正常范围内工作。", "推理步骤4: 无入侵迹象——深夜时段(00:00-06:00)无任何门锁操作、运动传感器触发或门窗传感器状态变化,表明住宅在夜间处于安全的静止状态。"], "key_evidence": ["全天四区域温度在22.9°C~25.9°C之间同步变化,符合自然昼夜温差规律,无异常热源", "19:27和19:32两次门锁解锁均为已注册用户(UserIndex 1和2)通过正常方式(OperationSource=3)操作,属于傍晚正常回家", "全天无烟雾报警、漏水检测、异常运动检测或门窗异常开启等安全事件"], "recommended_actions": ["无需采取安全响应措施,家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.83490538597107, "api_error": null} {"episode_id": "SQ5_FP_B_1147", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1147.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261776, "scenario_id": "INS-03", "total_events": 233, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "kitchen", "injection_time": "2026-06-01T20:08:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和多次空值,疑似传感器故障;同时入户门在22:13存在未开门却触发关门和自动上锁的可疑序列。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约2482(24.82°C)跳升至2853(28.53°C),涨幅近4°C,而同一时刻其他三个房间温度均在24.6°C左右,厨房与全屋温差异常大。此时灶具尚未开启(18:50才开),无合理热源解释该跳变。\",\n \"推理步骤2: 18:30厨房温度进一步升至2860(28.60°C),仍远高于其他房间(约24.6°C)。随后18:51和19:43两次报告MeasuredValue=None(空值),表明传感器读数丢失。19:00恢复后读数回落至2435(24.35°C),与其他房间一致,说明之前的高温读数并非真实环境温度。\",\n \"推理步骤3: 综合来看,厨房温度传感器在18:00-18:51期间经历了异常高温读数→空值→恢复正常的过程,这是典型的传感器故障或通信异常模式,而非真实火灾风险(烟雾报警器全程未触发)。\",\n \"推理步骤4: 22:13的门锁序列存在轻微异常——front_door_contact报告StateValue=True(门关闭)并触发自动上锁,但之前没有对应的开门记录(StateValue=False)。回溯发现18:08开门后一直未记录关门事件,说明入户门可能从18:08起处于未关状态长达4小时,直到22:13才关闭上锁。\",\n \"推理步骤5: 20:08和20:13有两次远程解锁事件(OperationSource=3,分别为UserIndex=1和UserIndex=2),但没有对应的开门/关门传感器触发,也没有玄关运动传感器触发,属于远程操作门锁但无人实际进出,行为合理(可能是远程确认或为他人远程开锁)。\",\n \"推理步骤6: 其余事件均属正常生活模式——凌晨无活动、06:32起床如厕、07:14-07:31早晨出门上班、18:08下班回家、18:50-19:42做饭、22:13睡前关灯关空调,符合单人工作日作息。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度传感器读数突跳至2853(28.53°C),比同时刻其他房间高约4°C,且灶具未开启\",\n \"18:30厨房温度继续异常高达2860(28.60°C)\",\n \"18:51和19:43厨房温度传感器两次报告MeasuredValue=None(读数丢失)\",\n \"19:00恢复后厨房温度回归正常值2435(24.35°C),与其他房间一致\",\n \"烟雾报警器全程未触发,排除真实火灾\",\n \"入户门从18:08开门到22:13关门,中间约4小时无关门记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处),必要时更换传感器\",\n \"排查厨房温度传感器的无线通信质量,确认None值是否由信号丢失引起\",\n \"建议设置温度传感器异常检测规则:当单个传感器读数与其他房间偏差超过3°C且无对应设备操作时,自动告警\",\n \"确认入户门关门传感器灵敏度,18:08开门后长时间未记录关门状态,可能是传感器延迟或门确实未关,建议增加长时间未关门提醒\",\n \"审查20:08和20:13的远程解锁操作是否为户主本人授权,确认UserIndex=1和UserIndex=2的身份\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和多次空值,疑似传感器故障;同时入户门在22:13存在未开门却触发关门和自动上锁的可疑序列。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约2482(24.82°C)跳升至2853(28.53°C),涨幅近4°C,而同一时刻其他三个房间温度均在24.6°C左右,厨房与全屋温差异常大。此时灶具尚未开启(18:50才开),无合理热源解释该跳变。", "推理步骤2: 18:30厨房温度进一步升至2860(28.60°C),仍远高于其他房间(约24.6°C)。随后18:51和19:43两次报告MeasuredValue=None(空值),表明传感器读数丢失。19:00恢复后读数回落至2435(24.35°C),与其他房间一致,说明之前的高温读数并非真实环境温度。", "推理步骤3: 综合来看,厨房温度传感器在18:00-18:51期间经历了异常高温读数→空值→恢复正常的过程,这是典型的传感器故障或通信异常模式,而非真实火灾风险(烟雾报警器全程未触发)。", "推理步骤4: 22:13的门锁序列存在轻微异常——front_door_contact报告StateValue=True(门关闭)并触发自动上锁,但之前没有对应的开门记录(StateValue=False)。回溯发现18:08开门后一直未记录关门事件,说明入户门可能从18:08起处于未关状态长达4小时,直到22:13才关闭上锁。", "推理步骤5: 20:08和20:13有两次远程解锁事件(OperationSource=3,分别为UserIndex=1和UserIndex=2),但没有对应的开门/关门传感器触发,也没有玄关运动传感器触发,属于远程操作门锁但无人实际进出,行为合理(可能是远程确认或为他人远程开锁)。", "推理步骤6: 其余事件均属正常生活模式——凌晨无活动、06:32起床如厕、07:14-07:31早晨出门上班、18:08下班回家、18:50-19:42做饭、22:13睡前关灯关空调,符合单人工作日作息。"], "key_evidence": ["18:00厨房温度传感器读数突跳至2853(28.53°C),比同时刻其他房间高约4°C,且灶具未开启", "18:30厨房温度继续异常高达2860(28.60°C)", "18:51和19:43厨房温度传感器两次报告MeasuredValue=None(读数丢失)", "19:00恢复后厨房温度回归正常值2435(24.35°C),与其他房间一致", "烟雾报警器全程未触发,排除真实火灾", "入户门从18:08开门到22:13关门,中间约4小时无关门记录"], "recommended_actions": ["检查厨房温度传感器硬件状态,清洁探头并确认安装位置是否靠近热源(如冰箱散热口、阳光直射处),必要时更换传感器", "排查厨房温度传感器的无线通信质量,确认None值是否由信号丢失引起", "建议设置温度传感器异常检测规则:当单个传感器读数与其他房间偏差超过3°C且无对应设备操作时,自动告警", "确认入户门关门传感器灵敏度,18:08开门后长时间未记录关门状态,可能是传感器延迟或门确实未关,建议增加长时间未关门提醒", "审查20:08和20:13的远程解锁操作是否为户主本人授权,确认UserIndex=1和UserIndex=2的身份"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.265640258789062, "api_error": null} {"episode_id": "SQ5_FP_B_1155", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1155.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261784, "scenario_id": "WD-01", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-02T13:25:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:17起床,07:38出门上班,17:59回家,22:42就寝,符合单人居住的工作日作息。\",\n \"推理步骤2: 入侵排查——入户门锁的开锁/上锁操作均为 Manual 或 Auto 方式,无异常远程解锁或暴力开锁事件;16:35 的开门事件无后续入室活动(可能是快递/取物),门在22:42确认关闭并自动上锁,无安全隐患。\",\n \"推理步骤3: 火灾风险排查——灶具两次使用时长分别约10分钟和3分钟,时间合理;烟雾报警器全天未触发;厨房使用后均开窗通风(kitchen_window_contact = False),属于正常操作。\",\n \"推理步骤4: 漏水排查——13:25 卫生间漏水传感器触发,但同时有人在场(occupancy=1,灯亮),且2分钟后恢复(13:27 StateValue=False),判断为正常用水溅水导致的短暂触发,非真实漏水。\",\n \"推理步骤5: 温度趋势正常——全屋温度从夜间约23°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化曲线,无异常热源。\",\n \"推理步骤6: 设备异常发现——厨房温度传感器在06:57、07:07、18:51、18:54共4次报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器不应返回 None,这表明传感器可能因高温干扰而暂时失效或存在硬件故障。\",\n \"推理步骤7: 该故障的安全影响——厨房温度传感器是火灾预警的重要辅助手段,如果传感器在灶具使用时恰好失效,可能导致异常高温无法被及时检测,削弱了厨房的安全监控能力。\"\n ],\n \"key_evidence\": [\n \"06:57 和 07:07 厨房温度传感器报告 None(灶具 06:56~07:06 使用期间)\",\n \"18:51 和 18:54 厨房温度传感器再次报告 None(灶具 18:50~18:53 使用期间)\",\n \"同一传感器在非烹饪时段每30分钟正常上报数据,仅在灶具使用时失效\",\n \"烟雾报警器全天未触发,排除当前火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰\",\n \"对厨房温度传感器进行功能测试,确认是否存在硬件故障,必要时更换设备\",\n \"在传感器修复前,烹饪时保持厨房窗户通风并留意烟雾报警器状态\",\n \"考虑将温度传感器迁移到远离灶具但仍能有效监测厨房整体温度的位置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明设备可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:17起床,07:38出门上班,17:59回家,22:42就寝,符合单人居住的工作日作息。", "推理步骤2: 入侵排查——入户门锁的开锁/上锁操作均为 Manual 或 Auto 方式,无异常远程解锁或暴力开锁事件;16:35 的开门事件无后续入室活动(可能是快递/取物),门在22:42确认关闭并自动上锁,无安全隐患。", "推理步骤3: 火灾风险排查——灶具两次使用时长分别约10分钟和3分钟,时间合理;烟雾报警器全天未触发;厨房使用后均开窗通风(kitchen_window_contact = False),属于正常操作。", "推理步骤4: 漏水排查——13:25 卫生间漏水传感器触发,但同时有人在场(occupancy=1,灯亮),且2分钟后恢复(13:27 StateValue=False),判断为正常用水溅水导致的短暂触发,非真实漏水。", "推理步骤5: 温度趋势正常——全屋温度从夜间约23°C逐步升至中午约25.8°C,再回落至夜间约23.3°C,符合夏季自然温度变化曲线,无异常热源。", "推理步骤6: 设备异常发现——厨房温度传感器在06:57、07:07、18:51、18:54共4次报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器不应返回 None,这表明传感器可能因高温干扰而暂时失效或存在硬件故障。", "推理步骤7: 该故障的安全影响——厨房温度传感器是火灾预警的重要辅助手段,如果传感器在灶具使用时恰好失效,可能导致异常高温无法被及时检测,削弱了厨房的安全监控能力。"], "key_evidence": ["06:57 和 07:07 厨房温度传感器报告 None(灶具 06:56~07:06 使用期间)", "18:51 和 18:54 厨房温度传感器再次报告 None(灶具 18:50~18:53 使用期间)", "同一传感器在非烹饪时段每30分钟正常上报数据,仅在灶具使用时失效", "烟雾报警器全天未触发,排除当前火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致高温干扰", "对厨房温度传感器进行功能测试,确认是否存在硬件故障,必要时更换设备", "在传感器修复前,烹饪时保持厨房窗户通风并留意烟雾报警器状态", "考虑将温度传感器迁移到远离灶具但仍能有效监测厨房整体温度的位置"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.416322708129883, "api_error": null} {"episode_id": "SQ5_FP_B_1153", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1153.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-05T00:00:00", "seed": 20261782, "scenario_id": "INS-04", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "balcony", "injection_time": "2026-06-05T11:07:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在18:00出现异常高温读数(28.5°C→28.66°C),随后两次报告None值,表明传感器可能故障;同时11:07有未识别用户(UserIndex=5)通过远程方式开锁进入,需确认身份。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在18:00突然从约24.6°C跳升至28.5°C,而同一时刻其他房间温度均在24.6°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具在18:52才开启),排除烹饪导致的升温。\",\n \"推理步骤2: 18:30厨房温度进一步上升至28.66°C,仍无任何烹饪活动,异常持续。18:53灶具刚开启后,传感器立即报告MeasuredValue=None(空值),19:35灶具关闭后再次报告None。正常传感器不应返回空值,这是典型的传感器故障或通信异常表现。\",\n \"推理步骤3: 19:00之后厨房温度恢复到与其他房间一致的正常范围(约24.4°C),说明18:00-18:30的高温读数并非真实环境温度变化,而是传感器数据漂移或硬件故障。\",\n \"推理步骤4: 11:07入户门锁被OperationSource=3(远程/App)方式解锁,使用UserIndex=5。早晨07:34住户手动出门,家中应无人。需确认UserIndex=5是否为授权用户(如家政人员、家庭成员),若非授权用户则存在入侵风险。\",\n \"推理步骤5: 11:07进入后客厅灯被打开,但未观察到门锁重新上锁的记录,直到18:18住户回家后22:15才有锁门记录。11:07至18:18期间门锁状态不明,存在安全隐患。\",\n \"推理步骤6: 其余事件均属正常生活模式——凌晨温度平稳(约23°C),早晨起床洗漱、出门上锁,傍晚回家开灯开空调、做饭、洗碗、睡前关灯锁门,烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"18:00厨房温度突升至2850(28.5°C),其他房间均为24.6°C左右,温差异常且灶具未开启\",\n \"18:30厨房温度继续升至2866(28.66°C),异常持续\",\n \"18:53和19:36厨房温度传感器两次报告MeasuredValue=None,传感器数据丢失\",\n \"11:07入户门锁通过远程方式(OperationSource=3)被UserIndex=5解锁,住户已于07:34离家\",\n \"11:07至18:18期间无门锁重新上锁记录\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除火灾隐患误报风险\",\n \"确认UserIndex=5的身份和授权状态,若非已知授权用户,应立即修改门锁密码并审查门锁访问日志\",\n \"建议为远程开锁操作配置实时通知推送,确保每次远程开锁时住户都能收到提醒\",\n \"检查11:07至18:18期间家中是否有财物异常,确认该次进入的合理性\",\n \"考虑为门锁设置自动上锁超时策略,避免长时间处于未锁定状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在18:00出现异常高温读数(28.5°C→28.66°C),随后两次报告None值,表明传感器可能故障;同时11:07有未识别用户(UserIndex=5)通过远程方式开锁进入,需确认身份。", "reasoning": ["推理步骤1: 厨房温度传感器在18:00突然从约24.6°C跳升至28.5°C,而同一时刻其他房间温度均在24.6°C左右,厨房与全屋温差达到约4°C,且此时灶具尚未开启(灶具在18:52才开启),排除烹饪导致的升温。", "推理步骤2: 18:30厨房温度进一步上升至28.66°C,仍无任何烹饪活动,异常持续。18:53灶具刚开启后,传感器立即报告MeasuredValue=None(空值),19:35灶具关闭后再次报告None。正常传感器不应返回空值,这是典型的传感器故障或通信异常表现。", "推理步骤3: 19:00之后厨房温度恢复到与其他房间一致的正常范围(约24.4°C),说明18:00-18:30的高温读数并非真实环境温度变化,而是传感器数据漂移或硬件故障。", "推理步骤4: 11:07入户门锁被OperationSource=3(远程/App)方式解锁,使用UserIndex=5。早晨07:34住户手动出门,家中应无人。需确认UserIndex=5是否为授权用户(如家政人员、家庭成员),若非授权用户则存在入侵风险。", "推理步骤5: 11:07进入后客厅灯被打开,但未观察到门锁重新上锁的记录,直到18:18住户回家后22:15才有锁门记录。11:07至18:18期间门锁状态不明,存在安全隐患。", "推理步骤6: 其余事件均属正常生活模式——凌晨温度平稳(约23°C),早晨起床洗漱、出门上锁,傍晚回家开灯开空调、做饭、洗碗、睡前关灯锁门,烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["18:00厨房温度突升至2850(28.5°C),其他房间均为24.6°C左右,温差异常且灶具未开启", "18:30厨房温度继续升至2866(28.66°C),异常持续", "18:53和19:36厨房温度传感器两次报告MeasuredValue=None,传感器数据丢失", "11:07入户门锁通过远程方式(OperationSource=3)被UserIndex=5解锁,住户已于07:34离家", "11:07至18:18期间无门锁重新上锁记录"], "recommended_actions": ["立即检查厨房温度传感器硬件状态,清洁探头或更换传感器,排除火灾隐患误报风险", "确认UserIndex=5的身份和授权状态,若非已知授权用户,应立即修改门锁密码并审查门锁访问日志", "建议为远程开锁操作配置实时通知推送,确保每次远程开锁时住户都能收到提醒", "检查11:07至18:18期间家中是否有财物异常,确认该次进入的合理性", "考虑为门锁设置自动上锁超时策略,避免长时间处于未锁定状态"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.477949857711792, "api_error": null} {"episode_id": "SQ5_FP_B_1169", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1169.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-14T00:00:00", "seed": 20261798, "scenario_id": "INS-02", "total_events": 230, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-14T17:21:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),且该传感器在灶具使用期间多次报告None值,存在传感器故障风险。\",\n \"reasoning\": [\n \"推理步骤1: 分析全天温度趋势——各房间温度从凌晨约23°C逐步升至中午约25.5°C,再回落至夜间约23.3°C,符合夏季自然温度变化规律,整体正常。\",\n \"推理步骤2: 厨房温度传感器在11:00突然从10:30的25.29°C跳升至29.50°C(2950),11:30仍为29.58°C(2958),而同时段其他房间温度仅约25.5°C,厨房与其他房间温差高达约4°C。关键是此时灶具并未开启(灶具在09:53关闭,11:55才再次开启),没有合理热源解释这一异常升温。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(09:20、09:54、11:56、18:07、18:32),共出现5次。虽然可能是灶具高温导致传感器保护性停止报告,但如此频繁的None值暗示传感器工作状态不稳定。\",\n \"推理步骤4: 11:00-11:30的异常高温读数结合频繁的None值,高度怀疑厨房温度传感器存在硬件故障或漂移,导致读数不可靠。如果传感器失准,可能无法在真正发生厨房火灾或燃气泄漏时提供准确预警。\",\n \"推理步骤5: 其他事件均属正常——入户门锁17:21的一次操作错误后立即由用户1成功解锁(密码输错一次属常见情况);灶具使用后开窗通风、洗碗机运行、客厅空调制冷(SystemMode=3)等均为正常生活行为;烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"11:00厨房温度传感器读数2950(29.50°C)、11:30读数2958(29.58°C),同时段其他房间仅约25.5°C,且灶具处于关闭状态(09:53关闭,11:55才开启)\",\n \"厨房温度传感器全天出现5次MeasuredValue=None(09:20、09:54、11:56、18:07、18:32),传感器工作状态不稳定\",\n \"异常高温后12:00恢复至25.89°C,与其他房间一致,进一步说明11:00-11:30的读数为传感器异常而非真实环境温度\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的安装位置和硬件状态,确认是否受到其他热源干扰或存在元件老化\",\n \"对厨房温度传感器进行校准或更换,确保其能在紧急情况下提供准确的温度预警\",\n \"在传感器修复前,可考虑设置厨房烟雾报警器(kitchen_smoke_alarm)为主要厨房安全监测手段,并适当降低其告警阈值\",\n \"排查厨房温度传感器频繁报告None值的原因——确认是灶具高温触发的保护机制还是通信/硬件故障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器在11:00-11:30出现异常高温读数(约29.5°C),且该传感器在灶具使用期间多次报告None值,存在传感器故障风险。", "reasoning": ["推理步骤1: 分析全天温度趋势——各房间温度从凌晨约23°C逐步升至中午约25.5°C,再回落至夜间约23.3°C,符合夏季自然温度变化规律,整体正常。", "推理步骤2: 厨房温度传感器在11:00突然从10:30的25.29°C跳升至29.50°C(2950),11:30仍为29.58°C(2958),而同时段其他房间温度仅约25.5°C,厨房与其他房间温差高达约4°C。关键是此时灶具并未开启(灶具在09:53关闭,11:55才再次开启),没有合理热源解释这一异常升温。", "推理步骤3: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None(09:20、09:54、11:56、18:07、18:32),共出现5次。虽然可能是灶具高温导致传感器保护性停止报告,但如此频繁的None值暗示传感器工作状态不稳定。", "推理步骤4: 11:00-11:30的异常高温读数结合频繁的None值,高度怀疑厨房温度传感器存在硬件故障或漂移,导致读数不可靠。如果传感器失准,可能无法在真正发生厨房火灾或燃气泄漏时提供准确预警。", "推理步骤5: 其他事件均属正常——入户门锁17:21的一次操作错误后立即由用户1成功解锁(密码输错一次属常见情况);灶具使用后开窗通风、洗碗机运行、客厅空调制冷(SystemMode=3)等均为正常生活行为;烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["11:00厨房温度传感器读数2950(29.50°C)、11:30读数2958(29.58°C),同时段其他房间仅约25.5°C,且灶具处于关闭状态(09:53关闭,11:55才开启)", "厨房温度传感器全天出现5次MeasuredValue=None(09:20、09:54、11:56、18:07、18:32),传感器工作状态不稳定", "异常高温后12:00恢复至25.89°C,与其他房间一致,进一步说明11:00-11:30的读数为传感器异常而非真实环境温度"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的安装位置和硬件状态,确认是否受到其他热源干扰或存在元件老化", "对厨房温度传感器进行校准或更换,确保其能在紧急情况下提供准确的温度预警", "在传感器修复前,可考虑设置厨房烟雾报警器(kitchen_smoke_alarm)为主要厨房安全监测手段,并适当降低其告警阈值", "排查厨房温度传感器频繁报告None值的原因——确认是灶具高温触发的保护机制还是通信/硬件故障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.150205612182617, "api_error": null} {"episode_id": "SQ5_FP_B_1166", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_B_1166.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261795, "scenario_id": "WD-01", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "bathroom", "injection_time": "2026-06-11T16:06:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:00:10、07:09:00、18:28:00、19:27:00 共四次报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温导致读数异常),但在灶具关闭后(07:08 关灶、07:09 仍报 None)也出现了该现象,说明传感器本身存在间歇性故障。\",\n \"推理步骤2: 厨房窗户在 07:08:30 被打开(BooleanState.StateValue = False),之后在 19:26:30 再次出现打开事件,但整个日志中没有任何厨房窗户关闭(StateValue = True)的记录。住户外出期间(07:43~16:02)厨房窗户一直处于开启状态,存在入侵风险。\",\n \"推理步骤3: 卫生间漏水传感器在 16:06:00 触发(StateValue = True),但 2 分钟后(16:08:00)恢复正常(StateValue = False),且同时段卫生间有人(occupancy=1)且灯亮,判断为住户正常用水导致的短暂触发,非真实漏水。\",\n \"推理步骤4: 入户门锁操作均为正常模式——早晨 07:43 手动开锁出门后自动上锁,下午 16:02 和 18:11 手动开锁回家,晚间 22:26 确认门已关闭并自动上锁。无异常开锁事件,无入侵迹象。\",\n \"推理步骤5: 全屋温度变化符合夏季昼夜规律:凌晨约 22.9~23.1°C,午间升至约 25.8°C,傍晚回落。各房间温度高度一致,无局部异常升温(排除火灾风险)。\",\n \"推理步骤6: 住户生活作息正常——06:01 起床、06:59 做早餐、07:43 出门、16:02 短暂回家、18:11 回家做晚餐、22:26 就寝。所有灯光、空调、灶具操作与作息吻合。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:00:10、07:09:00、18:28:00、19:27:00 四次报告 MeasuredValue = None,表明传感器间歇性失效\",\n \"kitchen_window_contact 在 07:08:30 和 19:26:30 两次记录打开(StateValue = False),但全天无关闭记录,住户外出约 8 小时期间窗户持续敞开\",\n \"bathroom_water_leak 在 16:06:00 短暂触发后 2 分钟恢复,伴随卫生间有人活动,属正常用水场景\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器(kitchen_temp_sensor):该传感器作为厨房安全监测的关键设备,间歇性失效会导致无法及时发现火灾或燃气泄漏等高温异常\",\n \"建议设置离家自动化规则:当入户门上锁且无人在家时,自动检查并提醒关闭厨房窗户,避免外出期间窗户长时间敞开带来的安全隐患\",\n \"关注卫生间漏水传感器后续表现:本次为短暂触发,暂无风险,但若频繁触发建议检查卫生间水管接头或传感器灵敏度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备存在间歇性故障;同时厨房窗户在做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:00:10、07:09:00、18:28:00、19:27:00 共四次报告 MeasuredValue = None。虽然其中两次发生在灶具使用期间(可能因高温导致读数异常),但在灶具关闭后(07:08 关灶、07:09 仍报 None)也出现了该现象,说明传感器本身存在间歇性故障。", "推理步骤2: 厨房窗户在 07:08:30 被打开(BooleanState.StateValue = False),之后在 19:26:30 再次出现打开事件,但整个日志中没有任何厨房窗户关闭(StateValue = True)的记录。住户外出期间(07:43~16:02)厨房窗户一直处于开启状态,存在入侵风险。", "推理步骤3: 卫生间漏水传感器在 16:06:00 触发(StateValue = True),但 2 分钟后(16:08:00)恢复正常(StateValue = False),且同时段卫生间有人(occupancy=1)且灯亮,判断为住户正常用水导致的短暂触发,非真实漏水。", "推理步骤4: 入户门锁操作均为正常模式——早晨 07:43 手动开锁出门后自动上锁,下午 16:02 和 18:11 手动开锁回家,晚间 22:26 确认门已关闭并自动上锁。无异常开锁事件,无入侵迹象。", "推理步骤5: 全屋温度变化符合夏季昼夜规律:凌晨约 22.9~23.1°C,午间升至约 25.8°C,傍晚回落。各房间温度高度一致,无局部异常升温(排除火灾风险)。", "推理步骤6: 住户生活作息正常——06:01 起床、06:59 做早餐、07:43 出门、16:02 短暂回家、18:11 回家做晚餐、22:26 就寝。所有灯光、空调、灶具操作与作息吻合。"], "key_evidence": ["kitchen_temp_sensor 在 07:00:10、07:09:00、18:28:00、19:27:00 四次报告 MeasuredValue = None,表明传感器间歇性失效", "kitchen_window_contact 在 07:08:30 和 19:26:30 两次记录打开(StateValue = False),但全天无关闭记录,住户外出约 8 小时期间窗户持续敞开", "bathroom_water_leak 在 16:06:00 短暂触发后 2 分钟恢复,伴随卫生间有人活动,属正常用水场景"], "recommended_actions": ["检查或更换厨房温度传感器(kitchen_temp_sensor):该传感器作为厨房安全监测的关键设备,间歇性失效会导致无法及时发现火灾或燃气泄漏等高温异常", "建议设置离家自动化规则:当入户门上锁且无人在家时,自动检查并提醒关闭厨房窗户,避免外出期间窗户长时间敞开带来的安全隐患", "关注卫生间漏水传感器后续表现:本次为短暂触发,暂无风险,但若频繁触发建议检查卫生间水管接头或传感器灵敏度"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.10259747505188, "api_error": null} {"episode_id": "SQ5_FP_C_1119", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1119.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261748, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kitchen", "injection_time": "2026-06-10T17:02:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:15开锁后未观察到关门/上锁记录,存在门未关闭的隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在06:31、06:54、18:37、19:30分别报告了 MeasuredValue = None,均发生在灶具开启后不久。虽然可能是高温导致传感器暂时超量程,但连续出现 None 值提示传感器可能存在耐热性不足或通信故障。\",\n \"推理步骤2: 16:15 入户门通过手动方式解锁(LockState=2),门传感器显示门被打开(StateValue=False),之后有人进入儿童房。但日志中未记录该次开门后的关门(StateValue=True)和重新上锁事件,直到22:13才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在16:15至22:13之间处于未关闭或未上锁状态长达约6小时。\",\n \"推理步骤3: 17:02 出现了一次使用 UserIndex=5、OperationSource=3(远程/密码)的开锁事件,这是正常的家庭成员回家行为,结合后续客厅灯亮起和空调开启,属于合理的生活模式。\",\n \"推理步骤4: 其余事件(早起做饭、孩子起床、出门上学/上班、傍晚回家做饭、晚间就寝)均符合典型三口之家的日常作息规律,温度变化也与夏季白天升温、夜间降温的自然趋势一致,无火灾或入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:31、06:54、18:37、19:30 报告 MeasuredValue = None\",\n \"16:15 front_door_contact StateValue=False 后,直到 22:13 才记录到 StateValue=True,期间无关门/上锁记录\",\n \"17:02 使用 UserIndex=5 远程开锁,属于已注册用户,非未授权访问\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超量程;如传感器本身故障,建议更换或重新校准\",\n \"检查入户门自动上锁策略,建议设置开门超时未关闭的告警提醒(如门开超过5分钟未关则推送通知)\",\n \"确认 UserIndex=5 对应的家庭成员身份,确保门锁用户列表中无多余或过期的凭证\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常;同时入户门在16:15开锁后未观察到关门/上锁记录,存在门未关闭的隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在06:31、06:54、18:37、19:30分别报告了 MeasuredValue = None,均发生在灶具开启后不久。虽然可能是高温导致传感器暂时超量程,但连续出现 None 值提示传感器可能存在耐热性不足或通信故障。", "推理步骤2: 16:15 入户门通过手动方式解锁(LockState=2),门传感器显示门被打开(StateValue=False),之后有人进入儿童房。但日志中未记录该次开门后的关门(StateValue=True)和重新上锁事件,直到22:13才出现 front_door_contact=True 和自动上锁。这意味着入户门可能在16:15至22:13之间处于未关闭或未上锁状态长达约6小时。", "推理步骤3: 17:02 出现了一次使用 UserIndex=5、OperationSource=3(远程/密码)的开锁事件,这是正常的家庭成员回家行为,结合后续客厅灯亮起和空调开启,属于合理的生活模式。", "推理步骤4: 其余事件(早起做饭、孩子起床、出门上学/上班、傍晚回家做饭、晚间就寝)均符合典型三口之家的日常作息规律,温度变化也与夏季白天升温、夜间降温的自然趋势一致,无火灾或入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:31、06:54、18:37、19:30 报告 MeasuredValue = None", "16:15 front_door_contact StateValue=False 后,直到 22:13 才记录到 StateValue=True,期间无关门/上锁记录", "17:02 使用 UserIndex=5 远程开锁,属于已注册用户,非未授权访问"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致超量程;如传感器本身故障,建议更换或重新校准", "检查入户门自动上锁策略,建议设置开门超时未关闭的告警提醒(如门开超过5分钟未关则推送通知)", "确认 UserIndex=5 对应的家庭成员身份,确保门锁用户列表中无多余或过期的凭证"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.223990201950073, "api_error": null} {"episode_id": "SQ5_FP_C_1118", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1118.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261747, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "kids_room", "injection_time": "2026-06-25T08:30:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活节奏正常——凌晨无人活动,06:21 主卧起床、06:44 儿童房起床,07:34 全家出门并自动锁门,16:28 孩子放学回家,17:41 大人回家,22:42 就寝锁门,符合典型三口之家作息。\",\n \"推理步骤2: 入侵风险排查——08:30 有一次 UserIndex=5 的开锁事件,随后客厅有人活动并开灯,行为连贯且无后续异常,推测为家政/保姆等授权用户,风险低。16:28 和 17:41 的两次手动开锁均伴随正常的入户-活动-开灯序列,无入侵迹象。\",\n \"推理步骤3: 温度趋势分析——全屋温度从凌晨约 22.9°C 逐步升至正午约 25.8°C,再回落至深夜约 23.3°C,属于夏季正常日温变化曲线。06:00 时各房间温度同步跳升约 1°C(从约 22.9→23.9),幅度合理,为清晨升温。17:41 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,表现正常。\",\n \"推理步骤4: 厨房温度传感器异常——07:07、07:25、18:17、19:07 四次报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能因高温导致读数溢出或通信故障,属于设备异常。\",\n \"推理步骤5: 厨房窗户状态——07:24:30 和 19:06:30 两次记录厨房窗户打开(StateValue=False),但整个日志中未见对应的关闭事件(StateValue=True)。做饭后开窗通风是正常行为,但如果窗户确实一直未关,夜间存在安全隐患。\",\n \"推理步骤6: 火灾风险排查——两次做饭(07:06-07:24、18:16-19:06)时长分别约 18 分钟和 50 分钟,均在合理范围内,且灶具均已正常关闭。烟雾报警器全天无触发,无火灾风险。\",\n \"推理步骤7: 漏水排查——三个漏水传感器(厨房、主卫、次卫)全天无报警事件,无漏水风险。\",\n \"推理步骤8: 儿童安全——20:44 儿童房关灯并关闭窗帘(10000=全关),孩子按时就寝,无异常。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:07、07:25、18:17、19:07 四次报告 MeasuredValue = None,均与灶具使用时段重合,指向传感器故障\",\n \"kitchen_window_contact 在 07:24:30 和 19:06:30 两次记录打开(StateValue=False),但全天日志中无对应关闭事件\",\n \"08:30 存在 UserIndex=5 的远程/密码开锁事件,非家庭常规成员的手动开锁方式,但后续行为正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:该传感器在灶具使用期间反复报告 None,建议检查其安装位置是否离灶具过近导致过热,或更换传感器\",\n \"确认厨房窗户状态:日志显示窗户两次打开但未记录关闭,建议确认窗户当前是否已关好,夜间开窗存在安全和防盗隐患\",\n \"核实 UserIndex=5 的身份:08:30 的开锁用户(编号5)建议确认是否为已授权人员(如保姆、家政),如非预期访客应及时修改门锁密码\",\n \"厨房温度传感器故障期间,烟雾报警器是唯一的厨房安全监测手段,建议确保 kitchen_smoke_alarm 电池和功能正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 整体生活节奏正常——凌晨无人活动,06:21 主卧起床、06:44 儿童房起床,07:34 全家出门并自动锁门,16:28 孩子放学回家,17:41 大人回家,22:42 就寝锁门,符合典型三口之家作息。", "推理步骤2: 入侵风险排查——08:30 有一次 UserIndex=5 的开锁事件,随后客厅有人活动并开灯,行为连贯且无后续异常,推测为家政/保姆等授权用户,风险低。16:28 和 17:41 的两次手动开锁均伴随正常的入户-活动-开灯序列,无入侵迹象。", "推理步骤3: 温度趋势分析——全屋温度从凌晨约 22.9°C 逐步升至正午约 25.8°C,再回落至深夜约 23.3°C,属于夏季正常日温变化曲线。06:00 时各房间温度同步跳升约 1°C(从约 22.9→23.9),幅度合理,为清晨升温。17:41 开启客厅空调(制冷模式 SystemMode=3)后温度逐步下降,表现正常。", "推理步骤4: 厨房温度传感器异常——07:07、07:25、18:17、19:07 四次报告 MeasuredValue = None,均发生在灶具开启期间或刚关闭后。正常传感器即使在高温环境下也应报告数值而非 None。这表明传感器可能因高温导致读数溢出或通信故障,属于设备异常。", "推理步骤5: 厨房窗户状态——07:24:30 和 19:06:30 两次记录厨房窗户打开(StateValue=False),但整个日志中未见对应的关闭事件(StateValue=True)。做饭后开窗通风是正常行为,但如果窗户确实一直未关,夜间存在安全隐患。", "推理步骤6: 火灾风险排查——两次做饭(07:06-07:24、18:16-19:06)时长分别约 18 分钟和 50 分钟,均在合理范围内,且灶具均已正常关闭。烟雾报警器全天无触发,无火灾风险。", "推理步骤7: 漏水排查——三个漏水传感器(厨房、主卫、次卫)全天无报警事件,无漏水风险。", "推理步骤8: 儿童安全——20:44 儿童房关灯并关闭窗帘(10000=全关),孩子按时就寝,无异常。"], "key_evidence": ["kitchen_temp_sensor 在 07:07、07:25、18:17、19:07 四次报告 MeasuredValue = None,均与灶具使用时段重合,指向传感器故障", "kitchen_window_contact 在 07:24:30 和 19:06:30 两次记录打开(StateValue=False),但全天日志中无对应关闭事件", "08:30 存在 UserIndex=5 的远程/密码开锁事件,非家庭常规成员的手动开锁方式,但后续行为正常"], "recommended_actions": ["检查厨房温度传感器:该传感器在灶具使用期间反复报告 None,建议检查其安装位置是否离灶具过近导致过热,或更换传感器", "确认厨房窗户状态:日志显示窗户两次打开但未记录关闭,建议确认窗户当前是否已关好,夜间开窗存在安全和防盗隐患", "核实 UserIndex=5 的身份:08:30 的开锁用户(编号5)建议确认是否为已授权人员(如保姆、家政),如非预期访客应及时修改门锁密码", "厨房温度传感器故障期间,烟雾报警器是唯一的厨房安全监测手段,建议确保 kitchen_smoke_alarm 电池和功能正常"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 31.28015375137329, "api_error": null} {"episode_id": "SQ5_FP_C_1121", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1121.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261750, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-29T09:42:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;厨房窗户在做完饭后开启但日志中未见关闭事件,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后短时间内(06:37:39 开灶 → 06:38:09、07:24:00、18:11:00、18:57:00)共4次报告 MeasuredValue = None,而其他三个温度传感器全天工作正常,说明问题局限于该传感器。\",\n \"推理步骤2: None 值均出现在灶具使用期间或刚关闭后,推测传感器可能因灶具高温超出量程而返回空值,也可能是传感器本身存在间歇性故障。无论哪种原因,厨房作为火灾高风险区域,温度监测失效会削弱火灾预警能力。\",\n \"推理步骤3: 厨房窗户在 07:23:30 被打开(BooleanState = False),之后日志中未见关闭事件。18:56:30 又一次打开事件,同样未见关闭。家人 07:25 出门后厨房窗户持续处于开启状态,存在安防风险(虽然入户门已上锁)。\",\n \"推理步骤4: 09:42 有一次通过 OperationSource=3(远程/密码)、UserIndex=5 的开锁事件。该用户身份需确认是否为已知家庭成员或保姆等授权人员,否则存在入侵可能。不过后续行为(开客厅灯)较为正常,暂判定为低风险。\",\n \"推理步骤5: 其余行为模式均属正常——早晨6点起床、做早餐、7:25全家出门并自动锁门、下午16:33孩子回家、18:12大人回家做晚饭、20:57孩子就寝、22:15大人就寝并锁门。温度曲线呈现正常的日间升温-夜间降温趋势,烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38:09、07:24:00、18:11:00、18:57:00 四次报告 MeasuredValue = None,均与灶具使用时段关联\",\n \"kitchen_window_contact 在 07:23:30 报告 StateValue = False(开启),全天日志中未见对应的关闭(StateValue = True)事件,家人外出期间窗户持续敞开\",\n \"09:42 front_door_lock 通过 OperationSource=3、UserIndex=5 解锁,该用户索引需确认是否为授权用户\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器本身故障,建议更换\",\n \"设置自动化规则:当灶具开启且厨房温度传感器返回 None 时,触发告警提醒用户注意厨房安全\",\n \"确认 UserIndex=5 对应的用户身份,如非授权人员应立即删除该凭证并审查门锁访问日志\",\n \"建议增加自动化规则:出门锁门后检测厨房窗户状态,若仍为开启则推送提醒\",\n \"厨房温度传感器失效期间,可考虑加大对厨房烟雾报警器状态的轮询频率,作为补偿监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,疑似设备故障或受灶具高温干扰;厨房窗户在做完饭后开启但日志中未见关闭事件,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后短时间内(06:37:39 开灶 → 06:38:09、07:24:00、18:11:00、18:57:00)共4次报告 MeasuredValue = None,而其他三个温度传感器全天工作正常,说明问题局限于该传感器。", "推理步骤2: None 值均出现在灶具使用期间或刚关闭后,推测传感器可能因灶具高温超出量程而返回空值,也可能是传感器本身存在间歇性故障。无论哪种原因,厨房作为火灾高风险区域,温度监测失效会削弱火灾预警能力。", "推理步骤3: 厨房窗户在 07:23:30 被打开(BooleanState = False),之后日志中未见关闭事件。18:56:30 又一次打开事件,同样未见关闭。家人 07:25 出门后厨房窗户持续处于开启状态,存在安防风险(虽然入户门已上锁)。", "推理步骤4: 09:42 有一次通过 OperationSource=3(远程/密码)、UserIndex=5 的开锁事件。该用户身份需确认是否为已知家庭成员或保姆等授权人员,否则存在入侵可能。不过后续行为(开客厅灯)较为正常,暂判定为低风险。", "推理步骤5: 其余行为模式均属正常——早晨6点起床、做早餐、7:25全家出门并自动锁门、下午16:33孩子回家、18:12大人回家做晚饭、20:57孩子就寝、22:15大人就寝并锁门。温度曲线呈现正常的日间升温-夜间降温趋势,烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:38:09、07:24:00、18:11:00、18:57:00 四次报告 MeasuredValue = None,均与灶具使用时段关联", "kitchen_window_contact 在 07:23:30 报告 StateValue = False(开启),全天日志中未见对应的关闭(StateValue = True)事件,家人外出期间窗户持续敞开", "09:42 front_door_lock 通过 OperationSource=3、UserIndex=5 解锁,该用户索引需确认是否为授权用户"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;如传感器本身故障,建议更换", "设置自动化规则:当灶具开启且厨房温度传感器返回 None 时,触发告警提醒用户注意厨房安全", "确认 UserIndex=5 对应的用户身份,如非授权人员应立即删除该凭证并审查门锁访问日志", "建议增加自动化规则:出门锁门后检测厨房窗户状态,若仍为开启则推送提醒", "厨房温度传感器失效期间,可考虑加大对厨房烟雾报警器状态的轮询频率,作为补偿监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.205721616744995, "api_error": null} {"episode_id": "SQ5_FP_C_1123", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1123.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261752, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-13T18:59:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁或异常情况。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个传感器全天温度变化呈现一致的自然昼夜曲线:凌晨最低约22.9°C,中午峰值约25.9°C,傍晚逐步回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 入户事件分析——18:59 入户门锁通过密码/指纹解锁(LockOperationType=1 表示Lock/Unlock,OperationSource=3 表示本地凭证操作,UserIndex=5 为已注册用户)。随后5秒内玄关运动传感器触发,30秒后客厅运动传感器触发,动线符合正常回家行为。\",\n \"推理步骤3: 灯光行为分析——19:00 客厅主灯开启,与住户到家时间吻合,属于正常的晚间生活操作。\",\n \"推理步骤4: 安全设备静默确认——全天无烟雾报警器、漏水传感器触发事件;无窗户/阳台门异常开合记录;门锁无异常操作(无暴力开锁、无未知用户)。\",\n \"推理步骤5: 时间合理性——住户约19:00回家属于正常下班时间,整体活动模式与三室两厅家庭的日常作息一致。\"\n ],\n \"key_evidence\": [\n \"四个房间温度传感器全天呈自然昼夜曲线,波动范围22.9°C~25.9°C,无异常突变\",\n \"18:59 入户门通过已注册用户(UserIndex=5)本地凭证正常解锁,玄关→客厅动线合理\",\n \"全天无烟雾报警、漏水报警、窗户/门异常开合等安全事件触发\"\n ],\n \"recommended_actions\": [\n \"当前无需采取任何安全响应措施\",\n \"建议关注:夏季午间室温已达25.9°C,如持续升高可考虑设置空调自动开启规则以保持舒适度\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁或异常情况。", "reasoning": ["推理步骤1: 温度数据分析——四个传感器全天温度变化呈现一致的自然昼夜曲线:凌晨最低约22.9°C,中午峰值约25.9°C,傍晚逐步回落至23.3°C。各房间温差始终在1°C以内,无任何单点异常升温,排除火灾或设备过热风险。", "推理步骤2: 入户事件分析——18:59 入户门锁通过密码/指纹解锁(LockOperationType=1 表示Lock/Unlock,OperationSource=3 表示本地凭证操作,UserIndex=5 为已注册用户)。随后5秒内玄关运动传感器触发,30秒后客厅运动传感器触发,动线符合正常回家行为。", "推理步骤3: 灯光行为分析——19:00 客厅主灯开启,与住户到家时间吻合,属于正常的晚间生活操作。", "推理步骤4: 安全设备静默确认——全天无烟雾报警器、漏水传感器触发事件;无窗户/阳台门异常开合记录;门锁无异常操作(无暴力开锁、无未知用户)。", "推理步骤5: 时间合理性——住户约19:00回家属于正常下班时间,整体活动模式与三室两厅家庭的日常作息一致。"], "key_evidence": ["四个房间温度传感器全天呈自然昼夜曲线,波动范围22.9°C~25.9°C,无异常突变", "18:59 入户门通过已注册用户(UserIndex=5)本地凭证正常解锁,玄关→客厅动线合理", "全天无烟雾报警、漏水报警、窗户/门异常开合等安全事件触发"], "recommended_actions": ["当前无需采取任何安全响应措施", "建议关注:夏季午间室温已达25.9°C,如持续升高可考虑设置空调自动开启规则以保持舒适度"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.589757680892944, "api_error": null} {"episode_id": "SQ5_FP_C_1128", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1128.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261757, "scenario_id": "INS-03", "total_events": 194, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "second_bedroom", "injection_time": "2026-06-14T06:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭状态正常,未发现安全威胁或异常情况。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——全天四个传感器(客厅、主卧、儿童房、厨房)的温度变化呈现典型的夏季昼夜曲线:凌晨最低约22.9°C,中午峰值约25.9°C,傍晚逐步回落至23.3°C。各房间温差始终在2°C以内,无局部异常升温,排除火灾或设备过热风险。\",\n \"推理步骤2: 门锁事件分析——06:53 和 06:58 分别有 UserIndex=1 和 UserIndex=2 通过 OperationSource=3(即键盘/PIN码)执行了解锁操作(LockOperationType=1)。两次操作间隔5分钟,时间处于早晨出门的合理时段,使用的是已注册的合法用户凭证,符合家庭成员(如夫妻或家长与孩子)先后出门的日常模式。\",\n \"推理步骤3: 无其他异常信号——整日未触发烟雾报警器、漏水传感器、CO报警;无未授权的门锁操作或开锁失败记录;无深夜异常的运动传感器触发或门窗传感器开合事件。所有设备均按预期正常上报数据,无设备离线或数据缺失的迹象。\"\n ],\n \"key_evidence\": [\n \"全天温度在22.9°C~25.9°C之间平稳波动,符合6月中旬夏季昼夜温差规律,无异常尖峰\",\n \"两次门锁解锁均为已注册用户(UserIndex 1和2)通过PIN码在早晨合理时段操作,无失败或异常尝试\",\n \"烟雾报警器、漏水传感器、门窗传感器等安全类设备全天无告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭运行状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭状态正常,未发现安全威胁或异常情况。", "reasoning": ["推理步骤1: 温度数据分析——全天四个传感器(客厅、主卧、儿童房、厨房)的温度变化呈现典型的夏季昼夜曲线:凌晨最低约22.9°C,中午峰值约25.9°C,傍晚逐步回落至23.3°C。各房间温差始终在2°C以内,无局部异常升温,排除火灾或设备过热风险。", "推理步骤2: 门锁事件分析——06:53 和 06:58 分别有 UserIndex=1 和 UserIndex=2 通过 OperationSource=3(即键盘/PIN码)执行了解锁操作(LockOperationType=1)。两次操作间隔5分钟,时间处于早晨出门的合理时段,使用的是已注册的合法用户凭证,符合家庭成员(如夫妻或家长与孩子)先后出门的日常模式。", "推理步骤3: 无其他异常信号——整日未触发烟雾报警器、漏水传感器、CO报警;无未授权的门锁操作或开锁失败记录;无深夜异常的运动传感器触发或门窗传感器开合事件。所有设备均按预期正常上报数据,无设备离线或数据缺失的迹象。"], "key_evidence": ["全天温度在22.9°C~25.9°C之间平稳波动,符合6月中旬夏季昼夜温差规律,无异常尖峰", "两次门锁解锁均为已注册用户(UserIndex 1和2)通过PIN码在早晨合理时段操作,无失败或异常尝试", "烟雾报警器、漏水传感器、门窗传感器等安全类设备全天无告警事件"], "recommended_actions": ["无需采取安全响应措施,家庭运行状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 3, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 17.063080072402954, "api_error": null} {"episode_id": "SQ5_FP_C_1139", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1139.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261768, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "master_bedroom", "injection_time": "2026-06-02T14:20:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,可能处于长时间敞开状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:46、07:06、18:51、19:13 共四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明传感器在厨房温度变化较大时反复失效,这不是单次偶发,而是可复现的故障模式。\",\n \"推理步骤2: 温度传感器对厨房安全至关重要——它与烟雾报警器配合,是火灾预警的关键数据源。传感器反复失效意味着在灶具使用期间恰好丧失了温度监控能力,形成安全盲区。\",\n \"推理步骤3: 厨房窗户传感器在 07:05:30 报告开启(StateValue=False),之后在 19:12:30 再次报告开启,但全天日志中没有任何关闭(StateValue=True)事件。窗户可能从早上 7 点起就一直处于打开状态,家中白天无人时(07:18 出门至 14:20/16:35 回家)窗户敞开存在安全隐患。\",\n \"推理步骤4: 14:20 的入户门解锁事件使用了 UserIndex=5 且 OperationSource=3(远程/密码),但未见门锁关闭和门关闭事件记录。虽然可能是日志截断,但值得关注该用户身份是否为已知授权用户。\",\n \"推理步骤5: 其余行为模式正常——早晨 6 点起床、7:18 出门上班/上学、下午陆续回家、晚间做饭用餐、22:23 就寝锁门,符合有孩子的三口之家作息。温度曲线呈现正常的日间升温夜间降温趋势。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:46、07:06、18:51、19:13 四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"kitchen_window_contact 在 07:05:30 和 19:12:30 两次报告 StateValue=False(开启),全天无关闭记录,白天家中无人期间窗户可能一直敞开\",\n \"14:20 front_door_lock 通过 OperationSource=3(远程)、UserIndex=5 解锁,后续无明确的锁门/关门记录\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器:该传感器在高温环境下反复失效,建议检查其安装位置是否离灶具过近,或更换耐高温型号,确保烹饪期间温度监控不中断\",\n \"确认厨房窗户当前状态:日志显示窗户可能长时间未关闭,建议立即检查并在无人时确保关闭,或设置离家自动化规则提醒关窗\",\n \"核实 UserIndex=5 的身份:确认 14:20 远程开锁的用户是否为家庭已知授权成员(如保姆、亲属),如非预期用户应及时修改门锁密码\",\n \"考虑添加厨房窗户关闭的自动化提醒:当离家模式激活时,若厨房窗户仍处于打开状态,触发通知提醒住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,可能处于长时间敞开状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:46、07:06、18:51、19:13 共四次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭前后,说明传感器在厨房温度变化较大时反复失效,这不是单次偶发,而是可复现的故障模式。", "推理步骤2: 温度传感器对厨房安全至关重要——它与烟雾报警器配合,是火灾预警的关键数据源。传感器反复失效意味着在灶具使用期间恰好丧失了温度监控能力,形成安全盲区。", "推理步骤3: 厨房窗户传感器在 07:05:30 报告开启(StateValue=False),之后在 19:12:30 再次报告开启,但全天日志中没有任何关闭(StateValue=True)事件。窗户可能从早上 7 点起就一直处于打开状态,家中白天无人时(07:18 出门至 14:20/16:35 回家)窗户敞开存在安全隐患。", "推理步骤4: 14:20 的入户门解锁事件使用了 UserIndex=5 且 OperationSource=3(远程/密码),但未见门锁关闭和门关闭事件记录。虽然可能是日志截断,但值得关注该用户身份是否为已知授权用户。", "推理步骤5: 其余行为模式正常——早晨 6 点起床、7:18 出门上班/上学、下午陆续回家、晚间做饭用餐、22:23 就寝锁门,符合有孩子的三口之家作息。温度曲线呈现正常的日间升温夜间降温趋势。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:46、07:06、18:51、19:13 四次报告 MeasuredValue = None,均发生在灶具使用前后", "kitchen_window_contact 在 07:05:30 和 19:12:30 两次报告 StateValue=False(开启),全天无关闭记录,白天家中无人期间窗户可能一直敞开", "14:20 front_door_lock 通过 OperationSource=3(远程)、UserIndex=5 解锁,后续无明确的锁门/关门记录"], "recommended_actions": ["检查或更换厨房温度传感器:该传感器在高温环境下反复失效,建议检查其安装位置是否离灶具过近,或更换耐高温型号,确保烹饪期间温度监控不中断", "确认厨房窗户当前状态:日志显示窗户可能长时间未关闭,建议立即检查并在无人时确保关闭,或设置离家自动化规则提醒关窗", "核实 UserIndex=5 的身份:确认 14:20 远程开锁的用户是否为家庭已知授权成员(如保姆、亲属),如非预期用户应及时修改门锁密码", "考虑添加厨房窗户关闭的自动化提醒:当离家模式激活时,若厨房窗户仍处于打开状态,触发通知提醒住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.724189043045044, "api_error": null} {"episode_id": "SQ5_FP_C_1145", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1145.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-11T00:00:00", "seed": 20261774, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "master_bathroom", "injection_time": "2026-06-11T08:52:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;另有一次灶具开启期间无人在场的记录需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:33、07:17、18:46、19:31 共 4 次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭后不久,说明传感器可能在灶具工作时受热干扰导致读数丢失,或传感器本身存在间歇性故障。\",\n \"推理步骤2: 08:52 灶具被开启,但此时 living_room_occupancy 显示为 0(无人),且日志中 07:30 全家已出门(门锁上锁、灯全关)。直到 09:12 客厅才重新检测到有人。虽然 08:52 的灶具事件格式略有不同(缺少 Cluster 前缀),有可能是远程操控或自动化触发,但也不排除日志格式不一致。这段时间灶具无人看管约 20 分钟,存在一定火灾风险。\",\n \"推理步骤3: 08:57 和 09:22 厨房温度传感器分别报告 2700(27.00°C)和 2750(27.50°C),比同时段其他房间高出约 2-2.5°C,与灶具开启一致,但未触发烟雾报警器,说明并未发生实际火情。\",\n \"推理步骤4: 其余事件模式正常——早晨 6:30 起床、7:30 出门上班/上学、16:12 孩子放学回家、18:05 大人下班回家、18:45 做晚饭、19:30 用餐、20:44 孩子就寝、22:33 大人就寝并锁门,均符合三口之家的典型作息。\",\n \"推理步骤5: 入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常的远程或未知来源解锁,不存在入侵迹象。\",\n \"推理步骤6: 所有漏水传感器和烟雾报警器全天无告警事件,水电安全方面无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器 4 次报告 None(06:33、07:17、18:46、19:31),均与灶具操作时间高度相关\",\n \"08:52 灶具开启时客厅无人(Occupancy=0),07:30 已确认全家出门,灶具无人看管约 20 分钟\",\n \"08:57 厨房温度飙升至 2700(27°C),09:22 进一步升至 2750(27.5°C),高于其他房间同期温度\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常(None),必要时更换或重新定位传感器\",\n \"排查 08:52 灶具开启的来源——确认是否为定时自动化规则或远程操控,如非预期操作应禁用相关自动化并检查账户安全\",\n \"建议设置安全规则:当家中无人(所有运动传感器 Occupancy=0 且门锁已锁定)时,禁止灶具远程或自动开启\",\n \"厨房窗户在做饭后开窗通风(07:16:30 和 19:30:30),但日志中未见关窗记录,建议确认窗户是否已关闭以保障夜间安全\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,疑似设备故障或受灶具高温干扰;另有一次灶具开启期间无人在场的记录需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:33、07:17、18:46、19:31 共 4 次报告 MeasuredValue = None。每次都紧跟在灶具开启或关闭后不久,说明传感器可能在灶具工作时受热干扰导致读数丢失,或传感器本身存在间歇性故障。", "推理步骤2: 08:52 灶具被开启,但此时 living_room_occupancy 显示为 0(无人),且日志中 07:30 全家已出门(门锁上锁、灯全关)。直到 09:12 客厅才重新检测到有人。虽然 08:52 的灶具事件格式略有不同(缺少 Cluster 前缀),有可能是远程操控或自动化触发,但也不排除日志格式不一致。这段时间灶具无人看管约 20 分钟,存在一定火灾风险。", "推理步骤3: 08:57 和 09:22 厨房温度传感器分别报告 2700(27.00°C)和 2750(27.50°C),比同时段其他房间高出约 2-2.5°C,与灶具开启一致,但未触发烟雾报警器,说明并未发生实际火情。", "推理步骤4: 其余事件模式正常——早晨 6:30 起床、7:30 出门上班/上学、16:12 孩子放学回家、18:05 大人下班回家、18:45 做晚饭、19:30 用餐、20:44 孩子就寝、22:33 大人就寝并锁门,均符合三口之家的典型作息。", "推理步骤5: 入户门锁的开锁/上锁操作均为 Manual 或 Auto 来源,无异常的远程或未知来源解锁,不存在入侵迹象。", "推理步骤6: 所有漏水传感器和烟雾报警器全天无告警事件,水电安全方面无异常。"], "key_evidence": ["厨房温度传感器 4 次报告 None(06:33、07:17、18:46、19:31),均与灶具操作时间高度相关", "08:52 灶具开启时客厅无人(Occupancy=0),07:30 已确认全家出门,灶具无人看管约 20 分钟", "08:57 厨房温度飙升至 2700(27°C),09:22 进一步升至 2750(27.5°C),高于其他房间同期温度"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常(None),必要时更换或重新定位传感器", "排查 08:52 灶具开启的来源——确认是否为定时自动化规则或远程操控,如非预期操作应禁用相关自动化并检查账户安全", "建议设置安全规则:当家中无人(所有运动传感器 Occupancy=0 且门锁已锁定)时,禁止灶具远程或自动开启", "厨房窗户在做饭后开窗通风(07:16:30 和 19:30:30),但日志中未见关窗记录,建议确认窗户是否已关闭以保障夜间安全"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.601503133773804, "api_error": null} {"episode_id": "SQ5_FP_C_1146", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1146.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261775, "scenario_id": "INS-02", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "second_bedroom", "injection_time": "2026-06-03T07:22:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障或通信异常;同时厨房窗户做饭后开启但日志中未见关闭记录,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:34:07、07:20:00、18:34:00、19:01:00 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器可能受高温影响出现间歇性故障,或存在通信链路不稳定。\",\n \"推理步骤2: 厨房窗户传感器在 07:19:30 报告 StateValue = False(窗户打开),之后日志中未见关闭事件。晚间 19:00:30 再次报告 StateValue = False(再次打开或仍处于打开状态),全天日志结束时仍无关闭记录。家人外出期间(07:33~16:14)厨房窗户处于开启状态,存在入侵风险。\",\n \"推理步骤3: 入户门锁在 07:22:00 出现一次 LockOperationError(OperationError=1, OperationSource=3,即键盘/密码输入错误),随后 07:22:20 同一用户(UserIndex=1)成功解锁。单次密码错误属于正常操作失误,不构成入侵威胁,但值得记录。\",\n \"推理步骤4: 次卫灯在 06:55 开启后,全天日志中未见关闭事件,可能是遗忘关灯,属于轻微能耗浪费,不构成安全威胁。\",\n \"推理步骤5: 其余设备行为均符合三口之家的正常作息模式——早晨 6 点起床、做早餐、7:33 出门上班/上学并自动锁门、下午 16:14 孩子先回家、18:01 大人回家、做晚饭、22:40 就寝锁门。温度曲线呈现正常的昼夜变化(夜间约 22.9°C,午间峰值约 25.8°C),空调制冷运行合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:34:07、07:20:00、18:34:00、19:01:00 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:19:30 和 19:00:30 报告 StateValue = False(窗户打开),全天未见关闭记录\",\n \"front_door_lock 在 07:22:00 出现一次 LockOperationError(密码输入错误),20秒后成功解锁\",\n \"second_bathroom_light 在 06:55 开启后全天未关闭\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态及通信链路,确认是否因灶具高温导致间歇性故障,必要时更换或重新定位传感器\",\n \"设置厨房窗户长时间未关闭的自动提醒,尤其是在全家外出(门锁上锁)后仍检测到窗户打开时应发出告警\",\n \"建议为次卫灯配置无人自动关闭策略(次卫未安装运动传感器,可考虑加装或设置定时关闭)\",\n \"持续监控入户门锁的密码错误事件,若短时间内出现多次连续错误应触发入侵告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,存在设备故障或通信异常;同时厨房窗户做饭后开启但日志中未见关闭记录,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:34:07、07:20:00、18:34:00、19:01:00 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器可能受高温影响出现间歇性故障,或存在通信链路不稳定。", "推理步骤2: 厨房窗户传感器在 07:19:30 报告 StateValue = False(窗户打开),之后日志中未见关闭事件。晚间 19:00:30 再次报告 StateValue = False(再次打开或仍处于打开状态),全天日志结束时仍无关闭记录。家人外出期间(07:33~16:14)厨房窗户处于开启状态,存在入侵风险。", "推理步骤3: 入户门锁在 07:22:00 出现一次 LockOperationError(OperationError=1, OperationSource=3,即键盘/密码输入错误),随后 07:22:20 同一用户(UserIndex=1)成功解锁。单次密码错误属于正常操作失误,不构成入侵威胁,但值得记录。", "推理步骤4: 次卫灯在 06:55 开启后,全天日志中未见关闭事件,可能是遗忘关灯,属于轻微能耗浪费,不构成安全威胁。", "推理步骤5: 其余设备行为均符合三口之家的正常作息模式——早晨 6 点起床、做早餐、7:33 出门上班/上学并自动锁门、下午 16:14 孩子先回家、18:01 大人回家、做晚饭、22:40 就寝锁门。温度曲线呈现正常的昼夜变化(夜间约 22.9°C,午间峰值约 25.8°C),空调制冷运行合理。"], "key_evidence": ["kitchen_temp_sensor 在 06:34:07、07:20:00、18:34:00、19:01:00 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:19:30 和 19:00:30 报告 StateValue = False(窗户打开),全天未见关闭记录", "front_door_lock 在 07:22:00 出现一次 LockOperationError(密码输入错误),20秒后成功解锁", "second_bathroom_light 在 06:55 开启后全天未关闭"], "recommended_actions": ["检查厨房温度传感器硬件状态及通信链路,确认是否因灶具高温导致间歇性故障,必要时更换或重新定位传感器", "设置厨房窗户长时间未关闭的自动提醒,尤其是在全家外出(门锁上锁)后仍检测到窗户打开时应发出告警", "建议为次卫灯配置无人自动关闭策略(次卫未安装运动传感器,可考虑加装或设置定时关闭)", "持续监控入户门锁的密码错误事件,若短时间内出现多次连续错误应触发入侵告警"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.976353645324707, "api_error": null} {"episode_id": "SQ5_FP_C_1152", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1152.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-29T00:00:00", "seed": 20261781, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "master_bedroom", "injection_time": "2026-06-29T15:30:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现与其他传感器矛盾的异常高温读数,存在传感器故障风险,可能导致灶具安全监控失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:02、07:20、18:22、19:23 四个时间点报告 MeasuredValue = None,均发生在灶具开启或刚关闭后不久。传感器在高温工况下反复丢失读数,说明其在关键监控时段无法正常工作。\",\n \"推理步骤2: 15:30 灶具开启后,15:35 厨房温度传感器报告 2700(27.00°C),16:00 报告 2750(27.50°C),而同一时刻其他房间温度均在 24.90-24.99°C 范围,厨房常规传感器读数却为 2495(24.95°C)。同一传感器在同一时刻出现两个不同的读数(16:00 既报 2495 又报 2750),数据自相矛盾,表明传感器读数不可靠。\",\n \"推理步骤3: 15:30 灶具开启后,直到日志结束都没有看到该灶具的关闭事件(15:30 开启的那次)。18:21 又记录了一次灶具开启,19:22 关闭——但 15:30 那次开启与 18:21 之间没有关闭记录。如果 15:30 的灶具确实持续开启了近 3 小时无人看管(15:30-18:18 期间家中无人活动迹象),这本身就是火灾隐患。\",\n \"推理步骤4: 厨房窗户传感器在 07:19:30 报告打开(StateValue=False),但日志中没有对应的关闭事件,直到 19:22:30 再次报告打开。厨房窗户可能长时间处于打开状态,这不是安全威胁但属于状态监控盲区。\",\n \"推理步骤5: 其余家庭活动模式正常——早晨 06:05 起床、07:25 出门上班/上学、16:01 孩子回家、18:18 大人回家、22:32 就寝,门锁开关和运动传感器均与正常生活节奏吻合,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 07:02、07:20、18:22、19:23 四次报告 MeasuredValue = None,均在灶具使用期间\",\n \"16:00 同一时刻厨房温度传感器出现两个矛盾读数:常规报告 2495 与异常报告 2750\",\n \"15:35 和 16:00 的异常高温读数(2700、2750)与同时段其他房间温度(~2490-2499)偏差过大\",\n \"15:30 灶具开启后无对应关闭记录,18:21 再次开启——中间约 2 小时 51 分钟灶具可能处于无人看管的开启状态\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器硬件状态,清洁或更换传感器,确保灶具使用期间温度监控不中断\",\n \"核实 15:30 灶具开启事件是否确实持续到 18:21 之前未关闭;如果是,建议设置灶具无人看管自动关闭规则(如超过 30 分钟无厨房活动则关闭灶具)\",\n \"为厨房温度传感器设置 None 值告警,一旦传感器在灶具运行期间丢失数据应立即通知住户\",\n \"检查厨房烟雾报警器(kitchen_smoke_alarm)是否正常工作,作为温度传感器故障期间的备用安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现与其他传感器矛盾的异常高温读数,存在传感器故障风险,可能导致灶具安全监控失效。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:02、07:20、18:22、19:23 四个时间点报告 MeasuredValue = None,均发生在灶具开启或刚关闭后不久。传感器在高温工况下反复丢失读数,说明其在关键监控时段无法正常工作。", "推理步骤2: 15:30 灶具开启后,15:35 厨房温度传感器报告 2700(27.00°C),16:00 报告 2750(27.50°C),而同一时刻其他房间温度均在 24.90-24.99°C 范围,厨房常规传感器读数却为 2495(24.95°C)。同一传感器在同一时刻出现两个不同的读数(16:00 既报 2495 又报 2750),数据自相矛盾,表明传感器读数不可靠。", "推理步骤3: 15:30 灶具开启后,直到日志结束都没有看到该灶具的关闭事件(15:30 开启的那次)。18:21 又记录了一次灶具开启,19:22 关闭——但 15:30 那次开启与 18:21 之间没有关闭记录。如果 15:30 的灶具确实持续开启了近 3 小时无人看管(15:30-18:18 期间家中无人活动迹象),这本身就是火灾隐患。", "推理步骤4: 厨房窗户传感器在 07:19:30 报告打开(StateValue=False),但日志中没有对应的关闭事件,直到 19:22:30 再次报告打开。厨房窗户可能长时间处于打开状态,这不是安全威胁但属于状态监控盲区。", "推理步骤5: 其余家庭活动模式正常——早晨 06:05 起床、07:25 出门上班/上学、16:01 孩子回家、18:18 大人回家、22:32 就寝,门锁开关和运动传感器均与正常生活节奏吻合,无入侵迹象。"], "key_evidence": ["厨房温度传感器在 07:02、07:20、18:22、19:23 四次报告 MeasuredValue = None,均在灶具使用期间", "16:00 同一时刻厨房温度传感器出现两个矛盾读数:常规报告 2495 与异常报告 2750", "15:35 和 16:00 的异常高温读数(2700、2750)与同时段其他房间温度(~2490-2499)偏差过大", "15:30 灶具开启后无对应关闭记录,18:21 再次开启——中间约 2 小时 51 分钟灶具可能处于无人看管的开启状态"], "recommended_actions": ["立即检查厨房温度传感器硬件状态,清洁或更换传感器,确保灶具使用期间温度监控不中断", "核实 15:30 灶具开启事件是否确实持续到 18:21 之前未关闭;如果是,建议设置灶具无人看管自动关闭规则(如超过 30 分钟无厨房活动则关闭灶具)", "为厨房温度传感器设置 None 值告警,一旦传感器在灶具运行期间丢失数据应立即通知住户", "检查厨房烟雾报警器(kitchen_smoke_alarm)是否正常工作,作为温度传感器故障期间的备用安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.98644495010376, "api_error": null} {"episode_id": "SQ5_FP_C_1156", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1156.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261785, "scenario_id": "FG-01", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kids_room", "injection_time": "2026-06-03T19:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值且出现异常高温读数,疑似传感器故障或数据通道异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:05、07:11、18:51、19:06 四次报告 MeasuredValue = None,表明传感器在灶具开启期间反复丢失读数,这不是正常的间歇性通信问题,而是与灶具使用强相关的系统性故障。\",\n \"推理步骤2: 19:06 出现一条格式异常的日志 'MeasuredValue = 2700'(缺少完整的 Cluster.Attribute 前缀 TemperatureMeasurement.),19:31 又出现 'MeasuredValue = 2750'。这两条读数对应 270.0°C 和 275.0°C,远超正常室温范围(当时其他房间约 24.3°C),且与同一时刻该传感器的正常通道读数(2436/2429)严重矛盾。这说明传感器可能存在数据通道混乱,将灶具表面温度或错误数据混入了环境温度上报。\",\n \"推理步骤3: 如果这些异常高温读数被下游自动化规则(如火灾报警联动)采信,可能触发误报;反之,如果传感器在真正发生厨房火灾时报告 None,则会导致漏报。两种情况都构成安全隐患。\",\n \"推理步骤4: 其余家庭活动模式正常——早晨 06:10 起床、07:12 出门上锁、15:55 孩子放学回家、17:46 大人回家开空调、22:43 就寝锁门,入侵/漏水/烟雾报警均无触发,门锁开关与人员活动时序吻合,无安防类异常。\",\n \"推理步骤5: 另外注意到 15:55 开门进入后,入户门未记录到关门(BooleanState.StateValue = True)和上锁事件,直到 22:43 才确认门关闭并自动上锁。这意味着从 15:55 到 22:43 近 7 小时入户门可能处于未锁定状态,存在一定安防风险,但考虑到家中持续有人活动,风险等级为低。\"\n ],\n \"key_evidence\": [\n \"07:05 / 07:11 / 18:51 kitchen_temp_sensor 报告 MeasuredValue = None(灶具使用期间传感器失效)\",\n \"19:06 出现异常日志 'kitchen_temp_sensor | MeasuredValue = 2700',19:31 出现 'MeasuredValue = 2750',格式缺少 TemperatureMeasurement 前缀,且读数(270°C/275°C)远超正常室温\",\n \"同一时刻正常通道读数为 2436/2429(约 24.3°C),与异常读数矛盾,说明传感器存在双通道数据冲突\",\n \"15:55 入户门开锁进入后未记录关门/上锁事件,直到 22:43 才关门上锁\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房温度传感器的硬件状态和固件版本,排查 None 值和异常高温读数的根因,必要时更换传感器\",\n \"检查该传感器的 Matter 集群配置,确认是否存在多个 Endpoint 或 Attribute 上报冲突导致数据通道混乱\",\n \"在传感器修复前,暂时将厨房烟雾报警器作为厨房安全的主要监测手段,不要依赖温度传感器做火灾联动判断\",\n \"建议设置入户门自动化规则:开门超过一定时间未关闭/上锁时发送提醒通知,避免长时间门户未锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值且出现异常高温读数,疑似传感器故障或数据通道异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:05、07:11、18:51、19:06 四次报告 MeasuredValue = None,表明传感器在灶具开启期间反复丢失读数,这不是正常的间歇性通信问题,而是与灶具使用强相关的系统性故障。", "推理步骤2: 19:06 出现一条格式异常的日志 'MeasuredValue = 2700'(缺少完整的 Cluster.Attribute 前缀 TemperatureMeasurement.),19:31 又出现 'MeasuredValue = 2750'。这两条读数对应 270.0°C 和 275.0°C,远超正常室温范围(当时其他房间约 24.3°C),且与同一时刻该传感器的正常通道读数(2436/2429)严重矛盾。这说明传感器可能存在数据通道混乱,将灶具表面温度或错误数据混入了环境温度上报。", "推理步骤3: 如果这些异常高温读数被下游自动化规则(如火灾报警联动)采信,可能触发误报;反之,如果传感器在真正发生厨房火灾时报告 None,则会导致漏报。两种情况都构成安全隐患。", "推理步骤4: 其余家庭活动模式正常——早晨 06:10 起床、07:12 出门上锁、15:55 孩子放学回家、17:46 大人回家开空调、22:43 就寝锁门,入侵/漏水/烟雾报警均无触发,门锁开关与人员活动时序吻合,无安防类异常。", "推理步骤5: 另外注意到 15:55 开门进入后,入户门未记录到关门(BooleanState.StateValue = True)和上锁事件,直到 22:43 才确认门关闭并自动上锁。这意味着从 15:55 到 22:43 近 7 小时入户门可能处于未锁定状态,存在一定安防风险,但考虑到家中持续有人活动,风险等级为低。"], "key_evidence": ["07:05 / 07:11 / 18:51 kitchen_temp_sensor 报告 MeasuredValue = None(灶具使用期间传感器失效)", "19:06 出现异常日志 'kitchen_temp_sensor | MeasuredValue = 2700',19:31 出现 'MeasuredValue = 2750',格式缺少 TemperatureMeasurement 前缀,且读数(270°C/275°C)远超正常室温", "同一时刻正常通道读数为 2436/2429(约 24.3°C),与异常读数矛盾,说明传感器存在双通道数据冲突", "15:55 入户门开锁进入后未记录关门/上锁事件,直到 22:43 才关门上锁"], "recommended_actions": ["立即检查厨房温度传感器的硬件状态和固件版本,排查 None 值和异常高温读数的根因,必要时更换传感器", "检查该传感器的 Matter 集群配置,确认是否存在多个 Endpoint 或 Attribute 上报冲突导致数据通道混乱", "在传感器修复前,暂时将厨房烟雾报警器作为厨房安全的主要监测手段,不要依赖温度传感器做火灾联动判断", "建议设置入户门自动化规则:开门超过一定时间未关闭/上锁时发送提醒通知,避免长时间门户未锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.46048617362976, "api_error": null} {"episode_id": "SQ5_FP_C_1165", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1165.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261794, "scenario_id": "WD-01", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "second_bathroom", "injection_time": "2026-06-27T18:43:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"家庭整体安全状态正常,未发现需要立即响应的安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 温度数据分析——四个房间的温度在全天呈现典型的自然昼夜变化曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落。各房间温度走势高度一致,无单一房间异常升温(排除火灾隐患),属于夏季正常室温范围。\",\n \"推理步骤2: 厨房漏水传感器在18:43触发(StateValue=True),但仅2分钟后(18:45)即恢复(StateValue=False)。这种短暂触发通常是洗碗、清洗食材等日常用水活动导致的少量溅水,而非管道破裂或持续漏水。同时厨房温度未出现异常波动,烟雾报警器也未触发,排除关联性安全事件。\",\n \"推理步骤3: 18:43客厅运动传感器检测到有人(Occupancy=1)且客厅主灯开启,说明此时住户在家活动,与厨房短暂溅水的时间吻合,进一步印证是住户正常生活行为。\",\n \"推理步骤4: 全天无入户门锁异常解锁、无门窗传感器异常开启、无烟雾/CO报警触发、无其他漏水传感器告警,入侵、火灾、燃气泄漏等威胁指标均未出现。\",\n \"推理步骤5: 日志中未出现深夜异常运动检测、设备离线或状态跳变等设备故障迹象,系统运行稳定。\"\n ],\n \"key_evidence\": [\n \"厨房漏水传感器18:43触发后仅2分钟即恢复正常,属于瞬时事件而非持续漏水\",\n \"四个房间温度全天在22.9°C~25.8°C之间同步变化,符合夏季自然昼夜温度曲线\",\n \"漏水触发时客厅有人活动(运动传感器+灯光开启),说明住户在家,溅水为正常生活行为\",\n \"全天无烟雾报警、无门锁异常、无门窗传感器异常开启事件\"\n ],\n \"recommended_actions\": [\n \"无需立即采取安全响应措施\",\n \"可关注厨房漏水传感器后续是否频繁短暂触发,若频率增加建议检查水槽周边密封和管道接头\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "家庭整体安全状态正常,未发现需要立即响应的安全威胁。", "reasoning": ["推理步骤1: 温度数据分析——四个房间的温度在全天呈现典型的自然昼夜变化曲线:凌晨最低约22.9°C,中午前后最高约25.8°C,傍晚后逐步回落。各房间温度走势高度一致,无单一房间异常升温(排除火灾隐患),属于夏季正常室温范围。", "推理步骤2: 厨房漏水传感器在18:43触发(StateValue=True),但仅2分钟后(18:45)即恢复(StateValue=False)。这种短暂触发通常是洗碗、清洗食材等日常用水活动导致的少量溅水,而非管道破裂或持续漏水。同时厨房温度未出现异常波动,烟雾报警器也未触发,排除关联性安全事件。", "推理步骤3: 18:43客厅运动传感器检测到有人(Occupancy=1)且客厅主灯开启,说明此时住户在家活动,与厨房短暂溅水的时间吻合,进一步印证是住户正常生活行为。", "推理步骤4: 全天无入户门锁异常解锁、无门窗传感器异常开启、无烟雾/CO报警触发、无其他漏水传感器告警,入侵、火灾、燃气泄漏等威胁指标均未出现。", "推理步骤5: 日志中未出现深夜异常运动检测、设备离线或状态跳变等设备故障迹象,系统运行稳定。"], "key_evidence": ["厨房漏水传感器18:43触发后仅2分钟即恢复正常,属于瞬时事件而非持续漏水", "四个房间温度全天在22.9°C~25.8°C之间同步变化,符合夏季自然昼夜温度曲线", "漏水触发时客厅有人活动(运动传感器+灯光开启),说明住户在家,溅水为正常生活行为", "全天无烟雾报警、无门锁异常、无门窗传感器异常开启事件"], "recommended_actions": ["无需立即采取安全响应措施", "可关注厨房漏水传感器后续是否频繁短暂触发,若频率增加建议检查水槽周边密封和管道接头"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.980013847351074, "api_error": null} {"episode_id": "SQ5_FP_C_1163", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1163.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261792, "scenario_id": "INS-03", "total_events": 258, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "INS-03-FP", "scenario_name": "INS-03-FP: 家庭成员先后到家", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "第二人通过合法凭证解锁(不同UserIndex),且有合理时间间隔", "target_room": "master_bedroom", "injection_time": "2026-06-16T16:21:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁在短时间内出现两次失败的远程解锁尝试。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:58、07:04、18:12、18:59 四个时间点报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的故障或间歇性离线。\",\n \"推理步骤2: 观察 None 值出现的时机——均在灶具开启或刚关闭后不久(06:57 灶具开启 → 06:58 None;18:11 灶具开启 → 18:12 None;18:58 灶具关闭 → 18:59 None)。这可能是灶具产生的热量或电磁干扰导致传感器暂时失效。厨房温度传感器是烟雾报警的辅助判断依据,如果在烹饪高温时段失效,会削弱火灾预警能力。\",\n \"推理步骤3: 16:21 和 16:26 入户门锁连续出现两次 LockOperationType=1(解锁)、OperationSource=3(远程/App)的事件,分别对应 UserIndex=1 和 UserIndex=2,但日志中没有对应的 LockState 变化和门磁开合记录。直到 16:32 才有一次正常的手动解锁-开门-进入序列。这两次远程解锁可能是操作失败(门锁未响应)或仅为远程预授权,需要确认是否为住户本人操作。\",\n \"推理步骤4: 其余行为模式均属正常——早晨 06:09 主卧起床、06:57 做早餐、07:47 全家出门并自动锁门;下午 16:32 孩子放学回家、17:53 大人回家开空调做饭;晚间 20:52 孩子关灯睡觉、22:10 大人就寝并确认锁门。温度曲线呈现正常的昼夜变化(夜间约 22.9°C,午间峰值约 25.8°C)。\",\n \"推理步骤5: 厨房窗户在做完饭后打开(07:03、18:58)属于通风行为,但日志中未见对应的关闭事件(BooleanState.StateValue = True),需确认厨房窗户当前是否仍处于打开状态,夜间开窗存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:58、07:04、18:12、18:59 四次报告 MeasuredValue = None,均与灶具使用时段高度关联\",\n \"16:21 和 16:26 入户门锁出现两次远程解锁事件(OperationSource=3),但无后续 LockState 变化或门磁开合记录\",\n \"厨房窗户在 07:03 和 18:58 被打开,日志中未见关闭记录,可能整夜处于开启状态\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰下间歇失效;考虑更换位置或更换耐高温型号\",\n \"核实 16:21 和 16:26 的两次远程解锁操作是否为家庭成员(UserIndex 1 和 2)本人通过 App 发起;如非本人操作,建议立即更改门锁远程访问密码并审查授权用户列表\",\n \"确认厨房窗户当前状态,如仍处于打开状态建议关闭,夜间开窗可能带来入侵风险\",\n \"鉴于厨房温度传感器在烹饪时段不可用,建议在传感器修复前加强对厨房烟雾报警器的功能测试,确保火灾预警不受影响\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门锁在短时间内出现两次失败的远程解锁尝试。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:58、07:04、18:12、18:59 四个时间点报告 MeasuredValue = None。其他三个温度传感器在相同时段均正常上报数值,说明这不是全局通信问题,而是该传感器自身的故障或间歇性离线。", "推理步骤2: 观察 None 值出现的时机——均在灶具开启或刚关闭后不久(06:57 灶具开启 → 06:58 None;18:11 灶具开启 → 18:12 None;18:58 灶具关闭 → 18:59 None)。这可能是灶具产生的热量或电磁干扰导致传感器暂时失效。厨房温度传感器是烟雾报警的辅助判断依据,如果在烹饪高温时段失效,会削弱火灾预警能力。", "推理步骤3: 16:21 和 16:26 入户门锁连续出现两次 LockOperationType=1(解锁)、OperationSource=3(远程/App)的事件,分别对应 UserIndex=1 和 UserIndex=2,但日志中没有对应的 LockState 变化和门磁开合记录。直到 16:32 才有一次正常的手动解锁-开门-进入序列。这两次远程解锁可能是操作失败(门锁未响应)或仅为远程预授权,需要确认是否为住户本人操作。", "推理步骤4: 其余行为模式均属正常——早晨 06:09 主卧起床、06:57 做早餐、07:47 全家出门并自动锁门;下午 16:32 孩子放学回家、17:53 大人回家开空调做饭;晚间 20:52 孩子关灯睡觉、22:10 大人就寝并确认锁门。温度曲线呈现正常的昼夜变化(夜间约 22.9°C,午间峰值约 25.8°C)。", "推理步骤5: 厨房窗户在做完饭后打开(07:03、18:58)属于通风行为,但日志中未见对应的关闭事件(BooleanState.StateValue = True),需确认厨房窗户当前是否仍处于打开状态,夜间开窗存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在 06:58、07:04、18:12、18:59 四次报告 MeasuredValue = None,均与灶具使用时段高度关联", "16:21 和 16:26 入户门锁出现两次远程解锁事件(OperationSource=3),但无后续 LockState 变化或门磁开合记录", "厨房窗户在 07:03 和 18:58 被打开,日志中未见关闭记录,可能整夜处于开启状态"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或电磁干扰下间歇失效;考虑更换位置或更换耐高温型号", "核实 16:21 和 16:26 的两次远程解锁操作是否为家庭成员(UserIndex 1 和 2)本人通过 App 发起;如非本人操作,建议立即更改门锁远程访问密码并审查授权用户列表", "确认厨房窗户当前状态,如仍处于打开状态建议关闭,夜间开窗可能带来入侵风险", "鉴于厨房温度传感器在烹饪时段不可用,建议在传感器修复前加强对厨房烟雾报警器的功能测试,确保火灾预警不受影响"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.13018774986267, "api_error": null} {"episode_id": "SQ5_FP_D_1117", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1117.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-25T00:00:00", "seed": 20261746, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-25T14:11:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后(06:05、06:22、10:58、11:28、17:05、17:28)连续报告 MeasuredValue = None,共出现6次,每次都与灶具使用时间高度吻合。\",\n \"推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(哪怕是超量程值),而非 None。反复出现 None 说明传感器在灶具工作时无法正常采集数据,可能是热损伤、通信中断或硬件故障。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的重要环节。如果传感器在灶具使用时恰好失效,将无法及时发现异常高温或火灾隐患,存在安全盲区。\",\n \"推理步骤4: 其余行为模式正常——老人05:24起床、06:52出门晨练、08:26回家、12:22午休、14:03起床、20:41就寝,作息规律;入户门锁操作正常;14:11的漏水报警2分钟后消除,属于短暂溅水,非持续泄漏。\",\n \"推理步骤5: 08:26回家时入户门未重新上锁(日志中无 LockOperationType=0 事件),直到20:41才自动上锁,白天长时间门锁处于未锁定状态,对独居老人存在一定安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(06:05、06:22、10:58、11:28、17:05、17:28)\",\n \"08:26开锁进门后至20:41期间无上锁记录,入户门可能长时间未锁\",\n \"14:11卫生间漏水传感器短暂触发(2分钟后恢复),需关注是否为反复现象\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器,确保其在灶具使用时能正常工作,消除火灾监测盲区\",\n \"设置入户门未锁定超时提醒(如进门后5分钟未上锁则推送通知),提升独居安全性\",\n \"持续观察卫生间漏水传感器是否频繁触发,若多日重复出现需检查管道或设备\",\n \"考虑为厨房增加独立的高温报警装置作为温度传感器的冗余备份\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或被高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后(06:05、06:22、10:58、11:28、17:05、17:28)连续报告 MeasuredValue = None,共出现6次,每次都与灶具使用时间高度吻合。", "推理步骤2: 正常的温度传感器即使在高温环境下也应报告数值(哪怕是超量程值),而非 None。反复出现 None 说明传感器在灶具工作时无法正常采集数据,可能是热损伤、通信中断或硬件故障。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的重要环节。如果传感器在灶具使用时恰好失效,将无法及时发现异常高温或火灾隐患,存在安全盲区。", "推理步骤4: 其余行为模式正常——老人05:24起床、06:52出门晨练、08:26回家、12:22午休、14:03起床、20:41就寝,作息规律;入户门锁操作正常;14:11的漏水报警2分钟后消除,属于短暂溅水,非持续泄漏。", "推理步骤5: 08:26回家时入户门未重新上锁(日志中无 LockOperationType=0 事件),直到20:41才自动上锁,白天长时间门锁处于未锁定状态,对独居老人存在一定安全隐患。"], "key_evidence": ["厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(06:05、06:22、10:58、11:28、17:05、17:28)", "08:26开锁进门后至20:41期间无上锁记录,入户门可能长时间未锁", "14:11卫生间漏水传感器短暂触发(2分钟后恢复),需关注是否为反复现象"], "recommended_actions": ["检查或更换厨房温度传感器,确保其在灶具使用时能正常工作,消除火灾监测盲区", "设置入户门未锁定超时提醒(如进门后5分钟未上锁则推送通知),提升独居安全性", "持续观察卫生间漏水传感器是否频繁触发,若多日重复出现需检查管道或设备", "考虑为厨房增加独立的高温报警装置作为温度传感器的冗余备份"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.15845513343811, "api_error": null} {"episode_id": "SQ5_FP_C_1167", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_C_1167.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261796, "scenario_id": "INS-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-04-FP", "scenario_name": "INS-04-FP: 清洁工/保姆上门", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "通过门锁合法进入(有 LockOperation 事件+有效 UserIndex),不是通过窗户", "target_room": "second_bedroom", "injection_time": "2026-06-25T06:09:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None(06:43、07:01、18:18、19:25),均发生在灶具开启或关闭前后,说明传感器在厨房最需要温度监控时反而失效。\",\n \"推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)全天每30分钟稳定上报数据,无任何 None 值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。\",\n \"推理步骤3: 厨房是火灾高风险区域,灶具使用期间温度传感器失效意味着如果发生异常高温,系统无法及时检测和预警。虽然厨房有独立烟雾报警器作为兜底,但温度传感器的缺失削弱了多层防护能力。\",\n \"推理步骤4: 其余家庭活动模式均正常——早晨06:09 UserIndex=5 密码开锁入户、早起洗漱做饭、07:11全家出门并自动上锁、16:12孩子放学回家直奔儿童房、17:55大人回家开空调做饭、21:02孩子关灯睡觉、22:45大人就寝锁门,完全符合三口之家的工作日作息。\",\n \"推理步骤5: 入户门锁的开锁/上锁序列完整且合理,门磁传感器与运动传感器的触发时序一致,无入侵迹象。烟雾报警器和漏水传感器全天无告警,厨房窗户在做饭后开启通风属正常操作。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:43、07:01、18:18、19:25 四次报告 MeasuredValue = None\",\n \"None 值均出现在灶具操作(开启/关闭)前后数分钟内,其余时段传感器正常工作\",\n \"同一时段其他三个温度传感器数据完全正常,排除系统性故障\",\n \"厨房灶具使用时段恰好是最需要温度监控的高风险时段\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰传感器工作\",\n \"检查该传感器的固件版本并尝试更新,或重新配对设备以排除通信问题\",\n \"如问题持续,建议更换厨房温度传感器,优先选择耐高温型号\",\n \"在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为关键安全兜底\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常,可能影响厨房安全监控能力。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了3次 MeasuredValue = None(06:43、07:01、18:18、19:25),均发生在灶具开启或关闭前后,说明传感器在厨房最需要温度监控时反而失效。", "推理步骤2: 其他三个温度传感器(客厅、主卧、儿童房)全天每30分钟稳定上报数据,无任何 None 值,排除了系统级通信故障的可能,问题定位在厨房温度传感器本身。", "推理步骤3: 厨房是火灾高风险区域,灶具使用期间温度传感器失效意味着如果发生异常高温,系统无法及时检测和预警。虽然厨房有独立烟雾报警器作为兜底,但温度传感器的缺失削弱了多层防护能力。", "推理步骤4: 其余家庭活动模式均正常——早晨06:09 UserIndex=5 密码开锁入户、早起洗漱做饭、07:11全家出门并自动上锁、16:12孩子放学回家直奔儿童房、17:55大人回家开空调做饭、21:02孩子关灯睡觉、22:45大人就寝锁门,完全符合三口之家的工作日作息。", "推理步骤5: 入户门锁的开锁/上锁序列完整且合理,门磁传感器与运动传感器的触发时序一致,无入侵迹象。烟雾报警器和漏水传感器全天无告警,厨房窗户在做饭后开启通风属正常操作。"], "key_evidence": ["kitchen_temp_sensor 在 06:43、07:01、18:18、19:25 四次报告 MeasuredValue = None", "None 值均出现在灶具操作(开启/关闭)前后数分钟内,其余时段传感器正常工作", "同一时段其他三个温度传感器数据完全正常,排除系统性故障", "厨房灶具使用时段恰好是最需要温度监控的高风险时段"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温或油烟干扰传感器工作", "检查该传感器的固件版本并尝试更新,或重新配对设备以排除通信问题", "如问题持续,建议更换厨房温度传感器,优先选择耐高温型号", "在传感器修复前,确保厨房烟雾报警器(kitchen_smoke_alarm)处于正常工作状态,作为关键安全兜底"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.415933847427368, "api_error": null} {"episode_id": "SQ5_FP_D_1126", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1126.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261755, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-16T17:23:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致无法及时检测厨房火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:27起床、05:44洗漱、05:54做早餐、06:52出门、08:23回家、12:20午休、14:02起床、16:51做晚餐、20:34洗漱、20:55就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 厨房温度传感器在灶具每次开启后约30秒至1分钟内均报告 MeasuredValue = None(05:55:09、11:01:00、16:52:00),灶具关闭后约1分钟也报告 None(06:22:00、11:38:00、17:41:00),共出现6次。正常传感器在灶具使用时应报告升高的温度值而非 None。\",\n \"推理步骤3: 温度传感器报 None 意味着在灶具工作期间厨房缺少有效的温度监测,如果发生干烧或过热,系统将无法通过温度异常触发预警,这对独居老人构成安全隐患。\",\n \"推理步骤4: 17:23 入户门锁出现一次 LockOperationError(OperationError=1, OperationSource=3 即远程/密码操作),但20秒后同一来源以 UserIndex=1(户主)成功解锁,判断为老人输错密码后重试成功,属正常行为,不构成入侵威胁。\",\n \"推理步骤5: 08:23 老人回家后入户门未立即上锁(日志中无自动锁定事件),直到20:55就寝时门才被自动锁定并关闭(StateValue=True),白天长时间门锁处于解锁状态,对独居老人存在一定安全隐患,但属于低风险的习惯问题。\",\n \"推理步骤6: 各房间温度整体走势合理(夜间约22-23°C,午间升至25-26°C,傍晚回落),无异常高温或低温。烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:55:09、06:22:00、11:01:00、11:38:00、16:52:00、17:41:00),而其他时段温度读数正常\",\n \"17:23 门锁远程操作失败一次(LockOperationError),20秒后户主成功解锁,属正常重试\",\n \"08:23 至 20:55 期间入户门锁未处于锁定状态,长达约12.5小时\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器——当前传感器在灶具使用时失效,无法提供关键的高温预警,对独居老人的用火安全至关重要\",\n \"建议启用入户门锁的自动上锁功能(如进门后30秒自动锁定),避免白天长时间处于未锁状态\",\n \"考虑为厨房灶具设置使用时长上限自动关断(如超过45分钟未手动关闭则自动断电),作为温度传感器失效期间的补充安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,可能导致无法及时检测厨房火灾风险。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:27起床、05:44洗漱、05:54做早餐、06:52出门、08:23回家、12:20午休、14:02起床、16:51做晚餐、20:34洗漱、20:55就寝,符合独居老人的典型日常规律。", "推理步骤2: 厨房温度传感器在灶具每次开启后约30秒至1分钟内均报告 MeasuredValue = None(05:55:09、11:01:00、16:52:00),灶具关闭后约1分钟也报告 None(06:22:00、11:38:00、17:41:00),共出现6次。正常传感器在灶具使用时应报告升高的温度值而非 None。", "推理步骤3: 温度传感器报 None 意味着在灶具工作期间厨房缺少有效的温度监测,如果发生干烧或过热,系统将无法通过温度异常触发预警,这对独居老人构成安全隐患。", "推理步骤4: 17:23 入户门锁出现一次 LockOperationError(OperationError=1, OperationSource=3 即远程/密码操作),但20秒后同一来源以 UserIndex=1(户主)成功解锁,判断为老人输错密码后重试成功,属正常行为,不构成入侵威胁。", "推理步骤5: 08:23 老人回家后入户门未立即上锁(日志中无自动锁定事件),直到20:55就寝时门才被自动锁定并关闭(StateValue=True),白天长时间门锁处于解锁状态,对独居老人存在一定安全隐患,但属于低风险的习惯问题。", "推理步骤6: 各房间温度整体走势合理(夜间约22-23°C,午间升至25-26°C,傍晚回落),无异常高温或低温。烟雾报警器全天无触发,漏水传感器无报警,窗户传感器无异常开合。"], "key_evidence": ["kitchen_temp_sensor 在灶具开启/关闭前后共6次报告 MeasuredValue = None(05:55:09、06:22:00、11:01:00、11:38:00、16:52:00、17:41:00),而其他时段温度读数正常", "17:23 门锁远程操作失败一次(LockOperationError),20秒后户主成功解锁,属正常重试", "08:23 至 20:55 期间入户门锁未处于锁定状态,长达约12.5小时"], "recommended_actions": ["检修或更换厨房温度传感器——当前传感器在灶具使用时失效,无法提供关键的高温预警,对独居老人的用火安全至关重要", "建议启用入户门锁的自动上锁功能(如进门后30秒自动锁定),避免白天长时间处于未锁状态", "考虑为厨房灶具设置使用时长上限自动关断(如超过45分钟未手动关闭则自动断电),作为温度传感器失效期间的补充安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.947729110717773, "api_error": null} {"episode_id": "SQ5_FP_D_1120", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1120.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261749, "scenario_id": "DF-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "DF-01-FP", "scenario_name": "DF-01-FP: 空调恒温控制导致温度稳定", "category": "device_fault", "is_anomaly": false, "threat_type": "none", "key_difference": "有微小波动(±0.2°C),不是完全固定值;且空调处于开启状态", "target_room": "living_room", "injection_time": "2026-06-03T21:47:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,客厅温度传感器出现异常跳变,空调疑似故障运行;同时入户门在老人外出归来后未正常关闭。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:08、06:30、11:03、11:22、16:53、17:36),虽然灶具工作时传感器可能因高温超量程而返回 None,但这种情况反复出现,需要确认传感器是否工作正常或安装位置是否合理。若传感器失效,将无法在真正的厨房火灾或燃气泄漏时提供温度预警,对独居老人构成安全隐患。\",\n \"推理步骤2: 客厅温度传感器从 21:47 开始出现异常的锯齿形跳变模式——在正常的半小时读数(逐步下降:2357→2359→2330→2325)之间,每隔约30分钟插入一个约 2500(25.0°C)的异常高读数(21:47=2500, 22:17=2502, 22:47=2498, 23:17=2501)。空调在 21:47 开启,此后客厅整体温度趋势是下降的,但这些周期性的 2500 尖峰与下降趋势矛盾。这可能表明:(a) 空调温控存在故障,周期性送热风;(b) 温度传感器受空调出风口直吹影响产生误读;(c) 传感器本身间歇性故障。无论哪种原因,都意味着室温监控数据不可靠。\",\n \"推理步骤3: 在 08:23 老人回家时,入户门解锁并打开(front_door_contact = False),但直到 20:49 才记录到门关闭(StateValue = True)并自动上锁。这意味着入户门可能保持未关闭/未锁定状态长达约 12.5 小时。对于独居老人家庭,这是一个显著的入侵风险。不过也存在另一种可能:门确实被关上了但传感器未触发报告(即中间状态变化丢失),这本身也是传感器可靠性问题。\",\n \"推理步骤4: 老人的日常作息模式本身是正常的——05:20 起床、05:45 洗漱、06:07 做早餐、06:55 出门晨练、08:23 回家、11:02 做午饭、12:38 午休、14:04 起床、16:52 做晚饭、19:36 看电视(灯光调暗至 19/254)、20:39 洗漱、20:49 就寝。三餐规律,活动正常,未发现健康方面的异常信号。\",\n \"推理步骤5: 综合来看,主要问题集中在设备可靠性上:厨房温度传感器反复丢失数据、客厅温度传感器/空调出现异常跳变、入户门传感器可能存在状态上报遗漏。这些设备故障会削弱整个安全监控体系的有效性,尤其对独居老人而言,可靠的传感器是及时发现火灾、入侵等紧急情况的关键。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次烹饪期间共 6 次报告 MeasuredValue = None(06:08, 06:30, 11:03, 11:22, 16:53, 17:36)\",\n \"客厅温度传感器从 21:47 起出现周期性异常尖峰:每隔约30分钟跳至 ~2500,而正常趋势读数持续下降(2357→2325),形成明显的锯齿形跳变\",\n \"入户门在 08:23:02 打开(StateValue=False)后,直到 20:49:11 才记录到关闭(StateValue=True),中间无任何门状态变化记录,持续约 12.5 小时\",\n \"空调 21:47 开启时客厅温度突然从 ~2382 跳至 2500,与其他房间同期温度趋势不一致\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和工作状态,确认其是否因距灶具过近导致超量程,必要时重新定位或更换耐高温型号\",\n \"排查客厅温度传感器与空调的交互问题:确认传感器是否被空调出风口直吹,检查空调是否存在间歇性制热故障,考虑将传感器移至远离出风口的位置\",\n \"检查入户门磁传感器的对齐和灵敏度,确认是否存在状态上报遗漏;如传感器正常,则需提醒老人外出归来后确认关门\",\n \"考虑为入户门设置「长时间未关闭」告警规则(如超过 5 分钟未关闭即推送提醒),保障独居老人的居家安全\",\n \"对空调运行状态进行专项检查,确认是否存在温控模块故障导致的周期性异常加热\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,客厅温度传感器出现异常跳变,空调疑似故障运行;同时入户门在老人外出归来后未正常关闭。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(06:08、06:30、11:03、11:22、16:53、17:36),虽然灶具工作时传感器可能因高温超量程而返回 None,但这种情况反复出现,需要确认传感器是否工作正常或安装位置是否合理。若传感器失效,将无法在真正的厨房火灾或燃气泄漏时提供温度预警,对独居老人构成安全隐患。", "推理步骤2: 客厅温度传感器从 21:47 开始出现异常的锯齿形跳变模式——在正常的半小时读数(逐步下降:2357→2359→2330→2325)之间,每隔约30分钟插入一个约 2500(25.0°C)的异常高读数(21:47=2500, 22:17=2502, 22:47=2498, 23:17=2501)。空调在 21:47 开启,此后客厅整体温度趋势是下降的,但这些周期性的 2500 尖峰与下降趋势矛盾。这可能表明:(a) 空调温控存在故障,周期性送热风;(b) 温度传感器受空调出风口直吹影响产生误读;(c) 传感器本身间歇性故障。无论哪种原因,都意味着室温监控数据不可靠。", "推理步骤3: 在 08:23 老人回家时,入户门解锁并打开(front_door_contact = False),但直到 20:49 才记录到门关闭(StateValue = True)并自动上锁。这意味着入户门可能保持未关闭/未锁定状态长达约 12.5 小时。对于独居老人家庭,这是一个显著的入侵风险。不过也存在另一种可能:门确实被关上了但传感器未触发报告(即中间状态变化丢失),这本身也是传感器可靠性问题。", "推理步骤4: 老人的日常作息模式本身是正常的——05:20 起床、05:45 洗漱、06:07 做早餐、06:55 出门晨练、08:23 回家、11:02 做午饭、12:38 午休、14:04 起床、16:52 做晚饭、19:36 看电视(灯光调暗至 19/254)、20:39 洗漱、20:49 就寝。三餐规律,活动正常,未发现健康方面的异常信号。", "推理步骤5: 综合来看,主要问题集中在设备可靠性上:厨房温度传感器反复丢失数据、客厅温度传感器/空调出现异常跳变、入户门传感器可能存在状态上报遗漏。这些设备故障会削弱整个安全监控体系的有效性,尤其对独居老人而言,可靠的传感器是及时发现火灾、入侵等紧急情况的关键。"], "key_evidence": ["厨房温度传感器在三次烹饪期间共 6 次报告 MeasuredValue = None(06:08, 06:30, 11:03, 11:22, 16:53, 17:36)", "客厅温度传感器从 21:47 起出现周期性异常尖峰:每隔约30分钟跳至 ~2500,而正常趋势读数持续下降(2357→2325),形成明显的锯齿形跳变", "入户门在 08:23:02 打开(StateValue=False)后,直到 20:49:11 才记录到关闭(StateValue=True),中间无任何门状态变化记录,持续约 12.5 小时", "空调 21:47 开启时客厅温度突然从 ~2382 跳至 2500,与其他房间同期温度趋势不一致"], "recommended_actions": ["检查厨房温度传感器的安装位置和工作状态,确认其是否因距灶具过近导致超量程,必要时重新定位或更换耐高温型号", "排查客厅温度传感器与空调的交互问题:确认传感器是否被空调出风口直吹,检查空调是否存在间歇性制热故障,考虑将传感器移至远离出风口的位置", "检查入户门磁传感器的对齐和灵敏度,确认是否存在状态上报遗漏;如传感器正常,则需提醒老人外出归来后确认关门", "考虑为入户门设置「长时间未关闭」告警规则(如超过 5 分钟未关闭即推送提醒),保障独居老人的居家安全", "对空调运行状态进行专项检查,确认是否存在温控模块故障导致的周期性异常加热"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 35.56053137779236, "api_error": null} {"episode_id": "SQ5_FP_D_1130", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1130.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-10T00:00:00", "seed": 20261759, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-10T18:41:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,且厨房温度异常飙升至27°C以上,存在火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:41 厨房灶具开启(OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0),说明灶具在无人看管的情况下运行。\",\n \"推理步骤2: 18:46 厨房温度传感器读数飙升至2700(27.00°C),19:11进一步升至2750(27.50°C),而同时段客厅和卧室温度分别在24°C和23°C左右,厨房温度比其他房间高出约3-4°C,且上升趋势明显异常。\",\n \"推理步骤3: 对比当天早、中、晚三次正常烹饪(06:02-06:25、10:51-11:20、16:58-17:29),每次灶具开启时厨房运动传感器均显示有人(Occupancy = 1),且温度传感器报告为None(被灶具热源干扰属正常现象)。但18:41这次灶具开启时无人在场,且温度传感器未报None而是报出了异常高温数值,模式与正常烹饪不同。\",\n \"推理步骤4: 直到19:01厨房才重新检测到有人(Occupancy = 1),意味着灶具在无人看管状态下运行了约20分钟。对于独居老人家庭,这是严重的火灾风险。\",\n \"推理步骤5: 日志中未出现灶具关闭(OnOff = False)的记录,无法确认灶具最终是否被关闭,进一步加大了风险。\",\n \"推理步骤6: 另外注意到厨房温度传感器在灶具使用期间多次报告None值(06:03、06:26、10:52、11:21、16:59、17:30),可能存在传感器受热源干扰或间歇性故障的问题,影响火灾预警的可靠性。\"\n ],\n \"key_evidence\": [\n \"18:41 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生,灶具在无人时开启\",\n \"18:46 厨房温度飙升至2700(27.00°C),19:11进一步升至2750(27.50°C),远超同时段其他房间温度\",\n \"灶具无人看管持续约20分钟(18:41至19:01才有人回到厨房)\",\n \"日志中未记录该次灶具关闭事件,灶具可能仍在运行\",\n \"厨房温度传感器在灶具使用期间多次报告None值,传感器可靠性存疑\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前是否已关闭,若仍在运行应远程或通知老人关闭\",\n \"向老人或其紧急联系人发送告警通知,提醒灶具曾在无人状态下运行\",\n \"检查厨房温度传感器,排查多次报告None值的原因,确保火灾预警功能正常\",\n \"建议为灶具设置安全规则:当厨房无人超过一定时间(如5分钟)自动关闭灶具\",\n \"考虑为独居老人安装灶具自动断气/断电保护装置,防止忘关灶具引发事故\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,且厨房温度异常飙升至27°C以上,存在火灾隐患。", "reasoning": ["推理步骤1: 18:41 厨房灶具开启(OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0),说明灶具在无人看管的情况下运行。", "推理步骤2: 18:46 厨房温度传感器读数飙升至2700(27.00°C),19:11进一步升至2750(27.50°C),而同时段客厅和卧室温度分别在24°C和23°C左右,厨房温度比其他房间高出约3-4°C,且上升趋势明显异常。", "推理步骤3: 对比当天早、中、晚三次正常烹饪(06:02-06:25、10:51-11:20、16:58-17:29),每次灶具开启时厨房运动传感器均显示有人(Occupancy = 1),且温度传感器报告为None(被灶具热源干扰属正常现象)。但18:41这次灶具开启时无人在场,且温度传感器未报None而是报出了异常高温数值,模式与正常烹饪不同。", "推理步骤4: 直到19:01厨房才重新检测到有人(Occupancy = 1),意味着灶具在无人看管状态下运行了约20分钟。对于独居老人家庭,这是严重的火灾风险。", "推理步骤5: 日志中未出现灶具关闭(OnOff = False)的记录,无法确认灶具最终是否被关闭,进一步加大了风险。", "推理步骤6: 另外注意到厨房温度传感器在灶具使用期间多次报告None值(06:03、06:26、10:52、11:21、16:59、17:30),可能存在传感器受热源干扰或间歇性故障的问题,影响火灾预警的可靠性。"], "key_evidence": ["18:41 kitchen_cook_surface OnOff=True 与 kitchen_occupancy Occupancy=0 同时发生,灶具在无人时开启", "18:46 厨房温度飙升至2700(27.00°C),19:11进一步升至2750(27.50°C),远超同时段其他房间温度", "灶具无人看管持续约20分钟(18:41至19:01才有人回到厨房)", "日志中未记录该次灶具关闭事件,灶具可能仍在运行", "厨房温度传感器在灶具使用期间多次报告None值,传感器可靠性存疑"], "recommended_actions": ["立即确认厨房灶具当前是否已关闭,若仍在运行应远程或通知老人关闭", "向老人或其紧急联系人发送告警通知,提醒灶具曾在无人状态下运行", "检查厨房温度传感器,排查多次报告None值的原因,确保火灾预警功能正常", "建议为灶具设置安全规则:当厨房无人超过一定时间(如5分钟)自动关闭灶具", "考虑为独居老人安装灶具自动断气/断电保护装置,防止忘关灶具引发事故"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.48617458343506, "api_error": null} {"episode_id": "SQ5_FP_D_1132", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1132.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261761, "scenario_id": "WD-01", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "WD-01-FP", "scenario_name": "WD-01-FP: 洗澡溅水", "category": "water_damage", "is_anomaly": false, "threat_type": "none", "key_difference": "有人在卫生间正常使用中触发,且短时间内恢复为 false", "target_room": "kitchen", "injection_time": "2026-06-05T20:01:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门在老人外出期间(08:24)未锁闭,直到晚间 20:44 才自动上锁,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:55、06:33、10:59、11:31、17:02、17:25),共计 6 次。正常传感器即使受灶具热源影响也应报告数值而非 null,这表明传感器可能存在间歇性故障或通信异常。\",\n \"推理步骤2: 老人于 06:53 手动开锁出门,门自动上锁。08:24 再次手动开锁进门,但日志中未显示此次进门后门锁重新上锁(LockState=1)。直到 20:44 才出现自动上锁记录。这意味着入户门在白天长时间处于未锁状态,对独居老人而言是安全隐患。\",\n \"推理步骤3: 20:01 卫生间漏水传感器短暂触发(StateValue=True),2 分钟后恢复(20:03 StateValue=False)。结合同时段卫生间有人(occupancy=1)且灯亮,推测为老人正常用水导致的短暂溅水,非持续漏水,但仍需关注是否反复出现。\",\n \"推理步骤4: 老人整体作息模式正常——05:25 起床、05:49 如厕、05:54 做早餐、06:53 出门、08:24 回家、12:31 午休(窗帘关闭)、13:56 起床、17:01 做晚餐、20:44 就寝。活动轨迹连贯,运动传感器与灯光联动合理,未发现长时间无活动的健康异常信号。\",\n \"推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约 21.9°C,午间峰值约 25.6°C),各房间温差合理,无异常高温或火灾迹象。烟雾报警器全天无触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 05:55、06:33、10:59、11:31、17:02、17:25 共 6 次报告 MeasuredValue = None\",\n \"08:24 入户门手动开锁(LockState=2)后,直到 20:44 才记录到自动上锁(LockState=1),中间约 12 小时无上锁记录\",\n \"20:01 卫生间漏水传感器短暂触发 2 分钟后自动恢复\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,排查间歇性 null 值的原因,必要时更换传感器\",\n \"检查入户门锁(front_door_lock)的自动上锁策略,建议设置开门后 30 秒至 1 分钟内自动上锁,避免长时间未锁闭\",\n \"持续监测卫生间漏水传感器,若短暂触发频繁出现,应检查卫生间水管接头和地漏密封情况\",\n \"考虑为独居老人增设紧急呼叫按钮或跌倒检测设备,提升居家安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 null 值,存在设备故障风险;同时入户门在老人外出期间(08:24)未锁闭,直到晚间 20:44 才自动上锁,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:55、06:33、10:59、11:31、17:02、17:25),共计 6 次。正常传感器即使受灶具热源影响也应报告数值而非 null,这表明传感器可能存在间歇性故障或通信异常。", "推理步骤2: 老人于 06:53 手动开锁出门,门自动上锁。08:24 再次手动开锁进门,但日志中未显示此次进门后门锁重新上锁(LockState=1)。直到 20:44 才出现自动上锁记录。这意味着入户门在白天长时间处于未锁状态,对独居老人而言是安全隐患。", "推理步骤3: 20:01 卫生间漏水传感器短暂触发(StateValue=True),2 分钟后恢复(20:03 StateValue=False)。结合同时段卫生间有人(occupancy=1)且灯亮,推测为老人正常用水导致的短暂溅水,非持续漏水,但仍需关注是否反复出现。", "推理步骤4: 老人整体作息模式正常——05:25 起床、05:49 如厕、05:54 做早餐、06:53 出门、08:24 回家、12:31 午休(窗帘关闭)、13:56 起床、17:01 做晚餐、20:44 就寝。活动轨迹连贯,运动传感器与灯光联动合理,未发现长时间无活动的健康异常信号。", "推理步骤5: 温度数据整体呈现正常的日间升温、夜间降温曲线(卧室夜间约 21.9°C,午间峰值约 25.6°C),各房间温差合理,无异常高温或火灾迹象。烟雾报警器全天无触发。"], "key_evidence": ["厨房温度传感器在 05:55、06:33、10:59、11:31、17:02、17:25 共 6 次报告 MeasuredValue = None", "08:24 入户门手动开锁(LockState=2)后,直到 20:44 才记录到自动上锁(LockState=1),中间约 12 小时无上锁记录", "20:01 卫生间漏水传感器短暂触发 2 分钟后自动恢复"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,排查间歇性 null 值的原因,必要时更换传感器", "检查入户门锁(front_door_lock)的自动上锁策略,建议设置开门后 30 秒至 1 分钟内自动上锁,避免长时间未锁闭", "持续监测卫生间漏水传感器,若短暂触发频繁出现,应检查卫生间水管接头和地漏密封情况", "考虑为独居老人增设紧急呼叫按钮或跌倒检测设备,提升居家安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.692078113555908, "api_error": null} {"episode_id": "SQ5_FP_D_1150", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1150.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261779, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "living_room", "injection_time": "2026-06-12T06:22:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器存在故障或被高温干扰,可能影响厨房火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:10、06:28、10:59、11:39、17:08、17:24),共出现6次。每次都与 kitchen_cook_surface 的开启/关闭时间高度吻合,说明灶具运行会导致该传感器读数丢失。\",\n \"推理步骤2: 对比客厅和卧室温度传感器,全天始终正常上报数值,无任何 None 值出现,排除系统级通信故障的可能。厨房温度传感器在灶具未使用时段(如整点半点的定时上报)读数正常,进一步确认问题与灶具使用相关。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾早期预警的关键环节。如果传感器在烹饪(最高风险时段)期间无法提供温度数据,一旦发生灶具失控或油锅起火,系统将无法通过温度异常升高来触发报警,存在安全盲区。\",\n \"推理步骤4: 其余行为模式均属正常——老人05:23起床、05:43洗漱、06:09做早餐、06:56出门(门自动上锁)、08:23回家、12:21午休拉窗帘、13:56起床、17:07做晚餐、20:31洗漱、20:42就寝,作息规律合理。\",\n \"推理步骤5: 06:22的门锁操作错误(LockOperationError, OperationError=1, OperationSource=3)随后紧跟一次成功解锁(UserIndex=1),推断为老人早晨开门时输错一次密码或指纹识别失败后重试成功,属于偶发正常现象,不构成入侵威胁。\",\n \"推理步骤6: 入户门在老人出门(06:56)和就寝(20:42)时均自动上锁(LockState=1),门窗传感器状态正常,无未授权开门记录,安防状态良好。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:28、10:59、11:39、17:08、17:24),而灶具关闭后恢复正常\",\n \"客厅和卧室温度传感器全天无异常,排除系统性通信故障\",\n \"06:22 门锁操作错误后立即由 UserIndex=1 成功解锁,为正常重试行为\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器超量程或进入保护模式,必要时重新选址安装\",\n \"考虑为厨房温度传感器加装隔热防护罩,或更换为耐高温型号,确保烹饪期间仍能正常监测温度\",\n \"在传感器修复前,可设置灶具使用超时自动关闭规则(如超过40分钟未手动关闭则自动断电),作为补偿性安全措施\",\n \"确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用火灾检测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间持续报告 None 值,表明传感器存在故障或被高温干扰,可能影响厨房火灾预警能力。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后多次报告 MeasuredValue = None(06:10、06:28、10:59、11:39、17:08、17:24),共出现6次。每次都与 kitchen_cook_surface 的开启/关闭时间高度吻合,说明灶具运行会导致该传感器读数丢失。", "推理步骤2: 对比客厅和卧室温度传感器,全天始终正常上报数值,无任何 None 值出现,排除系统级通信故障的可能。厨房温度传感器在灶具未使用时段(如整点半点的定时上报)读数正常,进一步确认问题与灶具使用相关。", "推理步骤3: 对于独居老人家庭,厨房温度传感器是火灾早期预警的关键环节。如果传感器在烹饪(最高风险时段)期间无法提供温度数据,一旦发生灶具失控或油锅起火,系统将无法通过温度异常升高来触发报警,存在安全盲区。", "推理步骤4: 其余行为模式均属正常——老人05:23起床、05:43洗漱、06:09做早餐、06:56出门(门自动上锁)、08:23回家、12:21午休拉窗帘、13:56起床、17:07做晚餐、20:31洗漱、20:42就寝,作息规律合理。", "推理步骤5: 06:22的门锁操作错误(LockOperationError, OperationError=1, OperationSource=3)随后紧跟一次成功解锁(UserIndex=1),推断为老人早晨开门时输错一次密码或指纹识别失败后重试成功,属于偶发正常现象,不构成入侵威胁。", "推理步骤6: 入户门在老人出门(06:56)和就寝(20:42)时均自动上锁(LockState=1),门窗传感器状态正常,无未授权开门记录,安防状态良好。"], "key_evidence": ["厨房温度传感器在灶具使用期间6次报告 MeasuredValue = None(06:10、06:28、10:59、11:39、17:08、17:24),而灶具关闭后恢复正常", "客厅和卧室温度传感器全天无异常,排除系统性通信故障", "06:22 门锁操作错误后立即由 UserIndex=1 成功解锁,为正常重试行为"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器超量程或进入保护模式,必要时重新选址安装", "考虑为厨房温度传感器加装隔热防护罩,或更换为耐高温型号,确保烹饪期间仍能正常监测温度", "在传感器修复前,可设置灶具使用超时自动关闭规则(如超过40分钟未手动关闭则自动断电),作为补偿性安全措施", "确认厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为温度传感器失效期间的备用火灾检测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.751344919204712, "api_error": null} {"episode_id": "SQ5_FP_D_1151", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1151.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261780, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "living_room", "injection_time": "2026-06-18T17:53:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启且持续运行,厨房温度异常升高,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 17:33 灶具正常关闭,但 17:53 灶具再次开启时,厨房运动传感器显示 Occupancy=0,说明厨房无人在场。独居老人可能忘记关灶或误触,也可能是设备故障导致意外开启。\",\n \"推理步骤2: 17:58 厨房温度传感器报告 MeasuredValue=2700(27.00°C),而同一时段客厅温度约 24.58°C、卧室约 23.61°C,厨房温度比其他房间高出约 2.5-3.4°C,且此前 17:30 厨房温度为 24.70°C,短短 28 分钟内上升了 2.3°C,升温速率异常。\",\n \"推理步骤3: 18:23 厨房温度进一步升至 2750(27.50°C),持续上升趋势明确。而 18:30 的定时温度采集却报告 24.54°C,与 18:23 的 27.50°C 存在矛盾,可能是传感器在灶具附近与房间整体温度的差异,也可能暗示灶具周围局部温度已经很高。\",\n \"推理步骤4: 18:13 厨房运动传感器恢复 Occupancy=1,说明老人回到了厨房,但灶具从 17:53 到 18:13 无人看管运行了约 20 分钟。对于独居老人场景,无人看管的明火灶具是严重的火灾隐患。\",\n \"推理步骤5: 从日志结尾到 23:30 均未见灶具关闭事件(OnOff=False),无法确认灶具最终是否被关闭。如果灶具在老人 20:50 就寝后仍在运行,风险将进一步升级。\",\n \"推理步骤6: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:07、06:41、11:08、11:23、16:59、17:34),虽然可能是灶具运行时的正常屏蔽机制,但也意味着在灶具工作时缺少温度监控,降低了火灾预警能力。\",\n \"推理步骤7: 入户门在 08:23 开锁进入后,直到日志结束未见再次上锁记录(20:50:18 的门传感器关闭和自动上锁对应的是确认门已关状态),属于次要关注点,但整体安全链中门锁状态也需确认。\"\n ],\n \"key_evidence\": [\n \"17:53 灶具开启时 kitchen_occupancy Occupancy=0,厨房无人\",\n \"17:58 厨房温度 27.00°C,18:23 升至 27.50°C,较同期其他房间高 2.5-3.4°C,且短时间内持续攀升\",\n \"灶具从 17:53 开启后,日志中无对应的 OnOff=False 关闭记录,无法确认灶具已关闭\",\n \"无人看管灶具持续约 20 分钟(17:53-18:13)\",\n \"厨房温度传感器在灶具运行期间多次报告 None,监控存在盲区\"\n ],\n \"recommended_actions\": [\n \"立即远程确认厨房灶具当前状态,如仍在运行应立即远程关闭\",\n \"通过语音或电话联系老人,确认其安全状况及是否知晓灶具状态\",\n \"设置自动化规则:当灶具开启且厨房 Occupancy=0 超过 5 分钟时,自动发送告警并考虑自动关闭灶具\",\n \"设置灶具最大连续运行时间告警(如超过 45 分钟未关闭则告警)\",\n \"排查厨房温度传感器在灶具运行时报告 None 的原因,确保火灾监控无盲区\",\n \"考虑为独居老人场景增加厨房烟雾报警器的灵敏度或增设燃气泄漏传感器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启且持续运行,厨房温度异常升高,存在火灾风险。", "reasoning": ["推理步骤1: 17:33 灶具正常关闭,但 17:53 灶具再次开启时,厨房运动传感器显示 Occupancy=0,说明厨房无人在场。独居老人可能忘记关灶或误触,也可能是设备故障导致意外开启。", "推理步骤2: 17:58 厨房温度传感器报告 MeasuredValue=2700(27.00°C),而同一时段客厅温度约 24.58°C、卧室约 23.61°C,厨房温度比其他房间高出约 2.5-3.4°C,且此前 17:30 厨房温度为 24.70°C,短短 28 分钟内上升了 2.3°C,升温速率异常。", "推理步骤3: 18:23 厨房温度进一步升至 2750(27.50°C),持续上升趋势明确。而 18:30 的定时温度采集却报告 24.54°C,与 18:23 的 27.50°C 存在矛盾,可能是传感器在灶具附近与房间整体温度的差异,也可能暗示灶具周围局部温度已经很高。", "推理步骤4: 18:13 厨房运动传感器恢复 Occupancy=1,说明老人回到了厨房,但灶具从 17:53 到 18:13 无人看管运行了约 20 分钟。对于独居老人场景,无人看管的明火灶具是严重的火灾隐患。", "推理步骤5: 从日志结尾到 23:30 均未见灶具关闭事件(OnOff=False),无法确认灶具最终是否被关闭。如果灶具在老人 20:50 就寝后仍在运行,风险将进一步升级。", "推理步骤6: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:07、06:41、11:08、11:23、16:59、17:34),虽然可能是灶具运行时的正常屏蔽机制,但也意味着在灶具工作时缺少温度监控,降低了火灾预警能力。", "推理步骤7: 入户门在 08:23 开锁进入后,直到日志结束未见再次上锁记录(20:50:18 的门传感器关闭和自动上锁对应的是确认门已关状态),属于次要关注点,但整体安全链中门锁状态也需确认。"], "key_evidence": ["17:53 灶具开启时 kitchen_occupancy Occupancy=0,厨房无人", "17:58 厨房温度 27.00°C,18:23 升至 27.50°C,较同期其他房间高 2.5-3.4°C,且短时间内持续攀升", "灶具从 17:53 开启后,日志中无对应的 OnOff=False 关闭记录,无法确认灶具已关闭", "无人看管灶具持续约 20 分钟(17:53-18:13)", "厨房温度传感器在灶具运行期间多次报告 None,监控存在盲区"], "recommended_actions": ["立即远程确认厨房灶具当前状态,如仍在运行应立即远程关闭", "通过语音或电话联系老人,确认其安全状况及是否知晓灶具状态", "设置自动化规则:当灶具开启且厨房 Occupancy=0 超过 5 分钟时,自动发送告警并考虑自动关闭灶具", "设置灶具最大连续运行时间告警(如超过 45 分钟未关闭则告警)", "排查厨房温度传感器在灶具运行时报告 None 的原因,确保火灾监控无盲区", "考虑为独居老人场景增加厨房烟雾报警器的灵敏度或增设燃气泄漏传感器"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.402096033096313, "api_error": null} {"episode_id": "SQ5_FP_D_1158", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1158.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261787, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-29T20:19:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门锁在 20:19 出现一次开锁失败事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:11、06:30、10:51、11:31、16:54、17:35 共 6 次报告 MeasuredValue = None。这些时间点与灶具开启/关闭时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在间歇性故障。\",\n \"推理步骤2: 虽然 None 值出现在灶具使用期间可能有一定关联性,但温度传感器在独居老人家庭中承担着火灾预警的辅助角色,如果传感器在灶具使用时恰好失效,将无法检测到厨房异常高温,这是一个安全隐患。\",\n \"推理步骤3: 20:19 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式),20秒后同一来源以 UserIndex=1 成功开锁。单次失败后成功开锁,最可能是老人或家属输错密码后重试,但在独居老人场景下仍需确认是否为本人或授权人员操作。\",\n \"推理步骤4: 20:19 开门后有人进入,随后 20:38 客厅灯关闭、老人去卫生间洗漱、20:54 进卧室关灯就寝,门在 20:54 关闭并自动上锁。这一系列行为连贯自然,说明进入者大概率是老人本人或熟悉的家属,入侵风险较低。\",\n \"推理步骤5: 老人全天作息规律——05:31 起床如厕、06:10 做早餐、06:59 出门、08:38 回家、12:34 午休、13:54 起床、16:53 做晚餐、20:38 洗漱、20:54 就寝。运动传感器、灯光、门锁事件相互印证,活动模式正常,无长时间无活动的健康异常信号。\",\n \"推理步骤6: 温度整体走势合理:夜间约 22-23°C,白天升至 25-26°C 峰值后回落,各房间温差在正常范围内。无烟雾报警、无漏水报警触发。灶具每次使用时长合理(早餐约19分钟、午餐约40分钟、晚餐约41分钟),未出现遗忘关火的情况。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用前后共 6 次报告 MeasuredValue = None(06:11、06:30、10:51、11:31、16:54、17:35)\",\n \"20:19 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后以 UserIndex=1 成功开锁\",\n \"老人全天活动轨迹连贯完整,灶具均在合理时长内关闭,无烟雾/漏水报警触发\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认传感器安装位置是否距灶具过近导致受热/干扰,清洁传感器探头,必要时更换设备以确保厨房温度监测可靠性\",\n \"确认 20:19 的门锁开锁操作是否为老人本人或授权家属所为,检查门锁密码是否需要更新\",\n \"建议为厨房温度传感器设置 None 值告警规则,当传感器连续报告无效值时及时通知家属\",\n \"当前无需紧急安全响应,但应尽快排查厨房温度传感器故障,避免在真正发生厨房火灾时丧失预警能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时入户门锁在 20:19 出现一次开锁失败事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:11、06:30、10:51、11:31、16:54、17:35 共 6 次报告 MeasuredValue = None。这些时间点与灶具开启/关闭时间高度吻合,可能是灶具产生的热量或电磁干扰导致传感器读数异常,也可能是传感器本身存在间歇性故障。", "推理步骤2: 虽然 None 值出现在灶具使用期间可能有一定关联性,但温度传感器在独居老人家庭中承担着火灾预警的辅助角色,如果传感器在灶具使用时恰好失效,将无法检测到厨房异常高温,这是一个安全隐患。", "推理步骤3: 20:19 入户门锁记录了一次 LockOperationError(OperationError=1, OperationSource=3,即远程/密码方式),20秒后同一来源以 UserIndex=1 成功开锁。单次失败后成功开锁,最可能是老人或家属输错密码后重试,但在独居老人场景下仍需确认是否为本人或授权人员操作。", "推理步骤4: 20:19 开门后有人进入,随后 20:38 客厅灯关闭、老人去卫生间洗漱、20:54 进卧室关灯就寝,门在 20:54 关闭并自动上锁。这一系列行为连贯自然,说明进入者大概率是老人本人或熟悉的家属,入侵风险较低。", "推理步骤5: 老人全天作息规律——05:31 起床如厕、06:10 做早餐、06:59 出门、08:38 回家、12:34 午休、13:54 起床、16:53 做晚餐、20:38 洗漱、20:54 就寝。运动传感器、灯光、门锁事件相互印证,活动模式正常,无长时间无活动的健康异常信号。", "推理步骤6: 温度整体走势合理:夜间约 22-23°C,白天升至 25-26°C 峰值后回落,各房间温差在正常范围内。无烟雾报警、无漏水报警触发。灶具每次使用时长合理(早餐约19分钟、午餐约40分钟、晚餐约41分钟),未出现遗忘关火的情况。"], "key_evidence": ["厨房温度传感器在灶具使用前后共 6 次报告 MeasuredValue = None(06:11、06:30、10:51、11:31、16:54、17:35)", "20:19 入户门锁出现 LockOperationError(OperationError=1, OperationSource=3),20秒后以 UserIndex=1 成功开锁", "老人全天活动轨迹连贯完整,灶具均在合理时长内关闭,无烟雾/漏水报警触发"], "recommended_actions": ["检查厨房温度传感器:确认传感器安装位置是否距灶具过近导致受热/干扰,清洁传感器探头,必要时更换设备以确保厨房温度监测可靠性", "确认 20:19 的门锁开锁操作是否为老人本人或授权家属所为,检查门锁密码是否需要更新", "建议为厨房温度传感器设置 None 值告警规则,当传感器连续报告无效值时及时通知家属", "当前无需紧急安全响应,但应尽快排查厨房温度传感器故障,避免在真正发生厨房火灾时丧失预警能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.11986255645752, "api_error": null} {"episode_id": "SQ5_FP_D_1160", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1160.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-22T00:00:00", "seed": 20261789, "scenario_id": "INS-02", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-02-FP", "scenario_name": "INS-02-FP: 住户忘记密码/手指脏", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "只有1-2次错误(非连续多次),最终成功解锁且 UserIndex 是合法用户", "target_room": "bedroom", "injection_time": "2026-06-22T06:24:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人 05:40 起床、06:02 做早餐、07:08 出门、08:26 回家、12:28 午休、13:53 起床、16:52 做晚餐、20:40 洗漱、20:47 就寝,符合独居老人的典型日常模式。\",\n \"推理步骤2: 入户门安全状况正常——06:24 有一次 LockOperationError(OperationError=1, OperationSource=3 表示密码/PIN 输入错误),但紧接着 06:24:20 同一 UserIndex=1 成功解锁,说明是老人自己输错一次密码后重试成功,不构成入侵威胁。07:08 出门后门锁自动上锁,20:47 就寝前门锁确认已锁,全天门锁状态安全。\",\n \"推理步骤3: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None:06:03(灶具 06:02:36 开启后)、06:40(灶具 06:39 关闭后)、11:00(灶具 10:59:30 开启后)、11:36(灶具 11:35 关闭后)、16:53(灶具 16:52:30 开启后)、17:31(灶具 17:30 关闭后)。每次灶具操作前后都会触发一次 None 读数,共出现 6 次。\",\n \"推理步骤4: 该 None 值模式高度规律——每次灶具开启约 30 秒后出现一次 None,灶具关闭约 1 分钟后再出现一次 None。这可能是传感器在温度急剧变化时超出量程或通信中断,属于设备故障或兼容性问题。\",\n \"推理步骤5: 厨房温度传感器是独居老人厨房安全的关键防线之一(配合烟雾报警器)。如果传感器在灶具使用时持续失效,一旦发生干烧或过热,系统将无法通过温度异常及时预警。虽然烟雾报警器仍在工作,但多层防护缺失会增加风险。\",\n \"推理步骤6: 其他方面均正常——全天无烟雾报警、无漏水报警、温度曲线符合夏季昼夜变化(夜间约 22°C,午间峰值约 25.8°C)、所有运动传感器与灯光/门锁联动逻辑一致、无异常窗户开启事件。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在一天内 6 次报告 MeasuredValue = None,均与灶具开关操作高度关联(06:03, 06:40, 11:00, 11:36, 16:53, 17:31)\",\n \"06:24 入户门锁出现一次 LockOperationError,但随即由 UserIndex=1 成功解锁,属于正常误操作\",\n \"08:26 老人回家后入户门未及时关锁——直到 20:47:19 才确认 front_door_contact = True(门关闭)并自动上锁,期间约 12 小时门锁状态未明确记录为已锁\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和固件版本,排查其在灶具使用时反复报告 None 的原因,必要时更换传感器\",\n \"在传感器修复前,建议老人使用灶具时格外注意,可考虑为灶具设置自动关闭定时器(如超过 45 分钟未手动操作则自动断电)\",\n \"确认入户门锁的自动上锁策略是否正常生效——日志显示 08:26 回家后门锁状态直到 20:47 才再次记录,建议检查门锁是否在关门后确实自动上锁\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,存在传感器故障风险,可能导致厨房火灾/高温无法被及时检测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人 05:40 起床、06:02 做早餐、07:08 出门、08:26 回家、12:28 午休、13:53 起床、16:52 做晚餐、20:40 洗漱、20:47 就寝,符合独居老人的典型日常模式。", "推理步骤2: 入户门安全状况正常——06:24 有一次 LockOperationError(OperationError=1, OperationSource=3 表示密码/PIN 输入错误),但紧接着 06:24:20 同一 UserIndex=1 成功解锁,说明是老人自己输错一次密码后重试成功,不构成入侵威胁。07:08 出门后门锁自动上锁,20:47 就寝前门锁确认已锁,全天门锁状态安全。", "推理步骤3: 厨房温度传感器在灶具开启后反复出现 MeasuredValue = None:06:03(灶具 06:02:36 开启后)、06:40(灶具 06:39 关闭后)、11:00(灶具 10:59:30 开启后)、11:36(灶具 11:35 关闭后)、16:53(灶具 16:52:30 开启后)、17:31(灶具 17:30 关闭后)。每次灶具操作前后都会触发一次 None 读数,共出现 6 次。", "推理步骤4: 该 None 值模式高度规律——每次灶具开启约 30 秒后出现一次 None,灶具关闭约 1 分钟后再出现一次 None。这可能是传感器在温度急剧变化时超出量程或通信中断,属于设备故障或兼容性问题。", "推理步骤5: 厨房温度传感器是独居老人厨房安全的关键防线之一(配合烟雾报警器)。如果传感器在灶具使用时持续失效,一旦发生干烧或过热,系统将无法通过温度异常及时预警。虽然烟雾报警器仍在工作,但多层防护缺失会增加风险。", "推理步骤6: 其他方面均正常——全天无烟雾报警、无漏水报警、温度曲线符合夏季昼夜变化(夜间约 22°C,午间峰值约 25.8°C)、所有运动传感器与灯光/门锁联动逻辑一致、无异常窗户开启事件。"], "key_evidence": ["厨房温度传感器在一天内 6 次报告 MeasuredValue = None,均与灶具开关操作高度关联(06:03, 06:40, 11:00, 11:36, 16:53, 17:31)", "06:24 入户门锁出现一次 LockOperationError,但随即由 UserIndex=1 成功解锁,属于正常误操作", "08:26 老人回家后入户门未及时关锁——直到 20:47:19 才确认 front_door_contact = True(门关闭)并自动上锁,期间约 12 小时门锁状态未明确记录为已锁"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和固件版本,排查其在灶具使用时反复报告 None 的原因,必要时更换传感器", "在传感器修复前,建议老人使用灶具时格外注意,可考虑为灶具设置自动关闭定时器(如超过 45 分钟未手动操作则自动断电)", "确认入户门锁的自动上锁策略是否正常生效——日志显示 08:26 回家后门锁状态直到 20:47 才再次记录,建议检查门锁是否在关门后确实自动上锁"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.817963123321533, "api_error": null} {"episode_id": "SQ5_FP_D_1162", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1162.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-29T00:00:00", "seed": 20261791, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "bathroom", "injection_time": "2026-06-29T21:17:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下被开启,且厨房温度异常飙升,独居老人已就寝,存在严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人在 20:33 离开客厅,20:48 进入卧室并关灯就寝,卧室窗帘完全关闭,符合睡前行为模式。\",\n \"推理步骤2: 21:17 厨房灶具被开启(OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0)。灶具在无人在场的情况下启动,这是严重异常。\",\n \"推理步骤3: 21:22 厨房温度传感器读数飙升至 2700(27.00°C),21:47 进一步升至 2750(27.50°C),而同时段客厅和卧室温度均在正常下降趋势中(约 23-24°C),说明厨房存在局部热源持续加热。\",\n \"推理步骤4: 对比当天三次正常烹饪(06:07、11:10、16:58),每次灶具开启时厨房运动传感器均显示 Occupancy=1(有人在场),且烹饪时长为 16-38 分钟后主动关闭。而 21:17 这次灶具开启后直到日志结束(23:30)都未关闭,已持续超过 2 小时。\",\n \"推理步骤5: 21:37 厨房运动传感器短暂检测到有人(Occupancy=1),但之后无任何关闭灶具的操作,也无厨房灯开启记录,说明可能是老人短暂经过但未意识到灶具已开启,或为传感器误触发。\",\n \"推理步骤6: 厨房温度传感器在当天三次正常烹饪期间均报告 None(可能因灶具附近高温超出量程),但 21:17 这次却报告了具体数值 2700/2750,且该数值远高于当天同时段正常温度(约 23.4°C),表明热量已扩散到传感器位置,情况比正常烹饪更危险。\",\n \"推理步骤7: 独居老人已就寝,无人监控灶具状态,灶具长时间空烧极易引发干烧、油烟甚至明火,火灾风险极高。\"\n ],\n \"key_evidence\": [\n \"21:17 厨房灶具开启时 kitchen_occupancy = 0(无人在场),与当天三次正常烹饪时 occupancy = 1 形成鲜明对比\",\n \"灶具从 21:17 开启后直到日志结束(23:30)未关闭,持续超过 2 小时,远超当天正常烹饪时长(16-38 分钟)\",\n \"21:22 厨房温度 27.00°C、21:47 升至 27.50°C,而同时段客厅/卧室温度仅约 23.3-23.8°C,厨房存在异常热源\",\n \"老人 20:48 已进入卧室关灯就寝,当前处于无人看管状态\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface)\",\n \"触发室内警报或通过智能音箱语音提醒老人厨房灶具仍在运行\",\n \"通知紧急联系人(家属/社区看护人员)当前情况\",\n \"持续监控厨房烟雾报警器(kitchen_smoke_alarm)状态,若触发烟雾告警则立即拨打 119\",\n \"排查灶具异常启动原因:检查是否存在设备故障、误操作或自动化规则错误配置\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下被开启,且厨房温度异常飙升,独居老人已就寝,存在严重火灾隐患。", "reasoning": ["推理步骤1: 老人在 20:33 离开客厅,20:48 进入卧室并关灯就寝,卧室窗帘完全关闭,符合睡前行为模式。", "推理步骤2: 21:17 厨房灶具被开启(OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0)。灶具在无人在场的情况下启动,这是严重异常。", "推理步骤3: 21:22 厨房温度传感器读数飙升至 2700(27.00°C),21:47 进一步升至 2750(27.50°C),而同时段客厅和卧室温度均在正常下降趋势中(约 23-24°C),说明厨房存在局部热源持续加热。", "推理步骤4: 对比当天三次正常烹饪(06:07、11:10、16:58),每次灶具开启时厨房运动传感器均显示 Occupancy=1(有人在场),且烹饪时长为 16-38 分钟后主动关闭。而 21:17 这次灶具开启后直到日志结束(23:30)都未关闭,已持续超过 2 小时。", "推理步骤5: 21:37 厨房运动传感器短暂检测到有人(Occupancy=1),但之后无任何关闭灶具的操作,也无厨房灯开启记录,说明可能是老人短暂经过但未意识到灶具已开启,或为传感器误触发。", "推理步骤6: 厨房温度传感器在当天三次正常烹饪期间均报告 None(可能因灶具附近高温超出量程),但 21:17 这次却报告了具体数值 2700/2750,且该数值远高于当天同时段正常温度(约 23.4°C),表明热量已扩散到传感器位置,情况比正常烹饪更危险。", "推理步骤7: 独居老人已就寝,无人监控灶具状态,灶具长时间空烧极易引发干烧、油烟甚至明火,火灾风险极高。"], "key_evidence": ["21:17 厨房灶具开启时 kitchen_occupancy = 0(无人在场),与当天三次正常烹饪时 occupancy = 1 形成鲜明对比", "灶具从 21:17 开启后直到日志结束(23:30)未关闭,持续超过 2 小时,远超当天正常烹饪时长(16-38 分钟)", "21:22 厨房温度 27.00°C、21:47 升至 27.50°C,而同时段客厅/卧室温度仅约 23.3-23.8°C,厨房存在异常热源", "老人 20:48 已进入卧室关灯就寝,当前处于无人看管状态"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface)", "触发室内警报或通过智能音箱语音提醒老人厨房灶具仍在运行", "通知紧急联系人(家属/社区看护人员)当前情况", "持续监控厨房烟雾报警器(kitchen_smoke_alarm)状态,若触发烟雾告警则立即拨打 119", "排查灶具异常启动原因:检查是否存在设备故障、误操作或自动化规则错误配置"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.78844976425171, "api_error": null} {"episode_id": "SQ5_FP_D_1164", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1164.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261793, "scenario_id": "INS-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-01-FP", "scenario_name": "INS-01-FP: 住户夜间开窗通风", "category": "intrusion", "is_anomaly": false, "threat_type": "none", "key_difference": "开窗前住户先在同一房间活动并开灯,是主动行为", "target_room": "living_room", "injection_time": "2026-06-11T06:59:00", "variant": "FP"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人 05:37 起床、05:40 如厕、05:56 进厨房做早餐、07:07 手动开锁出门、08:21 回家、11:04 做午餐、12:23 午休拉窗帘、14:01 起床、17:08 做晚餐、20:27 洗漱、20:49 回卧室关窗帘就寝,符合独居老人的典型日常节奏。\",\n \"推理步骤2: 入侵排查——全天仅两次开门事件(07:07 出门、08:21 回家),均为 Manual 手动操作,门锁在关门后自动上锁(Auto, LockState=1),08:21 回家后入户门未再开启直到次日,20:49 还出现了一次门锁确认上锁事件,无异常入侵迹象。\",\n \"推理步骤3: 火灾风险排查——三次使用灶具(05:56-06:27 约31分钟、11:04-11:25 约21分钟、17:08-17:31 约23分钟),时长均在合理范围内,且每次都正常关闭,烟雾报警器全天未触发,无火灾风险。\",\n \"推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无任何报告,无漏水事件。\",\n \"推理步骤5: 温度趋势正常——各房间温度随昼夜自然波动(夜间约22-23°C,午间峰值约25.5-25.8°C),卧室因窗帘遮挡始终略低,无异常高温或低温。\",\n \"推理步骤6: 设备异常发现——厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:57、06:28、11:05、11:26、17:09、17:32),共6次。灶具开启后约30秒到1分钟传感器就丢失读数,关闭后约1分钟再次报告 None,直到下一个30分钟整点周期才恢复正常数值。这意味着在烹饪这一最需要温度监控的时段,传感器恰恰无法工作。\",\n \"推理步骤7: 健康状况排查——老人全天活动轨迹连贯,各房间运动传感器按合理顺序触发,卫生间使用时长正常(早晨约16分钟、晚间约22分钟),未出现长时间无活动或跌倒迹象。\",\n \"推理步骤8: 06:59 卧室出现一组快速事件(进入→开灯→窗户传感器触发→关灯→离开,共21秒),推测老人短暂回卧室开窗通风,行为合理但窗户传感器显示 StateValue=False(窗户打开),之后全天未见关闭事件,直到 20:49 才报告 StateValue=True(关闭)。窗户长时间开启本身不构成威胁,但结合老人外出期间(07:07-08:21)窗户处于打开状态,存在轻微安全隐患。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:57、06:28、11:05、11:26、17:09、17:32),100%复现,表明传感器在高温环境下系统性失效\",\n \"卧室窗户 06:59 打开(StateValue=False)后,老人 07:07 外出,窗户在无人期间保持开启状态约1小时14分钟\",\n \"正面证据:烟雾报警器全天零触发、漏水传感器全天零触发、门锁操作均为手动且自动回锁正常\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器——当前传感器在灶具使用时无法提供读数,恰好在最需要温度监控的烹饪场景下失效,存在火灾预警盲区\",\n \"建议设置自动化规则:当老人离家(门锁上锁+外出)时,检查所有窗户传感器状态并发送提醒,避免外出期间窗户敞开\",\n \"考虑为厨房温度传感器增加冗余部署或将其安装位置远离灶具热源,确保烹饪期间仍能有效监测厨房温度\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人 05:37 起床、05:40 如厕、05:56 进厨房做早餐、07:07 手动开锁出门、08:21 回家、11:04 做午餐、12:23 午休拉窗帘、14:01 起床、17:08 做晚餐、20:27 洗漱、20:49 回卧室关窗帘就寝,符合独居老人的典型日常节奏。", "推理步骤2: 入侵排查——全天仅两次开门事件(07:07 出门、08:21 回家),均为 Manual 手动操作,门锁在关门后自动上锁(Auto, LockState=1),08:21 回家后入户门未再开启直到次日,20:49 还出现了一次门锁确认上锁事件,无异常入侵迹象。", "推理步骤3: 火灾风险排查——三次使用灶具(05:56-06:27 约31分钟、11:04-11:25 约21分钟、17:08-17:31 约23分钟),时长均在合理范围内,且每次都正常关闭,烟雾报警器全天未触发,无火灾风险。", "推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无任何报告,无漏水事件。", "推理步骤5: 温度趋势正常——各房间温度随昼夜自然波动(夜间约22-23°C,午间峰值约25.5-25.8°C),卧室因窗帘遮挡始终略低,无异常高温或低温。", "推理步骤6: 设备异常发现——厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:57、06:28、11:05、11:26、17:09、17:32),共6次。灶具开启后约30秒到1分钟传感器就丢失读数,关闭后约1分钟再次报告 None,直到下一个30分钟整点周期才恢复正常数值。这意味着在烹饪这一最需要温度监控的时段,传感器恰恰无法工作。", "推理步骤7: 健康状况排查——老人全天活动轨迹连贯,各房间运动传感器按合理顺序触发,卫生间使用时长正常(早晨约16分钟、晚间约22分钟),未出现长时间无活动或跌倒迹象。", "推理步骤8: 06:59 卧室出现一组快速事件(进入→开灯→窗户传感器触发→关灯→离开,共21秒),推测老人短暂回卧室开窗通风,行为合理但窗户传感器显示 StateValue=False(窗户打开),之后全天未见关闭事件,直到 20:49 才报告 StateValue=True(关闭)。窗户长时间开启本身不构成威胁,但结合老人外出期间(07:07-08:21)窗户处于打开状态,存在轻微安全隐患。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:57、06:28、11:05、11:26、17:09、17:32),100%复现,表明传感器在高温环境下系统性失效", "卧室窗户 06:59 打开(StateValue=False)后,老人 07:07 外出,窗户在无人期间保持开启状态约1小时14分钟", "正面证据:烟雾报警器全天零触发、漏水传感器全天零触发、门锁操作均为手动且自动回锁正常"], "recommended_actions": ["检修或更换厨房温度传感器——当前传感器在灶具使用时无法提供读数,恰好在最需要温度监控的烹饪场景下失效,存在火灾预警盲区", "建议设置自动化规则:当老人离家(门锁上锁+外出)时,检查所有窗户传感器状态并发送提醒,避免外出期间窗户敞开", "考虑为厨房温度传感器增加冗余部署或将其安装位置远离灶具热源,确保烹饪期间仍能有效监测厨房温度"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 33.836541175842285, "api_error": null} {"episode_id": "SQ5_FP_D_1168", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_FP_D_1168.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "FP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261797, "scenario_id": "FG-01", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "FG-01-FP", "scenario_name": "FG-01-FP: 煲汤/慢炖(正常长时间开灶)", "category": "fire_gas", "is_anomaly": false, "threat_type": "none", "key_difference": "温度上升后稳定(不持续飙升),住户定期回来检查,烟雾传感器未触发", "target_room": "kitchen", "injection_time": "2026-06-27T12:39:00", "variant": "FP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人状态下持续运行超过30分钟,且厨房温度出现异常飙升,存在火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 12:39:00 厨房灶具被开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0),老人已离开厨房前往卧室休息。\",\n \"推理步骤2: 灶具在无人看管状态下持续运行约20分钟,期间厨房温度从正常的25.70°C(12:30)异常飙升至27.00°C(12:44)和27.50°C(13:09),升幅远超同时段其他房间的自然温度变化。\",\n \"推理步骤3: 直到12:59厨房才重新检测到有人(Occupancy = 1),但日志中未记录灶具关闭事件。13:00的定时温度读数回落至25.63°C,说明可能在12:59~13:00之间灶具被关闭,但关闭事件缺失,整个无人烹饪窗口约20分钟。\",\n \"推理步骤4: 对于独居老人场景,无人看管的灶具是极高风险事件——可能是忘记关火就离开了厨房去午休(12:39卧室窗帘关闭、卧室有人),这是典型的认知疏忽模式。\",\n \"推理步骤5: 另外注意到厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:59、06:34、11:02、11:31、17:10、17:23),共出现6次,提示该传感器可能存在间歇性故障或受灶具热源干扰,削弱了厨房温度监控的可靠性。\",\n \"推理步骤6: 入户门在08:29被手动开锁后,日志中没有对应的关锁记录,直到20:44才出现自动上锁事件,意味着门锁可能在白天长时间处于未锁定状态(约12小时),对独居老人存在入侵风险隐患。\"\n ],\n \"key_evidence\": [\n \"12:39:00 灶具开启,同时厨房 Occupancy = 0,老人不在厨房\",\n \"12:44 厨房温度飙升至27.00°C,13:09进一步升至27.50°C,显著高于同时段客厅(25.68°C)和卧室(24.60°C)\",\n \"12:39:07 卧室检测到有人且窗帘关闭至100%,表明老人去午休,灶具处于完全无人看管状态\",\n \"厨房温度传感器全天出现6次 None 值,传感器可靠性存疑\",\n \"08:29 入户门手动开锁后无关锁记录,直到20:44才自动上锁\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房灶具当前状态,若仍在运行则远程关闭或通知老人/紧急联系人\",\n \"为灶具设置自动安全规则:当厨房 Occupancy 持续为0超过5分钟时,自动关闭灶具并发送告警\",\n \"检修厨房温度传感器,排查频繁报告 None 值的原因,确保火灾预警链路可靠\",\n \"为入户门锁配置离家自动上锁策略,或在门锁未锁定超过一定时间后发送提醒\",\n \"考虑为独居老人增加灶具使用时长上限(如连续运行超过30分钟自动断气/断电)\",\n \"建议联系老人确认身体状况,关注是否存在记忆力下降等健康问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人状态下持续运行超过30分钟,且厨房温度出现异常飙升,存在火灾风险。", "reasoning": ["推理步骤1: 12:39:00 厨房灶具被开启(kitchen_cook_surface OnOff = True),但同一时刻厨房运动传感器显示无人(Occupancy = 0),老人已离开厨房前往卧室休息。", "推理步骤2: 灶具在无人看管状态下持续运行约20分钟,期间厨房温度从正常的25.70°C(12:30)异常飙升至27.00°C(12:44)和27.50°C(13:09),升幅远超同时段其他房间的自然温度变化。", "推理步骤3: 直到12:59厨房才重新检测到有人(Occupancy = 1),但日志中未记录灶具关闭事件。13:00的定时温度读数回落至25.63°C,说明可能在12:59~13:00之间灶具被关闭,但关闭事件缺失,整个无人烹饪窗口约20分钟。", "推理步骤4: 对于独居老人场景,无人看管的灶具是极高风险事件——可能是忘记关火就离开了厨房去午休(12:39卧室窗帘关闭、卧室有人),这是典型的认知疏忽模式。", "推理步骤5: 另外注意到厨房温度传感器在灶具开启/关闭前后多次报告 MeasuredValue = None(05:59、06:34、11:02、11:31、17:10、17:23),共出现6次,提示该传感器可能存在间歇性故障或受灶具热源干扰,削弱了厨房温度监控的可靠性。", "推理步骤6: 入户门在08:29被手动开锁后,日志中没有对应的关锁记录,直到20:44才出现自动上锁事件,意味着门锁可能在白天长时间处于未锁定状态(约12小时),对独居老人存在入侵风险隐患。"], "key_evidence": ["12:39:00 灶具开启,同时厨房 Occupancy = 0,老人不在厨房", "12:44 厨房温度飙升至27.00°C,13:09进一步升至27.50°C,显著高于同时段客厅(25.68°C)和卧室(24.60°C)", "12:39:07 卧室检测到有人且窗帘关闭至100%,表明老人去午休,灶具处于完全无人看管状态", "厨房温度传感器全天出现6次 None 值,传感器可靠性存疑", "08:29 入户门手动开锁后无关锁记录,直到20:44才自动上锁"], "recommended_actions": ["立即确认厨房灶具当前状态,若仍在运行则远程关闭或通知老人/紧急联系人", "为灶具设置自动安全规则:当厨房 Occupancy 持续为0超过5分钟时,自动关闭灶具并发送告警", "检修厨房温度传感器,排查频繁报告 None 值的原因,确保火灾预警链路可靠", "为入户门锁配置离家自动上锁策略,或在门锁未锁定超过一定时间后发送提醒", "考虑为独居老人增加灶具使用时长上限(如连续运行超过30分钟自动断气/断电)", "建议联系老人确认身体状况,关注是否存在记忆力下降等健康问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.567986965179443, "api_error": null} {"episode_id": "SQ5_TN_B_1174", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1174.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261803, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天温度变化符合自然昼夜规律,所有房间表现一致,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器每30分钟一次的读数,无门锁、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件。\",\n \"推理步骤2: Matter 协议 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.88°C(中午高点),属于夏季(6月14日)典型的室内温度波动区间。\",\n \"推理步骤3: 温度变化曲线呈现清晰的昼夜节律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出开始上升,12:00-12:30 达到峰值约 25.7-25.9°C,午后逐步回落,至 23:30 回到约 23.3°C。这完全符合自然气温的日变化规律。\",\n \"推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度走势高度一致,同一时刻各传感器读数差异通常在 0.2°C 以内,无单一房间出现异常升温或骤降的情况,排除局部火灾风险或设备故障。\",\n \"推理步骤5: 未观察到任何突变(如短时间内温度跳升超过 5°C 等火灾特征),也未出现传感器离线或读数卡死等设备故障迹象。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.90°C - 25.88°C,属于正常室内温度\",\n \"四个传感器温度走势高度同步,呈标准昼夜抛物线曲线\",\n \"无任何安防类设备(门锁、烟雾、漏水、运动传感器)触发事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天温度变化符合自然昼夜规律,所有房间表现一致,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器每30分钟一次的读数,无门锁、运动传感器、烟雾报警器、漏水传感器等安防设备的异常事件。", "推理步骤2: Matter 协议 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.88°C(中午高点),属于夏季(6月14日)典型的室内温度波动区间。", "推理步骤3: 温度变化曲线呈现清晰的昼夜节律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出开始上升,12:00-12:30 达到峰值约 25.7-25.9°C,午后逐步回落,至 23:30 回到约 23.3°C。这完全符合自然气温的日变化规律。", "推理步骤4: 四个房间(客厅、主卧、次卧、厨房)的温度走势高度一致,同一时刻各传感器读数差异通常在 0.2°C 以内,无单一房间出现异常升温或骤降的情况,排除局部火灾风险或设备故障。", "推理步骤5: 未观察到任何突变(如短时间内温度跳升超过 5°C 等火灾特征),也未出现传感器离线或读数卡死等设备故障迹象。"], "key_evidence": ["全天温度范围 22.90°C - 25.88°C,属于正常室内温度", "四个传感器温度走势高度同步,呈标准昼夜抛物线曲线", "无任何安防类设备(门锁、烟雾、漏水、运动传感器)触发事件"], "recommended_actions": ["无需采取安全响应措施,家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.00637173652649, "api_error": null} {"episode_id": "SQ5_TN_A_1194", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_A_1194.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261823, "scenario_id": null, "total_events": 190, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常高温读数和两次 NULL 故障,存在传感器失效风险,可能掩盖真实的火灾或燃气隐患。\",\n \"reasoning\": [\n \"推理步骤1: 18:00 厨房温度传感器突然从 ~24.9°C 跳升至 28.61°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.56°C / 23.69°C),排除全屋升温的可能,说明该读数是厨房局部异常。\",\n \"推理步骤2: 18:30 厨房温度仍高达 28.58°C,但此时灶具尚未开启(灶具 18:50 才打开),住户也刚到家不久,没有合理的热源解释这一持续高温。这可能是传感器本身故障产生的虚假高读数,也不能排除厨房存在未被记录的异常热源。\",\n \"推理步骤3: 18:51 和 19:44 厨房温度传感器两次报告 MeasuredValue = None(空值)。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。传感器在需要监测的关键时段反复失效,说明设备存在硬件或通信故障。\",\n \"推理步骤4: 19:00 传感器恢复后读数回到 24.31°C,与客厅温度基本一致,进一步印证 18:00-18:30 的 28°C+ 读数并非真实环境温度,而是传感器异常输出。\",\n \"推理步骤5: 其余设备行为均属正常——住户 06:17 起床、07:21 出门上锁、18:02 回家开灯开空调、做饭后开洗碗机、22:07 转入卧室就寝、22:48 关灯睡觉,门锁自动上锁,入侵/漏水/烟雾报警器均无触发,生活节奏合理。\",\n \"推理步骤6: 厨房烟雾报警器全天无触发记录,说明没有发生实际火灾,但传感器故障意味着如果未来厨房真的出现异常高温,温度监测这道防线将失效。\"\n ],\n \"key_evidence\": [\n \"18:00 厨房温度突增至 28.61°C(较 17:30 的 24.90°C 骤升 3.7°C),同期客厅/卧室温度正常下降\",\n \"18:30 厨房温度仍为 28.58°C,但灶具直到 18:50 才开启,无合理热源\",\n \"18:51 厨房温度传感器报告 MeasuredValue = None(灶具运行期间失效)\",\n \"19:44 厨房温度传感器再次报告 MeasuredValue = None(灶具关闭后再次失效)\",\n \"19:00 传感器恢复后读数回落至 24.31°C,证实此前高温为异常值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态(电池电量、安装位置、是否受油烟/水汽侵蚀),必要时更换设备\",\n \"在传感器修复前,提高对厨房烟雾报警器的依赖权重,确保烟雾报警器处于正常工作状态\",\n \"检查传感器与 Matter 网关之间的通信链路,排查两次 None 值是通信中断还是传感器自身故障\",\n \"考虑为厨房增加冗余温度监测手段,避免单点故障导致安全盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常高温读数和两次 NULL 故障,存在传感器失效风险,可能掩盖真实的火灾或燃气隐患。", "reasoning": ["推理步骤1: 18:00 厨房温度传感器突然从 ~24.9°C 跳升至 28.61°C,而同一时刻客厅和卧室温度仍在正常下降趋势中(24.56°C / 23.69°C),排除全屋升温的可能,说明该读数是厨房局部异常。", "推理步骤2: 18:30 厨房温度仍高达 28.58°C,但此时灶具尚未开启(灶具 18:50 才打开),住户也刚到家不久,没有合理的热源解释这一持续高温。这可能是传感器本身故障产生的虚假高读数,也不能排除厨房存在未被记录的异常热源。", "推理步骤3: 18:51 和 19:44 厨房温度传感器两次报告 MeasuredValue = None(空值)。第一次发生在灶具刚开启后,第二次发生在灶具关闭、厨房窗户打开后。传感器在需要监测的关键时段反复失效,说明设备存在硬件或通信故障。", "推理步骤4: 19:00 传感器恢复后读数回到 24.31°C,与客厅温度基本一致,进一步印证 18:00-18:30 的 28°C+ 读数并非真实环境温度,而是传感器异常输出。", "推理步骤5: 其余设备行为均属正常——住户 06:17 起床、07:21 出门上锁、18:02 回家开灯开空调、做饭后开洗碗机、22:07 转入卧室就寝、22:48 关灯睡觉,门锁自动上锁,入侵/漏水/烟雾报警器均无触发,生活节奏合理。", "推理步骤6: 厨房烟雾报警器全天无触发记录,说明没有发生实际火灾,但传感器故障意味着如果未来厨房真的出现异常高温,温度监测这道防线将失效。"], "key_evidence": ["18:00 厨房温度突增至 28.61°C(较 17:30 的 24.90°C 骤升 3.7°C),同期客厅/卧室温度正常下降", "18:30 厨房温度仍为 28.58°C,但灶具直到 18:50 才开启,无合理热源", "18:51 厨房温度传感器报告 MeasuredValue = None(灶具运行期间失效)", "19:44 厨房温度传感器再次报告 MeasuredValue = None(灶具关闭后再次失效)", "19:00 传感器恢复后读数回落至 24.31°C,证实此前高温为异常值"], "recommended_actions": ["检查厨房温度传感器硬件状态(电池电量、安装位置、是否受油烟/水汽侵蚀),必要时更换设备", "在传感器修复前,提高对厨房烟雾报警器的依赖权重,确保烟雾报警器处于正常工作状态", "检查传感器与 Matter 网关之间的通信链路,排查两次 None 值是通信中断还是传感器自身故障", "考虑为厨房增加冗余温度监测手段,避免单点故障导致安全盲区"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.74385666847229, "api_error": null} {"episode_id": "SQ5_TN_B_1175", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1175.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261804, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:13 入户门解锁进入后未观察到关门/锁门记录,入户门可能处于未关闭状态约1.5小时。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约 06:12 起床,06:37 做早餐,07:41 出门并自动锁门,17:46 回家,18:29 做晚餐,22:32 就寝锁门,符合单人上班族的典型作息。\",\n \"推理步骤2: 温度趋势正常——凌晨约 22.9°C,随日照升温至中午峰值约 25.9°C,傍晚逐步回落,17:46 开启空调(制冷模式 SystemMode=3)后客厅温度持续下降,22:32 关闭空调,整体曲线合理。\",\n \"推理步骤3: 厨房温度传感器在 06:38、07:22、18:30、19:17 四次报告 MeasuredValue = None。虽然其中两次与灶具开关操作时间接近(可能受高温干扰),但 None 值意味着传感器未能返回有效读数,这对于厨房这种有烟雾/火灾风险的关键区域是不可接受的——如果传感器在真正的火灾场景中失效,将无法提供预警。\",\n \"推理步骤4: 16:13 入户门被手动解锁(LockOperationType=1)并打开(StateValue=False),玄关检测到有人,但日志中没有对应的关门(StateValue=True)和锁门记录,直到 17:46 住户再次从外面开门进入。这意味着 16:13 到 17:46 之间约 1.5 小时入户门可能处于未关闭或未锁定状态。结合住户 07:41 出门的记录,16:13 的开门者身份不明(可能是住户短暂回家、快递、或家人),但门未关闭是安全隐患。\",\n \"推理步骤5: 厨房窗户在 07:21 和 19:16 做完饭后打开通风(StateValue=False),但日志中均无关闭记录。07:21 打开后住户 07:41 出门,窗户在无人期间保持开启状态,存在一定安全风险。\",\n \"推理步骤6: 其余设备运行正常——门锁自动上锁功能正常工作,烟雾报警器和漏水传感器未触发,洗碗机正常启动,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:38、07:22、18:30、19:17 四次报告 MeasuredValue = None,传感器可能存在间歇性故障或受灶具高温干扰导致读数失效\",\n \"16:13 入户门手动解锁并打开,但无对应的关门和锁门记录,门可能在无人看管下保持开启约 1.5 小时\",\n \"厨房窗户在 07:21 打开后无关闭记录,住户 07:41 出门后窗户在无人状态下持续开启\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:确认传感器是否因灶具高温导致暂时性读数丢失,或存在硬件故障,必要时更换传感器以确保厨房火灾预警能力\",\n \"设置离家自动安全检查:建议配置自动化规则,在入户门锁定(离家模式)时检查所有窗户是否关闭,如有未关窗户则发送提醒\",\n \"排查 16:13 的开门事件:确认该时段是否为住户本人或授权人员进入,如非预期访问则需加强门锁安全策略(如启用远程通知)\",\n \"建议为入户门配置未关闭超时告警:如门在解锁/打开后超过一定时间未关闭,自动推送通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时 16:13 入户门解锁进入后未观察到关门/锁门记录,入户门可能处于未关闭状态约1.5小时。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约 06:12 起床,06:37 做早餐,07:41 出门并自动锁门,17:46 回家,18:29 做晚餐,22:32 就寝锁门,符合单人上班族的典型作息。", "推理步骤2: 温度趋势正常——凌晨约 22.9°C,随日照升温至中午峰值约 25.9°C,傍晚逐步回落,17:46 开启空调(制冷模式 SystemMode=3)后客厅温度持续下降,22:32 关闭空调,整体曲线合理。", "推理步骤3: 厨房温度传感器在 06:38、07:22、18:30、19:17 四次报告 MeasuredValue = None。虽然其中两次与灶具开关操作时间接近(可能受高温干扰),但 None 值意味着传感器未能返回有效读数,这对于厨房这种有烟雾/火灾风险的关键区域是不可接受的——如果传感器在真正的火灾场景中失效,将无法提供预警。", "推理步骤4: 16:13 入户门被手动解锁(LockOperationType=1)并打开(StateValue=False),玄关检测到有人,但日志中没有对应的关门(StateValue=True)和锁门记录,直到 17:46 住户再次从外面开门进入。这意味着 16:13 到 17:46 之间约 1.5 小时入户门可能处于未关闭或未锁定状态。结合住户 07:41 出门的记录,16:13 的开门者身份不明(可能是住户短暂回家、快递、或家人),但门未关闭是安全隐患。", "推理步骤5: 厨房窗户在 07:21 和 19:16 做完饭后打开通风(StateValue=False),但日志中均无关闭记录。07:21 打开后住户 07:41 出门,窗户在无人期间保持开启状态,存在一定安全风险。", "推理步骤6: 其余设备运行正常——门锁自动上锁功能正常工作,烟雾报警器和漏水传感器未触发,洗碗机正常启动,无入侵迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:38、07:22、18:30、19:17 四次报告 MeasuredValue = None,传感器可能存在间歇性故障或受灶具高温干扰导致读数失效", "16:13 入户门手动解锁并打开,但无对应的关门和锁门记录,门可能在无人看管下保持开启约 1.5 小时", "厨房窗户在 07:21 打开后无关闭记录,住户 07:41 出门后窗户在无人状态下持续开启"], "recommended_actions": ["检查厨房温度传感器:确认传感器是否因灶具高温导致暂时性读数丢失,或存在硬件故障,必要时更换传感器以确保厨房火灾预警能力", "设置离家自动安全检查:建议配置自动化规则,在入户门锁定(离家模式)时检查所有窗户是否关闭,如有未关窗户则发送提醒", "排查 16:13 的开门事件:确认该时段是否为住户本人或授权人员进入,如非预期访问则需加强门锁安全策略(如启用远程通知)", "建议为入户门配置未关闭超时告警:如门在解锁/打开后超过一定时间未关闭,自动推送通知"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.41700577735901, "api_error": null} {"episode_id": "SQ5_TN_B_1176", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1176.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261805, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,且入户门在16:08开锁进入后长时间未关闭/未上锁,直到22:40才重新关门上锁。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活模式正常——住户约06:19起床,07:00做早餐,07:43出门并自动上锁,17:46回家,22:40就寝,符合单人上班族的典型作息。\",\n \"推理步骤2: 厨房温度传感器在灶具开启后(07:01、07:29、18:12、19:02)连续报告 MeasuredValue = None,说明传感器在高温或灶具工作环境下出现读数丢失,可能是传感器故障或受热干扰。虽然灶具关闭后温度恢复正常读数,但烹饪期间正是最需要温度监测的时段,传感器失效会削弱火灾预警能力。\",\n \"推理步骤3: 16:08入户门解锁并开门(contact=False),但直到22:40才记录到关门(contact=True)和自动上锁。中间长达约6.5小时入户门处于未关闭/未上锁状态。虽然17:46住户回家时也有一次开锁记录,说明住户在家期间可能有意不关门,但如此长时间大门敞开存在入侵风险。\",\n \"推理步骤4: 温度趋势方面,全屋温度从凌晨约23°C逐步升至中午约25.8°C再回落,各房间温度一致,属于夏季自然温度变化,无异常热源迹象。\",\n \"推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门窗传感器变化均与住户活动吻合(做饭后开窗通风),洗碗机正常运行,整体无入侵或火灾迹象。\",\n \"推理步骤6: 厨房窗户在07:28和19:01做饭结束后打开(StateValue=False),但日志中未见关闭记录,存在窗户长时间未关的可能。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:01、07:29、18:12、19:02 四次报告 MeasuredValue = None,均发生在灶具使用前后\",\n \"入户门 16:08 开门后直到 22:40 才关闭上锁,中间约6.5小时门处于开启状态\",\n \"厨房窗户在 07:28 和 19:01 打开后,日志中无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置\",\n \"设置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免大门长时间敞开带来的安全隐患\",\n \"建议为厨房窗户和入户门添加自动化规则:离家时自动检查并提醒关闭所有门窗\",\n \"虽然当前烟雾报警器未触发,但厨房温度传感器在烹饪时失效意味着缺少一层热监测保护,建议增加冗余温度监测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,且入户门在16:08开锁进入后长时间未关闭/未上锁,直到22:40才重新关门上锁。", "reasoning": ["推理步骤1: 整体生活模式正常——住户约06:19起床,07:00做早餐,07:43出门并自动上锁,17:46回家,22:40就寝,符合单人上班族的典型作息。", "推理步骤2: 厨房温度传感器在灶具开启后(07:01、07:29、18:12、19:02)连续报告 MeasuredValue = None,说明传感器在高温或灶具工作环境下出现读数丢失,可能是传感器故障或受热干扰。虽然灶具关闭后温度恢复正常读数,但烹饪期间正是最需要温度监测的时段,传感器失效会削弱火灾预警能力。", "推理步骤3: 16:08入户门解锁并开门(contact=False),但直到22:40才记录到关门(contact=True)和自动上锁。中间长达约6.5小时入户门处于未关闭/未上锁状态。虽然17:46住户回家时也有一次开锁记录,说明住户在家期间可能有意不关门,但如此长时间大门敞开存在入侵风险。", "推理步骤4: 温度趋势方面,全屋温度从凌晨约23°C逐步升至中午约25.8°C再回落,各房间温度一致,属于夏季自然温度变化,无异常热源迹象。", "推理步骤5: 烟雾报警器全天无触发,漏水传感器无报警,门窗传感器变化均与住户活动吻合(做饭后开窗通风),洗碗机正常运行,整体无入侵或火灾迹象。", "推理步骤6: 厨房窗户在07:28和19:01做饭结束后打开(StateValue=False),但日志中未见关闭记录,存在窗户长时间未关的可能。"], "key_evidence": ["kitchen_temp_sensor 在 07:01、07:29、18:12、19:02 四次报告 MeasuredValue = None,均发生在灶具使用前后", "入户门 16:08 开门后直到 22:40 才关闭上锁,中间约6.5小时门处于开启状态", "厨房窗户在 07:28 和 19:01 打开后,日志中无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时读数异常,必要时更换耐高温型号或调整安装位置", "设置入户门长时间未关闭的告警规则(如超过10分钟未关门则推送提醒),避免大门长时间敞开带来的安全隐患", "建议为厨房窗户和入户门添加自动化规则:离家时自动检查并提醒关闭所有门窗", "虽然当前烟雾报警器未触发,但厨房温度传感器在烹饪时失效意味着缺少一层热监测保护,建议增加冗余温度监测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.743178606033325, "api_error": null} {"episode_id": "SQ5_TN_B_1191", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1191.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261820, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间两次报告 None 值,且入户门在16:12开锁进入后长时间未关门/未上锁,直到22:27才重新关闭上锁。\",\n \"reasoning\": [\n \"推理步骤1: 住户作息模式正常——05:58主卧有人起床开灯,07:02做早餐,07:40关灯锁门出门(门锁手动开锁→开门→关门→自动上锁),符合上班族早出模式。\",\n \"推理步骤2: 17:43住户回家(开锁→开门→玄关/客厅检测到人→开客厅灯和空调),18:36做晚餐,19:30开洗碗机,22:27关灯关空调→进主卧→关窗帘→确认前门关闭上锁→关灯睡觉。整体生活节奏合理,无入侵迹象。\",\n \"推理步骤3: 温度趋势正常——夜间约23°C,白天随气温升至25-26°C,午后峰值约25.9°C,傍晚逐步回落。各房间温度一致,无异常热源。客厅空调17:43开启制冷(SystemMode=3)后温度从约24.8°C降至约23.6°C,合理。\",\n \"推理步骤4: 异常点一:厨房温度传感器在07:03、07:28、18:37、18:57四次报告 MeasuredValue = None。这发生在灶具开启和关闭前后,可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在故障。虽然07:30和19:00恢复了正常读数,但反复出现None值值得关注。\",\n \"推理步骤5: 异常点二:16:12入户门被手动开锁(LockOperationType=1)并打开(contact=False),玄关检测到人,但之后没有关门和上锁的记录,直到22:27才记录到门关闭(contact=True)并自动上锁。中间约6小时15分钟入户门处于开启/未锁状态。虽然17:43有第二次开锁记录(住户回家),但16:12的开门者身份不明,且长时间未关门存在安全隐患。\",\n \"推理步骤6: 16:12开门时无后续客厅/卧室活动(直到17:43才有),可能是住户短暂回来取东西后忘记关门,也可能是其他家庭成员进出。虽不构成明确入侵威胁,但入户门长时间未关闭是实际安全风险。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在07:03、07:28、18:37、18:57四次报告 MeasuredValue = None\",\n \"16:12:00 入户门手动开锁并打开,16:12:03 玄关检测到人,但直到22:27:34才记录到门关闭并上锁,中间约6小时入户门未关闭\",\n \"16:12开门后无室内活动记录(无灯光、无运动传感器触发),直到17:43才有第二次进入和室内活动\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致高温干扰,必要时更换传感器或调整安装位置\",\n \"设置入户门未关闭超时告警:建议配置自动化规则,当入户门打开超过5-10分钟未关闭时推送通知提醒\",\n \"确认16:12的开门事件是否为已知家庭成员操作,排除未授权进入的可能性\",\n \"考虑为门锁启用PIN码或指纹日志记录,以便追溯每次开锁的具体操作人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间两次报告 None 值,且入户门在16:12开锁进入后长时间未关门/未上锁,直到22:27才重新关闭上锁。", "reasoning": ["推理步骤1: 住户作息模式正常——05:58主卧有人起床开灯,07:02做早餐,07:40关灯锁门出门(门锁手动开锁→开门→关门→自动上锁),符合上班族早出模式。", "推理步骤2: 17:43住户回家(开锁→开门→玄关/客厅检测到人→开客厅灯和空调),18:36做晚餐,19:30开洗碗机,22:27关灯关空调→进主卧→关窗帘→确认前门关闭上锁→关灯睡觉。整体生活节奏合理,无入侵迹象。", "推理步骤3: 温度趋势正常——夜间约23°C,白天随气温升至25-26°C,午后峰值约25.9°C,傍晚逐步回落。各房间温度一致,无异常热源。客厅空调17:43开启制冷(SystemMode=3)后温度从约24.8°C降至约23.6°C,合理。", "推理步骤4: 异常点一:厨房温度传感器在07:03、07:28、18:37、18:57四次报告 MeasuredValue = None。这发生在灶具开启和关闭前后,可能是灶具产生的高温或油烟干扰了传感器读数,也可能是传感器本身存在故障。虽然07:30和19:00恢复了正常读数,但反复出现None值值得关注。", "推理步骤5: 异常点二:16:12入户门被手动开锁(LockOperationType=1)并打开(contact=False),玄关检测到人,但之后没有关门和上锁的记录,直到22:27才记录到门关闭(contact=True)并自动上锁。中间约6小时15分钟入户门处于开启/未锁状态。虽然17:43有第二次开锁记录(住户回家),但16:12的开门者身份不明,且长时间未关门存在安全隐患。", "推理步骤6: 16:12开门时无后续客厅/卧室活动(直到17:43才有),可能是住户短暂回来取东西后忘记关门,也可能是其他家庭成员进出。虽不构成明确入侵威胁,但入户门长时间未关闭是实际安全风险。"], "key_evidence": ["厨房温度传感器在07:03、07:28、18:37、18:57四次报告 MeasuredValue = None", "16:12:00 入户门手动开锁并打开,16:12:03 玄关检测到人,但直到22:27:34才记录到门关闭并上锁,中间约6小时入户门未关闭", "16:12开门后无室内活动记录(无灯光、无运动传感器触发),直到17:43才有第二次进入和室内活动"], "recommended_actions": ["检查厨房温度传感器:清洁传感器探头,确认安装位置是否离灶具过近导致高温干扰,必要时更换传感器或调整安装位置", "设置入户门未关闭超时告警:建议配置自动化规则,当入户门打开超过5-10分钟未关闭时推送通知提醒", "确认16:12的开门事件是否为已知家庭成员操作,排除未授权进入的可能性", "考虑为门锁启用PIN码或指纹日志记录,以便追溯每次开锁的具体操作人"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.927167654037476, "api_error": null} {"episode_id": "SQ5_TN_B_1180", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1180.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-15T00:00:00", "seed": 20261809, "scenario_id": null, "total_events": 231, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器突然从 ~2434(约24.3°C)跳升至 2825(约28.3°C),而同一时刻其他三个房间温度均在 2432-2434 范围内,厨房灶具尚未开启(19:07:30 才开),排除烹饪导致的升温。\",\n \"推理步骤2: 19:08 和 19:43 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是典型的传感器故障或通信异常表现。\",\n \"推理步骤3: 19:30 传感器恢复后读数为 2831(约28.3°C),仍然异常偏高;但 20:00 读数回落至 2413(约24.1°C),与其他房间一致,说明并非持续性高温环境,而是传感器间歇性故障。\",\n \"推理步骤4: 烟雾报警器全天未触发任何告警,排除真实火灾或燃气泄漏的可能性。\",\n \"推理步骤5: 其余设备行为均属正常——早晨住户起床、如厕、做早餐后出门上班(07:27 门锁手动开锁、开门、关门、自动上锁),傍晚回家(18:02)、开灯开空调、做饭、洗碗、晚间关灯离开或就寝,入户门始终处于锁定状态,无入侵迹象。\",\n \"推理步骤6: 住户 18:02 回家时入户门先解锁再开门,但 21:46 离开/就寝时日志显示门先关闭(contact=True)再自动上锁,未见解锁开门过程,说明门本身已关好、自动锁定,属于正常的关门自锁行为。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度传感器读数从 ~2434 异常跳升至 2825,此时灶具尚未开启,其他房间温度正常\",\n \"19:08 和 19:43 厨房温度传感器两次报告 MeasuredValue = None\",\n \"19:30 传感器读数仍为异常高值 2831,但 20:00 恢复至正常范围 2413\",\n \"全天烟雾报警器未触发,排除真实火灾风险\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置和线路连接,确认是否受灶具热辐射影响或存在接触不良\",\n \"观察未来几天厨房温度传感器是否继续出现 null 值或异常跳变,若反复出现建议更换传感器\",\n \"考虑将厨房温度传感器安装位置远离灶具,避免烹饪时的热源干扰影响正常监测\",\n \"确认厨房窗户(19:42 打开通风)在就寝前已关闭,日志中未见关闭记录\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器出现异常读数跳变及两次 null 值,疑似传感器故障或线路问题。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器突然从 ~2434(约24.3°C)跳升至 2825(约28.3°C),而同一时刻其他三个房间温度均在 2432-2434 范围内,厨房灶具尚未开启(19:07:30 才开),排除烹饪导致的升温。", "推理步骤2: 19:08 和 19:43 厨房温度传感器连续两次报告 MeasuredValue = None(空值),表明传感器无法正常采集数据,这是典型的传感器故障或通信异常表现。", "推理步骤3: 19:30 传感器恢复后读数为 2831(约28.3°C),仍然异常偏高;但 20:00 读数回落至 2413(约24.1°C),与其他房间一致,说明并非持续性高温环境,而是传感器间歇性故障。", "推理步骤4: 烟雾报警器全天未触发任何告警,排除真实火灾或燃气泄漏的可能性。", "推理步骤5: 其余设备行为均属正常——早晨住户起床、如厕、做早餐后出门上班(07:27 门锁手动开锁、开门、关门、自动上锁),傍晚回家(18:02)、开灯开空调、做饭、洗碗、晚间关灯离开或就寝,入户门始终处于锁定状态,无入侵迹象。", "推理步骤6: 住户 18:02 回家时入户门先解锁再开门,但 21:46 离开/就寝时日志显示门先关闭(contact=True)再自动上锁,未见解锁开门过程,说明门本身已关好、自动锁定,属于正常的关门自锁行为。"], "key_evidence": ["19:00 厨房温度传感器读数从 ~2434 异常跳升至 2825,此时灶具尚未开启,其他房间温度正常", "19:08 和 19:43 厨房温度传感器两次报告 MeasuredValue = None", "19:30 传感器读数仍为异常高值 2831,但 20:00 恢复至正常范围 2413", "全天烟雾报警器未触发,排除真实火灾风险"], "recommended_actions": ["检查厨房温度传感器的安装位置和线路连接,确认是否受灶具热辐射影响或存在接触不良", "观察未来几天厨房温度传感器是否继续出现 null 值或异常跳变,若反复出现建议更换传感器", "考虑将厨房温度传感器安装位置远离灶具,避免烹饪时的热源干扰影响正常监测", "确认厨房窗户(19:42 打开通风)在就寝前已关闭,日志中未见关闭记录"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 34.48197150230408, "api_error": null} {"episode_id": "SQ5_TN_C_1170", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1170.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261799, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.86°C(中午高点),属于夏季室内正常温度区间。\",\n \"推理步骤3: 温度变化曲线呈现清晰的昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出逐步升温,12:00-13:00 达到峰值约 25.7-25.9°C,午后缓慢回落,至 23:30 降回约 23.3°C。这是典型的自然昼夜温差模式。\",\n \"推理步骤4: 四个房间的温度高度一致,彼此偏差始终在 0.2°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。\",\n \"推理步骤5: 未出现任何突变或尖峰,温度变化平滑连续,排除设备故障或传感器异常读数的可能。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.90°C ~ 25.86°C,属于夏季室内正常范围\",\n \"四个房间温度走势高度同步,呈标准昼夜抛物线曲线,无异常偏离\",\n \"无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的事件记录\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭状态正常。\",\n \"可考虑在午间高温时段(11:00-14:00,室温接近 26°C)开启空调以提升舒适度。\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.86°C(中午高点),属于夏季室内正常温度区间。", "推理步骤3: 温度变化曲线呈现清晰的昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出逐步升温,12:00-13:00 达到峰值约 25.7-25.9°C,午后缓慢回落,至 23:30 降回约 23.3°C。这是典型的自然昼夜温差模式。", "推理步骤4: 四个房间的温度高度一致,彼此偏差始终在 0.2°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。", "推理步骤5: 未出现任何突变或尖峰,温度变化平滑连续,排除设备故障或传感器异常读数的可能。"], "key_evidence": ["全天温度范围 22.90°C ~ 25.86°C,属于夏季室内正常范围", "四个房间温度走势高度同步,呈标准昼夜抛物线曲线,无异常偏离", "无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的事件记录"], "recommended_actions": ["无需采取安全响应措施,家庭状态正常。", "可考虑在午间高温时段(11:00-14:00,室温接近 26°C)开启空调以提升舒适度。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.850904941558838, "api_error": null} {"episode_id": "SQ5_TN_B_1193", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_B_1193.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261822, "scenario_id": null, "total_events": 237, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:34开锁进入后未关门,存在安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:51、07:23、18:25、19:19 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。其他三个温度传感器全天无 None 值,说明这不是系统性通信问题,而是厨房温度传感器自身的异常。\",\n \"推理步骤2: 灶具使用期间温度传感器失效尤其值得关注——如果传感器因高温或干扰而无法正常读数,则在真正发生厨房火灾时可能无法提供有效的温度预警数据,削弱了烟雾报警器之外的辅助安全监测能力。\",\n \"推理步骤3: 16:34 入户门通过手动方式解锁(LockOperationType=1)并开门(StateValue=False),但直到 22:38 才记录到门关闭(StateValue=True)并自动上锁。在将近6小时内,入户门处于未关闭状态。虽然 18:20 有第二次开门记录(住户回家),但 16:34 的开门事件没有对应的关门记录,说明门在这段时间内一直敞开或未锁。\",\n \"推理步骤4: 整体生活模式合理——06:01起床、06:50做早餐、07:34出门并自动锁门、18:20回家开灯开空调做晚饭、22:38关灯就寝锁门,符合单人上班族的日常作息。温度曲线也符合夏季白天升温夜间降温的自然规律。\",\n \"推理步骤5: 烟雾报警器全天未触发,卫生间漏水传感器无报告,无入侵迹象(所有开锁均为手动操作),排除火灾、漏水和入侵威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在 06:51、07:23、18:25、19:19 四次报告 MeasuredValue = None,均与灶具操作时间高度关联\",\n \"16:34:02 入户门开启(StateValue=False),直到 22:38:23 才记录关闭(StateValue=True),中间约6小时无关门记录\",\n \"其他房间温度传感器全天正常,排除系统性故障\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号\",\n \"设置入户门长时间未关闭的告警规则(如超过5分钟未关门则推送提醒),避免门户长时间敞开\",\n \"考虑为厨房温度传感器配置 None 值告警,当传感器在灶具运行期间失效时及时通知住户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时入户门在16:34开锁进入后未关门,存在安全隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:51、07:23、18:25、19:19 四次报告 MeasuredValue = None,均发生在灶具开启或关闭前后。其他三个温度传感器全天无 None 值,说明这不是系统性通信问题,而是厨房温度传感器自身的异常。", "推理步骤2: 灶具使用期间温度传感器失效尤其值得关注——如果传感器因高温或干扰而无法正常读数,则在真正发生厨房火灾时可能无法提供有效的温度预警数据,削弱了烟雾报警器之外的辅助安全监测能力。", "推理步骤3: 16:34 入户门通过手动方式解锁(LockOperationType=1)并开门(StateValue=False),但直到 22:38 才记录到门关闭(StateValue=True)并自动上锁。在将近6小时内,入户门处于未关闭状态。虽然 18:20 有第二次开门记录(住户回家),但 16:34 的开门事件没有对应的关门记录,说明门在这段时间内一直敞开或未锁。", "推理步骤4: 整体生活模式合理——06:01起床、06:50做早餐、07:34出门并自动锁门、18:20回家开灯开空调做晚饭、22:38关灯就寝锁门,符合单人上班族的日常作息。温度曲线也符合夏季白天升温夜间降温的自然规律。", "推理步骤5: 烟雾报警器全天未触发,卫生间漏水传感器无报告,无入侵迹象(所有开锁均为手动操作),排除火灾、漏水和入侵威胁。"], "key_evidence": ["厨房温度传感器在 06:51、07:23、18:25、19:19 四次报告 MeasuredValue = None,均与灶具操作时间高度关联", "16:34:02 入户门开启(StateValue=False),直到 22:38:23 才记录关闭(StateValue=True),中间约6小时无关门记录", "其他房间温度传感器全天正常,排除系统性故障"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温干扰,必要时重新定位或更换耐高温型号", "设置入户门长时间未关闭的告警规则(如超过5分钟未关门则推送提醒),避免门户长时间敞开", "考虑为厨房温度传感器配置 None 值告警,当传感器在灶具运行期间失效时及时通知住户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.3095383644104, "api_error": null} {"episode_id": "SQ5_TN_C_1172", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1172.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261801, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:36、07:09、18:12、18:56 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关(06:35 灶具开启→06:36 None;07:08 灶具关闭→07:09 None;18:11 灶具开启→18:12 None;18:55 灶具关闭→18:56 None),说明灶具工作时产生的热量或电磁干扰可能导致传感器读数异常。\",\n \"推理步骤3: 温度传感器是厨房安全监控的关键组件,若传感器在灶具使用期间失效,将无法及时检测到异常高温或火灾风险,存在安全隐患。\",\n \"推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关和运动传感器逻辑一致,无入侵迹象。\",\n \"推理步骤5: 厨房窗户在做完饭后打开(07:08、18:55)属于通风行为,烟雾报警器未触发,说明没有实际火灾发生,但传感器故障本身需要关注。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:36、07:09、18:12、18:56 四次报告 MeasuredValue = None\",\n \"None 值每次都紧跟灶具状态变化(开启或关闭后约1分钟内出现)\",\n \"其他房间温度传感器在相同时间段均正常报告数值\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰或电磁干扰\",\n \"检查传感器电池电量及通信信号强度,排除硬件故障\",\n \"考虑将传感器重新定位到远离灶具但仍能有效监测厨房温度的位置\",\n \"在传感器问题解决前,烹饪时加强人工关注厨房安全状况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:36、07:09、18:12、18:56 四次报告 MeasuredValue = None,而其他三个温度传感器在相同时段均正常上报数值。", "推理步骤2: None 值出现的时间点与灶具开启/关闭操作高度相关(06:35 灶具开启→06:36 None;07:08 灶具关闭→07:09 None;18:11 灶具开启→18:12 None;18:55 灶具关闭→18:56 None),说明灶具工作时产生的热量或电磁干扰可能导致传感器读数异常。", "推理步骤3: 温度传感器是厨房安全监控的关键组件,若传感器在灶具使用期间失效,将无法及时检测到异常高温或火灾风险,存在安全隐患。", "推理步骤4: 其余家庭活动模式完全正常——早晨起床、出门上班/上学、下午孩子回家、傍晚大人回家做饭、晚间就寝,门锁开关和运动传感器逻辑一致,无入侵迹象。", "推理步骤5: 厨房窗户在做完饭后打开(07:08、18:55)属于通风行为,烟雾报警器未触发,说明没有实际火灾发生,但传感器故障本身需要关注。"], "key_evidence": ["kitchen_temp_sensor 在 06:36、07:09、18:12、18:56 四次报告 MeasuredValue = None", "None 值每次都紧跟灶具状态变化(开启或关闭后约1分钟内出现)", "其他房间温度传感器在相同时间段均正常报告数值"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致热干扰或电磁干扰", "检查传感器电池电量及通信信号强度,排除硬件故障", "考虑将传感器重新定位到远离灶具但仍能有效监测厨房温度的位置", "在传感器问题解决前,烹饪时加强人工关注厨房安全状况"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 18.08414340019226, "api_error": null} {"episode_id": "SQ5_TN_C_1171", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1171.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261800, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,全天处于开启状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:47、06:58、18:22、19:26 四次报告 MeasuredValue = None,分别出现在早晚两次使用灶具期间。其他三个温度传感器全天无任何 None 值,说明这不是系统级通信问题,而是该传感器自身的异常。\",\n \"推理步骤2: 灶具开启后传感器读数变为 None,可能是高温导致传感器超量程或硬件故障。虽然在下一个整点(07:00、18:30)恢复了正常数值,但反复出现说明问题具有规律性,传感器在高温环境下工作不稳定。\",\n \"推理步骤3: 厨房窗户传感器在 06:57:30 报告 StateValue=False(窗户打开),之后在 19:25:30 再次报告 StateValue=False(仍然打开或重新打开),但全天日志中没有任何 StateValue=True(窗户关闭)的记录。这意味着厨房窗户从早上 6:57 起一直处于打开状态,家人外出期间(07:23~16:17)窗户也未关闭,存在安全隐患。\",\n \"推理步骤4: 其余设备行为均属正常——早上 6 点起床、7:23 出门并自动锁门、16:17 孩子先回家、18:02 大人回家、22:50 睡前锁门关灯,生活节奏合理。入户门锁的开锁/上锁操作均为 Manual 或 Auto,无异常来源。\",\n \"推理步骤5: 全屋温度走势符合夏季自然规律(夜间 23°C → 正午 25.9°C → 夜间回落至 23.3°C),空调在 18:02 开启制冷模式(SystemMode=3)后温度逐步下降,无异常温升。烟雾报警器和漏水传感器全天无告警。\",\n \"推理步骤6: 次卫灯在 06:32 开启后日志中无关闭记录,可能是遗忘关灯,属于轻微能耗浪费但无安全风险。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:47、06:58、18:22、19:26 四次报告 MeasuredValue = None,其他传感器同期均正常\",\n \"kitchen_window_contact 在 06:57:30 报告 StateValue=False(开窗),全天无关闭记录,家人外出近 9 小时期间窗户持续敞开\",\n \"second_bathroom_light 在 06:32 开启后无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;考虑更换耐高温型号或调整安装位置\",\n \"设置离家模式自动化规则:当入户门上锁且全屋无人时,自动检查并提醒关闭所有窗户\",\n \"为厨房窗户传感器添加长时间开启告警(如超过 2 小时未关闭时推送通知)\",\n \"排查次卫灯是否缺少运动传感器联动,建议添加无人自动关灯规则以节能\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障或通信异常;同时厨房窗户在做饭后开启但日志中未见关闭事件,全天处于开启状态。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:47、06:58、18:22、19:26 四次报告 MeasuredValue = None,分别出现在早晚两次使用灶具期间。其他三个温度传感器全天无任何 None 值,说明这不是系统级通信问题,而是该传感器自身的异常。", "推理步骤2: 灶具开启后传感器读数变为 None,可能是高温导致传感器超量程或硬件故障。虽然在下一个整点(07:00、18:30)恢复了正常数值,但反复出现说明问题具有规律性,传感器在高温环境下工作不稳定。", "推理步骤3: 厨房窗户传感器在 06:57:30 报告 StateValue=False(窗户打开),之后在 19:25:30 再次报告 StateValue=False(仍然打开或重新打开),但全天日志中没有任何 StateValue=True(窗户关闭)的记录。这意味着厨房窗户从早上 6:57 起一直处于打开状态,家人外出期间(07:23~16:17)窗户也未关闭,存在安全隐患。", "推理步骤4: 其余设备行为均属正常——早上 6 点起床、7:23 出门并自动锁门、16:17 孩子先回家、18:02 大人回家、22:50 睡前锁门关灯,生活节奏合理。入户门锁的开锁/上锁操作均为 Manual 或 Auto,无异常来源。", "推理步骤5: 全屋温度走势符合夏季自然规律(夜间 23°C → 正午 25.9°C → 夜间回落至 23.3°C),空调在 18:02 开启制冷模式(SystemMode=3)后温度逐步下降,无异常温升。烟雾报警器和漏水传感器全天无告警。", "推理步骤6: 次卫灯在 06:32 开启后日志中无关闭记录,可能是遗忘关灯,属于轻微能耗浪费但无安全风险。"], "key_evidence": ["kitchen_temp_sensor 在 06:47、06:58、18:22、19:26 四次报告 MeasuredValue = None,其他传感器同期均正常", "kitchen_window_contact 在 06:57:30 报告 StateValue=False(开窗),全天无关闭记录,家人外出近 9 小时期间窗户持续敞开", "second_bathroom_light 在 06:32 开启后无关闭记录"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致超量程;考虑更换耐高温型号或调整安装位置", "设置离家模式自动化规则:当入户门上锁且全屋无人时,自动检查并提醒关闭所有窗户", "为厨房窗户传感器添加长时间开启告警(如超过 2 小时未关闭时推送通知)", "排查次卫灯是否缺少运动传感器联动,建议添加无人自动关灯规则以节能"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.91299295425415, "api_error": null} {"episode_id": "SQ5_TN_C_1179", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1179.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261808, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.963732957839966, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ5_TN_C_1182", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1182.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-15T00:00:00", "seed": 20261811, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.961059331893921, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ5_TN_C_1177", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1177.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-28T00:00:00", "seed": 20261806, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数正常,符合夏季昼夜温度自然变化规律,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器、运动传感器等安全相关设备的事件触发记录。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.92°C(凌晨低点)至 25.89°C(午间高点),完全处于正常室内温度区间,未出现任何异常高温或异常低温。\",\n \"推理步骤3: 温度变化曲线呈现典型的夏季昼夜节律——凌晨 00:00-05:30 维持在约 23°C,06:00 起随日出逐步升温,12:00-13:00 达到峰值约 25.7-25.9°C,午后逐步回落,至 23:30 回到约 23.3°C。这是自然环境温度驱动的正常模式。\",\n \"推理步骤4: 四个房间的温度高度一致,彼此偏差始终在 1°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗异常打开)的情况。\",\n \"推理步骤5: 全天无空调运行记录,结合温度未超过 26°C 的事实,说明当天气温适中,住户未需要开启空调,属于合理状态。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.92°C ~ 25.89°C,处于正常室内舒适区间\",\n \"四个房间温度走势高度同步,呈标准昼夜升降曲线,无局部异常热源\",\n \"无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的异常事件记录\"\n ],\n \"recommended_actions\": [\n \"无需采取任何安全响应措施,家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数正常,符合夏季昼夜温度自然变化规律,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器、运动传感器等安全相关设备的事件触发记录。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.92°C(凌晨低点)至 25.89°C(午间高点),完全处于正常室内温度区间,未出现任何异常高温或异常低温。", "推理步骤3: 温度变化曲线呈现典型的夏季昼夜节律——凌晨 00:00-05:30 维持在约 23°C,06:00 起随日出逐步升温,12:00-13:00 达到峰值约 25.7-25.9°C,午后逐步回落,至 23:30 回到约 23.3°C。这是自然环境温度驱动的正常模式。", "推理步骤4: 四个房间的温度高度一致,彼此偏差始终在 1°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗异常打开)的情况。", "推理步骤5: 全天无空调运行记录,结合温度未超过 26°C 的事实,说明当天气温适中,住户未需要开启空调,属于合理状态。"], "key_evidence": ["全天温度范围 22.92°C ~ 25.89°C,处于正常室内舒适区间", "四个房间温度走势高度同步,呈标准昼夜升降曲线,无局部异常热源", "无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的异常事件记录"], "recommended_actions": ["无需采取任何安全响应措施,家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.631506443023682, "api_error": null} {"episode_id": "SQ5_TN_C_1189", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1189.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261818, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"全天温度变化符合夏季自然昼夜温差规律,未发现安全威胁\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的异常事件\",\n \"推理步骤2: 温度值以百分之一摄氏度为单位(Matter 协议标准),凌晨 00:00-05:30 各房间温度在 22.9°C-23.1°C 之间,属于夏季夜间正常室温\",\n \"推理步骤3: 06:00 起温度开始上升,至 12:00-12:30 达到峰值约 25.7°C-25.9°C,随后逐步回落,23:30 降至约 23.3°C,这是典型的夏季昼夜温度曲线\",\n \"推理步骤4: 四个房间的温度走势高度一致,同一时刻各房间温差不超过 1°C,不存在某个房间温度异常飙升(如火灾)或异常偏低(如门窗被破坏导致冷风灌入)的情况\",\n \"推理步骤5: 全天温度范围 22.9°C-25.9°C,未出现任何突变(如 30 分钟内跳升 5°C 以上),排除火灾风险或设备故障导致的异常发热\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C-25.9°C,符合六月中旬夏季室内正常温度\",\n \"四个房间温度同步变化,呈现标准的昼高夜低曲线,无单点异常\",\n \"无任何安全类设备(烟雾报警器、门窗传感器、漏水传感器、门锁)触发事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,当前家庭状态正常\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "全天温度变化符合夏季自然昼夜温差规律,未发现安全威胁", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的异常事件", "推理步骤2: 温度值以百分之一摄氏度为单位(Matter 协议标准),凌晨 00:00-05:30 各房间温度在 22.9°C-23.1°C 之间,属于夏季夜间正常室温", "推理步骤3: 06:00 起温度开始上升,至 12:00-12:30 达到峰值约 25.7°C-25.9°C,随后逐步回落,23:30 降至约 23.3°C,这是典型的夏季昼夜温度曲线", "推理步骤4: 四个房间的温度走势高度一致,同一时刻各房间温差不超过 1°C,不存在某个房间温度异常飙升(如火灾)或异常偏低(如门窗被破坏导致冷风灌入)的情况", "推理步骤5: 全天温度范围 22.9°C-25.9°C,未出现任何突变(如 30 分钟内跳升 5°C 以上),排除火灾风险或设备故障导致的异常发热"], "key_evidence": ["全天温度范围 22.9°C-25.9°C,符合六月中旬夏季室内正常温度", "四个房间温度同步变化,呈现标准的昼高夜低曲线,无单点异常", "无任何安全类设备(烟雾报警器、门窗传感器、漏水传感器、门锁)触发事件"], "recommended_actions": ["无需采取安全响应措施,当前家庭状态正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.285991907119751, "api_error": null} {"episode_id": "SQ5_TN_C_1183", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1183.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261812, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及次卫灯开启后无关闭记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:44:07、07:07:00、18:21:00、18:57:00 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器在高温环境下工作不稳定,存在硬件故障或通信异常。\",\n \"推理步骤2: 厨房窗户传感器在 07:06:30 报告 StateValue = False(窗户打开),之后在 18:56:30 再次报告 False(打开)。整个日志中没有出现 kitchen_window_contact 的 StateValue = True(关闭)事件。这意味着厨房窗户可能从早上 07:06 起一直处于打开状态,或者传感器未能正确上报关闭事件。家中无人期间(07:28~16:02)窗户持续开启存在一定安全隐患。\",\n \"推理步骤3: 次卫灯在 06:28 开启后,整天日志中未见关闭记录,可能是遗忘关灯(低风险),但也可能反映传感器/开关通信异常。\",\n \"推理步骤4: 入侵风险排查——两次入户门开锁(07:28 和 16:02、17:40)均为 Manual 操作,伴随正常的运动传感器触发和后续生活行为(开灯、做饭、开空调等),符合住户日常出入模式。07:28 出门后门锁自动上锁,22:37 睡前门锁再次自动上锁,安防链路完整。\",\n \"推理步骤5: 火灾风险排查——灶具两次使用(06:43~07:06、18:20~18:56)时长分别约 23 分钟和 36 分钟,属于正常烹饪时长。烟雾报警器全天未触发。温度曲线整体随室外气温自然升降,无异常尖峰。\",\n \"推理步骤6: 漏水风险排查——厨房、主卫、次卫的漏水传感器全天无任何报警事件,无漏水风险。\",\n \"推理步骤7: 整体生活模式合理:早晨 06:05 起床 → 洗漱做饭 → 07:28 全家出门 → 16:02 孩子先回家 → 17:40 大人回家 → 做饭吃饭 → 21:08 孩子睡觉 → 22:37 大人睡觉。属于典型的工作日家庭作息。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:44:07、07:07:00、18:21:00、18:57:00 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:06:30 和 18:56:30 两次报告 StateValue = False(打开),全天未见关闭(True)记录,家中无人时段窗户可能持续开启\",\n \"second_bathroom_light 在 06:28 开启后全天无关闭记录\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的硬件状态和安装位置,确认是否因灶具高温导致传感器读数异常,必要时更换或重新定位传感器\",\n \"确认厨房窗户当前实际状态,如确实未关闭请及时关闭;同时检查窗户传感器是否正常上报关闭事件\",\n \"检查次卫灯开关是否正常工作,确认是遗忘关灯还是设备通信故障\",\n \"考虑为外出模式添加自动化规则:出门时自动检查并提醒未关闭的窗户和灯具\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障;同时厨房窗户在做饭后开启但日志中未见关闭记录,以及次卫灯开启后无关闭记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:44:07、07:07:00、18:21:00、18:57:00 共四次报告 MeasuredValue = None。每次都发生在灶具使用期间或刚关闭后,说明传感器在高温环境下工作不稳定,存在硬件故障或通信异常。", "推理步骤2: 厨房窗户传感器在 07:06:30 报告 StateValue = False(窗户打开),之后在 18:56:30 再次报告 False(打开)。整个日志中没有出现 kitchen_window_contact 的 StateValue = True(关闭)事件。这意味着厨房窗户可能从早上 07:06 起一直处于打开状态,或者传感器未能正确上报关闭事件。家中无人期间(07:28~16:02)窗户持续开启存在一定安全隐患。", "推理步骤3: 次卫灯在 06:28 开启后,整天日志中未见关闭记录,可能是遗忘关灯(低风险),但也可能反映传感器/开关通信异常。", "推理步骤4: 入侵风险排查——两次入户门开锁(07:28 和 16:02、17:40)均为 Manual 操作,伴随正常的运动传感器触发和后续生活行为(开灯、做饭、开空调等),符合住户日常出入模式。07:28 出门后门锁自动上锁,22:37 睡前门锁再次自动上锁,安防链路完整。", "推理步骤5: 火灾风险排查——灶具两次使用(06:43~07:06、18:20~18:56)时长分别约 23 分钟和 36 分钟,属于正常烹饪时长。烟雾报警器全天未触发。温度曲线整体随室外气温自然升降,无异常尖峰。", "推理步骤6: 漏水风险排查——厨房、主卫、次卫的漏水传感器全天无任何报警事件,无漏水风险。", "推理步骤7: 整体生活模式合理:早晨 06:05 起床 → 洗漱做饭 → 07:28 全家出门 → 16:02 孩子先回家 → 17:40 大人回家 → 做饭吃饭 → 21:08 孩子睡觉 → 22:37 大人睡觉。属于典型的工作日家庭作息。"], "key_evidence": ["kitchen_temp_sensor 在 06:44:07、07:07:00、18:21:00、18:57:00 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:06:30 和 18:56:30 两次报告 StateValue = False(打开),全天未见关闭(True)记录,家中无人时段窗户可能持续开启", "second_bathroom_light 在 06:28 开启后全天无关闭记录"], "recommended_actions": ["检查厨房温度传感器的硬件状态和安装位置,确认是否因灶具高温导致传感器读数异常,必要时更换或重新定位传感器", "确认厨房窗户当前实际状态,如确实未关闭请及时关闭;同时检查窗户传感器是否正常上报关闭事件", "检查次卫灯开关是否正常工作,确认是遗忘关灯还是设备通信故障", "考虑为外出模式添加自动化规则:出门时自动检查并提醒未关闭的窗户和灯具"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.045117139816284, "api_error": null} {"episode_id": "SQ5_TN_C_1192", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1192.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-20T00:00:00", "seed": 20261821, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。\",\n \"推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.90°C(正午高点),完全处于正常室内温度区间。\",\n \"推理步骤3: 温度变化趋势符合典型夏季昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出逐步升温,12:00 前后达到峰值约 25.8-25.9°C,午后缓慢回落,至 23:30 降回约 23.3°C。\",\n \"推理步骤4: 四个房间的温度高度一致,彼此差异始终在 0.2°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。\",\n \"推理步骤5: 不存在温度突变(如短时间内跳升 5°C 以上)等可能暗示火灾风险或设备故障的异常模式。每个 30 分钟间隔的变化幅度均在合理范围内(通常 0.1-1.2°C)。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.90°C ~ 25.90°C,处于正常室内舒适区间\",\n \"温度曲线呈平滑的昼升夜降趋势,符合夏季自然昼夜节律\",\n \"四个房间温度高度同步,无单点异常偏离\",\n \"无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭状态正常。\",\n \"可关注正午时段室温接近 26°C,如住户在家可考虑开启空调保持舒适度。\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数正常,呈现典型的夏季昼夜温度变化曲线,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的 MeasuredValue 数据,无门锁、门窗传感器、烟雾报警器、漏水传感器等安全设备的告警事件。", "推理步骤2: Matter 协议中 TemperatureMeasurement.MeasuredValue 单位为 0.01°C。全天温度范围为 22.90°C(凌晨低点)至 25.90°C(正午高点),完全处于正常室内温度区间。", "推理步骤3: 温度变化趋势符合典型夏季昼夜规律——凌晨 00:00-05:30 维持在约 22.9-23.1°C 的低位,06:00 起随日出逐步升温,12:00 前后达到峰值约 25.8-25.9°C,午后缓慢回落,至 23:30 降回约 23.3°C。", "推理步骤4: 四个房间的温度高度一致,彼此差异始终在 0.2°C 以内,不存在某个房间温度异常偏高(可能指示火灾)或异常偏低(可能指示门窗被破坏打开)的情况。", "推理步骤5: 不存在温度突变(如短时间内跳升 5°C 以上)等可能暗示火灾风险或设备故障的异常模式。每个 30 分钟间隔的变化幅度均在合理范围内(通常 0.1-1.2°C)。"], "key_evidence": ["全天温度范围 22.90°C ~ 25.90°C,处于正常室内舒适区间", "温度曲线呈平滑的昼升夜降趋势,符合夏季自然昼夜节律", "四个房间温度高度同步,无单点异常偏离", "无任何安全类设备(烟雾报警器、漏水传感器、门窗传感器、门锁)的告警事件"], "recommended_actions": ["无需采取安全响应措施,家庭状态正常。", "可关注正午时段室温接近 26°C,如住户在家可考虑开启空调保持舒适度。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 16.554753303527832, "api_error": null} {"episode_id": "SQ5_TN_C_1190", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1190.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261819, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 07:08、07:22、18:19、19:10 四次报告 MeasuredValue = None。这些时间点均与灶具使用前后高度相关(07:07 开灶、07:21 关灶;18:18 开灶、19:09 关灶),传感器可能因高温或烟气干扰导致读数丢失。\",\n \"推理步骤2: 虽然 07:30 和 18:30 传感器恢复了正常数值,但一天内四次出现 None 值属于异常频率,说明传感器工作状态不稳定,可能存在硬件老化、积灰或安装位置不当的问题。\",\n \"推理步骤3: 厨房窗户在 07:21:30 和 19:09:30 两次被打开(BooleanState.StateValue = False),这是做饭后通风的合理行为,但整个日志中未见对应的关闭事件。如果窗户确实一直处于开启状态,在无人在家期间(07:12~15:55)存在一定的安全隐患。\",\n \"推理步骤4: 入侵风险方面——两次入户门开锁(07:12 和 15:55、17:47)均为 Manual 操作且伴随合理的室内活动链(开灯、做饭、进入各房间),符合家庭成员早出晚归和孩子放学回家的模式,无入侵迹象。\",\n \"推理步骤5: 火灾风险方面——灶具两次使用时长分别约14分钟和51分钟,均在合理范围内,且使用后均已关闭;烟雾报警器全天无告警;各房间温度变化符合夏季昼夜自然波动规律(夜间约23°C,午间峰值约25.8°C),无异常升温。\",\n \"推理步骤6: 漏水方面——厨房、主卫、次卫的漏水传感器全天无告警事件,洗碗机正常启动运行,无异常。\",\n \"推理步骤7: 整体生活模式合理:06:30 主卧起床 → 孩子 06:39 起床 → 洗漱做早餐 → 07:12 全家出门并自动锁门 → 15:55 孩子放学回家 → 17:47 大人回家开空调 → 18:18 做晚饭 → 19:43 洗碗机运行 → 20:48 孩子房间关灯睡觉 → 22:24 大人就寝并确认锁门。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 07:08、07:22、18:19、19:10 四次报告 MeasuredValue = None\",\n \"kitchen_window_contact 在 07:21:30 和 19:09:30 报告 StateValue = False(窗户打开),但全天日志中无对应的关闭(StateValue = True)事件\",\n \"烟雾报警器和漏水传感器全天无告警\",\n \"所有入户门操作均为 Manual 来源且伴随合理的室内活动序列\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,清洁传感器探头并确认安装位置是否远离灶具直接热源和油烟,必要时更换传感器\",\n \"确认厨房窗户当前是否仍处于开启状态,如是则建议关闭,并考虑设置自动化规则:无人在家时若窗户长时间开启则发送提醒\",\n \"建议为厨房温度传感器设置 None 值告警规则,连续出现 None 时及时通知用户\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房窗户在做饭后开启但日志中未见关闭事件,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在 07:08、07:22、18:19、19:10 四次报告 MeasuredValue = None。这些时间点均与灶具使用前后高度相关(07:07 开灶、07:21 关灶;18:18 开灶、19:09 关灶),传感器可能因高温或烟气干扰导致读数丢失。", "推理步骤2: 虽然 07:30 和 18:30 传感器恢复了正常数值,但一天内四次出现 None 值属于异常频率,说明传感器工作状态不稳定,可能存在硬件老化、积灰或安装位置不当的问题。", "推理步骤3: 厨房窗户在 07:21:30 和 19:09:30 两次被打开(BooleanState.StateValue = False),这是做饭后通风的合理行为,但整个日志中未见对应的关闭事件。如果窗户确实一直处于开启状态,在无人在家期间(07:12~15:55)存在一定的安全隐患。", "推理步骤4: 入侵风险方面——两次入户门开锁(07:12 和 15:55、17:47)均为 Manual 操作且伴随合理的室内活动链(开灯、做饭、进入各房间),符合家庭成员早出晚归和孩子放学回家的模式,无入侵迹象。", "推理步骤5: 火灾风险方面——灶具两次使用时长分别约14分钟和51分钟,均在合理范围内,且使用后均已关闭;烟雾报警器全天无告警;各房间温度变化符合夏季昼夜自然波动规律(夜间约23°C,午间峰值约25.8°C),无异常升温。", "推理步骤6: 漏水方面——厨房、主卫、次卫的漏水传感器全天无告警事件,洗碗机正常启动运行,无异常。", "推理步骤7: 整体生活模式合理:06:30 主卧起床 → 孩子 06:39 起床 → 洗漱做早餐 → 07:12 全家出门并自动锁门 → 15:55 孩子放学回家 → 17:47 大人回家开空调 → 18:18 做晚饭 → 19:43 洗碗机运行 → 20:48 孩子房间关灯睡觉 → 22:24 大人就寝并确认锁门。"], "key_evidence": ["kitchen_temp_sensor 在 07:08、07:22、18:19、19:10 四次报告 MeasuredValue = None", "kitchen_window_contact 在 07:21:30 和 19:09:30 报告 StateValue = False(窗户打开),但全天日志中无对应的关闭(StateValue = True)事件", "烟雾报警器和漏水传感器全天无告警", "所有入户门操作均为 Manual 来源且伴随合理的室内活动序列"], "recommended_actions": ["检查厨房温度传感器的工作状态,清洁传感器探头并确认安装位置是否远离灶具直接热源和油烟,必要时更换传感器", "确认厨房窗户当前是否仍处于开启状态,如是则建议关闭,并考虑设置自动化规则:无人在家时若窗户长时间开启则发送提醒", "建议为厨房温度传感器设置 None 值告警规则,连续出现 None 时及时通知用户"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.156755924224854, "api_error": null} {"episode_id": "SQ5_TN_C_1196", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1196.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261825, "scenario_id": null, "total_events": 192, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"所有温度传感器读数正常,符合夏季昼夜自然温度变化规律,无安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安防设备的异常事件。\",\n \"推理步骤2: 温度值范围为 2293~2590(即 22.93°C~25.90°C),属于夏季室内正常温度区间。\",\n \"推理步骤3: 温度变化曲线呈现典型的昼夜周期——凌晨最低(约 23.0°C),中午前后达到峰值(约 25.9°C),傍晚后逐步回落,符合 6 月初自然气温波动规律。\",\n \"推理步骤4: 四个房间的温度走势高度一致,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障导致的异常发热。\",\n \"推理步骤5: 06:00 前后温度从约 23.0°C 跳升至约 24.0°C(约 1°C/30min),是日出后升温加速的正常表现,非突变异常。\"\n ],\n \"key_evidence\": [\n \"全天温度范围 22.9°C~25.9°C,处于正常室内舒适区间\",\n \"四个传感器温度曲线同步变化,呈标准昼高夜低的自然周期\",\n \"无任何安防类设备(门锁、烟雾、漏水、门窗接触传感器)的告警事件\"\n ],\n \"recommended_actions\": [\n \"无需采取安全响应措施,家庭状态正常。\",\n \"可考虑在午间高温时段(11:00~14:00,室温接近 26°C)开启空调以提升舒适度。\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "所有温度传感器读数正常,符合夏季昼夜自然温度变化规律,无安全威胁。", "reasoning": ["推理步骤1: 日志仅包含四个温度传感器(客厅、主卧、儿童房、厨房)的全天读数,无门锁、门窗传感器、烟雾报警器、漏水传感器等安防设备的异常事件。", "推理步骤2: 温度值范围为 2293~2590(即 22.93°C~25.90°C),属于夏季室内正常温度区间。", "推理步骤3: 温度变化曲线呈现典型的昼夜周期——凌晨最低(约 23.0°C),中午前后达到峰值(约 25.9°C),傍晚后逐步回落,符合 6 月初自然气温波动规律。", "推理步骤4: 四个房间的温度走势高度一致,不存在某个房间温度异常飙升或骤降的情况,排除局部火灾风险或设备故障导致的异常发热。", "推理步骤5: 06:00 前后温度从约 23.0°C 跳升至约 24.0°C(约 1°C/30min),是日出后升温加速的正常表现,非突变异常。"], "key_evidence": ["全天温度范围 22.9°C~25.9°C,处于正常室内舒适区间", "四个传感器温度曲线同步变化,呈标准昼高夜低的自然周期", "无任何安防类设备(门锁、烟雾、漏水、门窗接触传感器)的告警事件"], "recommended_actions": ["无需采取安全响应措施,家庭状态正常。", "可考虑在午间高温时段(11:00~14:00,室温接近 26°C)开启空调以提升舒适度。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "CORRECT_REJECT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 15.223238468170166, "api_error": null} {"episode_id": "SQ5_TN_C_1198", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1198.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261827, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:44、07:18、18:36、18:52 四次报告 MeasuredValue = None,而其他时间段及其他房间传感器均正常上报数值。\",\n \"推理步骤2: None 值出现的时间点均与灶具开启或关闭时间高度相关(06:43 灶具开启→06:44 None;07:17 灶具关闭→07:18 None;18:35 灶具开启→18:36 None;18:51 灶具关闭→18:52 None),说明灶具运行可能对传感器产生电磁干扰或热冲击导致读数失效。\",\n \"推理步骤3: 虽然厨房烟雾报警器未触发,且温度恢复正常读数后数值合理,但传感器在灶具使用期间无法提供有效温度数据,意味着如果发生真实火灾或过热,系统将无法及时检测。\",\n \"推理步骤4: 其余家庭活动模式正常——早晨起床、出门上锁、下午孩子回家、傍晚大人回家做饭、晚间就寝锁门,入侵/漏水/火灾等威胁均无迹象。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:44、07:18、18:36、18:52 四次报告 MeasuredValue = None\",\n \"None 值出现时间与 kitchen_cook_surface 开关操作高度吻合,其他传感器同期工作正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰\",\n \"考虑将传感器重新定位或增加屏蔽,确保灶具使用期间仍能获得有效温度读数\",\n \"如问题持续,更换传感器或联系厂商确认是否为已知兼容性问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:44、07:18、18:36、18:52 四次报告 MeasuredValue = None,而其他时间段及其他房间传感器均正常上报数值。", "推理步骤2: None 值出现的时间点均与灶具开启或关闭时间高度相关(06:43 灶具开启→06:44 None;07:17 灶具关闭→07:18 None;18:35 灶具开启→18:36 None;18:51 灶具关闭→18:52 None),说明灶具运行可能对传感器产生电磁干扰或热冲击导致读数失效。", "推理步骤3: 虽然厨房烟雾报警器未触发,且温度恢复正常读数后数值合理,但传感器在灶具使用期间无法提供有效温度数据,意味着如果发生真实火灾或过热,系统将无法及时检测。", "推理步骤4: 其余家庭活动模式正常——早晨起床、出门上锁、下午孩子回家、傍晚大人回家做饭、晚间就寝锁门,入侵/漏水/火灾等威胁均无迹象。"], "key_evidence": ["kitchen_temp_sensor 在 06:44、07:18、18:36、18:52 四次报告 MeasuredValue = None", "None 值出现时间与 kitchen_cook_surface 开关操作高度吻合,其他传感器同期工作正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致热冲击或电磁干扰", "考虑将传感器重新定位或增加屏蔽,确保灶具使用期间仍能获得有效温度读数", "如问题持续,更换传感器或联系厂商确认是否为已知兼容性问题"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.32410454750061, "api_error": null} {"episode_id": "SQ5_TN_C_1199", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_C_1199.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261828, "scenario_id": null, "total_events": 256, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房灶具关闭后厨房窗户未及时关闭,且入户门在16:15开锁后未见关门/锁门记录。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在 06:59、07:05、18:44、19:05 四次报告 MeasuredValue = None。每次都发生在灶具状态变化前后,说明传感器可能受高温或油烟干扰导致读数丢失,属于设备异常。\",\n \"推理步骤2: 厨房窗户在 06:58:30 被打开(StateValue=False),但整个日志中没有对应的关闭记录(StateValue=True)。同样 19:04:30 再次打开,也无关闭记录。虽然做饭时开窗通风合理,但长时间未关窗在无人在家时段(07:45~16:15)存在安全隐患。\",\n \"推理步骤3: 16:15 入户门解锁并打开(contact=False),有人进入后儿童房检测到活动,但日志中没有对应的关门(contact=True)和锁门记录,直到 22:32:18 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能从16:15到22:32处于未关闭状态长达6小时以上。\",\n \"推理步骤4: 其余行为模式正常——06:29 儿童起床、06:30 大人起床、07:45 全家出门并自动锁门、16:15 孩子放学回家、17:54 大人回家开空调、18:43 做晚饭、20:48 孩子睡觉、22:32 大人睡觉并锁门,符合典型三口之家的作息。\",\n \"推理步骤5: 温度趋势合理:夜间约23°C,白天逐步升至25-26°C,午后回落,17:54开启制冷空调后客厅温度从24.5°C降至23.4°C,符合夏季自然温度曲线。无异常温升,排除火灾风险。\",\n \"推理步骤6: 所有门锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件,排除入侵威胁。烟雾报警器和漏水传感器全天无告警。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在 06:59、07:05、18:44、19:05 四次报告 MeasuredValue = None,传感器工作异常\",\n \"kitchen_window_contact 在 06:58:30 和 19:04:30 两次打开,日志中无对应关闭记录,全天出门时段窗户可能处于开启状态\",\n \"front_door_contact 在 16:15:02 打开后,直到 22:32:18 才记录关闭,入户门可能长时间未关\",\n \"16:15 开门后仅儿童房有活动记录,无大人在场,孩子独自在家且大门可能未关\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器,清洁或更换设备,确保其在灶具使用时仍能正常工作\",\n \"设置自动化规则:出门模式激活时检查厨房窗户是否关闭,若未关闭则发送提醒\",\n \"设置自动化规则:入户门打开超过一定时间(如5分钟)未关闭时,向家长手机推送告警\",\n \"考虑为儿童放学回家场景设置专属自动化:孩子进门后自动确认门锁状态,若未锁门则自动上锁并通知家长\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险;同时厨房灶具关闭后厨房窗户未及时关闭,且入户门在16:15开锁后未见关门/锁门记录。", "reasoning": ["推理步骤1: 厨房温度传感器在 06:59、07:05、18:44、19:05 四次报告 MeasuredValue = None。每次都发生在灶具状态变化前后,说明传感器可能受高温或油烟干扰导致读数丢失,属于设备异常。", "推理步骤2: 厨房窗户在 06:58:30 被打开(StateValue=False),但整个日志中没有对应的关闭记录(StateValue=True)。同样 19:04:30 再次打开,也无关闭记录。虽然做饭时开窗通风合理,但长时间未关窗在无人在家时段(07:45~16:15)存在安全隐患。", "推理步骤3: 16:15 入户门解锁并打开(contact=False),有人进入后儿童房检测到活动,但日志中没有对应的关门(contact=True)和锁门记录,直到 22:32:18 才出现 front_door_contact=True 和自动上锁。这意味着入户门可能从16:15到22:32处于未关闭状态长达6小时以上。", "推理步骤4: 其余行为模式正常——06:29 儿童起床、06:30 大人起床、07:45 全家出门并自动锁门、16:15 孩子放学回家、17:54 大人回家开空调、18:43 做晚饭、20:48 孩子睡觉、22:32 大人睡觉并锁门,符合典型三口之家的作息。", "推理步骤5: 温度趋势合理:夜间约23°C,白天逐步升至25-26°C,午后回落,17:54开启制冷空调后客厅温度从24.5°C降至23.4°C,符合夏季自然温度曲线。无异常温升,排除火灾风险。", "推理步骤6: 所有门锁操作均为 Manual 或 Auto 来源,无异常远程解锁或暴力开锁事件,排除入侵威胁。烟雾报警器和漏水传感器全天无告警。"], "key_evidence": ["kitchen_temp_sensor 在 06:59、07:05、18:44、19:05 四次报告 MeasuredValue = None,传感器工作异常", "kitchen_window_contact 在 06:58:30 和 19:04:30 两次打开,日志中无对应关闭记录,全天出门时段窗户可能处于开启状态", "front_door_contact 在 16:15:02 打开后,直到 22:32:18 才记录关闭,入户门可能长时间未关", "16:15 开门后仅儿童房有活动记录,无大人在场,孩子独自在家且大门可能未关"], "recommended_actions": ["检查厨房温度传感器,清洁或更换设备,确保其在灶具使用时仍能正常工作", "设置自动化规则:出门模式激活时检查厨房窗户是否关闭,若未关闭则发送提醒", "设置自动化规则:入户门打开超过一定时间(如5分钟)未关闭时,向家长手机推送告警", "考虑为儿童放学回家场景设置专属自动化:孩子进门后自动确认门锁状态,若未锁门则自动上锁并通知家长"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.41684055328369, "api_error": null} {"episode_id": "SQ5_TN_D_1173", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1173.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261802, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时老人晚间入户门及卫生间活动序列存在轻微不一致,需关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:59、10:51、16:59),灶具关闭后约1分钟也报告 None(06:37、11:33、17:38)。这一现象在三次烹饪中完全重复出现,说明并非偶发丢包,而是传感器在灶具状态切换时存在系统性故障。\",\n \"推理步骤2: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用期间无法正常读数,意味着在最需要温度监控的时段恰恰失去了监控能力,这是一个安全盲区。\",\n \"推理步骤3: 20:35 的事件序列略有异常——卫生间灯关闭后,卧室检测到人,但紧接着入户门传感器报告关闭(StateValue=True)并自动上锁。这暗示入户门在此前处于未关闭状态。回溯日志,08:22 老人回家后入户门没有关闭/上锁的记录,说明入户门从 08:22 到 20:35 可能一直处于未锁定或未完全关闭状态,持续约12小时。\",\n \"推理步骤4: 老人整体生活作息正常:05:36 起床、05:58 做早餐、07:03 出门、08:22 回家、12:22 午休、13:54 起床、16:58 做晚餐、20:35 准备就寝。灯光、运动传感器、窗帘操作均与独居老人的日常模式吻合。\",\n \"推理步骤5: 温度数据整体走势合理(夜间约22°C,午间峰值约25.8°C),各房间温差在正常范围内,未见异常高温或火灾迹象。烟雾报警器全天无触发。漏水传感器无报警。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:59:02、06:37:00、10:51:00、11:33:00、16:59:00、17:38:00),共6次异常读数\",\n \"入户门在 08:22 老人回家后无关门/上锁记录,直到 20:35:15 才出现 StateValue=True(门关闭)和自动上锁,中间约12小时入户门可能未锁\",\n \"烟雾报警器、漏水传感器全天无告警,排除火灾和水患风险\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:当前传感器在灶具开关时系统性失效,建议排查是否因灶具电磁干扰或传感器自身故障导致,必要时更换为抗干扰型号\",\n \"设置入户门未锁定超时告警:建议配置规则——入户门解锁超过10分钟未重新上锁时,向老人或家属手机推送提醒,防止长时间门户大开\",\n \"为厨房温度传感器 None 值设置实时告警:在灶具开启期间如果温度传感器连续报告无效值,应立即通知家属,避免烹饪期间失去温度监控\",\n \"建议家属定期远程检查设备状态日志,特别关注传感器离线或异常读数情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时老人晚间入户门及卫生间活动序列存在轻微不一致,需关注。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内均报告 MeasuredValue = None(05:59、10:51、16:59),灶具关闭后约1分钟也报告 None(06:37、11:33、17:38)。这一现象在三次烹饪中完全重复出现,说明并非偶发丢包,而是传感器在灶具状态切换时存在系统性故障。", "推理步骤2: 对于独居老人家庭,厨房温度传感器是火灾预警的关键环节。如果传感器在灶具使用期间无法正常读数,意味着在最需要温度监控的时段恰恰失去了监控能力,这是一个安全盲区。", "推理步骤3: 20:35 的事件序列略有异常——卫生间灯关闭后,卧室检测到人,但紧接着入户门传感器报告关闭(StateValue=True)并自动上锁。这暗示入户门在此前处于未关闭状态。回溯日志,08:22 老人回家后入户门没有关闭/上锁的记录,说明入户门从 08:22 到 20:35 可能一直处于未锁定或未完全关闭状态,持续约12小时。", "推理步骤4: 老人整体生活作息正常:05:36 起床、05:58 做早餐、07:03 出门、08:22 回家、12:22 午休、13:54 起床、16:58 做晚餐、20:35 准备就寝。灯光、运动传感器、窗帘操作均与独居老人的日常模式吻合。", "推理步骤5: 温度数据整体走势合理(夜间约22°C,午间峰值约25.8°C),各房间温差在正常范围内,未见异常高温或火灾迹象。烟雾报警器全天无触发。漏水传感器无报警。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间均报告 MeasuredValue = None(05:59:02、06:37:00、10:51:00、11:33:00、16:59:00、17:38:00),共6次异常读数", "入户门在 08:22 老人回家后无关门/上锁记录,直到 20:35:15 才出现 StateValue=True(门关闭)和自动上锁,中间约12小时入户门可能未锁", "烟雾报警器、漏水传感器全天无告警,排除火灾和水患风险"], "recommended_actions": ["检修或更换厨房温度传感器:当前传感器在灶具开关时系统性失效,建议排查是否因灶具电磁干扰或传感器自身故障导致,必要时更换为抗干扰型号", "设置入户门未锁定超时告警:建议配置规则——入户门解锁超过10分钟未重新上锁时,向老人或家属手机推送提醒,防止长时间门户大开", "为厨房温度传感器 None 值设置实时告警:在灶具开启期间如果温度传感器连续报告无效值,应立即通知家属,避免烹饪期间失去温度监控", "建议家属定期远程检查设备状态日志,特别关注传感器离线或异常读数情况"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.75608515739441, "api_error": null} {"episode_id": "SQ5_TN_D_1178", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1178.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-17T00:00:00", "seed": 20261807, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在一天内出现了6次 MeasuredValue = None 的读数(06:09、06:36、11:08、11:40、17:10、17:24),每次都发生在灶具开启或关闭后约1分钟内。\",\n \"推理步骤2: 其他两个温度传感器(客厅、卧室)全天48个读数均正常,无任何 None 值,说明这不是系统级通信问题,而是厨房温度传感器的个体问题。\",\n \"推理步骤3: None 值与灶具操作高度相关——灶具开启后约30秒至1分钟出现 None,灶具关闭后约1分钟也出现 None。可能是灶具产生的热量或电磁干扰导致传感器读数异常。\",\n \"推理步骤4: 厨房温度传感器是独居老人厨房安全监控的关键设备,若传感器在烹饪期间无法正常报告温度,则无法及时检测到厨房过热或火灾风险,这对安全构成隐患。\",\n \"推理步骤5: 除传感器异常外,其余行为模式均正常——老人约05:38起床、06:08做早餐、06:58外出晨练、08:31回家、12:23午休、14:02起床、17:09做晚餐、20:31洗漱、20:48就寝,作息规律,门锁正常开关,无入侵或漏水迹象。\",\n \"推理步骤6: 入户门在08:31开门后直到20:48才再次出现锁门记录,期间门锁状态未显示异常解锁事件,无入侵风险。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水威胁。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在06:09、06:36、11:08、11:40、17:10、17:24共6次报告 MeasuredValue = None\",\n \"None 值均与灶具 cook_surface 的开关操作在时间上强相关(开启后~30s或关闭后~1min)\",\n \"同期客厅和卧室温度传感器读数完全正常,排除系统性故障\",\n \"烹饪期间温度监控失效意味着无法检测厨房异常高温\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰\",\n \"对厨房温度传感器进行设备诊断或固件更新,排查 None 值的根本原因\",\n \"考虑临时增加厨房烟雾报警器的灵敏度,在温度传感器修复前弥补监控盲区\",\n \"如传感器持续异常,建议更换设备以确保独居老人的厨房安全监控不中断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,表明设备可能存在故障或通信异常,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 厨房温度传感器在一天内出现了6次 MeasuredValue = None 的读数(06:09、06:36、11:08、11:40、17:10、17:24),每次都发生在灶具开启或关闭后约1分钟内。", "推理步骤2: 其他两个温度传感器(客厅、卧室)全天48个读数均正常,无任何 None 值,说明这不是系统级通信问题,而是厨房温度传感器的个体问题。", "推理步骤3: None 值与灶具操作高度相关——灶具开启后约30秒至1分钟出现 None,灶具关闭后约1分钟也出现 None。可能是灶具产生的热量或电磁干扰导致传感器读数异常。", "推理步骤4: 厨房温度传感器是独居老人厨房安全监控的关键设备,若传感器在烹饪期间无法正常报告温度,则无法及时检测到厨房过热或火灾风险,这对安全构成隐患。", "推理步骤5: 除传感器异常外,其余行为模式均正常——老人约05:38起床、06:08做早餐、06:58外出晨练、08:31回家、12:23午休、14:02起床、17:09做晚餐、20:31洗漱、20:48就寝,作息规律,门锁正常开关,无入侵或漏水迹象。", "推理步骤6: 入户门在08:31开门后直到20:48才再次出现锁门记录,期间门锁状态未显示异常解锁事件,无入侵风险。烟雾报警器和漏水传感器全天无告警,排除火灾和漏水威胁。"], "key_evidence": ["厨房温度传感器在06:09、06:36、11:08、11:40、17:10、17:24共6次报告 MeasuredValue = None", "None 值均与灶具 cook_surface 的开关操作在时间上强相关(开启后~30s或关闭后~1min)", "同期客厅和卧室温度传感器读数完全正常,排除系统性故障", "烹饪期间温度监控失效意味着无法检测厨房异常高温"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或电磁干扰", "对厨房温度传感器进行设备诊断或固件更新,排查 None 值的根本原因", "考虑临时增加厨房烟雾报警器的灵敏度,在温度传感器修复前弥补监控盲区", "如传感器持续异常,建议更换设备以确保独居老人的厨房安全监控不中断"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 22.215550661087036, "api_error": null} {"episode_id": "SQ5_TN_D_1181", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1181.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-05T00:00:00", "seed": 20261810, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出归来后未完全关闭即自动上锁的时序值得关注。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在三次烹饪期间(06:10、11:09、16:55)及灶具关闭后(06:35、11:32、17:39)均报告 MeasuredValue = None,共计6次。正常传感器在灶具工作时温度应上升而非丢失读数,这表明传感器可能因高温保护断连、通信故障或硬件异常。\",\n \"推理步骤2: 厨房温度传感器故障对独居老人构成间接安全风险——若传感器失效,系统将无法在灶具引发过热或火灾时及时报警。烟雾报警器虽未触发(说明目前无火灾),但温度监测作为早期预警层的缺失降低了安全冗余。\",\n \"推理步骤3: 08:20 老人回家时,入户门开启(front_door_contact = False)但日志中未见门关闭事件(StateValue = True),直到 20:42:15 才记录到门关闭并自动上锁。这意味着入户门可能在整个白天处于未关闭状态(约12小时),对独居老人存在入侵风险。不过也可能是传感器未上报中间状态,需要确认。\",\n \"推理步骤4: 其余行为模式正常——老人 05:23 起床、洗漱、做早餐、07:06 出门(手动开锁、门开关、自动上锁)、08:20 回家、12:38 午休拉窗帘、13:56 起床、16:54 做晚餐、20:32 洗漱、20:42 就寝,符合独居老人的典型日常作息。\",\n \"推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常温升。门锁操作均为 Manual 或 Auto 来源,无可疑远程解锁。烟雾报警器和漏水传感器均未触发。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:10、06:35、11:09、11:32、16:55、17:39),而其他时段读数正常\",\n \"08:20:02 入户门打开(front_door_contact = False)后,直到 20:42:15 才记录到门关闭(StateValue = True),期间长达约12小时无门关闭记录\",\n \"其他所有安全传感器(烟雾报警器、漏水传感器)均未触发异常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,确认是否因灶具高温导致传感器保护性断连或存在硬件故障,必要时更换或重新定位传感器\",\n \"确认入户门传感器(front_door_contact)是否存在状态上报遗漏,检查门是否确实在白天长时间未关闭;如确认未关,建议设置门未关闭超时提醒(如超过5分钟未关门则推送告警)\",\n \"鉴于厨房温度传感器故障期间灶具仍在使用,建议增加灶具使用超时自动关闭规则(如超过45分钟未手动关闭则自动断气/断电),作为额外安全保障\",\n \"定期检查所有传感器的在线状态和电池电量,确保安全监测链路完整\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出归来后未完全关闭即自动上锁的时序值得关注。", "reasoning": ["推理步骤1: 厨房温度传感器在三次烹饪期间(06:10、11:09、16:55)及灶具关闭后(06:35、11:32、17:39)均报告 MeasuredValue = None,共计6次。正常传感器在灶具工作时温度应上升而非丢失读数,这表明传感器可能因高温保护断连、通信故障或硬件异常。", "推理步骤2: 厨房温度传感器故障对独居老人构成间接安全风险——若传感器失效,系统将无法在灶具引发过热或火灾时及时报警。烟雾报警器虽未触发(说明目前无火灾),但温度监测作为早期预警层的缺失降低了安全冗余。", "推理步骤3: 08:20 老人回家时,入户门开启(front_door_contact = False)但日志中未见门关闭事件(StateValue = True),直到 20:42:15 才记录到门关闭并自动上锁。这意味着入户门可能在整个白天处于未关闭状态(约12小时),对独居老人存在入侵风险。不过也可能是传感器未上报中间状态,需要确认。", "推理步骤4: 其余行为模式正常——老人 05:23 起床、洗漱、做早餐、07:06 出门(手动开锁、门开关、自动上锁)、08:20 回家、12:38 午休拉窗帘、13:56 起床、16:54 做晚餐、20:32 洗漱、20:42 就寝,符合独居老人的典型日常作息。", "推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常温升。门锁操作均为 Manual 或 Auto 来源,无可疑远程解锁。烟雾报警器和漏水传感器均未触发。"], "key_evidence": ["厨房温度传感器在灶具开启期间及关闭后共6次报告 MeasuredValue = None(06:10、06:35、11:09、11:32、16:55、17:39),而其他时段读数正常", "08:20:02 入户门打开(front_door_contact = False)后,直到 20:42:15 才记录到门关闭(StateValue = True),期间长达约12小时无门关闭记录", "其他所有安全传感器(烟雾报警器、漏水传感器)均未触发异常"], "recommended_actions": ["检查厨房温度传感器(kitchen_temp_sensor)的硬件状态和通信连接,确认是否因灶具高温导致传感器保护性断连或存在硬件故障,必要时更换或重新定位传感器", "确认入户门传感器(front_door_contact)是否存在状态上报遗漏,检查门是否确实在白天长时间未关闭;如确认未关,建议设置门未关闭超时提醒(如超过5分钟未关门则推送告警)", "鉴于厨房温度传感器故障期间灶具仍在使用,建议增加灶具使用超时自动关闭规则(如超过45分钟未手动关闭则自动断气/断电),作为额外安全保障", "定期检查所有传感器的在线状态和电池电量,确保安全监测链路完整"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.038419246673584, "api_error": null} {"episode_id": "SQ5_TN_D_1184", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1184.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-14T00:00:00", "seed": 20261813, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,削弱了厨房火灾/高温的监测能力。\",\n \"reasoning\": [\n \"推理步骤1: 老人的日常作息模式正常——05:34 起床如厕、05:52 进厨房做早餐、06:59 出门(门锁手动开锁后自动回锁)、08:22 回家、12:34 午休拉窗帘、13:51 起床、17:10 做晚餐、20:37 洗漱、20:46 回卧室就寝,整体生活节奏规律,无健康异常迹象。\",\n \"推理步骤2: 入侵风险排查——入户门在 06:59 和 08:22 两次开门均为手动操作且自动回锁,08:22 回家后门传感器未报告关闭(StateValue 未回 True),但 20:46 系统补报了门关闭并自动上锁。整日无未授权开锁事件,无深夜异常运动检测,窗户传感器无触发,排除入侵。\",\n \"推理步骤3: 火灾/烟雾风险排查——灶具三次使用时长分别约 29 分钟、12 分钟、17 分钟,均在合理范围内且正常关闭。烟雾报警器全天未触发。温度曲线随天气自然升降(夜间约 22°C,午间峰值约 25.8°C),无异常高温。\",\n \"推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无触发,排除漏水风险。\",\n \"推理步骤5: 设备故障发现——厨房温度传感器在三次灶具使用期间(05:53、06:22、11:10、11:22、17:11、17:28)共 6 次报告 MeasuredValue = None。正常传感器在灶具工作时应能读取到升高的温度值,而非返回空值。这意味着在灶具使用这一最需要温度监控的时段,传感器恰好失效,存在安全监测盲区。\",\n \"推理步骤6: 综合评估——对于独居老人家庭,厨房是火灾高风险区域。温度传感器在烹饪时段反复失效,会导致系统无法及时发现灶具忘关或油温过高等危险情况,虽然当前未造成实际危害,但属于需要关注的设备故障问题。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间 6 次报告 MeasuredValue = None(05:53:04、06:22:00、11:10:00、11:22:00、17:11:00、17:28:00),每次灶具使用都会触发该故障\",\n \"传感器在灶具关闭后的下一个整点读数恢复正常(如 06:30 报 2392、11:30 报 2560、17:30 报 2486),说明故障与灶具运行状态强相关\",\n \"08:22 老人回家时入户门传感器仅报告开门(StateValue=False)未报告关门,直到 20:46 才补报关闭状态,门传感器可能也存在状态上报延迟或遗漏\"\n ],\n \"recommended_actions\": [\n \"检查或更换厨房温度传感器——当前传感器在高温环境下反复失效,可能是安装位置离灶具过近导致超量程,建议调整安装位置或更换耐高温型号\",\n \"检查入户门磁传感器的安装状态——确认门磁间距是否合适,排除 08:22 开门后未上报关门状态的原因\",\n \"考虑为厨房灶具增加超时自动断气/断电保护——独居老人场景下,即使传感器失效也能有兜底安全措施\",\n \"确认烟雾报警器电池及功能正常——作为厨房温度传感器失效期间的备用安全防线,需确保其可靠性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器可能存在故障或受高温干扰失效,削弱了厨房火灾/高温的监测能力。", "reasoning": ["推理步骤1: 老人的日常作息模式正常——05:34 起床如厕、05:52 进厨房做早餐、06:59 出门(门锁手动开锁后自动回锁)、08:22 回家、12:34 午休拉窗帘、13:51 起床、17:10 做晚餐、20:37 洗漱、20:46 回卧室就寝,整体生活节奏规律,无健康异常迹象。", "推理步骤2: 入侵风险排查——入户门在 06:59 和 08:22 两次开门均为手动操作且自动回锁,08:22 回家后门传感器未报告关闭(StateValue 未回 True),但 20:46 系统补报了门关闭并自动上锁。整日无未授权开锁事件,无深夜异常运动检测,窗户传感器无触发,排除入侵。", "推理步骤3: 火灾/烟雾风险排查——灶具三次使用时长分别约 29 分钟、12 分钟、17 分钟,均在合理范围内且正常关闭。烟雾报警器全天未触发。温度曲线随天气自然升降(夜间约 22°C,午间峰值约 25.8°C),无异常高温。", "推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无触发,排除漏水风险。", "推理步骤5: 设备故障发现——厨房温度传感器在三次灶具使用期间(05:53、06:22、11:10、11:22、17:11、17:28)共 6 次报告 MeasuredValue = None。正常传感器在灶具工作时应能读取到升高的温度值,而非返回空值。这意味着在灶具使用这一最需要温度监控的时段,传感器恰好失效,存在安全监测盲区。", "推理步骤6: 综合评估——对于独居老人家庭,厨房是火灾高风险区域。温度传感器在烹饪时段反复失效,会导致系统无法及时发现灶具忘关或油温过高等危险情况,虽然当前未造成实际危害,但属于需要关注的设备故障问题。"], "key_evidence": ["厨房温度传感器在灶具开启期间 6 次报告 MeasuredValue = None(05:53:04、06:22:00、11:10:00、11:22:00、17:11:00、17:28:00),每次灶具使用都会触发该故障", "传感器在灶具关闭后的下一个整点读数恢复正常(如 06:30 报 2392、11:30 报 2560、17:30 报 2486),说明故障与灶具运行状态强相关", "08:22 老人回家时入户门传感器仅报告开门(StateValue=False)未报告关门,直到 20:46 才补报关闭状态,门传感器可能也存在状态上报延迟或遗漏"], "recommended_actions": ["检查或更换厨房温度传感器——当前传感器在高温环境下反复失效,可能是安装位置离灶具过近导致超量程,建议调整安装位置或更换耐高温型号", "检查入户门磁传感器的安装状态——确认门磁间距是否合适,排除 08:22 开门后未上报关门状态的原因", "考虑为厨房灶具增加超时自动断气/断电保护——独居老人场景下,即使传感器失效也能有兜底安全措施", "确认烟雾报警器电池及功能正常——作为厨房温度传感器失效期间的备用安全防线,需确保其可靠性"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.112048864364624, "api_error": null} {"episode_id": "SQ5_TN_D_1185", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1185.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-20T00:00:00", "seed": 20261814, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器多次报告 None 值,存在设备故障风险,可能影响对独居老人的厨房安全监控。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:31起床,05:41洗漱,05:56做早餐,07:01出门,08:39回家,12:21午休,14:00起床,16:51做晚餐,20:25洗漱,20:49就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入侵风险排除——07:01出门时手动开锁、门传感器开关、自动上锁的序列完整;08:39回家同理;20:49就寝前门锁确认为已锁状态(LockState=1),全天无异常开锁事件。\",\n \"推理步骤3: 厨房灶具使用合理——三次使用(05:56-06:33约37分钟,11:01-11:30约29分钟,16:51-17:32约41分钟)均在合理时长内,无遗忘关火迹象,烟雾报警器全天未触发。\",\n \"推理步骤4: 厨房温度传感器异常——在05:57、06:34、11:02、11:31、16:52、17:33共6次报告MeasuredValue=None。虽然每次都与灶具开启/关闭时间高度相关(可能是灶具产生的热量导致传感器超量程),但传感器应报告极值而非None,这表明传感器可能存在固件缺陷或硬件老化问题。\",\n \"推理步骤5: 该故障对独居老人安全构成隐患——厨房温度传感器是检测火灾、灶具遗忘等危险的重要辅助手段,如果传感器在高温时失效(报None),恰恰在最需要监控的时刻丧失了感知能力。\",\n \"推理步骤6: 其他设备状态正常——漏水传感器未触发,烟雾报警器未触发,窗户传感器无异常,温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.9°C),空调未使用属夏初合理范围。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间共6次报告 MeasuredValue = None(05:57、06:34、11:02、11:31、16:52、17:33),每次均与 kitchen_cook_surface 的开启或关闭时刻紧密关联\",\n \"传感器在灶具未使用时读数正常(如06:00报2406、06:30报2403),仅在灶具运行状态变化时出现None,说明故障与高温或状态切换有关\",\n \"全天无烟雾报警、无漏水报警、无异常入侵事件,门锁操作序列完整合规\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的工作状态,确认其测量量程是否覆盖灶具使用时的环境温度,必要时更换为耐高温型号\",\n \"对该传感器进行固件更新或重置,排除软件层面的报告异常\",\n \"在传感器修复前,建议增加灶具使用时长的自动化监控规则(如灶具开启超过45分钟未关闭则发出提醒),弥补温度传感器失效期间的安全监控空白\",\n \"定期检查独居老人家中所有传感器的在线状态和数据完整性,建立设备健康巡检机制\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器多次报告 None 值,存在设备故障风险,可能影响对独居老人的厨房安全监控。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:31起床,05:41洗漱,05:56做早餐,07:01出门,08:39回家,12:21午休,14:00起床,16:51做晚餐,20:25洗漱,20:49就寝,符合独居老人的典型日常规律。", "推理步骤2: 入侵风险排除——07:01出门时手动开锁、门传感器开关、自动上锁的序列完整;08:39回家同理;20:49就寝前门锁确认为已锁状态(LockState=1),全天无异常开锁事件。", "推理步骤3: 厨房灶具使用合理——三次使用(05:56-06:33约37分钟,11:01-11:30约29分钟,16:51-17:32约41分钟)均在合理时长内,无遗忘关火迹象,烟雾报警器全天未触发。", "推理步骤4: 厨房温度传感器异常——在05:57、06:34、11:02、11:31、16:52、17:33共6次报告MeasuredValue=None。虽然每次都与灶具开启/关闭时间高度相关(可能是灶具产生的热量导致传感器超量程),但传感器应报告极值而非None,这表明传感器可能存在固件缺陷或硬件老化问题。", "推理步骤5: 该故障对独居老人安全构成隐患——厨房温度传感器是检测火灾、灶具遗忘等危险的重要辅助手段,如果传感器在高温时失效(报None),恰恰在最需要监控的时刻丧失了感知能力。", "推理步骤6: 其他设备状态正常——漏水传感器未触发,烟雾报警器未触发,窗户传感器无异常,温度整体随昼夜自然波动(夜间约22°C,午间峰值约25.9°C),空调未使用属夏初合理范围。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间共6次报告 MeasuredValue = None(05:57、06:34、11:02、11:31、16:52、17:33),每次均与 kitchen_cook_surface 的开启或关闭时刻紧密关联", "传感器在灶具未使用时读数正常(如06:00报2406、06:30报2403),仅在灶具运行状态变化时出现None,说明故障与高温或状态切换有关", "全天无烟雾报警、无漏水报警、无异常入侵事件,门锁操作序列完整合规"], "recommended_actions": ["检查厨房温度传感器的工作状态,确认其测量量程是否覆盖灶具使用时的环境温度,必要时更换为耐高温型号", "对该传感器进行固件更新或重置,排除软件层面的报告异常", "在传感器修复前,建议增加灶具使用时长的自动化监控规则(如灶具开启超过45分钟未关闭则发出提醒),弥补温度传感器失效期间的安全监控空白", "定期检查独居老人家中所有传感器的在线状态和数据完整性,建立设备健康巡检机制"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.757535457611084, "api_error": null} {"episode_id": "SQ5_TN_D_1186", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1186.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20261815, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。\",\n \"reasoning\": [\n \"推理步骤1: 整体生活作息正常——老人约05:28起床、05:41如厕、06:01做早餐、07:01出门、08:31回家、12:35午休、14:05起床、16:54做晚餐、20:20洗漱、20:45就寝,符合独居老人的典型日常规律。\",\n \"推理步骤2: 入侵排查——全天仅有两次出入门事件(07:01出门、08:31回家),门锁均为手动开锁后自动上锁,无异常开锁源或未授权操作;20:45就寝前门锁确认为锁定状态(LockState=1),无入侵迹象。\",\n \"推理步骤3: 火灾/烟雾排查——三次灶具使用时长分别约20分钟、31分钟、31分钟,均在合理范围内;烟雾报警器全天未触发;厨房温度在灶具关闭后的半小时读数正常,无异常升温。\",\n \"推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无任何报警事件,排除漏水风险。\",\n \"推理步骤5: 厨房温度传感器异常——在三次灶具开启期间(06:02、06:23、10:53、11:24、16:55、17:26),kitchen_temp_sensor 均报告 MeasuredValue = None,共出现6次。传感器在灶具关闭后的下一个整点读数恢复正常值,说明传感器本身未完全损坏,但在灶具工作时无法正常采集数据。这意味着如果灶具引发真正的高温危险,该传感器将无法提供预警。\",\n \"推理步骤6: 健康状况排查——老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,未出现长时间无活动或异常滞留某区域的情况(卫生间使用时间约20分钟和25分钟,均在正常范围),无明显健康异常信号。\",\n \"推理步骤7: 温度趋势正常——室内温度随夏季日间升温(峰值约25.7°C在12:00左右)、夜间降温的自然规律波动,卧室始终比客厅/厨房低约1°C(可能窗户通风或朝向原因),均在舒适范围内,无异常。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(06:02、06:23、10:53、11:24、16:55、17:26),灶具关闭后恢复正常读数\",\n \"该故障模式在三次独立的烹饪事件中100%复现,具有高度一致性,排除偶发通信故障的可能\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器进入保护模式或超出量程,建议将其移至距灶具较远但仍能监测厨房整体温度的位置\",\n \"在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为烹饪期间的主要安全监测手段\",\n \"考虑为灶具设置自动关闭定时器(如超过30-40分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或被高温干扰,无法在烹饪期间提供安全监测。", "reasoning": ["推理步骤1: 整体生活作息正常——老人约05:28起床、05:41如厕、06:01做早餐、07:01出门、08:31回家、12:35午休、14:05起床、16:54做晚餐、20:20洗漱、20:45就寝,符合独居老人的典型日常规律。", "推理步骤2: 入侵排查——全天仅有两次出入门事件(07:01出门、08:31回家),门锁均为手动开锁后自动上锁,无异常开锁源或未授权操作;20:45就寝前门锁确认为锁定状态(LockState=1),无入侵迹象。", "推理步骤3: 火灾/烟雾排查——三次灶具使用时长分别约20分钟、31分钟、31分钟,均在合理范围内;烟雾报警器全天未触发;厨房温度在灶具关闭后的半小时读数正常,无异常升温。", "推理步骤4: 漏水排查——卫生间和厨房漏水传感器全天无任何报警事件,排除漏水风险。", "推理步骤5: 厨房温度传感器异常——在三次灶具开启期间(06:02、06:23、10:53、11:24、16:55、17:26),kitchen_temp_sensor 均报告 MeasuredValue = None,共出现6次。传感器在灶具关闭后的下一个整点读数恢复正常值,说明传感器本身未完全损坏,但在灶具工作时无法正常采集数据。这意味着如果灶具引发真正的高温危险,该传感器将无法提供预警。", "推理步骤6: 健康状况排查——老人全天活动轨迹连贯,各房间运动传感器按合理时序触发,未出现长时间无活动或异常滞留某区域的情况(卫生间使用时间约20分钟和25分钟,均在正常范围),无明显健康异常信号。", "推理步骤7: 温度趋势正常——室内温度随夏季日间升温(峰值约25.7°C在12:00左右)、夜间降温的自然规律波动,卧室始终比客厅/厨房低约1°C(可能窗户通风或朝向原因),均在舒适范围内,无异常。"], "key_evidence": ["厨房温度传感器在灶具开启期间6次报告 MeasuredValue = None(06:02、06:23、10:53、11:24、16:55、17:26),灶具关闭后恢复正常读数", "该故障模式在三次独立的烹饪事件中100%复现,具有高度一致性,排除偶发通信故障的可能"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时传感器进入保护模式或超出量程,建议将其移至距灶具较远但仍能监测厨房整体温度的位置", "在传感器问题解决前,确保厨房烟雾报警器(kitchen_smoke_alarm)工作正常,作为烹饪期间的主要安全监测手段", "考虑为灶具设置自动关闭定时器(如超过30-40分钟未手动操作则自动断气/断电),为独居老人增加一层安全保障"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.397910356521606, "api_error": null} {"episode_id": "SQ5_TN_D_1187", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1187.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-30T00:00:00", "seed": 20261816, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出期间(07:02-08:20)处于未锁状态。\",\n \"reasoning\": [\n \"推理步骤1: 老人整体作息规律正常——05:21起床、05:34洗漱、05:58做早餐、07:02出门、08:20回家、12:30午休、14:08起床、16:55做晚餐、20:35洗漱、20:50就寝,符合独居老人的典型生活模式。\",\n \"推理步骤2: 厨房灶具三次使用(05:58-06:34、10:54-11:39、16:55-17:38)时长分别约36分钟、45分钟、43分钟,均在合理范围内,且每次使用后都正常关闭,无忘关灶具的风险。\",\n \"推理步骤3: 但厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(05:59:09、10:55:00、16:56:00),灶具关闭后约1分钟也报告 None(06:35:00、11:40:00、17:39:00),共出现6次。这不是正常的高温读数,而是传感器返回空值,说明传感器在灶具工作产生的热量或电磁环境下出现故障或通信中断。\",\n \"推理步骤4: 厨房温度传感器故障意味着在灶具使用的关键时段无法监测厨房温度,如果发生灶具异常导致温度过高,系统将无法及时发出预警,对独居老人构成安全隐患。\",\n \"推理步骤5: 07:02老人手动开锁(LockOperationType=1)出门,门关闭后门锁自动上锁(LockOperationType=0, Auto),这是正常的。08:20回家时手动开锁进门,但此后日志中未见门锁重新上锁的记录,直到20:50就寝时才出现自动上锁事件。这意味着入户门在08:20至20:50期间可能处于未锁状态长达约12.5小时。\",\n \"推理步骤6: 温度数据整体趋势合理——夜间22-23°C,午间峰值约25.8°C,符合夏季室内温度变化规律。各房间无异常温升,烟雾报警器和漏水传感器均未触发,排除火灾和漏水风险。\",\n \"推理步骤7: 门窗传感器、运动传感器的触发模式与老人的活动轨迹一致,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:59:09、06:35:00、10:55:00、11:40:00、16:56:00、17:39:00),在灶具未使用时段读数正常\",\n \"08:20老人回家开锁后,直到20:50就寝时才记录到门锁上锁事件,期间约12.5小时入户门可能未上锁\",\n \"厨房烟雾报警器和漏水传感器全天未触发,排除火灾和漏水威胁\"\n ],\n \"recommended_actions\": [\n \"检修或更换厨房温度传感器:该传感器在灶具工作时反复失效,无法在最需要温度监控的时段提供数据,建议尽快排查原因(可能是耐热性不足、电磁干扰或通信模块问题)\",\n \"检查入户门锁自动上锁策略:建议配置门锁在关门后一定时间内(如5分钟)自动上锁,避免老人忘记锁门导致长时间门户未锁\",\n \"为厨房温度传感器设置离线/空值告警规则:当传感器在灶具开启期间报告 None 时,立即通知家属或护理人员\",\n \"建议家属关注老人日常安全,可考虑增加定时提醒锁门的自动化场景\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人外出期间(07:02-08:20)处于未锁状态。", "reasoning": ["推理步骤1: 老人整体作息规律正常——05:21起床、05:34洗漱、05:58做早餐、07:02出门、08:20回家、12:30午休、14:08起床、16:55做晚餐、20:35洗漱、20:50就寝,符合独居老人的典型生活模式。", "推理步骤2: 厨房灶具三次使用(05:58-06:34、10:54-11:39、16:55-17:38)时长分别约36分钟、45分钟、43分钟,均在合理范围内,且每次使用后都正常关闭,无忘关灶具的风险。", "推理步骤3: 但厨房温度传感器在灶具开启后约1分钟内均报告 MeasuredValue = None(05:59:09、10:55:00、16:56:00),灶具关闭后约1分钟也报告 None(06:35:00、11:40:00、17:39:00),共出现6次。这不是正常的高温读数,而是传感器返回空值,说明传感器在灶具工作产生的热量或电磁环境下出现故障或通信中断。", "推理步骤4: 厨房温度传感器故障意味着在灶具使用的关键时段无法监测厨房温度,如果发生灶具异常导致温度过高,系统将无法及时发出预警,对独居老人构成安全隐患。", "推理步骤5: 07:02老人手动开锁(LockOperationType=1)出门,门关闭后门锁自动上锁(LockOperationType=0, Auto),这是正常的。08:20回家时手动开锁进门,但此后日志中未见门锁重新上锁的记录,直到20:50就寝时才出现自动上锁事件。这意味着入户门在08:20至20:50期间可能处于未锁状态长达约12.5小时。", "推理步骤6: 温度数据整体趋势合理——夜间22-23°C,午间峰值约25.8°C,符合夏季室内温度变化规律。各房间无异常温升,烟雾报警器和漏水传感器均未触发,排除火灾和漏水风险。", "推理步骤7: 门窗传感器、运动传感器的触发模式与老人的活动轨迹一致,无入侵迹象。"], "key_evidence": ["厨房温度传感器在三次灶具使用期间共6次报告 MeasuredValue = None(05:59:09、06:35:00、10:55:00、11:40:00、16:56:00、17:39:00),在灶具未使用时段读数正常", "08:20老人回家开锁后,直到20:50就寝时才记录到门锁上锁事件,期间约12.5小时入户门可能未上锁", "厨房烟雾报警器和漏水传感器全天未触发,排除火灾和漏水威胁"], "recommended_actions": ["检修或更换厨房温度传感器:该传感器在灶具工作时反复失效,无法在最需要温度监控的时段提供数据,建议尽快排查原因(可能是耐热性不足、电磁干扰或通信模块问题)", "检查入户门锁自动上锁策略:建议配置门锁在关门后一定时间内(如5分钟)自动上锁,避免老人忘记锁门导致长时间门户未锁", "为厨房温度传感器设置离线/空值告警规则:当传感器在灶具开启期间报告 None 时,立即通知家属或护理人员", "建议家属关注老人日常安全,可考虑增加定时提醒锁门的自动化场景"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.21665048599243, "api_error": null} {"episode_id": "SQ5_TN_D_1188", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1188.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261817, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间及关闭后多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(06:05、11:06、17:10),且在灶具关闭后1分钟再次报告 None(06:33、11:38、17:37),共出现6次无效读数。\",\n \"推理步骤2: 正常温度传感器即使在灶具使用时也应能报告数值(哪怕偏高),返回 None 表示传感器测量失败或超出量程,这是设备异常信号。\",\n \"推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在烹饪时失效,一旦发生灶具忘关或油烟过大的情况,系统将无法及时发出高温预警。\",\n \"推理步骤4: 其余行为模式正常——老人05:35起床、06:04做早餐、07:09外出、08:20回家、12:36午休、17:09做晚餐、20:43就寝,符合独居老人的典型日常作息。\",\n \"推理步骤5: 入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象;烟雾报警器未触发;漏水传感器未报警;温度整体随日照变化合理。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在灶具使用期间及关闭后共6次报告 MeasuredValue = None(06:05、06:33、11:06、11:38、17:10、17:37)\",\n \"同时段客厅和卧室温度传感器均正常报告数值,排除系统性通信故障\",\n \"该现象每次烹饪都重复出现,具有规律性,指向传感器本身对高温/蒸汽的耐受问题\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或蒸汽影响\",\n \"考虑更换耐高温型温度传感器或将传感器移至远离灶具但仍能监测厨房整体温度的位置\",\n \"在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"建议设置灶具使用超时提醒(如超过45分钟未关闭则告警),作为温度监测失效时的补充安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间及关闭后多次报告 None 值,表明传感器可能存在故障或受高温干扰失效。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后约30秒内报告 MeasuredValue = None(06:05、11:06、17:10),且在灶具关闭后1分钟再次报告 None(06:33、11:38、17:37),共出现6次无效读数。", "推理步骤2: 正常温度传感器即使在灶具使用时也应能报告数值(哪怕偏高),返回 None 表示传感器测量失败或超出量程,这是设备异常信号。", "推理步骤3: 对于独居老人家庭,厨房温度监测是火灾预警的关键环节。如果传感器在烹饪时失效,一旦发生灶具忘关或油烟过大的情况,系统将无法及时发出高温预警。", "推理步骤4: 其余行为模式正常——老人05:35起床、06:04做早餐、07:09外出、08:20回家、12:36午休、17:09做晚餐、20:43就寝,符合独居老人的典型日常作息。", "推理步骤5: 入户门锁操作均为手动开锁+自动上锁,无异常入侵迹象;烟雾报警器未触发;漏水传感器未报警;温度整体随日照变化合理。"], "key_evidence": ["kitchen_temp_sensor 在灶具使用期间及关闭后共6次报告 MeasuredValue = None(06:05、06:33、11:06、11:38、17:10、17:37)", "同时段客厅和卧室温度传感器均正常报告数值,排除系统性通信故障", "该现象每次烹饪都重复出现,具有规律性,指向传感器本身对高温/蒸汽的耐受问题"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距离灶具过近导致受热或蒸汽影响", "考虑更换耐高温型温度传感器或将传感器移至远离灶具但仍能监测厨房整体温度的位置", "在传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "建议设置灶具使用超时提醒(如超过45分钟未关闭则告警),作为温度监测失效时的补充安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.484691381454468, "api_error": null} {"episode_id": "SQ5_TN_D_1195", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1195.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-27T00:00:00", "seed": 20261824, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人已回家后出现未关闭的可疑状态。\",\n \"reasoning\": [\n \"推理步骤1: 厨房温度传感器在灶具开启后(06:11:05、10:54:00、17:00:00)以及灶具关闭后(06:37:00、11:24:00、17:39:00)均报告 MeasuredValue = None,共出现6次。正常传感器在灶具使用时应报告升高的温度值而非空值,这说明传感器可能因高温干扰、通信中断或硬件故障而无法正常读数。\",\n \"推理步骤2: 厨房温度传感器的故障对独居老人构成安全隐患——如果灶具忘关或发生火灾,温度传感器无法提供有效的温度异常预警,削弱了厨房安全监控能力。\",\n \"推理步骤3: 20:48:20 入户门传感器报告 StateValue = True(门关闭)并自动上锁,但老人早在 08:29 就已回家,且 07:06:14 门已自动锁上。20:48 时老人正从客厅转移到卧室准备就寝,此时出现门锁/门传感器事件略显异常,可能是门锁状态刷新或传感器抖动,但也不排除门在白天一直未完全关好直到此刻才触发关闭。\",\n \"推理步骤4: 其余行为模式正常——老人 05:24 起床、06:10 做早餐、07:06 出门、08:29 回家、12:32 午休拉窗帘、13:58 起床、16:59 做晚餐、20:30 洗漱、20:48 就寝,符合独居老人的典型日常作息。\",\n \"推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常高温或低温。烟雾报警器和漏水传感器全天无告警。门窗状态整体正常,无入侵迹象。\"\n ],\n \"key_evidence\": [\n \"厨房温度传感器在灶具使用前后共6次报告 MeasuredValue = None(06:11:05、06:37:00、10:54:00、11:24:00、17:00:00、17:39:00)\",\n \"20:48:20 老人已在室内但入户门传感器触发关闭事件并自动上锁,时间点与老人 08:29 回家相隔超过12小时\",\n \"灶具每次使用时长合理(约25-39分钟),但传感器在此期间完全失效,无法提供温度监控\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热保护或通信模块故障,必要时更换或重新定位传感器\",\n \"在厨房温度传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常\",\n \"检查入户门锁和门磁传感器的安装状态,确认是否存在门未完全关闭的情况,避免独居老人家中门户安全隐患\",\n \"考虑为灶具增加超时自动关闭功能,作为温度传感器失效时的备用安全措施\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或通信异常;同时入户门在老人已回家后出现未关闭的可疑状态。", "reasoning": ["推理步骤1: 厨房温度传感器在灶具开启后(06:11:05、10:54:00、17:00:00)以及灶具关闭后(06:37:00、11:24:00、17:39:00)均报告 MeasuredValue = None,共出现6次。正常传感器在灶具使用时应报告升高的温度值而非空值,这说明传感器可能因高温干扰、通信中断或硬件故障而无法正常读数。", "推理步骤2: 厨房温度传感器的故障对独居老人构成安全隐患——如果灶具忘关或发生火灾,温度传感器无法提供有效的温度异常预警,削弱了厨房安全监控能力。", "推理步骤3: 20:48:20 入户门传感器报告 StateValue = True(门关闭)并自动上锁,但老人早在 08:29 就已回家,且 07:06:14 门已自动锁上。20:48 时老人正从客厅转移到卧室准备就寝,此时出现门锁/门传感器事件略显异常,可能是门锁状态刷新或传感器抖动,但也不排除门在白天一直未完全关好直到此刻才触发关闭。", "推理步骤4: 其余行为模式正常——老人 05:24 起床、06:10 做早餐、07:06 出门、08:29 回家、12:32 午休拉窗帘、13:58 起床、16:59 做晚餐、20:30 洗漱、20:48 就寝,符合独居老人的典型日常作息。", "推理步骤5: 温度整体趋势合理(夜间约22°C,午间峰值约25.9°C),无异常高温或低温。烟雾报警器和漏水传感器全天无告警。门窗状态整体正常,无入侵迹象。"], "key_evidence": ["厨房温度传感器在灶具使用前后共6次报告 MeasuredValue = None(06:11:05、06:37:00、10:54:00、11:24:00、17:00:00、17:39:00)", "20:48:20 老人已在室内但入户门传感器触发关闭事件并自动上锁,时间点与老人 08:29 回家相隔超过12小时", "灶具每次使用时长合理(约25-39分钟),但传感器在此期间完全失效,无法提供温度监控"], "recommended_actions": ["检查厨房温度传感器硬件状态,确认是否因灶具高温导致传感器过热保护或通信模块故障,必要时更换或重新定位传感器", "在厨房温度传感器修复前,加强对厨房烟雾报警器的依赖,确保其电池和功能正常", "检查入户门锁和门磁传感器的安装状态,确认是否存在门未完全关闭的情况,避免独居老人家中门户安全隐患", "考虑为灶具增加超时自动关闭功能,作为温度传感器失效时的备用安全措施"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.33828091621399, "api_error": null} {"episode_id": "SQ5_TN_D_1197", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TN_D_1197.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TN", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-03T00:00:00", "seed": 20261826, "scenario_id": null, "total_events": 204, "anomaly_events_count": 0}, "ground_truth": {"scenario_id": "TN", "scenario_name": "Normal — no anomaly", "category": "none", "is_anomaly": false, "threat_type": "none", "variant": "TN"}, "raw_response": "\n\n```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"device_fault\",\n \"threat_description\": \"厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。\",\n \"reasoning\": [\n \"推理步骤1: 老人的整体作息规律正常——05:25起床、06:06做早餐、07:09外出、08:27回家、12:40午休、16:50做晚餐、20:53就寝,符合独居老人的典型生活模式。\",\n \"推理步骤2: 入侵风险排查——07:09外出时手动开锁、门开关后自动上锁;08:27回家同样手动开锁进入,全天仅这两次门锁操作,无异常开锁事件。20:53就寝前门锁确认为已锁状态(LockState=1),入户门传感器显示关闭(StateValue=True),安全无异常。\",\n \"推理步骤3: 灶具使用安全排查——三次做饭(06:06-06:32约26分钟、11:00-11:28约28分钟、16:50-17:29约39分钟),每次均在合理时长内关闭,未出现长时间无人看管的情况(厨房运动传感器在灶具开启前均检测到有人),烟雾报警器全天未触发。\",\n \"推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 共报告了6次 MeasuredValue = None(06:07、06:33、11:01、11:29、16:51、17:30),均出现在灶具开启后约30秒至灶具关闭后约1分钟的时间窗口内。而灶具未使用时,该传感器读数正常。这说明传感器在高温环境下无法正常工作。\",\n \"推理步骤5: 该故障的安全影响——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用(最需要监控的时段)时恰好失效,一旦发生灶具引燃等意外,系统将无法通过温度异常升高来提前预警,只能依赖烟雾报警器作为最后防线。对独居老人而言,这降低了安全冗余度。\",\n \"推理步骤6: 其他设备状态正常——漏水传感器全天未触发,烟雾报警器未触发,各房间温度随昼夜自然变化(夜间约22°C,午间峰值约25.7°C),空调未开启但室温在合理范围内,窗户传感器无异常开启记录。\"\n ],\n \"key_evidence\": [\n \"kitchen_temp_sensor 在三次灶具使用期间共6次报告 MeasuredValue = None(06:07、06:33、11:01、11:29、16:51、17:30),灶具未使用时读数正常\",\n \"故障模式高度一致:每次均在灶具开启后约30秒出现 None,灶具关闭后约1分钟再次出现 None,随后恢复正常读数\",\n \"全天无入侵、火灾、漏水等安全事件,老人作息规律正常\"\n ],\n \"recommended_actions\": [\n \"检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或触发保护机制,建议将其移至远离灶具热源但仍能监测厨房整体温度的位置\",\n \"在传感器问题修复前,可考虑设置灶具使用时长上限告警(如超过45分钟未关闭则提醒),作为温度传感器失效期间的补偿监控手段\",\n \"确认烟雾报警器 kitchen_smoke_alarm 工作正常并定期测试,在温度传感器不可靠期间它是厨房火灾的唯一自动检测手段\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "device_fault", "threat_description": "厨房温度传感器在灶具使用期间多次报告 None 值,表明传感器存在故障或受灶具热源干扰失效,对独居老人的厨房安全监控构成隐患。", "reasoning": ["推理步骤1: 老人的整体作息规律正常——05:25起床、06:06做早餐、07:09外出、08:27回家、12:40午休、16:50做晚餐、20:53就寝,符合独居老人的典型生活模式。", "推理步骤2: 入侵风险排查——07:09外出时手动开锁、门开关后自动上锁;08:27回家同样手动开锁进入,全天仅这两次门锁操作,无异常开锁事件。20:53就寝前门锁确认为已锁状态(LockState=1),入户门传感器显示关闭(StateValue=True),安全无异常。", "推理步骤3: 灶具使用安全排查——三次做饭(06:06-06:32约26分钟、11:00-11:28约28分钟、16:50-17:29约39分钟),每次均在合理时长内关闭,未出现长时间无人看管的情况(厨房运动传感器在灶具开启前均检测到有人),烟雾报警器全天未触发。", "推理步骤4: 厨房温度传感器异常——在三次灶具使用期间,kitchen_temp_sensor 共报告了6次 MeasuredValue = None(06:07、06:33、11:01、11:29、16:51、17:30),均出现在灶具开启后约30秒至灶具关闭后约1分钟的时间窗口内。而灶具未使用时,该传感器读数正常。这说明传感器在高温环境下无法正常工作。", "推理步骤5: 该故障的安全影响——厨房温度传感器是火灾预警的重要辅助手段。如果传感器在灶具使用(最需要监控的时段)时恰好失效,一旦发生灶具引燃等意外,系统将无法通过温度异常升高来提前预警,只能依赖烟雾报警器作为最后防线。对独居老人而言,这降低了安全冗余度。", "推理步骤6: 其他设备状态正常——漏水传感器全天未触发,烟雾报警器未触发,各房间温度随昼夜自然变化(夜间约22°C,午间峰值约25.7°C),空调未开启但室温在合理范围内,窗户传感器无异常开启记录。"], "key_evidence": ["kitchen_temp_sensor 在三次灶具使用期间共6次报告 MeasuredValue = None(06:07、06:33、11:01、11:29、16:51、17:30),灶具未使用时读数正常", "故障模式高度一致:每次均在灶具开启后约30秒出现 None,灶具关闭后约1分钟再次出现 None,随后恢复正常读数", "全天无入侵、火灾、漏水等安全事件,老人作息规律正常"], "recommended_actions": ["检查厨房温度传感器的安装位置,确认是否距灶具过近导致高温时超出量程或触发保护机制,建议将其移至远离灶具热源但仍能监测厨房整体温度的位置", "在传感器问题修复前,可考虑设置灶具使用时长上限告警(如超过45分钟未关闭则提醒),作为温度传感器失效期间的补偿监控手段", "确认烟雾报警器 kitchen_smoke_alarm 工作正常并定期测试,在温度传感器不可靠期间它是厨房火灾的唯一自动检测手段"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "FALSE_ALARM", "is_miss": false, "is_false_alarm": true, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.001692533493042, "api_error": null} {"episode_id": "SQ5_TP_A_1013", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1013.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261642, "scenario_id": "INS-01", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T04:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨4:11客厅窗户在无人开锁入户的情况下被打开,且入户门始终处于锁定状态,高度疑似夜间破窗入侵。\",\n \"reasoning\": [\n \"推理步骤1: 在04:11,客厅窗户传感器报告 StateValue=False(窗户打开),此时为深夜凌晨,住户应处于睡眠状态。\",\n \"推理步骤2: 窗户打开后仅5秒(04:11:05),客厅运动传感器检测到有人(Occupancy=1),并在04:11:30再次确认有人存在,说明有人通过窗户进入了室内。\",\n \"推理步骤3: 检查入户门状态——从前一天晚上到早上07:38住户出门,入户门锁始终没有解锁/开门记录,说明这个人不是通过正门进入的。\",\n \"推理步骤4: 住户的正常作息模式为06:15起床(卧室运动传感器触发),07:38出门。凌晨4点住户应在卧室睡觉,不会去客厅开窗。\",\n \"推理步骤5: 04:11:45厨房灯被打开,但没有对应的厨房运动传感器事件,且住户此时应在卧室——这与入侵者在室内活动的行为一致。\",\n \"推理步骤6: 整个过程中卧室运动传感器没有触发(直到06:15才触发),进一步证实住户一直在卧室睡觉,客厅的活动来自外部入侵者。\"\n ],\n \"key_evidence\": [\n \"04:11:00 客厅窗户传感器 StateValue=False(窗户被打开),时间为深夜凌晨\",\n \"04:11:05 和 04:11:30 客厅运动传感器连续两次检测到有人(Occupancy=1),紧随窗户打开之后\",\n \"入户门锁在04:11前后无任何解锁记录,排除从正门进入的可能\",\n \"04:11:45 厨房灯被打开,表明入侵者在室内移动活动\",\n \"卧室运动传感器在06:15之前无触发,住户一直在卧室睡眠中\"\n ],\n \"recommended_actions\": [\n \"立即触发全屋警报(声光报警),打开所有灯光以震慑入侵者\",\n \"自动锁定入户门锁(确认 DoorLock.LockState=1),防止入侵者从正门逃离或同伙进入\",\n \"立即向住户手机推送高优先级入侵警报通知,附带事件时间和触发设备信息\",\n \"自动拨打110报警电话或通知物业安保,提供入侵时间(04:11)和入侵方式(客厅窗户)\",\n \"如有摄像头,立即开始录像并保存客厅及玄关区域的视频证据\",\n \"关闭客厅窗帘(living_room_window)以阻碍入侵者视线和逃跑路线\",\n \"事后检查客厅窗户是否存在物理损坏,评估是否需要加装窗户防盗锁或破碎传感器\",\n \"建议为窗户传感器增加玻璃破碎检测功能,实现更早期的入侵预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨4:11客厅窗户在无人开锁入户的情况下被打开,且入户门始终处于锁定状态,高度疑似夜间破窗入侵。", "reasoning": ["推理步骤1: 在04:11,客厅窗户传感器报告 StateValue=False(窗户打开),此时为深夜凌晨,住户应处于睡眠状态。", "推理步骤2: 窗户打开后仅5秒(04:11:05),客厅运动传感器检测到有人(Occupancy=1),并在04:11:30再次确认有人存在,说明有人通过窗户进入了室内。", "推理步骤3: 检查入户门状态——从前一天晚上到早上07:38住户出门,入户门锁始终没有解锁/开门记录,说明这个人不是通过正门进入的。", "推理步骤4: 住户的正常作息模式为06:15起床(卧室运动传感器触发),07:38出门。凌晨4点住户应在卧室睡觉,不会去客厅开窗。", "推理步骤5: 04:11:45厨房灯被打开,但没有对应的厨房运动传感器事件,且住户此时应在卧室——这与入侵者在室内活动的行为一致。", "推理步骤6: 整个过程中卧室运动传感器没有触发(直到06:15才触发),进一步证实住户一直在卧室睡觉,客厅的活动来自外部入侵者。"], "key_evidence": ["04:11:00 客厅窗户传感器 StateValue=False(窗户被打开),时间为深夜凌晨", "04:11:05 和 04:11:30 客厅运动传感器连续两次检测到有人(Occupancy=1),紧随窗户打开之后", "入户门锁在04:11前后无任何解锁记录,排除从正门进入的可能", "04:11:45 厨房灯被打开,表明入侵者在室内移动活动", "卧室运动传感器在06:15之前无触发,住户一直在卧室睡眠中"], "recommended_actions": ["立即触发全屋警报(声光报警),打开所有灯光以震慑入侵者", "自动锁定入户门锁(确认 DoorLock.LockState=1),防止入侵者从正门逃离或同伙进入", "立即向住户手机推送高优先级入侵警报通知,附带事件时间和触发设备信息", "自动拨打110报警电话或通知物业安保,提供入侵时间(04:11)和入侵方式(客厅窗户)", "如有摄像头,立即开始录像并保存客厅及玄关区域的视频证据", "关闭客厅窗帘(living_room_window)以阻碍入侵者视线和逃跑路线", "事后检查客厅窗户是否存在物理损坏,评估是否需要加装窗户防盗锁或破碎传感器", "建议为窗户传感器增加玻璃破碎检测功能,实现更早期的入侵预警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.681073665618896, "api_error": null} {"episode_id": "SQ5_TP_A_1017", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1017.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261646, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-11T15:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"住户外出期间,厨房窗户被短暂打开,客厅运动传感器随即检测到人体活动,高度疑似通过厨房窗户非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:11 关灯、手动开锁出门,门自动上锁,此后家中应无人。直到 18:11 住户才通过前门回家。因此 07:11–18:11 为确认的无人在家时段。\",\n \"推理步骤2: 在无人时段内,15:24:00 厨房窗户传感器 StateValue=False(窗户被打开),仅 8 秒后(15:24:08)客厅运动传感器检测到 Occupancy=1,说明有人从厨房窗户进入并移动到客厅。\",\n \"推理步骤3: 客厅运动传感器在 15:25、15:26 持续报告 Occupancy=1,表明入侵者在室内活动了约 3 分钟。\",\n \"推理步骤4: 15:27:00 厨房窗户关闭(StateValue=True),15:27:05 客厅运动传感器恢复 Occupancy=0,入侵者离开。整个过程仅持续约 3 分钟,符合快速入室盗窃的行为模式。\",\n \"推理步骤5: 期间前门锁始终处于上锁状态(LockState=1),前门传感器未触发,排除了住户或授权人员通过正门进入的可能性。\",\n \"推理步骤6: 没有任何灯光、空调等设备被操作,说明入侵者未使用智能家居系统,进一步排除了远程控制或自动化场景触发的可能。\"\n ],\n \"key_evidence\": [\n \"15:24:00 厨房窗户传感器打开(StateValue=False),住户不在家期间无合理原因\",\n \"15:24:08 客厅运动传感器检测到人体(Occupancy=1),窗户打开仅 8 秒后即有人出现\",\n \"15:25–15:26 客厅持续检测到人体活动,持续约 3 分钟\",\n \"15:27:00 厨房窗户关闭,15:27:05 运动传感器恢复无人,入侵者离开\",\n \"07:11–18:11 期间前门锁始终为上锁状态,前门未被打开,排除正常出入\"\n ],\n \"recommended_actions\": [\n \"立即报警:拨打 110 报警,告知警方有人于 15:24 左右通过厨房窗户非法进入住宅,活动约 3 分钟后离开\",\n \"远程锁定:确认前门锁处于锁定状态,如支持远程操作可再次发送上锁指令确保门锁安全\",\n \"保全证据:导出并备份 15:20–15:30 时段所有设备日志,作为报案证据;如有摄像头录像一并保存\",\n \"现场排查:住户回家后(或请物业/警方协助)检查厨房窗户是否有撬痕、室内物品是否丢失或被翻动\",\n \"加固厨房窗户:安装窗户锁扣或防盗窗栏,防止再次从窗户入侵;考虑加装窗户振动传感器\",\n \"增设安防设备:在厨房和客厅增加摄像头,以便未来入侵时获取影像证据;考虑在窗户区域增加玻璃破碎传感器\",\n \"配置实时告警规则:设置自动化规则——当住户外出(门锁上锁)期间,任何窗户打开或运动传感器触发时,立即推送手机告警通知\",\n \"检查其他房间:排查卧室窗户传感器、客厅窗户传感器状态,确认是否有其他入侵点被尝试\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "住户外出期间,厨房窗户被短暂打开,客厅运动传感器随即检测到人体活动,高度疑似通过厨房窗户非法入侵。", "reasoning": ["推理步骤1: 住户于 07:11 关灯、手动开锁出门,门自动上锁,此后家中应无人。直到 18:11 住户才通过前门回家。因此 07:11–18:11 为确认的无人在家时段。", "推理步骤2: 在无人时段内,15:24:00 厨房窗户传感器 StateValue=False(窗户被打开),仅 8 秒后(15:24:08)客厅运动传感器检测到 Occupancy=1,说明有人从厨房窗户进入并移动到客厅。", "推理步骤3: 客厅运动传感器在 15:25、15:26 持续报告 Occupancy=1,表明入侵者在室内活动了约 3 分钟。", "推理步骤4: 15:27:00 厨房窗户关闭(StateValue=True),15:27:05 客厅运动传感器恢复 Occupancy=0,入侵者离开。整个过程仅持续约 3 分钟,符合快速入室盗窃的行为模式。", "推理步骤5: 期间前门锁始终处于上锁状态(LockState=1),前门传感器未触发,排除了住户或授权人员通过正门进入的可能性。", "推理步骤6: 没有任何灯光、空调等设备被操作,说明入侵者未使用智能家居系统,进一步排除了远程控制或自动化场景触发的可能。"], "key_evidence": ["15:24:00 厨房窗户传感器打开(StateValue=False),住户不在家期间无合理原因", "15:24:08 客厅运动传感器检测到人体(Occupancy=1),窗户打开仅 8 秒后即有人出现", "15:25–15:26 客厅持续检测到人体活动,持续约 3 分钟", "15:27:00 厨房窗户关闭,15:27:05 运动传感器恢复无人,入侵者离开", "07:11–18:11 期间前门锁始终为上锁状态,前门未被打开,排除正常出入"], "recommended_actions": ["立即报警:拨打 110 报警,告知警方有人于 15:24 左右通过厨房窗户非法进入住宅,活动约 3 分钟后离开", "远程锁定:确认前门锁处于锁定状态,如支持远程操作可再次发送上锁指令确保门锁安全", "保全证据:导出并备份 15:20–15:30 时段所有设备日志,作为报案证据;如有摄像头录像一并保存", "现场排查:住户回家后(或请物业/警方协助)检查厨房窗户是否有撬痕、室内物品是否丢失或被翻动", "加固厨房窗户:安装窗户锁扣或防盗窗栏,防止再次从窗户入侵;考虑加装窗户振动传感器", "增设安防设备:在厨房和客厅增加摄像头,以便未来入侵时获取影像证据;考虑在窗户区域增加玻璃破碎传感器", "配置实时告警规则:设置自动化规则——当住户外出(门锁上锁)期间,任何窗户打开或运动传感器触发时,立即推送手机告警通知", "检查其他房间:排查卧室窗户传感器、客厅窗户传感器状态,确认是否有其他入侵点被尝试"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.664552211761475, "api_error": null} {"episode_id": "SQ5_TP_A_1019", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1019.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261648, "scenario_id": "WD-01", "total_events": 192, "anomaly_events_count": 2}, "ground_truth": {"scenario_id": "WD-01", "scenario_name": "卫生间水管漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "water_leak", "key_evidence": ["漏水传感器直接触发"], "expected_response": "通知住户,如果有智能水阀则关闭总水阀", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-08T03:38:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器于凌晨3:38触发报警,且截至日志结束(23:30)未见复位,漏水持续近20小时未处理,存在水损和安全风险。\",\n \"reasoning\": [\n \"推理步骤1: 03:38 bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,确认卫生间发生漏水。\",\n \"推理步骤2: 漏水发生在凌晨深夜,此时住户处于睡眠状态(卧室无灯光/运动事件,直到06:21才有起床活动),意味着漏水在最初近3小时内无人察觉。\",\n \"推理步骤3: 整个日志时间跨度内(03:38至23:30),未出现 bathroom_water_leak StateValue = False 的复位记录,说明漏水状态持续未解除,总计约20小时。\",\n \"推理步骤4: 住户07:32出门、18:24回家,白天家中无人,漏水在无人看管的情况下持续了整个白天,水损风险极高。\",\n \"推理步骤5: 06:52住户曾进入卫生间使用约23分钟(至07:15离开),但漏水传感器仍未复位,说明住户可能未注意到漏水或未能解决问题。\",\n \"推理步骤6: 长时间漏水可能导致地板/墙体浸泡、楼下渗水、电气短路等次生风险,需要立即应急响应。\"\n ],\n \"key_evidence\": [\n \"[03:38] bathroom_water_leak StateValue = True,漏水报警触发\",\n \"整个日志周期内(至23:30)未出现漏水传感器复位(StateValue = False),漏水持续约20小时\",\n \"[06:52-07:15] 住户进入卫生间但漏水状态未解除,问题未被处理\",\n \"[07:32] 住户出门至 [18:24] 回家,白天长时间无人在家,漏水无人看管\"\n ],\n \"recommended_actions\": [\n \"立即关闭卫生间总水阀(若有智能水阀应远程关闭),切断漏水水源\",\n \"向住户手机推送高优先级紧急通知,明确告知卫生间漏水已持续约20小时,需立即处理\",\n \"检查卫生间及相邻区域(卧室墙面、地板下方)是否有积水或渗水痕迹,评估水损范围\",\n \"断开卫生间附近的非必要电源,防止积水导致电气短路或触电风险\",\n \"联系物业或专业水管维修人员上门排查漏水原因(水管破裂、接头松动、马桶溢水等)\",\n \"若为公寓/楼房,检查并通知楼下邻居是否有天花板渗水情况\",\n \"漏水修复后确认传感器复位(StateValue = False),并对受损区域进行干燥除湿处理\",\n \"建议在智能家居系统中配置漏水自动化规则:漏水触发时自动关闭智能水阀并发送紧急通知,避免类似事件再次长时间无人处理\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器于凌晨3:38触发报警,且截至日志结束(23:30)未见复位,漏水持续近20小时未处理,存在水损和安全风险。", "reasoning": ["推理步骤1: 03:38 bathroom_water_leak 的 StateValue 变为 True 并触发 StateChange 事件,确认卫生间发生漏水。", "推理步骤2: 漏水发生在凌晨深夜,此时住户处于睡眠状态(卧室无灯光/运动事件,直到06:21才有起床活动),意味着漏水在最初近3小时内无人察觉。", "推理步骤3: 整个日志时间跨度内(03:38至23:30),未出现 bathroom_water_leak StateValue = False 的复位记录,说明漏水状态持续未解除,总计约20小时。", "推理步骤4: 住户07:32出门、18:24回家,白天家中无人,漏水在无人看管的情况下持续了整个白天,水损风险极高。", "推理步骤5: 06:52住户曾进入卫生间使用约23分钟(至07:15离开),但漏水传感器仍未复位,说明住户可能未注意到漏水或未能解决问题。", "推理步骤6: 长时间漏水可能导致地板/墙体浸泡、楼下渗水、电气短路等次生风险,需要立即应急响应。"], "key_evidence": ["[03:38] bathroom_water_leak StateValue = True,漏水报警触发", "整个日志周期内(至23:30)未出现漏水传感器复位(StateValue = False),漏水持续约20小时", "[06:52-07:15] 住户进入卫生间但漏水状态未解除,问题未被处理", "[07:32] 住户出门至 [18:24] 回家,白天长时间无人在家,漏水无人看管"], "recommended_actions": ["立即关闭卫生间总水阀(若有智能水阀应远程关闭),切断漏水水源", "向住户手机推送高优先级紧急通知,明确告知卫生间漏水已持续约20小时,需立即处理", "检查卫生间及相邻区域(卧室墙面、地板下方)是否有积水或渗水痕迹,评估水损范围", "断开卫生间附近的非必要电源,防止积水导致电气短路或触电风险", "联系物业或专业水管维修人员上门排查漏水原因(水管破裂、接头松动、马桶溢水等)", "若为公寓/楼房,检查并通知楼下邻居是否有天花板渗水情况", "漏水修复后确认传感器复位(StateValue = False),并对受损区域进行干燥除湿处理", "建议在智能家居系统中配置漏水自动化规则:漏水触发时自动关闭智能水阀并发送紧急通知,避免类似事件再次长时间无人处理"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.379689693450928, "api_error": null} {"episode_id": "SQ5_TP_A_1020", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1020.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261649, "scenario_id": "INS-02", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-02", "scenario_name": "门锁暴力破解", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion_attempt", "key_evidence": ["短时间内多次 LockOperationError (InvalidCredential)", "DoorLockAlarm (WrongCodeEntryLimit) 触发", "操作来源为 Keypad 而非 Remote/Auto"], "expected_response": "触发安全警报,临时禁用 Keypad 输入,通知住户", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T05:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨5:57发生入户门锁连续4次密码/凭证错误,触发门锁防撬报警(AlarmCode=3),高度疑似暴力破解入侵尝试。\",\n \"reasoning\": [\n \"推理步骤1: 在05:57:00至05:57:40的40秒内,front_door_lock连续报告4次LockOperationError(OperationError=1, OperationSource=3)。OperationError=1表示凭证/PIN错误,OperationSource=3表示远程或键盘输入来源,短时间内高频错误输入是典型的暴力破解特征。\",\n \"推理步骤2: 05:57:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数已达到门锁安全阈值,门锁自身已判定为暴力破解攻击。\",\n \"推理步骤3: 事件发生在凌晨5:57,住户此时仍在睡眠中(卧室运动传感器直到06:20才检测到活动),排除了住户自己忘记密码反复尝试的可能性。\",\n \"推理步骤4: 整个深夜时段(00:00-05:57)家中无任何人员活动记录,所有灯光关闭,温度自然波动,说明这是一个无人活动的正常睡眠时段,门锁操作不可能来自家庭成员。\",\n \"推理步骤5: 攻击未成功——门锁未报告LockState变为2(解锁),入户门传感器未报告开门事件,说明入侵者未能突破门锁。住户于06:20正常起床,07:17正常手动开锁出门,生活节奏未受影响,但威胁本身是真实存在的。\"\n ],\n \"key_evidence\": [\n \"05:57:00-05:57:40:40秒内4次LockOperationError(OperationError=1, OperationSource=3),密码/凭证错误,来源为键盘或远程输入\",\n \"05:57:50:触发DoorLockAlarm(AlarmCode=3),即错误输入次数超限报警,门锁已进入安全锁定状态\",\n \"事件发生在凌晨5:57,住户06:20才起床,排除住户自身误操作\",\n \"攻击期间门锁未解锁(无LockState=2)、入户门未打开(无StateValue=False),入侵未成功\"\n ],\n \"recommended_actions\": [\n \"【立即】确认门锁当前处于锁定状态,如门锁支持临时锁定模式(lockout),确保其已激活,在一段时间内禁止任何键盘输入解锁\",\n \"【立即】向住户手机推送高优先级安全警报,告知凌晨发生门锁暴力破解尝试,提醒住户提高警惕并确认是否为已知人员操作\",\n \"【立即】如有条件,联动玄关区域摄像头(如有)回溯05:55-06:05时段录像,保存证据以备报警使用\",\n \"【短期】更换门锁PIN码/密码,原密码可能已被部分试探,建议使用更长更复杂的密码组合\",\n \"【短期】降低门锁错误输入次数阈值(如从当前值降至3次),并延长锁定时间(建议至少5分钟),增加暴力破解难度\",\n \"【短期】启用门锁异常事件的实时通知策略,确保任何LockOperationError事件在第一次发生时就推送告警,而非等到触发AlarmCode\",\n \"【短期】向物业或社区安保部门报告此事件,建议加强凌晨时段楼道巡逻和监控\",\n \"【中期】考虑在入户门区域增设摄像头或可视门铃,实现事件发生时自动抓拍和录像\",\n \"【中期】评估是否需要向警方报案,尤其是如果此类事件重复发生\",\n \"【中期】考虑为门锁启用双因素认证(如PIN+手机蓝牙/NFC),防止单一凭证被暴力破解\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "凌晨5:57发生入户门锁连续4次密码/凭证错误,触发门锁防撬报警(AlarmCode=3),高度疑似暴力破解入侵尝试。", "reasoning": ["推理步骤1: 在05:57:00至05:57:40的40秒内,front_door_lock连续报告4次LockOperationError(OperationError=1, OperationSource=3)。OperationError=1表示凭证/PIN错误,OperationSource=3表示远程或键盘输入来源,短时间内高频错误输入是典型的暴力破解特征。", "推理步骤2: 05:57:50门锁触发DoorLockAlarm(AlarmCode=3),AlarmCode=3对应'Wrong Code Entry Limit'报警,即错误输入次数已达到门锁安全阈值,门锁自身已判定为暴力破解攻击。", "推理步骤3: 事件发生在凌晨5:57,住户此时仍在睡眠中(卧室运动传感器直到06:20才检测到活动),排除了住户自己忘记密码反复尝试的可能性。", "推理步骤4: 整个深夜时段(00:00-05:57)家中无任何人员活动记录,所有灯光关闭,温度自然波动,说明这是一个无人活动的正常睡眠时段,门锁操作不可能来自家庭成员。", "推理步骤5: 攻击未成功——门锁未报告LockState变为2(解锁),入户门传感器未报告开门事件,说明入侵者未能突破门锁。住户于06:20正常起床,07:17正常手动开锁出门,生活节奏未受影响,但威胁本身是真实存在的。"], "key_evidence": ["05:57:00-05:57:40:40秒内4次LockOperationError(OperationError=1, OperationSource=3),密码/凭证错误,来源为键盘或远程输入", "05:57:50:触发DoorLockAlarm(AlarmCode=3),即错误输入次数超限报警,门锁已进入安全锁定状态", "事件发生在凌晨5:57,住户06:20才起床,排除住户自身误操作", "攻击期间门锁未解锁(无LockState=2)、入户门未打开(无StateValue=False),入侵未成功"], "recommended_actions": ["【立即】确认门锁当前处于锁定状态,如门锁支持临时锁定模式(lockout),确保其已激活,在一段时间内禁止任何键盘输入解锁", "【立即】向住户手机推送高优先级安全警报,告知凌晨发生门锁暴力破解尝试,提醒住户提高警惕并确认是否为已知人员操作", "【立即】如有条件,联动玄关区域摄像头(如有)回溯05:55-06:05时段录像,保存证据以备报警使用", "【短期】更换门锁PIN码/密码,原密码可能已被部分试探,建议使用更长更复杂的密码组合", "【短期】降低门锁错误输入次数阈值(如从当前值降至3次),并延长锁定时间(建议至少5分钟),增加暴力破解难度", "【短期】启用门锁异常事件的实时通知策略,确保任何LockOperationError事件在第一次发生时就推送告警,而非等到触发AlarmCode", "【短期】向物业或社区安保部门报告此事件,建议加强凌晨时段楼道巡逻和监控", "【中期】考虑在入户门区域增设摄像头或可视门铃,实现事件发生时自动抓拍和录像", "【中期】评估是否需要向警方报案,尤其是如果此类事件重复发生", "【中期】考虑为门锁启用双因素认证(如PIN+手机蓝牙/NFC),防止单一凭证被暴力破解"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.7640221118927, "api_error": null} {"episode_id": "SQ5_TP_A_1025", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1025.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-16T00:00:00", "seed": 20261654, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-16T12:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"12:28 住户外出期间客厅窗户被打开,运动传感器检测到人体存在,高度疑似撬窗入室。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:24 关灯、手动开锁出门,门自动上锁,此后家中无任何人体活动,判定为外出离家状态。\",\n \"推理步骤2: 12:28 客厅窗户传感器 StateValue=False(窗户被打开),8秒后 12:28:08 客厅运动传感器检测到 Occupancy=1,且该占用状态持续到 12:31:05。这段时间内入户门始终处于锁定状态(LockState=1)、门传感器 StateValue=True(门关闭),说明进入者并非通过正门。\",\n \"推理步骤3: 窗户打开前无任何室内活动迹象——所有灯关闭、所有运动传感器无触发,排除了住户从室内开窗通风的可能。\",\n \"推理步骤4: 12:31 窗户关闭(StateValue=True),紧接着 12:31:05 运动传感器恢复无人(Occupancy=0),入侵者停留约3分钟后离开,行为模式符合快速入室盗窃。\",\n \"推理步骤5: 住户直到 18:10 才通过手动开锁回家,中间长达近6小时无人在家,进一步确认 12:28 的活动不可能是住户本人。\"\n ],\n \"key_evidence\": [\n \"07:24:29 入户门上锁(LockState=1),住户离家,此后至 18:10 门锁状态未变\",\n \"12:28:00 客厅窗户传感器 StateValue=False — 窗户在无人在家时被打开\",\n \"12:28:08 客厅运动传感器 Occupancy=1 — 窗户打开后立即检测到人体\",\n \"12:31:00 窗户关闭(StateValue=True),12:31:05 运动传感器恢复无人 — 入侵者停留约3分钟后离去\",\n \"整个过程中入户门始终锁闭且未被打开,排除正门进入的可能\"\n ],\n \"recommended_actions\": [\n \"立即报警: 拨打110报警,提供入侵时间(12:28-12:31)及通过客厅窗户进入的信息,请求警方出警并调取小区监控。\",\n \"远程锁定与加固: 确认入户门锁处于锁定状态;如支持远程操作,将所有窗帘关闭(living_room_window、bedroom_window 设为全闭),减少室内可见性。\",\n \"保留证据: 导出并备份 12:00-13:00 时段所有设备日志,作为报案证据;如有摄像头录像一并保存。\",\n \"回家后现场检查: 住户回家时建议不要独自进入,等待警方或同伴陪同;检查客厅窗户是否有撬痕、室内物品是否丢失。\",\n \"窗户安全加固: 客厅窗户加装防盗锁扣或限位器,防止从外部推开;考虑安装窗户振动/破碎传感器以实现更早期的预警。\",\n \"自动化告警规则: 设置自动化规则——当住户离家(门锁上锁且无人活动)期间,任何窗户传感器打开或运动传感器触发时,立即推送高优先级告警并触发警报。\",\n \"增设安防设备: 在客厅和入口处增加摄像头,以便未来事件可追溯取证;考虑增加窗户区域的门磁报警器。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "12:28 住户外出期间客厅窗户被打开,运动传感器检测到人体存在,高度疑似撬窗入室。", "reasoning": ["推理步骤1: 住户于 07:24 关灯、手动开锁出门,门自动上锁,此后家中无任何人体活动,判定为外出离家状态。", "推理步骤2: 12:28 客厅窗户传感器 StateValue=False(窗户被打开),8秒后 12:28:08 客厅运动传感器检测到 Occupancy=1,且该占用状态持续到 12:31:05。这段时间内入户门始终处于锁定状态(LockState=1)、门传感器 StateValue=True(门关闭),说明进入者并非通过正门。", "推理步骤3: 窗户打开前无任何室内活动迹象——所有灯关闭、所有运动传感器无触发,排除了住户从室内开窗通风的可能。", "推理步骤4: 12:31 窗户关闭(StateValue=True),紧接着 12:31:05 运动传感器恢复无人(Occupancy=0),入侵者停留约3分钟后离开,行为模式符合快速入室盗窃。", "推理步骤5: 住户直到 18:10 才通过手动开锁回家,中间长达近6小时无人在家,进一步确认 12:28 的活动不可能是住户本人。"], "key_evidence": ["07:24:29 入户门上锁(LockState=1),住户离家,此后至 18:10 门锁状态未变", "12:28:00 客厅窗户传感器 StateValue=False — 窗户在无人在家时被打开", "12:28:08 客厅运动传感器 Occupancy=1 — 窗户打开后立即检测到人体", "12:31:00 窗户关闭(StateValue=True),12:31:05 运动传感器恢复无人 — 入侵者停留约3分钟后离去", "整个过程中入户门始终锁闭且未被打开,排除正门进入的可能"], "recommended_actions": ["立即报警: 拨打110报警,提供入侵时间(12:28-12:31)及通过客厅窗户进入的信息,请求警方出警并调取小区监控。", "远程锁定与加固: 确认入户门锁处于锁定状态;如支持远程操作,将所有窗帘关闭(living_room_window、bedroom_window 设为全闭),减少室内可见性。", "保留证据: 导出并备份 12:00-13:00 时段所有设备日志,作为报案证据;如有摄像头录像一并保存。", "回家后现场检查: 住户回家时建议不要独自进入,等待警方或同伴陪同;检查客厅窗户是否有撬痕、室内物品是否丢失。", "窗户安全加固: 客厅窗户加装防盗锁扣或限位器,防止从外部推开;考虑安装窗户振动/破碎传感器以实现更早期的预警。", "自动化告警规则: 设置自动化规则——当住户离家(门锁上锁且无人活动)期间,任何窗户传感器打开或运动传感器触发时,立即推送高优先级告警并触发警报。", "增设安防设备: 在客厅和入口处增加摄像头,以便未来事件可追溯取证;考虑增加窗户区域的门磁报警器。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.360831022262573, "api_error": null} {"episode_id": "SQ5_TP_A_1028", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1028.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261657, "scenario_id": "INS-05", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "kitchen", "injection_time": "2026-06-13T07:24:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨7:24有人使用合法凭证开锁进入,但住户行为模式显示此时应在室内睡眠,且进入后未开灯、未触发后续正常起居活动,疑似被盗/复制凭证入侵。\",\n \"reasoning\": [\n \"推理步骤1: 07:24门锁事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/凭证方式)、UserIndex=1,表明使用了注册用户凭证远程开锁。\",\n \"推理步骤2: 从00:00到07:24期间,无任何运动传感器触发、无灯光开启、无门锁/门磁事件,说明住户一直在家中睡眠,不存在外出后返回的场景。\",\n \"推理步骤3: 07:24门磁显示门被打开(StateValue=False),客厅运动传感器触发(Occupancy=1),但客厅灯被关闭(OnOff=False)而非开启——正常住户进门通常会开灯,深夜/清晨不开灯进入极为可疑。\",\n \"推理步骤4: 住户真正的起床活动出现在08:34(卫生间运动+开灯)和08:38(卧室运动+开灯+开窗帘),这与07:24的入侵事件间隔超过1小时,说明07:24进入者并非住户本人。\",\n \"推理步骤5: OperationSource=8 通常对应远程操作或PIN码/凭证方式,结合住户在家睡觉的事实,高度怀疑凭证被复制或泄露,第三方利用合法凭证实施入侵。\"\n ],\n \"key_evidence\": [\n \"07:24 门锁通过 OperationSource=8(远程/凭证)解锁,UserIndex=1\",\n \"07:24 门被打开后客厅检测到人,但灯被关闭而非开启\",\n \"00:00-07:24 期间无任何住户外出记录,住户应在家中\",\n \"住户真正起床活动在08:34才开始(卫生间传感器触发)\",\n \"07:24入侵者进入后约1小时内无后续活动记录,行为隐蔽\"\n ],\n \"recommended_actions\": [\n \"立即远程锁定门锁并禁用当前所有PIN码/数字凭证,防止再次使用被盗凭证进入\",\n \"向住户手机发送高优先级入侵警报通知,确认是否为本人操作\",\n \"调取门口摄像头(如有)07:24前后的录像,确认入侵者身份\",\n \"重置门锁所有用户凭证,重新注册新的PIN码/指纹/密码,确保旧凭证完全失效\",\n \"检查门锁固件版本,排查是否存在已知远程漏洞,必要时升级固件\",\n \"启用门锁双因素认证(如PIN+指纹),提高开锁安全等级\",\n \"设置夜间时段(23:00-07:00)门锁操作的额外验证规则或禁止远程开锁\",\n \"报警并联系物业/警方,告知疑似有人使用复制凭证非法入侵\",\n \"检查家中是否有财物丢失或被翻动的痕迹\",\n \"审计门锁操作日志,排查凭证泄露的时间点和途径\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "凌晨7:24有人使用合法凭证开锁进入,但住户行为模式显示此时应在室内睡眠,且进入后未开灯、未触发后续正常起居活动,疑似被盗/复制凭证入侵。", "reasoning": ["推理步骤1: 07:24门锁事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/凭证方式)、UserIndex=1,表明使用了注册用户凭证远程开锁。", "推理步骤2: 从00:00到07:24期间,无任何运动传感器触发、无灯光开启、无门锁/门磁事件,说明住户一直在家中睡眠,不存在外出后返回的场景。", "推理步骤3: 07:24门磁显示门被打开(StateValue=False),客厅运动传感器触发(Occupancy=1),但客厅灯被关闭(OnOff=False)而非开启——正常住户进门通常会开灯,深夜/清晨不开灯进入极为可疑。", "推理步骤4: 住户真正的起床活动出现在08:34(卫生间运动+开灯)和08:38(卧室运动+开灯+开窗帘),这与07:24的入侵事件间隔超过1小时,说明07:24进入者并非住户本人。", "推理步骤5: OperationSource=8 通常对应远程操作或PIN码/凭证方式,结合住户在家睡觉的事实,高度怀疑凭证被复制或泄露,第三方利用合法凭证实施入侵。"], "key_evidence": ["07:24 门锁通过 OperationSource=8(远程/凭证)解锁,UserIndex=1", "07:24 门被打开后客厅检测到人,但灯被关闭而非开启", "00:00-07:24 期间无任何住户外出记录,住户应在家中", "住户真正起床活动在08:34才开始(卫生间传感器触发)", "07:24入侵者进入后约1小时内无后续活动记录,行为隐蔽"], "recommended_actions": ["立即远程锁定门锁并禁用当前所有PIN码/数字凭证,防止再次使用被盗凭证进入", "向住户手机发送高优先级入侵警报通知,确认是否为本人操作", "调取门口摄像头(如有)07:24前后的录像,确认入侵者身份", "重置门锁所有用户凭证,重新注册新的PIN码/指纹/密码,确保旧凭证完全失效", "检查门锁固件版本,排查是否存在已知远程漏洞,必要时升级固件", "启用门锁双因素认证(如PIN+指纹),提高开锁安全等级", "设置夜间时段(23:00-07:00)门锁操作的额外验证规则或禁止远程开锁", "报警并联系物业/警方,告知疑似有人使用复制凭证非法入侵", "检查家中是否有财物丢失或被翻动的痕迹", "审计门锁操作日志,排查凭证泄露的时间点和途径"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.235184907913208, "api_error": null} {"episode_id": "SQ5_TP_A_1029", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1029.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261658, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-02T01:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,期间发生了灶具深夜异常开启和厨房温度传感器故障等多起事件,火灾预警能力严重受损。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-01T01:40 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。\",\n \"推理步骤2: 2026-06-02T01:40 厨房灶具在凌晨1:40被开启(OnOff=True),这是一个非常异常的时间点——住户当时应处于深度睡眠状态(卧室无活动、所有灯关闭),且没有任何运动传感器检测到人员活动。灶具开启10分钟后(01:50),厨房温度从约23°C骤升至29.85°C,升幅近7°C,说明灶具确实在工作。\",\n \"推理步骤3: 01:50 烟雾报警器报告 SmokeState=0(无烟雾),但考虑到电池低电量状态,该读数的可靠性存疑。若电池电量不足导致传感器灵敏度下降,可能存在漏报风险。\",\n \"推理步骤4: 日志中没有灶具关闭的记录(直到当晚19:40才出现第二次关闭事件,但那是晚餐后的正常操作)。凌晨灶具开启后,厨房温度在02:00回落至23.07°C,说明灶具可能短暂运行后自行关闭或被未记录的操作关闭,但这一过程缺乏监控。\",\n \"推理步骤5: 厨房温度传感器在18:51和19:41两次报告 MeasuredValue=None(空值),表明传感器出现故障或通信中断。在18:00时厨房温度曾异常飙升至28.63°C(其他房间仅约24.6°C和23.6°C),而18:30仍高达28.50°C,这发生在住户回家开灶之前,原因不明,进一步说明厨房环境监测存在盲区。\",\n \"推理步骤6: 综合来看,烟雾报警器低电量 + 灶具深夜无人时异常启动 + 温度传感器间歇性故障,三者叠加构成严重的火灾风险盲区:即使发生火情,报警和监测系统都可能无法及时响应。\"\n ],\n \"key_evidence\": [\n \"2026-06-01T01:40 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低\",\n \"2026-06-02T01:40 kitchen_cook_surface OnOff=True,凌晨无人活动时灶具异常开启\",\n \"2026-06-02T01:50 kitchen_temp_sensor 温度骤升至29.85°C(正常约23°C),确认灶具实际在加热\",\n \"2026-06-02T18:00 kitchen_temp_sensor 异常读数28.63°C,远高于同期其他房间\",\n \"2026-06-02T18:51 和 19:41 kitchen_temp_sensor MeasuredValue=None,温度传感器两次故障\",\n \"烟雾报警器低电量期间 SmokeState=0 的读数可靠性无法保证\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,恢复其正常报警能力,这是最高优先级操作\",\n \"检查厨房灶具是否存在硬件故障或误触发问题——凌晨1:40无人时自动开启属于严重安全隐患,必要时联系厂商检修或暂时关闭灶具总阀/断路器\",\n \"排查厨房温度传感器故障原因(两次报告None值),检查传感器电池、网络连接和安装位置,必要时更换设备\",\n \"调查18:00厨房温度异常升高至28.63°C的原因(住户尚未回家、灶具未开启),排除是否有其他热源或传感器漂移\",\n \"设置自动化规则:当烟雾报警器电池低电量时,若灶具开启则立即发送高优先级通知到住户手机\",\n \"设置自动化规则:深夜时段(00:00-06:00)如灶具被开启且无运动传感器检测到人员活动,自动关闭灶具并发送紧急告警\",\n \"考虑为厨房增加一个独立的燃气泄漏探测器,作为烟雾报警器的补充安全层\",\n \"在温度传感器修复前,增加对厨房区域的人工巡检频率\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,期间发生了灶具深夜异常开启和厨房温度传感器故障等多起事件,火灾预警能力严重受损。", "reasoning": ["推理步骤1: 2026-06-01T01:40 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。", "推理步骤2: 2026-06-02T01:40 厨房灶具在凌晨1:40被开启(OnOff=True),这是一个非常异常的时间点——住户当时应处于深度睡眠状态(卧室无活动、所有灯关闭),且没有任何运动传感器检测到人员活动。灶具开启10分钟后(01:50),厨房温度从约23°C骤升至29.85°C,升幅近7°C,说明灶具确实在工作。", "推理步骤3: 01:50 烟雾报警器报告 SmokeState=0(无烟雾),但考虑到电池低电量状态,该读数的可靠性存疑。若电池电量不足导致传感器灵敏度下降,可能存在漏报风险。", "推理步骤4: 日志中没有灶具关闭的记录(直到当晚19:40才出现第二次关闭事件,但那是晚餐后的正常操作)。凌晨灶具开启后,厨房温度在02:00回落至23.07°C,说明灶具可能短暂运行后自行关闭或被未记录的操作关闭,但这一过程缺乏监控。", "推理步骤5: 厨房温度传感器在18:51和19:41两次报告 MeasuredValue=None(空值),表明传感器出现故障或通信中断。在18:00时厨房温度曾异常飙升至28.63°C(其他房间仅约24.6°C和23.6°C),而18:30仍高达28.50°C,这发生在住户回家开灶之前,原因不明,进一步说明厨房环境监测存在盲区。", "推理步骤6: 综合来看,烟雾报警器低电量 + 灶具深夜无人时异常启动 + 温度传感器间歇性故障,三者叠加构成严重的火灾风险盲区:即使发生火情,报警和监测系统都可能无法及时响应。"], "key_evidence": ["2026-06-01T01:40 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低", "2026-06-02T01:40 kitchen_cook_surface OnOff=True,凌晨无人活动时灶具异常开启", "2026-06-02T01:50 kitchen_temp_sensor 温度骤升至29.85°C(正常约23°C),确认灶具实际在加热", "2026-06-02T18:00 kitchen_temp_sensor 异常读数28.63°C,远高于同期其他房间", "2026-06-02T18:51 和 19:41 kitchen_temp_sensor MeasuredValue=None,温度传感器两次故障", "烟雾报警器低电量期间 SmokeState=0 的读数可靠性无法保证"], "recommended_actions": ["立即更换厨房烟雾报警器电池,恢复其正常报警能力,这是最高优先级操作", "检查厨房灶具是否存在硬件故障或误触发问题——凌晨1:40无人时自动开启属于严重安全隐患,必要时联系厂商检修或暂时关闭灶具总阀/断路器", "排查厨房温度传感器故障原因(两次报告None值),检查传感器电池、网络连接和安装位置,必要时更换设备", "调查18:00厨房温度异常升高至28.63°C的原因(住户尚未回家、灶具未开启),排除是否有其他热源或传感器漂移", "设置自动化规则:当烟雾报警器电池低电量时,若灶具开启则立即发送高优先级通知到住户手机", "设置自动化规则:深夜时段(00:00-06:00)如灶具被开启且无运动传感器检测到人员活动,自动关闭灶具并发送紧急告警", "考虑为厨房增加一个独立的燃气泄漏探测器,作为烟雾报警器的补充安全层", "在温度传感器修复前,增加对厨房区域的人工巡检频率"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.528664588928223, "api_error": null} {"episode_id": "SQ5_TP_A_1032", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1032.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-19T00:00:00", "seed": 20261661, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-19T18:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而当晚厨房发生了高温烹饪事件(温度飙升至30.66°C)且传感器一度读数异常(返回None),报警器可能无法在真正火灾时正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-18T18:23:00 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,设备功能可能受限。\",\n \"推理步骤2: 约24小时后(6月19日18:23-19:36),住户使用厨房灶具烹饪。18:33时厨房温度从24.59°C骤升至30.66°C,19:00时仍高达28.27°C,19:30时为28.36°C,说明烹饪产生了显著热量。\",\n \"推理步骤3: 18:33时烟雾报警器上报 SmokeState=0(无烟雾),说明此刻报警器仍在工作。但低电量状态下,报警器的烟雾检测灵敏度和声光报警能力可能降低,若烹饪失控引发真正火灾,存在报警失败的风险。\",\n \"推理步骤4: 19:01和19:37厨房温度传感器两次返回 MeasuredValue=None,说明传感器在高温环境下出现读数异常或暂时失效,进一步削弱了厨房的安全监测能力。\",\n \"推理步骤5: 住户在19:36关闭灶具后开窗通风(kitchen_window_contact StateValue=False),说明烹饪确实产生了较多油烟或热量,属于高风险烹饪场景。\",\n \"推理步骤6: 综合来看,烟雾报警器低电量 + 高温烹饪场景 + 温度传感器间歇失效,构成了一个火灾预警链条上的多点薄弱环节,整体火灾风险显著升高。\"\n ],\n \"key_evidence\": [\n \"2026-06-18T18:23:00 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低\",\n \"2026-06-19T18:33:00 厨房温度从24.59°C骤升至30.66°C,烹饪产生大量热量\",\n \"2026-06-19T19:01:00 和 19:37:00 厨房温度传感器返回 None,传感器在高温下间歇失效\",\n \"2026-06-19T18:33:00 SmokeState=0,报警器虽未触发但在低电量下可靠性存疑\",\n \"2026-06-19T19:36:30 烹饪结束后住户立即开窗通风,侧面印证烹饪油烟/热量较大\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其满电工作状态,这是最高优先级措施\",\n \"检查厨房温度传感器(kitchen_temp_sensor)的工作状态,排查两次返回 None 的原因(可能是高温导致传感器暂时超量程或连接故障),必要时更换传感器\",\n \"在烟雾报警器电池更换前,避免长时间无人看管的烹饪操作,烹饪时保持厨房窗户开启以加强通风\",\n \"设置烟雾报警器低电量的自动化提醒规则:当 BatteryAlert 触发时,立即向住户手机推送高优先级通知,并在家中其他设备(如客厅灯)闪烁提示\",\n \"建议为厨房增加一个独立的燃气泄漏检测器,与烟雾报警器形成互补,避免单点故障导致火灾预警完全失效\",\n \"建立定期维护计划:每3个月检查一次所有安全类传感器(烟雾报警器、漏水传感器)的电池电量和工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而当晚厨房发生了高温烹饪事件(温度飙升至30.66°C)且传感器一度读数异常(返回None),报警器可能无法在真正火灾时正常工作。", "reasoning": ["推理步骤1: 2026-06-18T18:23:00 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,设备功能可能受限。", "推理步骤2: 约24小时后(6月19日18:23-19:36),住户使用厨房灶具烹饪。18:33时厨房温度从24.59°C骤升至30.66°C,19:00时仍高达28.27°C,19:30时为28.36°C,说明烹饪产生了显著热量。", "推理步骤3: 18:33时烟雾报警器上报 SmokeState=0(无烟雾),说明此刻报警器仍在工作。但低电量状态下,报警器的烟雾检测灵敏度和声光报警能力可能降低,若烹饪失控引发真正火灾,存在报警失败的风险。", "推理步骤4: 19:01和19:37厨房温度传感器两次返回 MeasuredValue=None,说明传感器在高温环境下出现读数异常或暂时失效,进一步削弱了厨房的安全监测能力。", "推理步骤5: 住户在19:36关闭灶具后开窗通风(kitchen_window_contact StateValue=False),说明烹饪确实产生了较多油烟或热量,属于高风险烹饪场景。", "推理步骤6: 综合来看,烟雾报警器低电量 + 高温烹饪场景 + 温度传感器间歇失效,构成了一个火灾预警链条上的多点薄弱环节,整体火灾风险显著升高。"], "key_evidence": ["2026-06-18T18:23:00 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低", "2026-06-19T18:33:00 厨房温度从24.59°C骤升至30.66°C,烹饪产生大量热量", "2026-06-19T19:01:00 和 19:37:00 厨房温度传感器返回 None,传感器在高温下间歇失效", "2026-06-19T18:33:00 SmokeState=0,报警器虽未触发但在低电量下可靠性存疑", "2026-06-19T19:36:30 烹饪结束后住户立即开窗通风,侧面印证烹饪油烟/热量较大"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其满电工作状态,这是最高优先级措施", "检查厨房温度传感器(kitchen_temp_sensor)的工作状态,排查两次返回 None 的原因(可能是高温导致传感器暂时超量程或连接故障),必要时更换传感器", "在烟雾报警器电池更换前,避免长时间无人看管的烹饪操作,烹饪时保持厨房窗户开启以加强通风", "设置烟雾报警器低电量的自动化提醒规则:当 BatteryAlert 触发时,立即向住户手机推送高优先级通知,并在家中其他设备(如客厅灯)闪烁提示", "建议为厨房增加一个独立的燃气泄漏检测器,与烟雾报警器形成互补,避免单点故障导致火灾预警完全失效", "建立定期维护计划:每3个月检查一次所有安全类传感器(烟雾报警器、漏水传感器)的电池电量和工作状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.326971292495728, "api_error": null} {"episode_id": "SQ5_TP_A_1038", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1038.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261667, "scenario_id": "INS-04", "total_events": 190, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-07T10:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"日志中未发现撬窗入室的证据,白天窗户开启事件均为住户正常操作\",\n \"reasoning\": [\n \"推理步骤1: 分析白天所有窗户传感器事件。客厅窗户在10:55开启(StateValue=False),10:58关闭(StateValue=True);厨房窗户在09:47、12:53、18:41分别开启,均发生在灶具关闭后,属于做饭后通风的正常行为。\",\n \"推理步骤2: 客厅窗户10:55开启时,客厅运动传感器持续报告Occupancy=1(10:55~10:57),说明住户在场操作窗户,而非外部入侵。若为撬窗入侵,应先出现窗户打开事件,随后才有运动传感器触发,且住户不在场。\",\n \"推理步骤3: 客厅窗户开启前(10:10),住户已在客厅活动(开灯、开空调、开窗帘),说明住户一直在家。窗户仅开启约3分钟后即关闭,符合短暂通风的行为模式。\",\n \"推理步骤4: 入户门锁全天无异常解锁事件,卧室窗户传感器(bedroom_window_contact)全天无触发,无任何设备报警(烟雾、漏水等),整体安防状态正常。\",\n \"推理步骤5: 厨房温度传感器在12:00出现异常读数2973(约29.73°C,比前一时段跳升约4.5°C),但这与灶具即将在12:09开启的烹饪活动相关,且无烟雾报警触发,属于设备故障或烹饪余热,非入侵迹象。\"\n ],\n \"key_evidence\": [\n \"客厅窗户10:55开启时运动传感器显示Occupancy=1,住户在场\",\n \"客厅窗户仅开启3分钟(10:55~10:58),符合通风行为\",\n \"住户10:10已在客厅活动(开灯、开空调),窗户操作前已确认在家\",\n \"厨房窗户三次开启均紧跟灶具关闭事件,为做饭后通风\",\n \"全天无门锁异常事件、无报警触发、无未授权进入迹象\"\n ],\n \"recommended_actions\": [\n \"确认误报:日志分析未发现撬窗入室证据,建议检查触发该安全事件告警的规则逻辑,可能存在误判\",\n \"优化告警规则:建议将窗户开启事件与运动传感器、门锁状态联动判断,仅在住户不在场且窗户异常开启时触发入侵告警\",\n \"检查厨房温度传感器:12:00出现的异常温度跳变(2973)可能为传感器故障,建议校准或更换\",\n \"若仍有安全顾虑:可回放该时段的摄像头录像(如有),或在窗户上加装振动/破碎传感器以增强入侵检测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "日志中未发现撬窗入室的证据,白天窗户开启事件均为住户正常操作", "reasoning": ["推理步骤1: 分析白天所有窗户传感器事件。客厅窗户在10:55开启(StateValue=False),10:58关闭(StateValue=True);厨房窗户在09:47、12:53、18:41分别开启,均发生在灶具关闭后,属于做饭后通风的正常行为。", "推理步骤2: 客厅窗户10:55开启时,客厅运动传感器持续报告Occupancy=1(10:55~10:57),说明住户在场操作窗户,而非外部入侵。若为撬窗入侵,应先出现窗户打开事件,随后才有运动传感器触发,且住户不在场。", "推理步骤3: 客厅窗户开启前(10:10),住户已在客厅活动(开灯、开空调、开窗帘),说明住户一直在家。窗户仅开启约3分钟后即关闭,符合短暂通风的行为模式。", "推理步骤4: 入户门锁全天无异常解锁事件,卧室窗户传感器(bedroom_window_contact)全天无触发,无任何设备报警(烟雾、漏水等),整体安防状态正常。", "推理步骤5: 厨房温度传感器在12:00出现异常读数2973(约29.73°C,比前一时段跳升约4.5°C),但这与灶具即将在12:09开启的烹饪活动相关,且无烟雾报警触发,属于设备故障或烹饪余热,非入侵迹象。"], "key_evidence": ["客厅窗户10:55开启时运动传感器显示Occupancy=1,住户在场", "客厅窗户仅开启3分钟(10:55~10:58),符合通风行为", "住户10:10已在客厅活动(开灯、开空调),窗户操作前已确认在家", "厨房窗户三次开启均紧跟灶具关闭事件,为做饭后通风", "全天无门锁异常事件、无报警触发、无未授权进入迹象"], "recommended_actions": ["确认误报:日志分析未发现撬窗入室证据,建议检查触发该安全事件告警的规则逻辑,可能存在误判", "优化告警规则:建议将窗户开启事件与运动传感器、门锁状态联动判断,仅在住户不在场且窗户异常开启时触发入侵告警", "检查厨房温度传感器:12:00出现的异常温度跳变(2973)可能为传感器故障,建议校准或更换", "若仍有安全顾虑:可回放该时段的摄像头录像(如有),或在窗户上加装振动/破碎传感器以增强入侵检测能力"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.26736092567444, "api_error": null} {"episode_id": "SQ5_TP_A_1045", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1045.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261674, "scenario_id": "INS-05", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-23T12:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"12:13 的开锁事件疑似使用被盗/复制凭证入侵,住户不在家期间门锁被远程解锁且入侵者行为异常。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:30 手动开锁出门(OperationSource=Manual),门自动上锁,之后家中无任何人体活动,所有灯关闭,符合外出离家状态。\",\n \"推理步骤2: 12:13 门锁被解锁,OperationSource=8(远程/凭证方式),使用 UserIndex=1 的凭证。这不是住户手动操作,而是通过已注册凭证(PIN码/指纹/远程指令)触发的。如果凭证被复制或泄露,攻击者可以用此方式开锁。\",\n \"推理步骤3: 12:13:03 入户门打开(StateValue=False),但日志中始终没有记录门关闭(StateValue=True)的事件,直到 22:07:30 住户晚间回家后门才恢复关闭状态。这意味着入户门在住户不在家的近10小时内处于未关闭状态,极不正常。\",\n \"推理步骤4: 12:13:05 客厅运动传感器检测到有人(Occupancy=1),说明确实有人进入了室内,但随后 12:13:25 客厅主灯被关闭(OnOff=False),而此前主灯本就处于关闭状态——这个操作要么是冗余的,要么是入侵者试图确保灯光关闭以避免引起注意。\",\n \"推理步骤5: 入侵者进入后没有任何后续的正常居家活动(无开灯、无使用厨房/卫生间等),行为模式与住户完全不同。住户正常回家模式(如 18:24)是开灯、开空调、做饭等一系列连贯活动。\",\n \"推理步骤6: 住户真正回家是 18:24,通过手动开锁(OperationSource=Manual)进入,随后有完整的居家活动链(开玄关灯→开客厅灯→开空调→做饭→洗碗→睡觉),这才是正常的住户行为模式。\",\n \"推理步骤7: 对比两次入门事件——07:30 出门和 18:24 回家都是 Manual 操作,而 12:13 是远程凭证操作(Source=8),且 12:13 进入后无任何正常生活痕迹,高度疑似非授权人员使用复制/盗取的凭证进入。\"\n ],\n \"key_evidence\": [\n \"12:13 门锁通过 OperationSource=8(远程/凭证)以 UserIndex=1 解锁,而住户当天出门和回家均使用 Manual 方式\",\n \"12:13:03 入户门打开后,直到 22:07:30(近10小时)才记录到门关闭事件,期间门处于未关状态\",\n \"12:13:05 客厅检测到人体存在,但随后无任何正常居家活动(无开灯、无使用设备),行为模式异常\",\n \"12:13:25 客厅主灯被执行关闭操作,疑似入侵者刻意保持室内黑暗\",\n \"住户 18:24 手动开锁回家后才有完整的正常居家活动链,证明 12:13 的进入者并非住户本人\"\n ],\n \"recommended_actions\": [\n \"立即更换入户门锁的所有用户凭证(PIN码、指纹、数字钥匙等),尤其是 UserIndex=1 对应的凭证,防止被盗凭证再次使用\",\n \"检查门锁的完整操作日志和凭证分发记录,确认 UserIndex=1 的凭证是否曾被分享、导出或通过不安全渠道传输\",\n \"立即检查家中是否有财物丢失、设备被篡改、或被安装了窃听/监控装置\",\n \"启用门锁的实时告警功能:任何远程解锁操作应立即推送通知到住户手机\",\n \"设置离家模式自动化规则:住户外出期间如检测到开锁+人体存在,立即触发警报并推送通知\",\n \"考虑在玄关/客厅加装摄像头,以便在类似事件发生时获取视频证据\",\n \"如确认为非授权入侵,立即报警并保留所有设备日志作为证据\",\n \"审查门锁固件版本,确认是否存在已知的安全漏洞,必要时升级固件\",\n \"临时禁用远程开锁功能,仅保留手动/物理方式开锁,直到安全审计完成\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "12:13 的开锁事件疑似使用被盗/复制凭证入侵,住户不在家期间门锁被远程解锁且入侵者行为异常。", "reasoning": ["推理步骤1: 住户于 07:30 手动开锁出门(OperationSource=Manual),门自动上锁,之后家中无任何人体活动,所有灯关闭,符合外出离家状态。", "推理步骤2: 12:13 门锁被解锁,OperationSource=8(远程/凭证方式),使用 UserIndex=1 的凭证。这不是住户手动操作,而是通过已注册凭证(PIN码/指纹/远程指令)触发的。如果凭证被复制或泄露,攻击者可以用此方式开锁。", "推理步骤3: 12:13:03 入户门打开(StateValue=False),但日志中始终没有记录门关闭(StateValue=True)的事件,直到 22:07:30 住户晚间回家后门才恢复关闭状态。这意味着入户门在住户不在家的近10小时内处于未关闭状态,极不正常。", "推理步骤4: 12:13:05 客厅运动传感器检测到有人(Occupancy=1),说明确实有人进入了室内,但随后 12:13:25 客厅主灯被关闭(OnOff=False),而此前主灯本就处于关闭状态——这个操作要么是冗余的,要么是入侵者试图确保灯光关闭以避免引起注意。", "推理步骤5: 入侵者进入后没有任何后续的正常居家活动(无开灯、无使用厨房/卫生间等),行为模式与住户完全不同。住户正常回家模式(如 18:24)是开灯、开空调、做饭等一系列连贯活动。", "推理步骤6: 住户真正回家是 18:24,通过手动开锁(OperationSource=Manual)进入,随后有完整的居家活动链(开玄关灯→开客厅灯→开空调→做饭→洗碗→睡觉),这才是正常的住户行为模式。", "推理步骤7: 对比两次入门事件——07:30 出门和 18:24 回家都是 Manual 操作,而 12:13 是远程凭证操作(Source=8),且 12:13 进入后无任何正常生活痕迹,高度疑似非授权人员使用复制/盗取的凭证进入。"], "key_evidence": ["12:13 门锁通过 OperationSource=8(远程/凭证)以 UserIndex=1 解锁,而住户当天出门和回家均使用 Manual 方式", "12:13:03 入户门打开后,直到 22:07:30(近10小时)才记录到门关闭事件,期间门处于未关状态", "12:13:05 客厅检测到人体存在,但随后无任何正常居家活动(无开灯、无使用设备),行为模式异常", "12:13:25 客厅主灯被执行关闭操作,疑似入侵者刻意保持室内黑暗", "住户 18:24 手动开锁回家后才有完整的正常居家活动链,证明 12:13 的进入者并非住户本人"], "recommended_actions": ["立即更换入户门锁的所有用户凭证(PIN码、指纹、数字钥匙等),尤其是 UserIndex=1 对应的凭证,防止被盗凭证再次使用", "检查门锁的完整操作日志和凭证分发记录,确认 UserIndex=1 的凭证是否曾被分享、导出或通过不安全渠道传输", "立即检查家中是否有财物丢失、设备被篡改、或被安装了窃听/监控装置", "启用门锁的实时告警功能:任何远程解锁操作应立即推送通知到住户手机", "设置离家模式自动化规则:住户外出期间如检测到开锁+人体存在,立即触发警报并推送通知", "考虑在玄关/客厅加装摄像头,以便在类似事件发生时获取视频证据", "如确认为非授权入侵,立即报警并保留所有设备日志作为证据", "审查门锁固件版本,确认是否存在已知的安全漏洞,必要时升级固件", "临时禁用远程开锁功能,仅保留手动/物理方式开锁,直到安全审计完成"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.966345071792603, "api_error": null} {"episode_id": "SQ5_TP_A_1049", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1049.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261678, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-26T04:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时存在灶具无人值守开启和厨房温度传感器异常读数,火灾预警能力严重削弱。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-25T04:48 厨房烟雾报警器报告 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。\",\n \"推理步骤2: 低电量报警发生后约24小时内,灶具在 04:48 被开启(凌晨时段,无任何运动传感器检测到人员活动),10分钟后厨房温度从约23°C骤升至28.9°C,这是一次无人值守的灶具使用事件。虽然 SmokeState=0 表示当时未检测到烟雾,但报警器在低电量下的检测灵敏度和可靠性存疑。\",\n \"推理步骤3: 晚间19:00厨房温度传感器出现异常高值2841(约28.4°C,较同时段客厅高出约4°C),随后19:06和19:53两次报告 MeasuredValue=None(空值),说明厨房温度传感器本身也存在故障或通信异常,进一步削弱了火灾监测能力。\",\n \"推理步骤4: 烟雾报警器低电量 + 温度传感器间歇性失效 = 厨房火灾监测链条出现双重薄弱环节。一旦发生真实火情,系统可能无法及时发现和报警。\",\n \"推理步骤5: 凌晨04:48灶具开启时全屋无人活动(卧室/客厅/卫生间运动传感器均无触发),直到06:30卧室才检测到人员活动,存在约1小时40分钟的灶具无人值守窗口,这本身就是严重的火灾隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-25T04:48 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低\",\n \"2026-06-26T04:48 灶具在凌晨无人活动时段被开启,直到06:30才有人员活动记录\",\n \"2026-06-26T04:58 灶具开启10分钟后厨房温度骤升至28.9°C(正常约23°C)\",\n \"2026-06-26T19:06 和 19:53 厨房温度传感器两次报告 MeasuredValue=None,传感器存在故障\",\n \"2026-06-26T19:00 厨房温度异常读数2841(28.4°C),显著高于同时段其他房间\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,更换后进行手动测试确认报警功能正常\",\n \"排查厨房温度传感器故障原因(两次 None 值和异常高温读数),必要时更换传感器,确保温度监测链路完整\",\n \"调查凌晨04:48灶具自动开启的原因——检查是否存在误触发的自动化规则、定时任务或设备故障,排除后关闭相关自动化或修复故障\",\n \"为灶具设置安全联动规则:当全屋运动传感器均无人时,禁止灶具开启;灶具开启超过设定时长(如30分钟)且无人活动时自动关闭并推送告警\",\n \"在烟雾报警器电池更换完成前,提高厨房区域的监控频率,可临时启用手机推送,对厨房温度超过阈值(如30°C)立即告警\",\n \"建议为烟雾报警器设置低电量自动提醒规则,在 BatteryAlert 触发时立即推送通知到住户手机,避免长时间处于低电量状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时存在灶具无人值守开启和厨房温度传感器异常读数,火灾预警能力严重削弱。", "reasoning": ["推理步骤1: 2026-06-25T04:48 厨房烟雾报警器报告 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。", "推理步骤2: 低电量报警发生后约24小时内,灶具在 04:48 被开启(凌晨时段,无任何运动传感器检测到人员活动),10分钟后厨房温度从约23°C骤升至28.9°C,这是一次无人值守的灶具使用事件。虽然 SmokeState=0 表示当时未检测到烟雾,但报警器在低电量下的检测灵敏度和可靠性存疑。", "推理步骤3: 晚间19:00厨房温度传感器出现异常高值2841(约28.4°C,较同时段客厅高出约4°C),随后19:06和19:53两次报告 MeasuredValue=None(空值),说明厨房温度传感器本身也存在故障或通信异常,进一步削弱了火灾监测能力。", "推理步骤4: 烟雾报警器低电量 + 温度传感器间歇性失效 = 厨房火灾监测链条出现双重薄弱环节。一旦发生真实火情,系统可能无法及时发现和报警。", "推理步骤5: 凌晨04:48灶具开启时全屋无人活动(卧室/客厅/卫生间运动传感器均无触发),直到06:30卧室才检测到人员活动,存在约1小时40分钟的灶具无人值守窗口,这本身就是严重的火灾隐患。"], "key_evidence": ["2026-06-25T04:48 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低", "2026-06-26T04:48 灶具在凌晨无人活动时段被开启,直到06:30才有人员活动记录", "2026-06-26T04:58 灶具开启10分钟后厨房温度骤升至28.9°C(正常约23°C)", "2026-06-26T19:06 和 19:53 厨房温度传感器两次报告 MeasuredValue=None,传感器存在故障", "2026-06-26T19:00 厨房温度异常读数2841(28.4°C),显著高于同时段其他房间"], "recommended_actions": ["立即更换厨房烟雾报警器电池,更换后进行手动测试确认报警功能正常", "排查厨房温度传感器故障原因(两次 None 值和异常高温读数),必要时更换传感器,确保温度监测链路完整", "调查凌晨04:48灶具自动开启的原因——检查是否存在误触发的自动化规则、定时任务或设备故障,排除后关闭相关自动化或修复故障", "为灶具设置安全联动规则:当全屋运动传感器均无人时,禁止灶具开启;灶具开启超过设定时长(如30分钟)且无人活动时自动关闭并推送告警", "在烟雾报警器电池更换完成前,提高厨房区域的监控频率,可临时启用手机推送,对厨房温度超过阈值(如30°C)立即告警", "建议为烟雾报警器设置低电量自动提醒规则,在 BatteryAlert 触发时立即推送通知到住户手机,避免长时间处于低电量状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.97039294242859, "api_error": null} {"episode_id": "SQ5_TP_A_1051", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1051.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261680, "scenario_id": "FG-02", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-23T07:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅温度传感器在07:11-07:16出现极端异常高温读数,厨房烟雾报警器随后触发,高度疑似电器过热起火事件。\",\n \"reasoning\": [\n \"推理步骤1: 07:11客厅温度传感器突然从约24.3°C(2433)飙升至33.7°C(3370),仅11分钟内上升近10°C,这远超正常环境温度波动幅度,属于极端异常。\",\n \"推理步骤2: 07:16温度略降至32.0°C(3200),但仍远高于正常值。注意此时段日志使用了缩写格式(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能是传感器在异常高温下的非标准上报行为。\",\n \"推理步骤3: 07:21厨房烟雾报警器触发(SmokeState=1),这是火灾最直接的证据。烟雾报警器触发时间与温度异常仅相隔10分钟,时间高度吻合。\",\n \"推理步骤4: 事发时住户在家——06:32起床、07:08从卫生间出来后进入厨房开灯(07:08:16),说明住户当时在厨房区域活动,但日志中未见灶具开启记录,排除正常烹饪导致的烟雾。\",\n \"推理步骤5: 07:30温度回落至24.25°C(2425),说明火情可能已被控制或自行熄灭,但烟雾报警器未见复位记录(SmokeState未回到0),需要确认现场状况。\",\n \"推理步骤6: 另一个值得关注的异常是18:00厨房温度传感器突然跳至28.54°C(2854),较前一时段的23.64°C骤升近5°C,且18:30仍维持在28.58°C。随后18:57传感器上报None值(离线/故障),这可能是厨房温度传感器因早晨火灾事件受损导致的后续故障表现。\",\n \"推理步骤7: 19:47厨房温度传感器再次上报None,进一步印证该传感器可能已受损,存在持续的设备可靠性问题。\"\n ],\n \"key_evidence\": [\n \"07:11 客厅温度从24.3°C骤升至33.7°C,11分钟内异常升温约10°C\",\n \"07:16 客厅温度仍高达32.0°C,远超正常室温范围\",\n \"07:21 厨房烟雾报警器触发(SmokeState=1),与温度异常时间高度吻合\",\n \"事发时段无灶具开启记录,排除正常烹饪产生烟雾的可能\",\n \"18:00 厨房温度传感器异常跳升至28.54°C,18:57和19:47两次上报None值,疑似传感器受损\"\n ],\n \"recommended_actions\": [\n \"【立即】确认烟雾报警器当前状态,若SmokeState仍为1,立即疏散并拨打119火警电话\",\n \"【立即】远程切断家中所有非必要电器电源,特别是客厅和厨房区域的电器,防止二次起火\",\n \"【立即】如住户在家,使用灭火器对起火点进行初期灭火;如火势无法控制,立即撤离并关闭入户门\",\n \"【紧急】打开厨房窗户(当前kitchen_window_contact已在19:46开启)和客厅窗户进行通风排烟\",\n \"【排查】检查客厅区域所有电器(特别是空调、灯具、插排等)是否存在短路、过载或过热痕迹,定位起火源\",\n \"【修复】厨房温度传感器出现多次None值上报,需检查是否因高温受损,必要时更换\",\n \"【修复】手动复位烟雾报警器,确认其恢复正常监测功能\",\n \"【预防】对家中电路进行全面检查,排查老化线路和过载插座;考虑加装客厅烟雾报警器以提升覆盖范围\",\n \"【预防】设置自动化规则:当烟雾报警器触发时,自动切断灶具和大功率电器、打开所有窗户、解锁入户门以便逃生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅温度传感器在07:11-07:16出现极端异常高温读数,厨房烟雾报警器随后触发,高度疑似电器过热起火事件。", "reasoning": ["推理步骤1: 07:11客厅温度传感器突然从约24.3°C(2433)飙升至33.7°C(3370),仅11分钟内上升近10°C,这远超正常环境温度波动幅度,属于极端异常。", "推理步骤2: 07:16温度略降至32.0°C(3200),但仍远高于正常值。注意此时段日志使用了缩写格式(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能是传感器在异常高温下的非标准上报行为。", "推理步骤3: 07:21厨房烟雾报警器触发(SmokeState=1),这是火灾最直接的证据。烟雾报警器触发时间与温度异常仅相隔10分钟,时间高度吻合。", "推理步骤4: 事发时住户在家——06:32起床、07:08从卫生间出来后进入厨房开灯(07:08:16),说明住户当时在厨房区域活动,但日志中未见灶具开启记录,排除正常烹饪导致的烟雾。", "推理步骤5: 07:30温度回落至24.25°C(2425),说明火情可能已被控制或自行熄灭,但烟雾报警器未见复位记录(SmokeState未回到0),需要确认现场状况。", "推理步骤6: 另一个值得关注的异常是18:00厨房温度传感器突然跳至28.54°C(2854),较前一时段的23.64°C骤升近5°C,且18:30仍维持在28.58°C。随后18:57传感器上报None值(离线/故障),这可能是厨房温度传感器因早晨火灾事件受损导致的后续故障表现。", "推理步骤7: 19:47厨房温度传感器再次上报None,进一步印证该传感器可能已受损,存在持续的设备可靠性问题。"], "key_evidence": ["07:11 客厅温度从24.3°C骤升至33.7°C,11分钟内异常升温约10°C", "07:16 客厅温度仍高达32.0°C,远超正常室温范围", "07:21 厨房烟雾报警器触发(SmokeState=1),与温度异常时间高度吻合", "事发时段无灶具开启记录,排除正常烹饪产生烟雾的可能", "18:00 厨房温度传感器异常跳升至28.54°C,18:57和19:47两次上报None值,疑似传感器受损"], "recommended_actions": ["【立即】确认烟雾报警器当前状态,若SmokeState仍为1,立即疏散并拨打119火警电话", "【立即】远程切断家中所有非必要电器电源,特别是客厅和厨房区域的电器,防止二次起火", "【立即】如住户在家,使用灭火器对起火点进行初期灭火;如火势无法控制,立即撤离并关闭入户门", "【紧急】打开厨房窗户(当前kitchen_window_contact已在19:46开启)和客厅窗户进行通风排烟", "【排查】检查客厅区域所有电器(特别是空调、灯具、插排等)是否存在短路、过载或过热痕迹,定位起火源", "【修复】厨房温度传感器出现多次None值上报,需检查是否因高温受损,必要时更换", "【修复】手动复位烟雾报警器,确认其恢复正常监测功能", "【预防】对家中电路进行全面检查,排查老化线路和过载插座;考虑加装客厅烟雾报警器以提升覆盖范围", "【预防】设置自动化规则:当烟雾报警器触发时,自动切断灶具和大功率电器、打开所有窗户、解锁入户门以便逃生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.65336585044861, "api_error": null} {"episode_id": "SQ5_TP_A_1055", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1055.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-10T00:00:00", "seed": 20261684, "scenario_id": "INS-05", "total_events": 195, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-10T09:37:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"09:37 的开锁事件存在伪装/凭证被盗嫌疑:家中无人时远程凭证开锁,入门后未关门、未开灯,行为模式与住户习惯显著不符。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:16 手动开锁出门(OperationSource=Manual),门自动上锁,此后家中所有运动传感器无触发,确认住户已离家。\",\n \"推理步骤2: 09:37 发生一次开锁事件,OperationSource=8(远程/凭证方式),使用 UserIndex=1。门锁解锁后门被打开(StateValue=False),但日志中始终没有关门记录(StateValue=True 缺失),说明入户门在此后长时间处于开启状态,这与正常住户行为不符。\",\n \"推理步骤3: 09:37 客厅运动传感器检测到有人(Occupancy=1),但紧接着客厅主灯被关闭(OnOff=False),而非打开。正常住户回家通常会开灯,而非关灯——这更像是入侵者试图保持低调。\",\n \"推理步骤4: 对比住户 18:20 正常回家的行为模式:手动开锁→开玄关灯→开客厅灯→开空调,流程自然连贯。而 09:37 事件完全缺少这些正常生活动作(无开灯、无开空调、无进入其他房间)。\",\n \"推理步骤5: 09:37 至 18:20 之间长达近9小时,家中无任何运动传感器触发、无任何设备操作,说明 09:37 进入的人并未长时间停留或进行正常居住活动,进一步佐证这不是住户本人。\",\n \"推理步骤6: 使用远程凭证(OperationSource=8)开锁本身不一定异常,但结合不关门、关灯而非开灯、无后续生活痕迹等多重反常行为,高度怀疑凭证被盗用或复制。\"\n ],\n \"key_evidence\": [\n \"09:37 远程凭证开锁(OperationSource=8, UserIndex=1),发生在住户 07:16 离家之后、18:20 回家之前的无人时段\",\n \"开锁后入户门只有打开记录(StateValue=False),缺少关门记录(StateValue=True),门长时间未关闭\",\n \"客厅检测到人体存在(Occupancy=1)后,主灯被关闭而非打开,行为逻辑反常\",\n \"09:37 至 18:20 之间无任何后续生活活动痕迹(无灯光、无电器、无其他房间运动传感器触发),与正常居住行为不符\",\n \"对比 18:20 住户正常回家流程(开锁→开灯→开空调),09:37 事件的行为模式完全异常\"\n ],\n \"recommended_actions\": [\n \"立即应急:远程锁定入户门锁,撤销当前所有远程访问凭证(尤其是 UserIndex=1 对应的密码/PIN/NFC 凭证),防止再次被利用\",\n \"立即应急:向住户手机推送高优先级入侵告警通知,告知 09:37 发生可疑开锁事件,建议住户确认是否为本人或授权人员操作\",\n \"立即应急:如住户确认非本人操作,立即报警并提供门锁事件日志作为证据\",\n \"安全排查:住户回家后检查家中是否有财物丢失或被翻动的痕迹,重点检查贵重物品存放区域\",\n \"凭证重置:更换门锁所有用户的 PIN 码、密码、NFC 卡等凭证,启用新的加密密钥;如果使用手机蓝牙/远程开锁,重置配对并更改账户密码\",\n \"加固措施:为门锁启用多因素认证(如 PIN + 指纹),限制远程开锁仅在特定时间段或地理围栏内可用\",\n \"加固措施:设置自动化规则——当住户离家模式激活后,任何开锁事件立即触发实时告警和摄像头录像(如有摄像头)\",\n \"日志审计:检查门锁固件版本是否存在已知漏洞,确认 Matter 协议通信是否被中间人攻击;审查近期所有远程开锁记录,排查是否有其他可疑访问\",\n \"长期建议:考虑在玄关区域增设摄像头或可视门铃,为类似事件提供视觉证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "09:37 的开锁事件存在伪装/凭证被盗嫌疑:家中无人时远程凭证开锁,入门后未关门、未开灯,行为模式与住户习惯显著不符。", "reasoning": ["推理步骤1: 住户于 07:16 手动开锁出门(OperationSource=Manual),门自动上锁,此后家中所有运动传感器无触发,确认住户已离家。", "推理步骤2: 09:37 发生一次开锁事件,OperationSource=8(远程/凭证方式),使用 UserIndex=1。门锁解锁后门被打开(StateValue=False),但日志中始终没有关门记录(StateValue=True 缺失),说明入户门在此后长时间处于开启状态,这与正常住户行为不符。", "推理步骤3: 09:37 客厅运动传感器检测到有人(Occupancy=1),但紧接着客厅主灯被关闭(OnOff=False),而非打开。正常住户回家通常会开灯,而非关灯——这更像是入侵者试图保持低调。", "推理步骤4: 对比住户 18:20 正常回家的行为模式:手动开锁→开玄关灯→开客厅灯→开空调,流程自然连贯。而 09:37 事件完全缺少这些正常生活动作(无开灯、无开空调、无进入其他房间)。", "推理步骤5: 09:37 至 18:20 之间长达近9小时,家中无任何运动传感器触发、无任何设备操作,说明 09:37 进入的人并未长时间停留或进行正常居住活动,进一步佐证这不是住户本人。", "推理步骤6: 使用远程凭证(OperationSource=8)开锁本身不一定异常,但结合不关门、关灯而非开灯、无后续生活痕迹等多重反常行为,高度怀疑凭证被盗用或复制。"], "key_evidence": ["09:37 远程凭证开锁(OperationSource=8, UserIndex=1),发生在住户 07:16 离家之后、18:20 回家之前的无人时段", "开锁后入户门只有打开记录(StateValue=False),缺少关门记录(StateValue=True),门长时间未关闭", "客厅检测到人体存在(Occupancy=1)后,主灯被关闭而非打开,行为逻辑反常", "09:37 至 18:20 之间无任何后续生活活动痕迹(无灯光、无电器、无其他房间运动传感器触发),与正常居住行为不符", "对比 18:20 住户正常回家流程(开锁→开灯→开空调),09:37 事件的行为模式完全异常"], "recommended_actions": ["立即应急:远程锁定入户门锁,撤销当前所有远程访问凭证(尤其是 UserIndex=1 对应的密码/PIN/NFC 凭证),防止再次被利用", "立即应急:向住户手机推送高优先级入侵告警通知,告知 09:37 发生可疑开锁事件,建议住户确认是否为本人或授权人员操作", "立即应急:如住户确认非本人操作,立即报警并提供门锁事件日志作为证据", "安全排查:住户回家后检查家中是否有财物丢失或被翻动的痕迹,重点检查贵重物品存放区域", "凭证重置:更换门锁所有用户的 PIN 码、密码、NFC 卡等凭证,启用新的加密密钥;如果使用手机蓝牙/远程开锁,重置配对并更改账户密码", "加固措施:为门锁启用多因素认证(如 PIN + 指纹),限制远程开锁仅在特定时间段或地理围栏内可用", "加固措施:设置自动化规则——当住户离家模式激活后,任何开锁事件立即触发实时告警和摄像头录像(如有摄像头)", "日志审计:检查门锁固件版本是否存在已知漏洞,确认 Matter 协议通信是否被中间人攻击;审查近期所有远程开锁记录,排查是否有其他可疑访问", "长期建议:考虑在玄关区域增设摄像头或可视门铃,为类似事件提供视觉证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 32.74128293991089, "api_error": null} {"episode_id": "SQ5_TP_A_1064", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1064.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-09T00:00:00", "seed": 20261693, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-09T09:19:00", "variant": "TP"}, "raw_response": "", "model_response": {"is_anomaly": null, "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": false, "detection_label": "UNPARSEABLE", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 0, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 2.973662853240967, "api_error": "500 Server Error: Internal Server Error for url: https://hche3637.com/v1/chat/completions"} {"episode_id": "SQ5_TP_A_1058", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1058.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-20T00:00:00", "seed": 20261687, "scenario_id": "INS-05", "total_events": 189, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-20T19:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:51 的开锁事件存在凭证被盗/复制的嫌疑:住户全天在家,却在傍晚出现远程开锁并关灯的反常行为组合,且入户门在之后长时间未确认关闭。\",\n \"reasoning\": [\n \"推理步骤1: 分析开锁事件本身 — 19:51 front_door_lock 报告 LockOperation(LockOperationType=1, OperationSource=8, UserIndex=1)。LockOperationType=1 表示 Unlock,OperationSource=8 对应远程操作(Remote)。这意味着门锁是通过远程指令(如手机App或API)而非物理钥匙/密码/指纹打开的。\",\n \"推理步骤2: 分析住户全天行为轨迹 — 08:21 卧室有人起床(occupancy=1、开灯、开窗帘),08:53 进卫生间,09:03 到厨房做早餐,10:07 在客厅活动并开空调。全天没有任何出门记录(无 front_door_lock Unlock + front_door_contact 开门事件),说明住户一直在家。\",\n \"推理步骤3: 开锁后的行为异常 — 19:51:03 门被打开(front_door_contact=False),19:51:05 客厅检测到有人,但 19:51:25 客厅主灯却被关闭。一个正常回家的人不会在进门后立刻关灯;而如果是住户自己远程开门迎客,客厅灯应该保持开启。关灯动作更像是入侵者试图隐蔽行踪。\",\n \"推理步骤4: 门的关闭状态存在时间断层 — 19:51:03 门被打开后,直到 23:09:21 才记录到 front_door_contact=True(门关闭)并自动上锁。中间超过3小时门的状态没有更新,这可能意味着门一直处于未关闭状态,存在安全隐患。\",\n \"推理步骤5: 23:09 的就寝序列看起来是住户本人操作(关客厅灯、关空调、进卧室、关窗帘、锁门、关卧室灯),说明住户在此时才意识到门未锁或进行正常就寝流程。但这也意味着 19:51 到 23:09 之间,入户门可能一直未上锁。\",\n \"推理步骤6: 综合判断 — 远程开锁(OperationSource=8)+ 住户全天在家未出门 + 开门后关灯的反常行为 + 门长时间未关闭,这些组合高度符合「凭证被盗/复制后远程开锁」的入侵模式。置信度为 medium 而非 high,是因为不能完全排除住户自己通过手机远程为访客开门后忘记关门的可能性。\"\n ],\n \"key_evidence\": [\n \"19:51 front_door_lock 远程开锁事件:LockOperationType=1(解锁), OperationSource=8(远程操作), UserIndex=1\",\n \"住户全天在家(08:21起床后无任何出门记录),远程开锁缺乏合理动机\",\n \"19:51:25 开门后客厅主灯被关闭,与正常进门行为矛盾\",\n \"入户门从 19:51 打开后直到 23:09 才关闭上锁,超过3小时处于不安全状态\",\n \"厨房温度传感器在 11:00 和 11:30 出现异常高温读数(2960/2955,约29.6°C),远高于同时段客厅温度,且灶具处于关闭状态,可能是传感器故障或存在其他热源\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,确认 DoorLock.LockState=1(已锁定),并临时禁用远程开锁功能\",\n \"【立即】吊销当前所有远程访问凭证(App Token、API Key),强制所有用户重新认证,重置 UserIndex=1 对应用户的门锁密码/PIN\",\n \"【立即】检查门锁的完整访问日志,确认 OperationSource=8 的远程开锁请求来源IP、设备指纹,排查是否有未授权设备接入\",\n \"【短期】启用门锁多因素认证(如远程开锁需同时验证手机+生物识别),限制远程开锁的时间窗口和地理围栏\",\n \"【短期】为入户门添加自动上锁策略:门打开超过5分钟未关闭时触发告警推送,超过10分钟自动上锁\",\n \"【短期】检查智能家居平台账户安全:更改账户密码、启用两步验证、审查已授权的第三方应用和共享权限\",\n \"【排查】检查厨房温度传感器 — 11:00-11:30 在灶具关闭状态下读数飙升至约29.6°C(较客厅高约4°C),可能是传感器故障,建议校准或更换\",\n \"【建议】在玄关/客厅增设摄像头,配合门锁事件联动录像,为后续类似事件提供视觉证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:51 的开锁事件存在凭证被盗/复制的嫌疑:住户全天在家,却在傍晚出现远程开锁并关灯的反常行为组合,且入户门在之后长时间未确认关闭。", "reasoning": ["推理步骤1: 分析开锁事件本身 — 19:51 front_door_lock 报告 LockOperation(LockOperationType=1, OperationSource=8, UserIndex=1)。LockOperationType=1 表示 Unlock,OperationSource=8 对应远程操作(Remote)。这意味着门锁是通过远程指令(如手机App或API)而非物理钥匙/密码/指纹打开的。", "推理步骤2: 分析住户全天行为轨迹 — 08:21 卧室有人起床(occupancy=1、开灯、开窗帘),08:53 进卫生间,09:03 到厨房做早餐,10:07 在客厅活动并开空调。全天没有任何出门记录(无 front_door_lock Unlock + front_door_contact 开门事件),说明住户一直在家。", "推理步骤3: 开锁后的行为异常 — 19:51:03 门被打开(front_door_contact=False),19:51:05 客厅检测到有人,但 19:51:25 客厅主灯却被关闭。一个正常回家的人不会在进门后立刻关灯;而如果是住户自己远程开门迎客,客厅灯应该保持开启。关灯动作更像是入侵者试图隐蔽行踪。", "推理步骤4: 门的关闭状态存在时间断层 — 19:51:03 门被打开后,直到 23:09:21 才记录到 front_door_contact=True(门关闭)并自动上锁。中间超过3小时门的状态没有更新,这可能意味着门一直处于未关闭状态,存在安全隐患。", "推理步骤5: 23:09 的就寝序列看起来是住户本人操作(关客厅灯、关空调、进卧室、关窗帘、锁门、关卧室灯),说明住户在此时才意识到门未锁或进行正常就寝流程。但这也意味着 19:51 到 23:09 之间,入户门可能一直未上锁。", "推理步骤6: 综合判断 — 远程开锁(OperationSource=8)+ 住户全天在家未出门 + 开门后关灯的反常行为 + 门长时间未关闭,这些组合高度符合「凭证被盗/复制后远程开锁」的入侵模式。置信度为 medium 而非 high,是因为不能完全排除住户自己通过手机远程为访客开门后忘记关门的可能性。"], "key_evidence": ["19:51 front_door_lock 远程开锁事件:LockOperationType=1(解锁), OperationSource=8(远程操作), UserIndex=1", "住户全天在家(08:21起床后无任何出门记录),远程开锁缺乏合理动机", "19:51:25 开门后客厅主灯被关闭,与正常进门行为矛盾", "入户门从 19:51 打开后直到 23:09 才关闭上锁,超过3小时处于不安全状态", "厨房温度传感器在 11:00 和 11:30 出现异常高温读数(2960/2955,约29.6°C),远高于同时段客厅温度,且灶具处于关闭状态,可能是传感器故障或存在其他热源"], "recommended_actions": ["【立即】远程锁定入户门锁,确认 DoorLock.LockState=1(已锁定),并临时禁用远程开锁功能", "【立即】吊销当前所有远程访问凭证(App Token、API Key),强制所有用户重新认证,重置 UserIndex=1 对应用户的门锁密码/PIN", "【立即】检查门锁的完整访问日志,确认 OperationSource=8 的远程开锁请求来源IP、设备指纹,排查是否有未授权设备接入", "【短期】启用门锁多因素认证(如远程开锁需同时验证手机+生物识别),限制远程开锁的时间窗口和地理围栏", "【短期】为入户门添加自动上锁策略:门打开超过5分钟未关闭时触发告警推送,超过10分钟自动上锁", "【短期】检查智能家居平台账户安全:更改账户密码、启用两步验证、审查已授权的第三方应用和共享权限", "【排查】检查厨房温度传感器 — 11:00-11:30 在灶具关闭状态下读数飙升至约29.6°C(较客厅高约4°C),可能是传感器故障,建议校准或更换", "【建议】在玄关/客厅增设摄像头,配合门锁事件联动录像,为后续类似事件提供视觉证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 36.20163154602051, "api_error": null} {"episode_id": "SQ5_TP_A_1066", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1066.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-06T00:00:00", "seed": 20261695, "scenario_id": "FG-02", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-06T05:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在凌晨5:49发生疑似电器过热起火事件,温度传感器出现剧烈飙升并触发烟雾报警,同时厨房温度传感器在后续多次报告 None 值,表明传感器可能已受损或离线。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨00:00至05:30期间,厨房温度稳定在22.93°C~23.09°C范围内,属于正常夜间室温。此时段无任何人员活动、无灶具使用记录。\",\n \"推理步骤2: 05:49厨房温度传感器突然报告37.87°C(3787),较前一次读数23.01°C飙升约15°C,这在无任何灶具开启的情况下极不正常。5分钟后(05:54)温度仍高达32.00°C(3200),说明并非瞬时读数错误,而是持续性高温。\",\n \"推理步骤3: 05:59烟雾报警器触发(SmokeState=1,表示检测到烟雾),进一步印证厨房存在真实的火灾/过热事件,而非单纯的传感器故障。\",\n \"推理步骤4: 事件发生在凌晨05:49,住户直到08:26才在卧室检测到活动,说明事发时无人在厨房操作,排除了正常烹饪导致高温的可能。灶具(kitchen_cook_surface)在此时段无开启记录。\",\n \"推理步骤5: 06:00之后厨房温度回落至24.09°C,说明火源可能自行熄灭或热量已散去,但这不排除已造成损害的可能。\",\n \"推理步骤6: 后续日志中厨房温度传感器多次报告 MeasuredValue = None(09:08、09:48、12:05、12:44、17:48、18:44),这种反复离线的模式提示传感器可能在火灾事件中受到了热损伤,工作状态不稳定。\",\n \"推理步骤7: 12:00厨房温度异常读数29.81°C、12:30读数29.86°C,远高于同时段客厅的25.70°C~25.82°C,可能是传感器损坏后的漂移读数,也可能是厨房内残留热源或受损电器仍在散热。\"\n ],\n \"key_evidence\": [\n \"05:49 厨房温度从约23°C骤升至37.87°C,05:54仍为32.00°C——无人操作灶具情况下的异常高温\",\n \"05:59 烟雾报警器触发 SmokeState=1,确认存在烟雾\",\n \"事发时段(凌晨05:49)无住户活动、灶具处于关闭状态,排除正常烹饪\",\n \"厨房温度传感器在事件后多次报告 None 值(09:08、09:48、12:05、12:44、17:48、18:44),疑似热损伤导致间歇性故障\",\n \"12:00 厨房温度读数29.81°C,显著高于其他房间,存在残留热源或传感器漂移\"\n ],\n \"recommended_actions\": [\n \"立即响应:远程切断厨房总电源(如有智能断路器),防止受损电器持续通电引发二次起火\",\n \"立即响应:向住户手机推送高优先级火灾警报,提示尽快检查厨房现场,如发现明火立即拨打119\",\n \"开窗通风:远程确认厨房窗户已打开(日志显示 kitchen_window_contact 在09:47后有开启记录),如未开启则触发开窗,排出残余烟气\",\n \"现场排查:住户应尽快检查厨房内所有电器(冰箱、微波炉、电饭煲、排插等),寻找过热痕迹、烧焦气味或熔化部件,定位起火源\",\n \"传感器检修:厨房温度传感器多次报告 None 值,疑似已受热损伤,需更换或重新校准,恢复厨房温度监控能力\",\n \"烟雾报警器复位:确认烟雾已完全消散后,对 kitchen_smoke_alarm 进行复位;如无法复位则检查报警器本身是否受损\",\n \"电气安全检查:建议联系专业电工对厨房线路进行全面检查,排查短路、过载或老化线路等隐患\",\n \"后续监控:在问题彻底排查前,提高厨房区域所有传感器的上报频率,并设置厨房温度超过30°C的即时告警阈值\",\n \"预防措施:考虑在厨房加装独立式灭火器或自动灭火装置,并为关键电器配置智能插座以实现远程断电\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在凌晨5:49发生疑似电器过热起火事件,温度传感器出现剧烈飙升并触发烟雾报警,同时厨房温度传感器在后续多次报告 None 值,表明传感器可能已受损或离线。", "reasoning": ["推理步骤1: 凌晨00:00至05:30期间,厨房温度稳定在22.93°C~23.09°C范围内,属于正常夜间室温。此时段无任何人员活动、无灶具使用记录。", "推理步骤2: 05:49厨房温度传感器突然报告37.87°C(3787),较前一次读数23.01°C飙升约15°C,这在无任何灶具开启的情况下极不正常。5分钟后(05:54)温度仍高达32.00°C(3200),说明并非瞬时读数错误,而是持续性高温。", "推理步骤3: 05:59烟雾报警器触发(SmokeState=1,表示检测到烟雾),进一步印证厨房存在真实的火灾/过热事件,而非单纯的传感器故障。", "推理步骤4: 事件发生在凌晨05:49,住户直到08:26才在卧室检测到活动,说明事发时无人在厨房操作,排除了正常烹饪导致高温的可能。灶具(kitchen_cook_surface)在此时段无开启记录。", "推理步骤5: 06:00之后厨房温度回落至24.09°C,说明火源可能自行熄灭或热量已散去,但这不排除已造成损害的可能。", "推理步骤6: 后续日志中厨房温度传感器多次报告 MeasuredValue = None(09:08、09:48、12:05、12:44、17:48、18:44),这种反复离线的模式提示传感器可能在火灾事件中受到了热损伤,工作状态不稳定。", "推理步骤7: 12:00厨房温度异常读数29.81°C、12:30读数29.86°C,远高于同时段客厅的25.70°C~25.82°C,可能是传感器损坏后的漂移读数,也可能是厨房内残留热源或受损电器仍在散热。"], "key_evidence": ["05:49 厨房温度从约23°C骤升至37.87°C,05:54仍为32.00°C——无人操作灶具情况下的异常高温", "05:59 烟雾报警器触发 SmokeState=1,确认存在烟雾", "事发时段(凌晨05:49)无住户活动、灶具处于关闭状态,排除正常烹饪", "厨房温度传感器在事件后多次报告 None 值(09:08、09:48、12:05、12:44、17:48、18:44),疑似热损伤导致间歇性故障", "12:00 厨房温度读数29.81°C,显著高于其他房间,存在残留热源或传感器漂移"], "recommended_actions": ["立即响应:远程切断厨房总电源(如有智能断路器),防止受损电器持续通电引发二次起火", "立即响应:向住户手机推送高优先级火灾警报,提示尽快检查厨房现场,如发现明火立即拨打119", "开窗通风:远程确认厨房窗户已打开(日志显示 kitchen_window_contact 在09:47后有开启记录),如未开启则触发开窗,排出残余烟气", "现场排查:住户应尽快检查厨房内所有电器(冰箱、微波炉、电饭煲、排插等),寻找过热痕迹、烧焦气味或熔化部件,定位起火源", "传感器检修:厨房温度传感器多次报告 None 值,疑似已受热损伤,需更换或重新校准,恢复厨房温度监控能力", "烟雾报警器复位:确认烟雾已完全消散后,对 kitchen_smoke_alarm 进行复位;如无法复位则检查报警器本身是否受损", "电气安全检查:建议联系专业电工对厨房线路进行全面检查,排查短路、过载或老化线路等隐患", "后续监控:在问题彻底排查前,提高厨房区域所有传感器的上报频率,并设置厨房温度超过30°C的即时告警阈值", "预防措施:考虑在厨房加装独立式灭火器或自动灭火装置,并为关键电器配置智能插座以实现远程断电"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.73847794532776, "api_error": null} {"episode_id": "SQ5_TP_A_1076", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1076.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261705, "scenario_id": "WD-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-12T23:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"住户已入睡且无人活动的情况下,卫生间漏水传感器持续报警超过30分钟未得到处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 住户于22:12关闭客厅灯和空调,进入卧室;22:22将卧室灯调暗至12.5%(32/254),22:34关灯,22:36卧室运动传感器显示无活动——判断住户已入睡。\",\n \"推理步骤2: 23:02卫生间漏水传感器首次报告StateValue=True,此后23:12和23:32连续两次重复报告True,说明漏水状态持续至少30分钟且未自行消除。\",\n \"推理步骤3: 在23:02至23:32期间,全屋无任何运动传感器触发、无灯光开关操作,确认住户处于无感知状态,漏水完全未被发现和处理。\",\n \"推理步骤4: 卫生间无关水阀门的智能设备记录,意味着漏水无法被自动止住,随时间推移水损面积将持续扩大,可能渗透到相邻房间或楼下。\",\n \"推理步骤5: 入户门锁在18:06后一直处于锁定状态(22:12:37自动上锁),家中仅住户一人,无其他人可响应此事件。\"\n ],\n \"key_evidence\": [\n \"23:02 bathroom_water_leak StateValue=True,首次触发漏水报警\",\n \"23:12 bathroom_water_leak StateValue=True,漏水持续10分钟\",\n \"23:32 bathroom_water_leak StateValue=True,漏水持续30分钟仍未消除\",\n \"22:34 卧室灯关闭、22:36 卧室运动传感器归零,住户已入睡\",\n \"23:02-23:32期间全屋无任何人体活动或设备操作记录\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送、电话、短信等多通道向住户发送高优先级漏水警报,尝试唤醒住户\",\n \"若智能家居系统接入了电磁水阀,立即远程关闭卫生间或全屋总进水阀\",\n \"触发卧室灯闪烁或智能音箱语音播报漏水警报,以物理方式唤醒住户\",\n \"同时通知物业管理处或紧急联系人,防止漏水影响楼下邻居\",\n \"若5分钟内住户无响应,升级为紧急事件,联系物业派人上门处理\",\n \"漏水解除后,检查卫生间水管接头、马桶进水阀、热水器等可能的漏水源\",\n \"建议住户加装智能电磁水阀,实现漏水时自动关水的联动规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "住户已入睡且无人活动的情况下,卫生间漏水传感器持续报警超过30分钟未得到处理,存在水损风险。", "reasoning": ["推理步骤1: 住户于22:12关闭客厅灯和空调,进入卧室;22:22将卧室灯调暗至12.5%(32/254),22:34关灯,22:36卧室运动传感器显示无活动——判断住户已入睡。", "推理步骤2: 23:02卫生间漏水传感器首次报告StateValue=True,此后23:12和23:32连续两次重复报告True,说明漏水状态持续至少30分钟且未自行消除。", "推理步骤3: 在23:02至23:32期间,全屋无任何运动传感器触发、无灯光开关操作,确认住户处于无感知状态,漏水完全未被发现和处理。", "推理步骤4: 卫生间无关水阀门的智能设备记录,意味着漏水无法被自动止住,随时间推移水损面积将持续扩大,可能渗透到相邻房间或楼下。", "推理步骤5: 入户门锁在18:06后一直处于锁定状态(22:12:37自动上锁),家中仅住户一人,无其他人可响应此事件。"], "key_evidence": ["23:02 bathroom_water_leak StateValue=True,首次触发漏水报警", "23:12 bathroom_water_leak StateValue=True,漏水持续10分钟", "23:32 bathroom_water_leak StateValue=True,漏水持续30分钟仍未消除", "22:34 卧室灯关闭、22:36 卧室运动传感器归零,住户已入睡", "23:02-23:32期间全屋无任何人体活动或设备操作记录"], "recommended_actions": ["立即通过手机推送、电话、短信等多通道向住户发送高优先级漏水警报,尝试唤醒住户", "若智能家居系统接入了电磁水阀,立即远程关闭卫生间或全屋总进水阀", "触发卧室灯闪烁或智能音箱语音播报漏水警报,以物理方式唤醒住户", "同时通知物业管理处或紧急联系人,防止漏水影响楼下邻居", "若5分钟内住户无响应,升级为紧急事件,联系物业派人上门处理", "漏水解除后,检查卫生间水管接头、马桶进水阀、热水器等可能的漏水源", "建议住户加装智能电磁水阀,实现漏水时自动关水的联动规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.303613424301147, "api_error": null} {"episode_id": "SQ5_TP_A_1079", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1079.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261708, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-22T22:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器在22:29触发CO(一氧化碳)报警,住户已在卧室准备入睡,存在一氧化碳中毒的严重生命安全风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:29厨房烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认厨房存在一氧化碳浓度升高。\",\n \"推理步骤2: 回溯CO可能来源——19:07至19:43期间灶具处于开启状态,烹饪结束后19:43才打开厨房窗户通风。19:00时厨房温度曾异常飙升至28.31°C(远高于同期客厅的24.32°C),且19:08和19:44两个时间点厨房温度传感器读数为None(可能因高温或烟气导致传感器暂时失效),说明烹饪期间厨房通风不良、燃烧产物积聚。\",\n \"推理步骤3: 虽然19:43已开窗,但CO报警发生在约3小时后的22:29,可能原因包括:(a)灶具燃气阀门未完全关闭导致持续微量泄漏;(b)烹饪期间产生的CO在通风不充分的情况下逐渐积累到报警阈值;(c)一室一厅户型空间有限,CO扩散到整个居住空间的风险更高。\",\n \"推理步骤4: 22:29时住户正在卧室(卧室灯调暗至13%亮度,22:41关灯、22:42运动传感器显示无活动),表明住户已入睡或即将入睡。睡眠状态下人体对CO中毒无感知能力,这是最危险的场景。\",\n \"推理步骤5: 从报警触发(22:29)到日志结束(23:30),未见任何住户响应动作(无灯光开启、无运动检测、无开窗开门操作),强烈暗示住户未察觉报警,可能已处于睡眠状态,情况极为紧急。\",\n \"推理步骤6: 入户门处于锁定状态(21:45:46自动上锁,LockState=1),厨房窗户虽然在19:43打开,但卧室窗帘已关闭(21:45:37关至100%),整体通风条件有限,CO浓度可能持续上升。\"\n ],\n \"key_evidence\": [\n \"22:29 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认CO浓度达到报警阈值\",\n \"19:00 厨房温度异常飙升至28.31°C,19:08和19:44温度传感器读数为None——烹饪期间燃烧状况异常\",\n \"19:07-19:43 灶具运行约36分钟,19:43之前厨房窗户未打开——烹饪期间通风不足导致燃烧产物积聚\",\n \"22:41卧室灯关闭、22:42卧室运动传感器归零——住户已入睡\",\n \"CO报警后至23:30无任何住户活动响应——住户极可能未察觉报警\"\n ],\n \"recommended_actions\": [\n \"【立即】触发全屋紧急警报(所有灯光闪烁、最大音量报警),尝试唤醒住户\",\n \"【立即】自动拨打119(消防)和120(急救),报告疑似一氧化碳泄漏,提供住户地址\",\n \"【立即】向住户手机推送紧急通知和电话呼叫,告知CO报警,要求立即撤离\",\n \"【立即】同时通知紧急联系人(家属/物业),告知CO报警及住户可能未响应的情况\",\n \"【立即-自动化】远程解锁入户门(front_door_lock),便于住户快速撤离或救援人员进入\",\n \"【立即-自动化】打开所有可控窗户和窗帘(客厅窗帘、卧室窗帘开启),最大化通风\",\n \"【立即-自动化】关闭厨房灶具燃气阀门(如有智能燃气阀),确认kitchen_cook_surface处于关闭状态\",\n \"【立即-自动化】关闭空调系统,防止CO通过空调管道在室内循环扩散\",\n \"【后续】住户撤离后,专业人员检查燃气管道、灶具密封性及厨房排烟系统,排查CO泄漏根源\",\n \"【后续】检查厨房温度传感器两次返回None的原因,排除传感器故障,确保监测系统可靠性\",\n \"【后续】建议在卧室增设独立CO报警器,确保睡眠区域有直接的CO检测能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器在22:29触发CO(一氧化碳)报警,住户已在卧室准备入睡,存在一氧化碳中毒的严重生命安全风险。", "reasoning": ["推理步骤1: 22:29厨房烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认厨房存在一氧化碳浓度升高。", "推理步骤2: 回溯CO可能来源——19:07至19:43期间灶具处于开启状态,烹饪结束后19:43才打开厨房窗户通风。19:00时厨房温度曾异常飙升至28.31°C(远高于同期客厅的24.32°C),且19:08和19:44两个时间点厨房温度传感器读数为None(可能因高温或烟气导致传感器暂时失效),说明烹饪期间厨房通风不良、燃烧产物积聚。", "推理步骤3: 虽然19:43已开窗,但CO报警发生在约3小时后的22:29,可能原因包括:(a)灶具燃气阀门未完全关闭导致持续微量泄漏;(b)烹饪期间产生的CO在通风不充分的情况下逐渐积累到报警阈值;(c)一室一厅户型空间有限,CO扩散到整个居住空间的风险更高。", "推理步骤4: 22:29时住户正在卧室(卧室灯调暗至13%亮度,22:41关灯、22:42运动传感器显示无活动),表明住户已入睡或即将入睡。睡眠状态下人体对CO中毒无感知能力,这是最危险的场景。", "推理步骤5: 从报警触发(22:29)到日志结束(23:30),未见任何住户响应动作(无灯光开启、无运动检测、无开窗开门操作),强烈暗示住户未察觉报警,可能已处于睡眠状态,情况极为紧急。", "推理步骤6: 入户门处于锁定状态(21:45:46自动上锁,LockState=1),厨房窗户虽然在19:43打开,但卧室窗帘已关闭(21:45:37关至100%),整体通风条件有限,CO浓度可能持续上升。"], "key_evidence": ["22:29 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认CO浓度达到报警阈值", "19:00 厨房温度异常飙升至28.31°C,19:08和19:44温度传感器读数为None——烹饪期间燃烧状况异常", "19:07-19:43 灶具运行约36分钟,19:43之前厨房窗户未打开——烹饪期间通风不足导致燃烧产物积聚", "22:41卧室灯关闭、22:42卧室运动传感器归零——住户已入睡", "CO报警后至23:30无任何住户活动响应——住户极可能未察觉报警"], "recommended_actions": ["【立即】触发全屋紧急警报(所有灯光闪烁、最大音量报警),尝试唤醒住户", "【立即】自动拨打119(消防)和120(急救),报告疑似一氧化碳泄漏,提供住户地址", "【立即】向住户手机推送紧急通知和电话呼叫,告知CO报警,要求立即撤离", "【立即】同时通知紧急联系人(家属/物业),告知CO报警及住户可能未响应的情况", "【立即-自动化】远程解锁入户门(front_door_lock),便于住户快速撤离或救援人员进入", "【立即-自动化】打开所有可控窗户和窗帘(客厅窗帘、卧室窗帘开启),最大化通风", "【立即-自动化】关闭厨房灶具燃气阀门(如有智能燃气阀),确认kitchen_cook_surface处于关闭状态", "【立即-自动化】关闭空调系统,防止CO通过空调管道在室内循环扩散", "【后续】住户撤离后,专业人员检查燃气管道、灶具密封性及厨房排烟系统,排查CO泄漏根源", "【后续】检查厨房温度传感器两次返回None的原因,排除传感器故障,确保监测系统可靠性", "【后续】建议在卧室增设独立CO报警器,确保睡眠区域有直接的CO检测能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.621195554733276, "api_error": null} {"episode_id": "SQ5_TP_A_1080", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1080.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-01T00:00:00", "seed": 20261709, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T09:35:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"住户外出期间,客厅窗户被打开且检测到室内有人活动,疑似撬窗入室。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:32 关灯、手动开锁出门,门自动上锁,此后家中应无人。\",\n \"推理步骤2: 09:35 客厅窗户传感器 StateValue=False(窗户被打开),随后 09:35:08 至 09:37 客厅运动传感器持续检测到有人(Occupancy=1),说明有人从窗户方向进入室内。\",\n \"推理步骤3: 09:38 窗户关闭(StateValue=True),紧接着 09:38:05 运动传感器归零(Occupancy=0),入侵者离开。整个过程约 3 分钟,时间短暂,符合快速入侵/踩点的特征。\",\n \"推理步骤4: 在此期间入户门锁无任何开锁事件,门传感器也未触发,排除了住户自行返回的可能。\",\n \"推理步骤5: 没有任何灯光、空调等设备被操作,说明这不是住户远程控制或自动化场景触发的正常行为。\",\n \"推理步骤6: 置信度定为 medium 而非 high,是因为仅凭窗户+运动传感器无法100%排除大风吹开窗户+动物/窗帘误触运动传感器的小概率情况,但三次持续的 Occupancy=1 读数大幅降低了误报可能性。\"\n ],\n \"key_evidence\": [\n \"09:35 客厅窗户传感器 StateValue=False — 住户外出期间窗户被打开\",\n \"09:35:08 ~ 09:37 客厅运动传感器连续三次报告 Occupancy=1 — 室内有人活动\",\n \"09:38 窗户关闭后运动传感器立即归零 — 入侵者经窗户离开\",\n \"07:32 住户出门后至 18:27 回家前,入户门锁和门传感器无任何事件 — 排除住户返回\"\n ],\n \"recommended_actions\": [\n \"立即通知住户并拨打报警电话(110),告知疑似撬窗入室,提供事件时间段 09:35-09:38\",\n \"远程锁定所有门窗:确认入户门锁处于锁定状态(LockState=1),如有电动窗锁应立即锁闭\",\n \"保留并导出 09:30-09:45 时间段所有设备日志作为证据,如有摄像头应保存录像\",\n \"住户回家前不要独自进入,等待警方或物业安保人员陪同检查室内是否有财物丢失或遗留痕迹\",\n \"检查客厅窗户是否有撬痕或损坏,评估窗户锁具安全性\",\n \"短期措施:在窗户加装振动/破碎传感器,提升入侵检测灵敏度;考虑加装室内摄像头覆盖客厅和玄关\",\n \"长期措施:为所有可开启窗户加装智能窗锁,设置离家模式下窗户打开即触发高优先级告警\",\n \"审查家中自动化规则,确保离家模式下运动传感器触发能立即推送告警通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "住户外出期间,客厅窗户被打开且检测到室内有人活动,疑似撬窗入室。", "reasoning": ["推理步骤1: 住户于 07:32 关灯、手动开锁出门,门自动上锁,此后家中应无人。", "推理步骤2: 09:35 客厅窗户传感器 StateValue=False(窗户被打开),随后 09:35:08 至 09:37 客厅运动传感器持续检测到有人(Occupancy=1),说明有人从窗户方向进入室内。", "推理步骤3: 09:38 窗户关闭(StateValue=True),紧接着 09:38:05 运动传感器归零(Occupancy=0),入侵者离开。整个过程约 3 分钟,时间短暂,符合快速入侵/踩点的特征。", "推理步骤4: 在此期间入户门锁无任何开锁事件,门传感器也未触发,排除了住户自行返回的可能。", "推理步骤5: 没有任何灯光、空调等设备被操作,说明这不是住户远程控制或自动化场景触发的正常行为。", "推理步骤6: 置信度定为 medium 而非 high,是因为仅凭窗户+运动传感器无法100%排除大风吹开窗户+动物/窗帘误触运动传感器的小概率情况,但三次持续的 Occupancy=1 读数大幅降低了误报可能性。"], "key_evidence": ["09:35 客厅窗户传感器 StateValue=False — 住户外出期间窗户被打开", "09:35:08 ~ 09:37 客厅运动传感器连续三次报告 Occupancy=1 — 室内有人活动", "09:38 窗户关闭后运动传感器立即归零 — 入侵者经窗户离开", "07:32 住户出门后至 18:27 回家前,入户门锁和门传感器无任何事件 — 排除住户返回"], "recommended_actions": ["立即通知住户并拨打报警电话(110),告知疑似撬窗入室,提供事件时间段 09:35-09:38", "远程锁定所有门窗:确认入户门锁处于锁定状态(LockState=1),如有电动窗锁应立即锁闭", "保留并导出 09:30-09:45 时间段所有设备日志作为证据,如有摄像头应保存录像", "住户回家前不要独自进入,等待警方或物业安保人员陪同检查室内是否有财物丢失或遗留痕迹", "检查客厅窗户是否有撬痕或损坏,评估窗户锁具安全性", "短期措施:在窗户加装振动/破碎传感器,提升入侵检测灵敏度;考虑加装室内摄像头覆盖客厅和玄关", "长期措施:为所有可开启窗户加装智能窗锁,设置离家模式下窗户打开即触发高优先级告警", "审查家中自动化规则,确保离家模式下运动传感器触发能立即推送告警通知"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.53925395011902, "api_error": null} {"episode_id": "SQ5_TP_A_1090", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1090.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261719, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-08T14:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"14:29 住户外出期间客厅窗户被打开,伴随运动传感器触发,疑似撬窗入室事件。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:10 手动开锁出门,门锁随后自动上锁,所有灯光关闭,全屋无人占用状态持续至 18:16 住户回家。这段时间(07:10–18:16)家中应无人。\",\n \"推理步骤2: 14:29 客厅窗户传感器报告 StateValue=False(窗户被打开),8秒后 14:29:08 客厅运动传感器检测到有人(Occupancy=1),运动持续至 14:32:05。14:32 窗户关闭(StateValue=True),随后运动消失。整个过程约3分钟。\",\n \"推理步骤3: 在此期间,入户门锁没有任何开锁事件,入户门传感器也未触发,说明不是通过正门进入的。窗户先于运动传感器触发,符合从外部打开窗户后翻入室内的时序特征。\",\n \"推理步骤4: 该时段没有任何灯光、空调等设备被操作,也没有卧室或卫生间的运动检测,说明不是住户提前回家的正常行为(住户回家时通常会开门锁、开灯、开空调,如 18:16 的回家模式所示)。\",\n \"推理步骤5: 停留时间短(约3分钟)、未操作任何家电、仅在客厅活动后迅速离开,符合入室盗窃或踩点的行为模式。\",\n \"推理步骤6: 置信度为 medium 而非 high,是因为也存在小概率的正常解释:如风吹开未锁好的窗户导致窗帘晃动触发运动传感器,但窗户打开后精确3分钟关闭这一点难以用自然因素解释。\"\n ],\n \"key_evidence\": [\n \"14:29:00 客厅窗户传感器打开(StateValue=False),住户外出期间无人在家\",\n \"14:29:08 客厅运动传感器触发(Occupancy=1),窗户打开后8秒检测到运动\",\n \"14:32:00 窗户关闭,14:32:05 运动消失,整个过程约3分钟\",\n \"07:10–18:16 期间入户门锁无任何开锁记录,排除从正门进入的可能\",\n \"入侵期间无任何灯光或家电操作,与住户 18:16 回家时的正常行为模式(开灯、开空调)形成鲜明对比\"\n ],\n \"recommended_actions\": [\n \"立即报警:将 14:29–14:32 的窗户开启和运动检测记录提供给警方作为证据\",\n \"检查财物:住户应仔细清点客厅及全屋贵重物品是否有丢失\",\n \"检查窗户:检查客厅窗户是否有撬痕、锁具是否损坏,确认入侵方式\",\n \"加固窗户安全:安装窗户限位器或窗锁,防止从外部打开;考虑加装窗户振动/破碎传感器\",\n \"增设安防设备:在客厅和玄关安装摄像头,以便未来事件可回溯视频证据\",\n \"配置实时告警规则:当住户外出(门锁上锁且无人在家)时,任何窗户打开或运动传感器触发应立即推送高优先级告警到手机\",\n \"设置离家自动布防:住户出门后自动进入安防模式,检测到异常运动时触发声光报警并远程通知\",\n \"检查厨房温度传感器:19:00 和 19:15/19:42 厨房温度传感器出现异常高值(28.42°C)和 None 读数,建议排查传感器是否受损或受到干扰\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "14:29 住户外出期间客厅窗户被打开,伴随运动传感器触发,疑似撬窗入室事件。", "reasoning": ["推理步骤1: 住户于 07:10 手动开锁出门,门锁随后自动上锁,所有灯光关闭,全屋无人占用状态持续至 18:16 住户回家。这段时间(07:10–18:16)家中应无人。", "推理步骤2: 14:29 客厅窗户传感器报告 StateValue=False(窗户被打开),8秒后 14:29:08 客厅运动传感器检测到有人(Occupancy=1),运动持续至 14:32:05。14:32 窗户关闭(StateValue=True),随后运动消失。整个过程约3分钟。", "推理步骤3: 在此期间,入户门锁没有任何开锁事件,入户门传感器也未触发,说明不是通过正门进入的。窗户先于运动传感器触发,符合从外部打开窗户后翻入室内的时序特征。", "推理步骤4: 该时段没有任何灯光、空调等设备被操作,也没有卧室或卫生间的运动检测,说明不是住户提前回家的正常行为(住户回家时通常会开门锁、开灯、开空调,如 18:16 的回家模式所示)。", "推理步骤5: 停留时间短(约3分钟)、未操作任何家电、仅在客厅活动后迅速离开,符合入室盗窃或踩点的行为模式。", "推理步骤6: 置信度为 medium 而非 high,是因为也存在小概率的正常解释:如风吹开未锁好的窗户导致窗帘晃动触发运动传感器,但窗户打开后精确3分钟关闭这一点难以用自然因素解释。"], "key_evidence": ["14:29:00 客厅窗户传感器打开(StateValue=False),住户外出期间无人在家", "14:29:08 客厅运动传感器触发(Occupancy=1),窗户打开后8秒检测到运动", "14:32:00 窗户关闭,14:32:05 运动消失,整个过程约3分钟", "07:10–18:16 期间入户门锁无任何开锁记录,排除从正门进入的可能", "入侵期间无任何灯光或家电操作,与住户 18:16 回家时的正常行为模式(开灯、开空调)形成鲜明对比"], "recommended_actions": ["立即报警:将 14:29–14:32 的窗户开启和运动检测记录提供给警方作为证据", "检查财物:住户应仔细清点客厅及全屋贵重物品是否有丢失", "检查窗户:检查客厅窗户是否有撬痕、锁具是否损坏,确认入侵方式", "加固窗户安全:安装窗户限位器或窗锁,防止从外部打开;考虑加装窗户振动/破碎传感器", "增设安防设备:在客厅和玄关安装摄像头,以便未来事件可回溯视频证据", "配置实时告警规则:当住户外出(门锁上锁且无人在家)时,任何窗户打开或运动传感器触发应立即推送高优先级告警到手机", "设置离家自动布防:住户出门后自动进入安防模式,检测到异常运动时触发声光报警并远程通知", "检查厨房温度传感器:19:00 和 19:15/19:42 厨房温度传感器出现异常高值(28.42°C)和 None 读数,建议排查传感器是否受损或受到干扰"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.13283061981201, "api_error": null} {"episode_id": "SQ5_TP_A_1086", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1086.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261715, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T19:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在使用灶具期间触发一氧化碳(CO)报警,伴随温度传感器异常和温度骤升,存在燃气泄漏或不完全燃烧的严重安全威胁。\",\n \"reasoning\": [\n \"推理步骤1: 19:00 厨房温度传感器读数从 ~24.7°C 突然跳升至 28.35°C,较前一时段上升约 3.7°C,远超正常半小时波动幅度,说明厨房内有异常热源或燃烧状况。\",\n \"推理步骤2: 19:05 厨房灯打开,19:05:30 灶具开启,随后 19:06 厨房温度传感器报告 MeasuredValue = None(读数丢失),传感器可能因高温或有害气体干扰而失效,这本身就是危险信号。\",\n \"推理步骤3: 19:30 厨房温度仍高达 28.31°C,且 19:31 烟雾报警器触发 CO 报警(COState=1, ExpressedState=2, COAlarm 事件),确认厨房存在一氧化碳浓度超标。CO 是不完全燃烧的产物,说明灶具燃烧异常或通风严重不足。\",\n \"推理步骤4: 住户在 19:49 关闭了灶具,19:49:30 打开了厨房窗户进行通风,说明住户已意识到问题并采取了初步措施。但从 CO 报警(19:31)到关灶(19:49)间隔约 18 分钟,暴露时间较长。\",\n \"推理步骤5: 19:50 厨房温度传感器再次报告 None,传感器在整个事件期间两次失效,可能已受损或被污染,后续读数可靠性存疑。20:00 温度恢复到 24.19°C,说明通风起效,但 CO 报警器未见明确的复位/恢复事件记录。\",\n \"推理步骤6: 入户门传感器显示 18:05 开门进入后,门一直处于未关闭状态(StateValue=False),直到 22:02:38 才关闭。整个 CO 事件期间大门未关,虽然客观上有助于通风,但也说明住户未在第一时间撤离并封闭现场排查气源。\"\n ],\n \"key_evidence\": [\n \"19:00 厨房温度从 ~24.7°C 骤升至 28.35°C,异常偏高\",\n \"19:06 和 19:50 厨房温度传感器两次报告 MeasuredValue = None,传感器疑似失效\",\n \"19:31 烟雾报警器触发 CO 报警:COState=1, ExpressedState=2, Event: COAlarm()\",\n \"19:05:30 灶具开启,19:49 才关闭,灶具在 CO 报警后仍运行了约 18 分钟\",\n \"19:49:30 厨房窗户打开(BooleanState.StateValue=False),住户开始通风\",\n \"日志中未见 CO 报警器恢复正常状态的记录(COState 未回到 0)\"\n ],\n \"recommended_actions\": [\n \"【立即撤离】所有人员应立即离开住所到室外通风处,CO 是无色无味的致命气体,即使浓度下降也可能已造成累积暴露。\",\n \"【拨打急救电话】如有头晕、恶心、头痛等 CO 中毒症状,立即拨打 120 急救电话;同时拨打 119 通知消防部门排查气源。\",\n \"【切断燃气总阀】远程或手动关闭厨房燃气总阀门,防止燃气持续泄漏。仅关闭灶具开关不够,必须关闭总阀。\",\n \"【保持通风】确认厨房窗户已打开(日志显示 19:49:30 已开窗),同时打开客厅窗户和其他可开启的窗户,形成对流通风,加速 CO 排出。\",\n \"【禁止明火和电器操作】在确认 CO 浓度恢复安全之前,不要操作任何电器开关或使用明火,防止可能伴随的可燃气体被点燃。\",\n \"【检查 CO 报警器状态】日志中 CO 报警器未见复位记录,需确认 COState 是否已恢复为 0。如报警器持续报警,说明 CO 浓度仍未降至安全水平,绝对不可返回室内。\",\n \"【检修厨房温度传感器】该传感器在事件中两次报告 None,可能已损坏,需要检查或更换,以确保后续监测能力。\",\n \"【专业燃气检测】联系燃气公司上门检查灶具、燃气管道和接口是否存在泄漏或燃烧不完全的问题,排除隐患后方可恢复使用。\",\n \"【系统自动化改进建议】建议配置自动化规则:当 CO 报警触发时,自动关闭灶具、打开所有窗户、关闭空调(防止 CO 通过管道扩散)、打开所有灯光照明并发送紧急通知,缩短从报警到响应的时间窗口。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在使用灶具期间触发一氧化碳(CO)报警,伴随温度传感器异常和温度骤升,存在燃气泄漏或不完全燃烧的严重安全威胁。", "reasoning": ["推理步骤1: 19:00 厨房温度传感器读数从 ~24.7°C 突然跳升至 28.35°C,较前一时段上升约 3.7°C,远超正常半小时波动幅度,说明厨房内有异常热源或燃烧状况。", "推理步骤2: 19:05 厨房灯打开,19:05:30 灶具开启,随后 19:06 厨房温度传感器报告 MeasuredValue = None(读数丢失),传感器可能因高温或有害气体干扰而失效,这本身就是危险信号。", "推理步骤3: 19:30 厨房温度仍高达 28.31°C,且 19:31 烟雾报警器触发 CO 报警(COState=1, ExpressedState=2, COAlarm 事件),确认厨房存在一氧化碳浓度超标。CO 是不完全燃烧的产物,说明灶具燃烧异常或通风严重不足。", "推理步骤4: 住户在 19:49 关闭了灶具,19:49:30 打开了厨房窗户进行通风,说明住户已意识到问题并采取了初步措施。但从 CO 报警(19:31)到关灶(19:49)间隔约 18 分钟,暴露时间较长。", "推理步骤5: 19:50 厨房温度传感器再次报告 None,传感器在整个事件期间两次失效,可能已受损或被污染,后续读数可靠性存疑。20:00 温度恢复到 24.19°C,说明通风起效,但 CO 报警器未见明确的复位/恢复事件记录。", "推理步骤6: 入户门传感器显示 18:05 开门进入后,门一直处于未关闭状态(StateValue=False),直到 22:02:38 才关闭。整个 CO 事件期间大门未关,虽然客观上有助于通风,但也说明住户未在第一时间撤离并封闭现场排查气源。"], "key_evidence": ["19:00 厨房温度从 ~24.7°C 骤升至 28.35°C,异常偏高", "19:06 和 19:50 厨房温度传感器两次报告 MeasuredValue = None,传感器疑似失效", "19:31 烟雾报警器触发 CO 报警:COState=1, ExpressedState=2, Event: COAlarm()", "19:05:30 灶具开启,19:49 才关闭,灶具在 CO 报警后仍运行了约 18 分钟", "19:49:30 厨房窗户打开(BooleanState.StateValue=False),住户开始通风", "日志中未见 CO 报警器恢复正常状态的记录(COState 未回到 0)"], "recommended_actions": ["【立即撤离】所有人员应立即离开住所到室外通风处,CO 是无色无味的致命气体,即使浓度下降也可能已造成累积暴露。", "【拨打急救电话】如有头晕、恶心、头痛等 CO 中毒症状,立即拨打 120 急救电话;同时拨打 119 通知消防部门排查气源。", "【切断燃气总阀】远程或手动关闭厨房燃气总阀门,防止燃气持续泄漏。仅关闭灶具开关不够,必须关闭总阀。", "【保持通风】确认厨房窗户已打开(日志显示 19:49:30 已开窗),同时打开客厅窗户和其他可开启的窗户,形成对流通风,加速 CO 排出。", "【禁止明火和电器操作】在确认 CO 浓度恢复安全之前,不要操作任何电器开关或使用明火,防止可能伴随的可燃气体被点燃。", "【检查 CO 报警器状态】日志中 CO 报警器未见复位记录,需确认 COState 是否已恢复为 0。如报警器持续报警,说明 CO 浓度仍未降至安全水平,绝对不可返回室内。", "【检修厨房温度传感器】该传感器在事件中两次报告 None,可能已损坏,需要检查或更换,以确保后续监测能力。", "【专业燃气检测】联系燃气公司上门检查灶具、燃气管道和接口是否存在泄漏或燃烧不完全的问题,排除隐患后方可恢复使用。", "【系统自动化改进建议】建议配置自动化规则:当 CO 报警触发时,自动关闭灶具、打开所有窗户、关闭空调(防止 CO 通过管道扩散)、打开所有灯光照明并发送紧急通知,缩短从报警到响应的时间窗口。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.41336274147034, "api_error": null} {"episode_id": "SQ5_TP_A_1099", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1099.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261728, "scenario_id": "FG-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-04T03:51:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"凌晨3:51厨房烟雾报警器检测到一氧化碳(CO)浓度升高并触发CO报警,住户当时正在卧室睡眠,存在CO中毒的严重健康威胁。\",\n \"reasoning\": [\n \"推理步骤1: 03:51厨房烟雾报警器报告COState=1(CO警告状态)、ExpressedState=2(CO报警激活)并触发COAlarm事件,确认CO浓度已达到报警阈值。\",\n \"推理步骤2: 事件发生在凌晨3:51,住户处于深度睡眠状态(卧室灯在前一晚未开启、卧室运动传感器无活动),对CO报警的感知和响应能力极低,中毒风险极高。\",\n \"推理步骤3: 检查厨房温度数据,CO报警前后(03:30至05:00)厨房温度在22.94°C~23.10°C之间,无明显升温,排除明火燃烧导致的CO泄漏,更可能是燃气灶具不完全燃烧、燃气管道微漏或热水器等燃气设备故障导致的低温CO积聚。\",\n \"推理步骤4: 报警后日志中未见住户任何响应动作(无灯光开启、无运动检测、无门窗开启),直到06:27住户才在卧室起床,说明住户很可能未被报警唤醒,CO暴露时间长达约2.5小时。\",\n \"推理步骤5: 厨房窗户传感器在报警期间未报告开启(直到19:49才有开窗记录),说明CO报警期间厨房处于封闭状态,不利于CO扩散,加剧了CO积聚风险。\",\n \"推理步骤6: 18:00厨房温度出现异常飙升至28.62°C(较正常值高约4°C),18:30仍为28.57°C,18:52住户开始使用灶具后19:00恢复正常。结合凌晨的CO报警,厨房温度传感器在18:53和19:50两次报告None值,提示厨房区域可能存在燃气设备异常或传感器受损的持续性问题。\"\n ],\n \"key_evidence\": [\n \"03:51 kitchen_smoke_alarm COState=1,ExpressedState=2,触发COAlarm事件——确认CO浓度达到报警级别\",\n \"报警发生在凌晨3:51,住户在卧室睡眠中,从03:51到06:27无任何人员活动响应记录\",\n \"CO报警期间厨房窗户处于关闭状态,厨房温度无异常升高,指向低温不完全燃烧或燃气泄漏而非明火\",\n \"18:00厨房温度异常飙升至28.62°C且温度传感器两次报告None值,提示厨房设备或传感器存在持续性故障\",\n \"整日日志中未见CO报警解除(COState恢复为0)的记录,报警状态可能持续存在\"\n ],\n \"recommended_actions\": [\n \"立即通风:远程或手动打开厨房窗户和所有可开启的门窗,尽快降低室内CO浓度\",\n \"人员撤离:如住户在家,立即撤离至室外通风处;如住户无响应,联系紧急联系人或拨打119/120请求上门确认住户安全\",\n \"关闭燃气总阀:立即关闭厨房燃气总阀,切断潜在CO来源,在专业检测完成前不要重新开启\",\n \"联系燃气公司上门检测:报告CO报警事件,请专业人员检查燃气管道、灶具、热水器等所有燃气设备是否存在泄漏或不完全燃烧问题\",\n \"就医检查:住户在CO环境中暴露约2.5小时(03:51-06:27),即使当前无明显症状,也建议尽快就医进行血液碳氧血红蛋白检测,排除CO中毒\",\n \"检查报警器状态:确认kitchen_smoke_alarm当前CO读数是否已恢复正常,如COState仍为1则说明CO源未消除,需加急处理\",\n \"排查厨房温度传感器故障:18:00温度异常飙升和两次None值读数提示传感器可能受损或受到干扰,需检修或更换\",\n \"增设CO报警联动:建议将CO报警与卧室声光报警、手机推送通知联动,确保深夜报警能有效唤醒住户;考虑在卧室增设独立CO探测器\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "凌晨3:51厨房烟雾报警器检测到一氧化碳(CO)浓度升高并触发CO报警,住户当时正在卧室睡眠,存在CO中毒的严重健康威胁。", "reasoning": ["推理步骤1: 03:51厨房烟雾报警器报告COState=1(CO警告状态)、ExpressedState=2(CO报警激活)并触发COAlarm事件,确认CO浓度已达到报警阈值。", "推理步骤2: 事件发生在凌晨3:51,住户处于深度睡眠状态(卧室灯在前一晚未开启、卧室运动传感器无活动),对CO报警的感知和响应能力极低,中毒风险极高。", "推理步骤3: 检查厨房温度数据,CO报警前后(03:30至05:00)厨房温度在22.94°C~23.10°C之间,无明显升温,排除明火燃烧导致的CO泄漏,更可能是燃气灶具不完全燃烧、燃气管道微漏或热水器等燃气设备故障导致的低温CO积聚。", "推理步骤4: 报警后日志中未见住户任何响应动作(无灯光开启、无运动检测、无门窗开启),直到06:27住户才在卧室起床,说明住户很可能未被报警唤醒,CO暴露时间长达约2.5小时。", "推理步骤5: 厨房窗户传感器在报警期间未报告开启(直到19:49才有开窗记录),说明CO报警期间厨房处于封闭状态,不利于CO扩散,加剧了CO积聚风险。", "推理步骤6: 18:00厨房温度出现异常飙升至28.62°C(较正常值高约4°C),18:30仍为28.57°C,18:52住户开始使用灶具后19:00恢复正常。结合凌晨的CO报警,厨房温度传感器在18:53和19:50两次报告None值,提示厨房区域可能存在燃气设备异常或传感器受损的持续性问题。"], "key_evidence": ["03:51 kitchen_smoke_alarm COState=1,ExpressedState=2,触发COAlarm事件——确认CO浓度达到报警级别", "报警发生在凌晨3:51,住户在卧室睡眠中,从03:51到06:27无任何人员活动响应记录", "CO报警期间厨房窗户处于关闭状态,厨房温度无异常升高,指向低温不完全燃烧或燃气泄漏而非明火", "18:00厨房温度异常飙升至28.62°C且温度传感器两次报告None值,提示厨房设备或传感器存在持续性故障", "整日日志中未见CO报警解除(COState恢复为0)的记录,报警状态可能持续存在"], "recommended_actions": ["立即通风:远程或手动打开厨房窗户和所有可开启的门窗,尽快降低室内CO浓度", "人员撤离:如住户在家,立即撤离至室外通风处;如住户无响应,联系紧急联系人或拨打119/120请求上门确认住户安全", "关闭燃气总阀:立即关闭厨房燃气总阀,切断潜在CO来源,在专业检测完成前不要重新开启", "联系燃气公司上门检测:报告CO报警事件,请专业人员检查燃气管道、灶具、热水器等所有燃气设备是否存在泄漏或不完全燃烧问题", "就医检查:住户在CO环境中暴露约2.5小时(03:51-06:27),即使当前无明显症状,也建议尽快就医进行血液碳氧血红蛋白检测,排除CO中毒", "检查报警器状态:确认kitchen_smoke_alarm当前CO读数是否已恢复正常,如COState仍为1则说明CO源未消除,需加急处理", "排查厨房温度传感器故障:18:00温度异常飙升和两次None值读数提示传感器可能受损或受到干扰,需检修或更换", "增设CO报警联动:建议将CO报警与卧室声光报警、手机推送通知联动,确保深夜报警能有效唤醒住户;考虑在卧室增设独立CO探测器"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.523940086364746, "api_error": null} {"episode_id": "SQ5_TP_A_1104", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1104.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261733, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bedroom", "injection_time": "2026-06-02T08:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时日志中存在灶具无人在家时开启、厨房温度传感器异常读数及数据丢失等问题,火灾预警能力严重削弱。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-01T08:15 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常触发警报。\",\n \"推理步骤2: 2026-06-02T08:15 灶具被开启(OnOff=True),但住户已于 07:16 出门(门锁解锁→开门→关门→自动上锁),且整个上午无任何运动传感器触发、无灯光操作,说明家中无人。灶具在无人状态下运行存在火灾隐患。\",\n \"推理步骤3: 08:25 厨房温度传感器瞬间飙升至 3068(约30.68°C),相比之前的 24.61°C 上升约 6°C,虽然烟雾报警器此时 SmokeState=0(正常),但温度异常升高说明灶具确实在工作产生热量。\",\n \"推理步骤4: 18:00 厨房温度传感器读数为 2851(约28.51°C),18:30 进一步升至 2866(约28.66°C),而同时段客厅和卧室温度分别为 24.51°C 和 23.55°C,厨房比其他房间高出约 4-5°C,存在不明热源或残余热量。\",\n \"推理步骤5: 18:46 和 19:37 厨房温度传感器两次上报 MeasuredValue=None(空值),表明传感器出现故障或通信异常,在烟雾报警器低电量的情况下,温度传感器也不可靠,意味着厨房的两道火灾防线同时削弱。\",\n \"推理步骤6: 综合来看,烟雾报警器低电量已持续超过24小时未处理,期间厨房发生了无人灶具运行、温度异常飙升、温度传感器数据丢失等多个关联事件,火灾风险显著升高且预警能力不足。\"\n ],\n \"key_evidence\": [\n \"2026-06-01T08:15 kitchen_smoke_alarm BatteryAlert=1,低电量告警已超过24小时未处理\",\n \"2026-06-02T08:15 灶具在住户07:16离家后被开启,无人在家期间灶具运行\",\n \"2026-06-02T08:25 厨房温度骤升至30.68°C(较正常值高约6°C),虽 SmokeState=0 但报警器低电量下可靠性存疑\",\n \"2026-06-02T18:00-18:30 厨房温度异常偏高(28.51-28.66°C),比同时段其他房间高4-5°C\",\n \"2026-06-02T18:46 和 19:37 厨房温度传感器两次返回 None,传感器故障导致监测盲区\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,恢复其正常报警能力;若无法立即更换,应在手机端开启烟雾报警器低电量的持续提醒,确保不遗漏\",\n \"检查厨房灶具的远程/定时控制逻辑,排查08:15无人在家时灶具被开启的原因(可能是误触定时任务或自动化规则配置错误),必要时禁用灶具的远程开启功能\",\n \"添加自动化安全规则:当住户离家(门锁上锁+无运动检测)后,若灶具被开启,立即推送告警并自动关闭灶具\",\n \"排查厨房温度传感器故障原因(两次返回 None),检查传感器供电、网络连接和固件版本,必要时更换传感器\",\n \"建立烟雾报警器与温度传感器的联动规则:当烟雾报警器低电量时,自动提升厨房温度传感器的采样频率作为补偿监测手段\",\n \"考虑为厨房增加燃气泄漏传感器,形成烟雾+温度+燃气的多重火灾预警体系,避免单点故障导致预警失效\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时日志中存在灶具无人在家时开启、厨房温度传感器异常读数及数据丢失等问题,火灾预警能力严重削弱。", "reasoning": ["推理步骤1: 2026-06-01T08:15 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常触发警报。", "推理步骤2: 2026-06-02T08:15 灶具被开启(OnOff=True),但住户已于 07:16 出门(门锁解锁→开门→关门→自动上锁),且整个上午无任何运动传感器触发、无灯光操作,说明家中无人。灶具在无人状态下运行存在火灾隐患。", "推理步骤3: 08:25 厨房温度传感器瞬间飙升至 3068(约30.68°C),相比之前的 24.61°C 上升约 6°C,虽然烟雾报警器此时 SmokeState=0(正常),但温度异常升高说明灶具确实在工作产生热量。", "推理步骤4: 18:00 厨房温度传感器读数为 2851(约28.51°C),18:30 进一步升至 2866(约28.66°C),而同时段客厅和卧室温度分别为 24.51°C 和 23.55°C,厨房比其他房间高出约 4-5°C,存在不明热源或残余热量。", "推理步骤5: 18:46 和 19:37 厨房温度传感器两次上报 MeasuredValue=None(空值),表明传感器出现故障或通信异常,在烟雾报警器低电量的情况下,温度传感器也不可靠,意味着厨房的两道火灾防线同时削弱。", "推理步骤6: 综合来看,烟雾报警器低电量已持续超过24小时未处理,期间厨房发生了无人灶具运行、温度异常飙升、温度传感器数据丢失等多个关联事件,火灾风险显著升高且预警能力不足。"], "key_evidence": ["2026-06-01T08:15 kitchen_smoke_alarm BatteryAlert=1,低电量告警已超过24小时未处理", "2026-06-02T08:15 灶具在住户07:16离家后被开启,无人在家期间灶具运行", "2026-06-02T08:25 厨房温度骤升至30.68°C(较正常值高约6°C),虽 SmokeState=0 但报警器低电量下可靠性存疑", "2026-06-02T18:00-18:30 厨房温度异常偏高(28.51-28.66°C),比同时段其他房间高4-5°C", "2026-06-02T18:46 和 19:37 厨房温度传感器两次返回 None,传感器故障导致监测盲区"], "recommended_actions": ["立即更换厨房烟雾报警器电池,恢复其正常报警能力;若无法立即更换,应在手机端开启烟雾报警器低电量的持续提醒,确保不遗漏", "检查厨房灶具的远程/定时控制逻辑,排查08:15无人在家时灶具被开启的原因(可能是误触定时任务或自动化规则配置错误),必要时禁用灶具的远程开启功能", "添加自动化安全规则:当住户离家(门锁上锁+无运动检测)后,若灶具被开启,立即推送告警并自动关闭灶具", "排查厨房温度传感器故障原因(两次返回 None),检查传感器供电、网络连接和固件版本,必要时更换传感器", "建立烟雾报警器与温度传感器的联动规则:当烟雾报警器低电量时,自动提升厨房温度传感器的采样频率作为补偿监测手段", "考虑为厨房增加燃气泄漏传感器,形成烟雾+温度+燃气的多重火灾预警体系,避免单点故障导致预警失效"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.53997039794922, "api_error": null} {"episode_id": "SQ5_TP_A_1108", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1108.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-24T00:00:00", "seed": 20261737, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-24T13:13:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"13:13 住户外出期间卧室窗户被打开,伴随室内运动检测触发,高度疑似撬窗入室盗窃。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:29 关灯、手动开锁出门,门自动上锁,此后家中无人。整个上午无任何运动传感器触发、无灯光操作,确认住户已离家。\",\n \"推理步骤2: 13:13 卧室窗户传感器 StateValue=False(窗户被打开),8秒后 13:13:08 卧室运动传感器触发 Occupancy=1,说明有人从窗户进入卧室。住户离家时未开窗(无对应开窗记录),此次开窗为外部打开。\",\n \"推理步骤3: 13:14 客厅运动传感器也触发 Occupancy=1,表明入侵者从卧室移动到了客厅,活动范围扩大。\",\n \"推理步骤4: 13:16 卧室窗户关闭(StateValue=True),13:16:05 卧室运动传感器恢复为0。整个过程仅持续约3分钟,符合快速入室盗窃的行为模式。\",\n \"推理步骤5: 全程入户门锁未有任何解锁事件,入户门传感器未触发,排除了住户中途回家的可能。入侵者通过窗户进出,未使用正门。\",\n \"推理步骤6: 住户直到 18:30 才通过手动开锁回家,与 13:13 的入侵事件间隔超过5小时,进一步确认 13:13 的活动并非住户本人。\"\n ],\n \"key_evidence\": [\n \"07:29 住户关灯出门、门锁自动上锁,至 18:30 回家期间门锁无任何解锁记录\",\n \"13:13:00 卧室窗户传感器 StateValue=False(窗户被打开)——住户离家期间不应有此操作\",\n \"13:13:08 卧室运动传感器 Occupancy=1,窗户打开仅8秒后即检测到人体,说明有人从窗外进入\",\n \"13:14:00 客厅运动传感器 Occupancy=1,入侵者移动至客厅\",\n \"13:16:00 卧室窗户关闭、13:16:05 卧室运动消失,整个过程约3分钟,符合快速入侵特征\",\n \"全程无灯光开启、无门锁操作,入侵者刻意避免触发明显设备\"\n ],\n \"recommended_actions\": [\n \"立即报警:将 13:13–13:16 的完整设备日志作为证据提交给警方,包含窗户传感器和运动传感器的时间戳记录\",\n \"保护现场:在警方到达前尽量不要触碰卧室窗户及窗框区域,保留可能的指纹和工具痕迹\",\n \"检查财物:重点清点卧室和客厅的贵重物品(入侵者在这两个区域均有活动记录),确认是否有财物丢失\",\n \"检查窗户损坏情况:检查卧室窗户锁扣、窗框是否有撬痕或损坏,评估是否需要紧急维修\",\n \"调取外部监控:联系物业或邻居获取 13:10–13:20 时段的楼道、外墙或小区监控录像\",\n \"紧急加固:为卧室窗户加装窗锁限位器或防盗窗栏,防止再次发生同类入侵\",\n \"启用离家安防模式:配置自动化规则——当住户离家(门锁上锁且无人在家)时,若窗户传感器或运动传感器触发,立即推送高优先级告警通知并触发警报\",\n \"考虑增设安防设备:在卧室窗户外侧或客厅增加摄像头,为未来可能的入侵提供视频证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "13:13 住户外出期间卧室窗户被打开,伴随室内运动检测触发,高度疑似撬窗入室盗窃。", "reasoning": ["推理步骤1: 住户于 07:29 关灯、手动开锁出门,门自动上锁,此后家中无人。整个上午无任何运动传感器触发、无灯光操作,确认住户已离家。", "推理步骤2: 13:13 卧室窗户传感器 StateValue=False(窗户被打开),8秒后 13:13:08 卧室运动传感器触发 Occupancy=1,说明有人从窗户进入卧室。住户离家时未开窗(无对应开窗记录),此次开窗为外部打开。", "推理步骤3: 13:14 客厅运动传感器也触发 Occupancy=1,表明入侵者从卧室移动到了客厅,活动范围扩大。", "推理步骤4: 13:16 卧室窗户关闭(StateValue=True),13:16:05 卧室运动传感器恢复为0。整个过程仅持续约3分钟,符合快速入室盗窃的行为模式。", "推理步骤5: 全程入户门锁未有任何解锁事件,入户门传感器未触发,排除了住户中途回家的可能。入侵者通过窗户进出,未使用正门。", "推理步骤6: 住户直到 18:30 才通过手动开锁回家,与 13:13 的入侵事件间隔超过5小时,进一步确认 13:13 的活动并非住户本人。"], "key_evidence": ["07:29 住户关灯出门、门锁自动上锁,至 18:30 回家期间门锁无任何解锁记录", "13:13:00 卧室窗户传感器 StateValue=False(窗户被打开)——住户离家期间不应有此操作", "13:13:08 卧室运动传感器 Occupancy=1,窗户打开仅8秒后即检测到人体,说明有人从窗外进入", "13:14:00 客厅运动传感器 Occupancy=1,入侵者移动至客厅", "13:16:00 卧室窗户关闭、13:16:05 卧室运动消失,整个过程约3分钟,符合快速入侵特征", "全程无灯光开启、无门锁操作,入侵者刻意避免触发明显设备"], "recommended_actions": ["立即报警:将 13:13–13:16 的完整设备日志作为证据提交给警方,包含窗户传感器和运动传感器的时间戳记录", "保护现场:在警方到达前尽量不要触碰卧室窗户及窗框区域,保留可能的指纹和工具痕迹", "检查财物:重点清点卧室和客厅的贵重物品(入侵者在这两个区域均有活动记录),确认是否有财物丢失", "检查窗户损坏情况:检查卧室窗户锁扣、窗框是否有撬痕或损坏,评估是否需要紧急维修", "调取外部监控:联系物业或邻居获取 13:10–13:20 时段的楼道、外墙或小区监控录像", "紧急加固:为卧室窗户加装窗锁限位器或防盗窗栏,防止再次发生同类入侵", "启用离家安防模式:配置自动化规则——当住户离家(门锁上锁且无人在家)时,若窗户传感器或运动传感器触发,立即推送高优先级告警通知并触发警报", "考虑增设安防设备:在卧室窗户外侧或客厅增加摄像头,为未来可能的入侵提供视频证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.548647165298462, "api_error": null} {"episode_id": "SQ5_TP_A_1105", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1105.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261734, "scenario_id": "INS-04", "total_events": 196, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-18T13:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"住户外出期间,客厅窗户被打开并检测到室内有人活动,高度疑似撬窗入室。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:38 关灯、手动开锁出门,门在 07:38:28 关闭后自动上锁(LockState=1),此后家中应无人。\",\n \"推理步骤2: 13:56 客厅窗户传感器报告 StateValue=False(窗户被打开),此时入户门仍处于锁定状态,住户并未通过正门回家。\",\n \"推理步骤3: 13:56:08 起客厅运动传感器连续三分钟检测到有人活动(Occupancy=1),说明确实有人进入室内,而非风吹等误触。\",\n \"推理步骤4: 13:59 窗户关闭(StateValue=True),随后 13:59:05 运动传感器恢复无人(Occupancy=0),入侵者在约3分钟内完成活动后从窗户离开。\",\n \"推理步骤5: 整个过程中入户门锁未发生任何解锁事件,玄关灯未亮,排除了住户或授权人员通过正门进入的可能性。\",\n \"推理步骤6: 住户直到 18:17 才通过手动开锁回家,中间长达约4.5小时家中无任何合法进入记录,进一步确认 13:56 的活动为非授权入侵。\"\n ],\n \"key_evidence\": [\n \"13:56:00 客厅窗户传感器 StateValue=False(窗户被打开),此时住户已外出、入户门处于锁定状态\",\n \"13:56:08 至 13:58:00 客厅运动传感器连续报告 Occupancy=1,确认有人在室内活动\",\n \"13:59:00 窗户关闭后 13:59:05 运动传感器恢复 Occupancy=0,入侵者通过窗户离开\",\n \"07:38:29 至 18:17:00 期间入户门锁无任何解锁事件,排除合法进入可能\",\n \"入侵持续约3分钟,时间短暂,符合典型的快速入室盗窃模式\"\n ],\n \"recommended_actions\": [\n \"立即报警:拨打110报警,提供入侵时间(13:56-13:59)、入侵方式(客厅窗户)等信息,配合警方调查\",\n \"保护现场:在警方到达前,尽量不要触碰客厅窗户及周边区域,保留指纹、脚印等物证\",\n \"检查财物损失:仔细清点家中贵重物品,特别是客厅区域,列出丢失清单供警方备案\",\n \"检查窗户完好性:检查客厅窗户锁扣、窗框是否有撬痕或损坏,如有损坏立即修复或加装防盗窗\",\n \"调取监控录像:如小区或楼道有监控摄像头,请物业调取 13:50-14:05 时段的录像协助警方识别嫌疑人\",\n \"加强窗户安防:为客厅窗户加装防盗锁扣或限位器,考虑安装窗户振动/破碎传感器,实现撬窗即时报警\",\n \"配置实时告警规则:在智能家居系统中设置规则——当住户外出(门锁锁定)期间,若窗户传感器触发打开事件,立即推送手机告警并触发警报\",\n \"增设安防设备:在客厅和玄关安装智能摄像头,入侵时可自动录像并远程查看;考虑加装声光报警器,运动传感器触发时自动鸣响威慑入侵者\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "住户外出期间,客厅窗户被打开并检测到室内有人活动,高度疑似撬窗入室。", "reasoning": ["推理步骤1: 住户于 07:38 关灯、手动开锁出门,门在 07:38:28 关闭后自动上锁(LockState=1),此后家中应无人。", "推理步骤2: 13:56 客厅窗户传感器报告 StateValue=False(窗户被打开),此时入户门仍处于锁定状态,住户并未通过正门回家。", "推理步骤3: 13:56:08 起客厅运动传感器连续三分钟检测到有人活动(Occupancy=1),说明确实有人进入室内,而非风吹等误触。", "推理步骤4: 13:59 窗户关闭(StateValue=True),随后 13:59:05 运动传感器恢复无人(Occupancy=0),入侵者在约3分钟内完成活动后从窗户离开。", "推理步骤5: 整个过程中入户门锁未发生任何解锁事件,玄关灯未亮,排除了住户或授权人员通过正门进入的可能性。", "推理步骤6: 住户直到 18:17 才通过手动开锁回家,中间长达约4.5小时家中无任何合法进入记录,进一步确认 13:56 的活动为非授权入侵。"], "key_evidence": ["13:56:00 客厅窗户传感器 StateValue=False(窗户被打开),此时住户已外出、入户门处于锁定状态", "13:56:08 至 13:58:00 客厅运动传感器连续报告 Occupancy=1,确认有人在室内活动", "13:59:00 窗户关闭后 13:59:05 运动传感器恢复 Occupancy=0,入侵者通过窗户离开", "07:38:29 至 18:17:00 期间入户门锁无任何解锁事件,排除合法进入可能", "入侵持续约3分钟,时间短暂,符合典型的快速入室盗窃模式"], "recommended_actions": ["立即报警:拨打110报警,提供入侵时间(13:56-13:59)、入侵方式(客厅窗户)等信息,配合警方调查", "保护现场:在警方到达前,尽量不要触碰客厅窗户及周边区域,保留指纹、脚印等物证", "检查财物损失:仔细清点家中贵重物品,特别是客厅区域,列出丢失清单供警方备案", "检查窗户完好性:检查客厅窗户锁扣、窗框是否有撬痕或损坏,如有损坏立即修复或加装防盗窗", "调取监控录像:如小区或楼道有监控摄像头,请物业调取 13:50-14:05 时段的录像协助警方识别嫌疑人", "加强窗户安防:为客厅窗户加装防盗锁扣或限位器,考虑安装窗户振动/破碎传感器,实现撬窗即时报警", "配置实时告警规则:在智能家居系统中设置规则——当住户外出(门锁锁定)期间,若窗户传感器触发打开事件,立即推送手机告警并触发警报", "增设安防设备:在客厅和玄关安装智能摄像头,入侵时可自动录像并远程查看;考虑加装声光报警器,运动传感器触发时自动鸣响威慑入侵者"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.249640703201294, "api_error": null} {"episode_id": "SQ5_TP_A_1109", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1109.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-18T00:00:00", "seed": 20261738, "scenario_id": "WD-03", "total_events": 193, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-18T05:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"住户外出期间卫生间漏水传感器持续报警超过30分钟,无人响应,存在水损和安全风险。\",\n \"reasoning\": [\n \"推理步骤1: 漏水传感器在 05:49 首次报告 StateValue=True,随后在 05:59 和 06:19 持续报告,说明漏水至少持续了30分钟且未自行停止。\",\n \"推理步骤2: 在 05:49 漏水首次触发时,全屋无任何运动传感器检测到占用(卧室、客厅、卫生间 Occupancy 均为0),所有灯光处于关闭状态,表明住户正在熟睡或不在家。\",\n \"推理步骤3: 住户约 06:23 在卧室起床(卧室运动传感器触发),06:39 进入卫生间,但日志中未见任何针对漏水的处置动作(如关闭水阀),漏水传感器在 06:19 之后也未报告恢复正常(StateValue=False)。\",\n \"推理步骤4: 住户于 07:38 关灯、手动开锁出门,门锁自动上锁,此后全天无人在家(直到 18:23 回家),漏水传感器始终未报告恢复,意味着漏水问题可能在无人看管的约11小时内持续存在。\",\n \"推理步骤5: 长时间无人处理的漏水可能导致地板、墙体浸泡损坏,电气短路风险,以及霉菌滋生等次生危害。\"\n ],\n \"key_evidence\": [\n \"05:49、05:59、06:19 卫生间漏水传感器连续三次报告 StateValue=True,间隔约10-20分钟,漏水持续未消除\",\n \"漏水首次触发时(05:49)全屋无占用状态,住户处于睡眠中,未能及时响应\",\n \"07:38 住户出门后门锁上锁,直到 18:23 才回家,期间长达约11小时无人在家\",\n \"全天日志中漏水传感器从未报告 StateValue=False(恢复正常),表明漏水可能一直未被解决\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭卫生间总水阀(如已安装智能水阀),或通知物业/紧急联系人上门手动关闭水源\",\n \"【立即】向住户手机推送高优先级漏水警报通知,包含漏水位置、持续时间和严重程度\",\n \"【立即】如家中有智能插座控制的卫生间电器,远程断电以防止漏水导致电气短路\",\n \"【短期】安排人员上门检查漏水源头(水管接头、马桶、热水器等),确认漏水原因并修复\",\n \"【短期】检查卫生间及相邻区域(卧室墙面、地板)是否已出现水渍浸泡损坏\",\n \"【改进】在自动化规则中增加:漏水传感器触发超过5分钟且无人在家时,自动关闭水阀并发送紧急通知\",\n \"【改进】建议安装智能水阀(如尚未安装),实现漏水时自动切断水源的联动能力\",\n \"【改进】设置漏水告警升级机制:若住户5分钟内未确认告警,自动通知紧急联系人或物业\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "住户外出期间卫生间漏水传感器持续报警超过30分钟,无人响应,存在水损和安全风险。", "reasoning": ["推理步骤1: 漏水传感器在 05:49 首次报告 StateValue=True,随后在 05:59 和 06:19 持续报告,说明漏水至少持续了30分钟且未自行停止。", "推理步骤2: 在 05:49 漏水首次触发时,全屋无任何运动传感器检测到占用(卧室、客厅、卫生间 Occupancy 均为0),所有灯光处于关闭状态,表明住户正在熟睡或不在家。", "推理步骤3: 住户约 06:23 在卧室起床(卧室运动传感器触发),06:39 进入卫生间,但日志中未见任何针对漏水的处置动作(如关闭水阀),漏水传感器在 06:19 之后也未报告恢复正常(StateValue=False)。", "推理步骤4: 住户于 07:38 关灯、手动开锁出门,门锁自动上锁,此后全天无人在家(直到 18:23 回家),漏水传感器始终未报告恢复,意味着漏水问题可能在无人看管的约11小时内持续存在。", "推理步骤5: 长时间无人处理的漏水可能导致地板、墙体浸泡损坏,电气短路风险,以及霉菌滋生等次生危害。"], "key_evidence": ["05:49、05:59、06:19 卫生间漏水传感器连续三次报告 StateValue=True,间隔约10-20分钟,漏水持续未消除", "漏水首次触发时(05:49)全屋无占用状态,住户处于睡眠中,未能及时响应", "07:38 住户出门后门锁上锁,直到 18:23 才回家,期间长达约11小时无人在家", "全天日志中漏水传感器从未报告 StateValue=False(恢复正常),表明漏水可能一直未被解决"], "recommended_actions": ["【立即】远程关闭卫生间总水阀(如已安装智能水阀),或通知物业/紧急联系人上门手动关闭水源", "【立即】向住户手机推送高优先级漏水警报通知,包含漏水位置、持续时间和严重程度", "【立即】如家中有智能插座控制的卫生间电器,远程断电以防止漏水导致电气短路", "【短期】安排人员上门检查漏水源头(水管接头、马桶、热水器等),确认漏水原因并修复", "【短期】检查卫生间及相邻区域(卧室墙面、地板)是否已出现水渍浸泡损坏", "【改进】在自动化规则中增加:漏水传感器触发超过5分钟且无人在家时,自动关闭水阀并发送紧急通知", "【改进】建议安装智能水阀(如尚未安装),实现漏水时自动切断水源的联动能力", "【改进】设置漏水告警升级机制:若住户5分钟内未确认告警,自动通知紧急联系人或物业"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.070263147354126, "api_error": null} {"episode_id": "SQ5_TP_A_1110", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1110.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261739, "scenario_id": "FG-04", "total_events": 194, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-30T02:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,且在此期间发生了灶具深夜异常启动和厨房温度传感器故障,烟雾报警器可能无法在火灾时正常报警,存在严重消防安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-29T02:15:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,报警器功能可能受限。\",\n \"推理步骤2: 2026-06-30T02:15:00 厨房灶具在凌晨2:15被开启(OnOff = True),此时全屋无任何人员活动(所有运动传感器均无触发),属于深夜无人操作的异常事件,存在火灾隐患。\",\n \"推理步骤3: 2026-06-30T02:25:00 灶具开启10分钟后,厨房温度从约23°C骤升至31.51°C,升幅超过8°C,证实灶具确实在工作产生热量。同一时刻烟雾报警器上报 SmokeState = 0(无烟雾),但考虑到电池低电量,其检测可靠性存疑。\",\n \"推理步骤4: 日志中未见灶具的明确关闭记录(直到19:07:30再次开启),灶具在凌晨的运行持续时间不明确,进一步加大了风险。\",\n \"推理步骤5: 晚间正常使用灶具期间(19:07-19:51),厨房温度传感器两次上报 MeasuredValue = None(19:08:00 和 19:52:00),说明该传感器存在间歇性故障,在高温环境下无法正常读数,削弱了温度异常的监测能力。\",\n \"推理步骤6: 烟雾报警器低电量 + 温度传感器间歇故障 + 灶具深夜无人启动,三者叠加构成了严重的消防安全盲区:一旦发生火情,既无法可靠检测烟雾,也无法可靠监测温度。\"\n ],\n \"key_evidence\": [\n \"2026-06-29T02:15:00 烟雾报警器 BatteryAlert = 1,电池电量低\",\n \"2026-06-30T02:15:00 灶具在凌晨无人活动时段被开启,无对应的人员运动检测\",\n \"2026-06-30T02:25:00 厨房温度从约23°C骤升至31.51°C,确认灶具实际产热\",\n \"2026-06-30T19:08:00 和 19:52:00 厨房温度传感器两次返回 None,传感器存在故障\",\n \"烟雾报警器低电量已持续超过24小时未得到处理\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器电池,确保其恢复正常报警能力;若无法立即更换,应在厨房临时放置备用独立式烟雾报警器\",\n \"排查灶具凌晨2:15自动启动的原因:检查是否存在定时任务误配置、自动化规则错误触发、或设备固件异常,必要时禁用灶具的远程/自动控制功能\",\n \"检修或更换厨房温度传感器,解决高温环境下读数返回 None 的间歇性故障问题\",\n \"为灶具添加安全联动规则:当全屋无人活动(所有运动传感器未触发)超过一定时间时,自动关闭灶具并发送告警通知\",\n \"设置烟雾报警器低电量的即时推送通知,确保住户第一时间收到提醒并及时处理\",\n \"建议为厨房加装独立的燃气泄漏检测器,与烟雾报警器形成互补的双重安全防护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,且在此期间发生了灶具深夜异常启动和厨房温度传感器故障,烟雾报警器可能无法在火灾时正常报警,存在严重消防安全隐患。", "reasoning": ["推理步骤1: 2026-06-29T02:15:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,报警器功能可能受限。", "推理步骤2: 2026-06-30T02:15:00 厨房灶具在凌晨2:15被开启(OnOff = True),此时全屋无任何人员活动(所有运动传感器均无触发),属于深夜无人操作的异常事件,存在火灾隐患。", "推理步骤3: 2026-06-30T02:25:00 灶具开启10分钟后,厨房温度从约23°C骤升至31.51°C,升幅超过8°C,证实灶具确实在工作产生热量。同一时刻烟雾报警器上报 SmokeState = 0(无烟雾),但考虑到电池低电量,其检测可靠性存疑。", "推理步骤4: 日志中未见灶具的明确关闭记录(直到19:07:30再次开启),灶具在凌晨的运行持续时间不明确,进一步加大了风险。", "推理步骤5: 晚间正常使用灶具期间(19:07-19:51),厨房温度传感器两次上报 MeasuredValue = None(19:08:00 和 19:52:00),说明该传感器存在间歇性故障,在高温环境下无法正常读数,削弱了温度异常的监测能力。", "推理步骤6: 烟雾报警器低电量 + 温度传感器间歇故障 + 灶具深夜无人启动,三者叠加构成了严重的消防安全盲区:一旦发生火情,既无法可靠检测烟雾,也无法可靠监测温度。"], "key_evidence": ["2026-06-29T02:15:00 烟雾报警器 BatteryAlert = 1,电池电量低", "2026-06-30T02:15:00 灶具在凌晨无人活动时段被开启,无对应的人员运动检测", "2026-06-30T02:25:00 厨房温度从约23°C骤升至31.51°C,确认灶具实际产热", "2026-06-30T19:08:00 和 19:52:00 厨房温度传感器两次返回 None,传感器存在故障", "烟雾报警器低电量已持续超过24小时未得到处理"], "recommended_actions": ["立即更换厨房烟雾报警器电池,确保其恢复正常报警能力;若无法立即更换,应在厨房临时放置备用独立式烟雾报警器", "排查灶具凌晨2:15自动启动的原因:检查是否存在定时任务误配置、自动化规则错误触发、或设备固件异常,必要时禁用灶具的远程/自动控制功能", "检修或更换厨房温度传感器,解决高温环境下读数返回 None 的间歇性故障问题", "为灶具添加安全联动规则:当全屋无人活动(所有运动传感器未触发)超过一定时间时,自动关闭灶具并发送告警通知", "设置烟雾报警器低电量的即时推送通知,确保住户第一时间收到提醒并及时处理", "建议为厨房加装独立的燃气泄漏检测器,与烟雾报警器形成互补的双重安全防护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.13500952720642, "api_error": null} {"episode_id": "SQ5_TP_B_1015", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1015.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261644, "scenario_id": "FG-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-01T00:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时灶具在深夜无人看管持续运行近7小时,且厨房温度传感器多次报告 None 值,存在火灾监控盲区的严重风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-05-31T00:02 厨房烟雾报警器报告 BatteryAlert = 1,表示电池电量低,报警器可能无法在烟雾事件中正常触发。\",\n \"推理步骤2: 2026-06-01T00:02 灶具被开启(OnOff = True),此时为凌晨零点,属于异常使用时段。灶具一直运行到 06:52 才关闭,持续近 7 小时无人操作记录,期间无任何厨房灯光开启或厨房运动传感器触发,说明无人在厨房看管。\",\n \"推理步骤3: 00:12 厨房温度传感器飙升至 2945(约29.45°C),相比其他房间同时段的 ~23°C 高出约 6°C,这与灶具运行一致。但烟雾报警器报告 SmokeState = 0(无烟雾),说明此时尚未产生烟雾,但报警器低电量状态下该读数的可靠性存疑。\",\n \"推理步骤4: 厨房温度传感器在 06:53、07:07、18:22、19:25 多次报告 MeasuredValue = None,表明传感器存在间歇性故障或离线,进一步削弱了厨房的安全监控能力。\",\n \"推理步骤5: 07:06 灶具再次被开启,07:10 住户关灯离家(前门上锁),灶具在无人在家的情况下持续运行。直到 15:55 住户回家前,灶具处于无人看管的运行状态长达约 8 小时。\",\n \"推理步骤6: 综合来看,烟雾报警器低电量 + 灶具深夜/离家时长时间无人看管运行 + 温度传感器间歇性失效,三重因素叠加形成了严重的火灾监控盲区。一旦发生火情,报警器可能无法及时报警,温度传感器也可能无法提供有效数据。\"\n ],\n \"key_evidence\": [\n \"2026-05-31T00:02 kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池电量低\",\n \"2026-06-01T00:02 灶具开启,持续运行至 06:52(近7小时),期间无厨房灯光或人体活动记录,属于深夜无人看管运行\",\n \"2026-06-01T00:12 厨房温度飙升至 2945(29.45°C),比其他房间高约 6°C\",\n \"厨房温度传感器在 06:53、07:07、18:22、19:25 四次报告 MeasuredValue = None,传感器间歇性故障\",\n \"07:06 灶具再次开启后,07:10 住户离家上锁,灶具在无人状态下继续运行\",\n \"15:55 住户回家时前门未关闭(无 StateValue = True 记录),直到 22:20 才确认关门上锁\"\n ],\n \"recommended_actions\": [\n \"【立即】更换厨房烟雾报警器电池,确保报警器恢复正常工作状态,这是最高优先级措施\",\n \"【立即】检查厨房温度传感器,排查其多次报告 None 的原因(可能是接线松动、电池耗尽或设备故障),必要时更换传感器\",\n \"【自动化规则】设置灶具安全联动:灶具开启超过 2 小时无人操作时自动关闭,并推送告警通知\",\n \"【自动化规则】设置离家模式联动:前门上锁离家时自动检查灶具状态,若灶具仍在运行则立即关闭并发送通知\",\n \"【自动化规则】设置深夜安全策略:23:00-06:00 期间灶具开启时触发高优先级告警\",\n \"【自动化规则】烟雾报警器低电量时,若灶具开启应立即推送紧急通知,提醒用户火灾监控能力下降\",\n \"【建议】为厨房增加独立的燃气泄漏传感器,作为烟雾报警器的补充监控手段\",\n \"【建议】定期(每月)自动检测所有安全类传感器的电池状态和在线状态,提前预警维护需求\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时灶具在深夜无人看管持续运行近7小时,且厨房温度传感器多次报告 None 值,存在火灾监控盲区的严重风险。", "reasoning": ["推理步骤1: 2026-05-31T00:02 厨房烟雾报警器报告 BatteryAlert = 1,表示电池电量低,报警器可能无法在烟雾事件中正常触发。", "推理步骤2: 2026-06-01T00:02 灶具被开启(OnOff = True),此时为凌晨零点,属于异常使用时段。灶具一直运行到 06:52 才关闭,持续近 7 小时无人操作记录,期间无任何厨房灯光开启或厨房运动传感器触发,说明无人在厨房看管。", "推理步骤3: 00:12 厨房温度传感器飙升至 2945(约29.45°C),相比其他房间同时段的 ~23°C 高出约 6°C,这与灶具运行一致。但烟雾报警器报告 SmokeState = 0(无烟雾),说明此时尚未产生烟雾,但报警器低电量状态下该读数的可靠性存疑。", "推理步骤4: 厨房温度传感器在 06:53、07:07、18:22、19:25 多次报告 MeasuredValue = None,表明传感器存在间歇性故障或离线,进一步削弱了厨房的安全监控能力。", "推理步骤5: 07:06 灶具再次被开启,07:10 住户关灯离家(前门上锁),灶具在无人在家的情况下持续运行。直到 15:55 住户回家前,灶具处于无人看管的运行状态长达约 8 小时。", "推理步骤6: 综合来看,烟雾报警器低电量 + 灶具深夜/离家时长时间无人看管运行 + 温度传感器间歇性失效,三重因素叠加形成了严重的火灾监控盲区。一旦发生火情,报警器可能无法及时报警,温度传感器也可能无法提供有效数据。"], "key_evidence": ["2026-05-31T00:02 kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池电量低", "2026-06-01T00:02 灶具开启,持续运行至 06:52(近7小时),期间无厨房灯光或人体活动记录,属于深夜无人看管运行", "2026-06-01T00:12 厨房温度飙升至 2945(29.45°C),比其他房间高约 6°C", "厨房温度传感器在 06:53、07:07、18:22、19:25 四次报告 MeasuredValue = None,传感器间歇性故障", "07:06 灶具再次开启后,07:10 住户离家上锁,灶具在无人状态下继续运行", "15:55 住户回家时前门未关闭(无 StateValue = True 记录),直到 22:20 才确认关门上锁"], "recommended_actions": ["【立即】更换厨房烟雾报警器电池,确保报警器恢复正常工作状态,这是最高优先级措施", "【立即】检查厨房温度传感器,排查其多次报告 None 的原因(可能是接线松动、电池耗尽或设备故障),必要时更换传感器", "【自动化规则】设置灶具安全联动:灶具开启超过 2 小时无人操作时自动关闭,并推送告警通知", "【自动化规则】设置离家模式联动:前门上锁离家时自动检查灶具状态,若灶具仍在运行则立即关闭并发送通知", "【自动化规则】设置深夜安全策略:23:00-06:00 期间灶具开启时触发高优先级告警", "【自动化规则】烟雾报警器低电量时,若灶具开启应立即推送紧急通知,提醒用户火灾监控能力下降", "【建议】为厨房增加独立的燃气泄漏传感器,作为烟雾报警器的补充监控手段", "【建议】定期(每月)自动检测所有安全类传感器的电池状态和在线状态,提前预警维护需求"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.815490007400513, "api_error": null} {"episode_id": "SQ5_TP_A_1111", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_A_1111.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "A", "layout_name": "一室一厅 (Studio/1BR)", "profile_id": "young_professional", "base_date": "2026-06-27T00:00:00", "seed": 20261740, "scenario_id": "FG-02", "total_events": 187, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-27T03:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨3:12厨房温度传感器出现剧烈异常飙升并触发烟雾报警,高度疑似电器过热起火事件;此外厨房温度传感器存在持续性故障,多次报告None值。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨03:00厨房温度为2304(约23.04°C),属于正常夜间室温。但仅12分钟后(03:12),厨房温度传感器突然飙升至3711(约37.11°C),升幅约14°C,这在无任何设备开启的深夜极不正常。\",\n \"推理步骤2: 03:17温度读数为3200(约32°C),虽较03:12有所回落但仍远高于正常室温,说明热源仍在持续或余温未散。同一时段客厅和卧室温度均保持在22-23°C的正常范围,排除了全屋升温(如空调故障或外部高温)的可能。\",\n \"推理步骤3: 03:22烟雾报警器触发(SmokeState=1),距温度异常飙升仅10分钟。烟雾报警在深夜无人烹饪时触发,结合前序温度异常,强烈指向厨房发生了过热甚至起火事件。\",\n \"推理步骤4: 事发时段(凌晨3点)所有住户在卧室睡眠,无人在厨房活动,灶具处于关闭状态,排除了正常烹饪导致的温度升高和烟雾。这意味着热源来自某个电器自燃、短路或其他非人为因素。\",\n \"推理步骤5: 03:30厨房温度恢复至2302(约23°C),说明火情可能是短暂的过热/闪燃后自行熄灭,或热源被切断。但烟雾报警已触发,仍需确认现场安全。\",\n \"推理步骤6: 额外发现——厨房温度传感器在09:13、09:34、12:05、12:49、18:05、18:26多次报告MeasuredValue=None,均发生在灶具开启前后。传感器频繁失效可能是高温损伤或线路问题的征兆,也可能与凌晨的过热事件存在关联。\",\n \"推理步骤7: 12:00厨房温度出现2985(约29.85°C)的异常读数,而同时段客厅仅25.73°C、卧室24.73°C,差值过大。虽然此时灶具即将开启(12:04),但灶具尚未点火前温度就已异常偏高,进一步佐证厨房存在潜在的电器过热隐患。\"\n ],\n \"key_evidence\": [\n \"03:12 厨房温度从23.04°C骤升至37.11°C,12分钟内升幅约14°C,深夜无人操作\",\n \"03:17 厨房温度仍高达32°C,持续异常\",\n \"03:22 厨房烟雾报警器触发(SmokeState=1),深夜无烹饪活动时报警\",\n \"事发时段全屋无人活动记录,灶具处于关闭状态,排除正常烹饪\",\n \"同时段客厅(23.10°C)和卧室(22.07°C)温度完全正常,异常仅限厨房\",\n \"厨房温度传感器全天多次报告None值(共6次),传感器可能已受损\",\n \"12:00灶具未开启时厨房温度异常达29.85°C,存在持续性过热隐患\"\n ],\n \"recommended_actions\": [\n \"立即响应:确认烟雾报警是否仍在触发状态,如住户在家应立即前往厨房查看是否有明火、冒烟或焦糊气味,确保人身安全优先\",\n \"紧急断电:远程或手动切断厨房电路总开关,防止故障电器持续通电引发二次起火\",\n \"通风处理:确认厨房窗户已打开(日志显示厨房窗户在白天有开启记录),保持通风排烟\",\n \"排查火源:重点检查厨房内所有电器(尤其是冰箱、微波炉、电饭煲等长期通电设备)是否有过热、变形、烧焦痕迹,以及电线和插座是否有短路迹象\",\n \"传感器维修:厨房温度传感器全天多次报告None值,应尽快检修或更换,确保火灾预警能力不受影响\",\n \"如发现明火或无法确认安全,立即拨打119火警电话,撤离住所并在安全区域等待\",\n \"事后建议:联系专业电工对厨房线路进行全面检查;考虑为厨房加装独立的温度异常自动断电装置;设置烟雾报警联动规则(触发时自动切断厨房电源、开启所有灯光、解锁入户门以便逃生)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨3:12厨房温度传感器出现剧烈异常飙升并触发烟雾报警,高度疑似电器过热起火事件;此外厨房温度传感器存在持续性故障,多次报告None值。", "reasoning": ["推理步骤1: 凌晨03:00厨房温度为2304(约23.04°C),属于正常夜间室温。但仅12分钟后(03:12),厨房温度传感器突然飙升至3711(约37.11°C),升幅约14°C,这在无任何设备开启的深夜极不正常。", "推理步骤2: 03:17温度读数为3200(约32°C),虽较03:12有所回落但仍远高于正常室温,说明热源仍在持续或余温未散。同一时段客厅和卧室温度均保持在22-23°C的正常范围,排除了全屋升温(如空调故障或外部高温)的可能。", "推理步骤3: 03:22烟雾报警器触发(SmokeState=1),距温度异常飙升仅10分钟。烟雾报警在深夜无人烹饪时触发,结合前序温度异常,强烈指向厨房发生了过热甚至起火事件。", "推理步骤4: 事发时段(凌晨3点)所有住户在卧室睡眠,无人在厨房活动,灶具处于关闭状态,排除了正常烹饪导致的温度升高和烟雾。这意味着热源来自某个电器自燃、短路或其他非人为因素。", "推理步骤5: 03:30厨房温度恢复至2302(约23°C),说明火情可能是短暂的过热/闪燃后自行熄灭,或热源被切断。但烟雾报警已触发,仍需确认现场安全。", "推理步骤6: 额外发现——厨房温度传感器在09:13、09:34、12:05、12:49、18:05、18:26多次报告MeasuredValue=None,均发生在灶具开启前后。传感器频繁失效可能是高温损伤或线路问题的征兆,也可能与凌晨的过热事件存在关联。", "推理步骤7: 12:00厨房温度出现2985(约29.85°C)的异常读数,而同时段客厅仅25.73°C、卧室24.73°C,差值过大。虽然此时灶具即将开启(12:04),但灶具尚未点火前温度就已异常偏高,进一步佐证厨房存在潜在的电器过热隐患。"], "key_evidence": ["03:12 厨房温度从23.04°C骤升至37.11°C,12分钟内升幅约14°C,深夜无人操作", "03:17 厨房温度仍高达32°C,持续异常", "03:22 厨房烟雾报警器触发(SmokeState=1),深夜无烹饪活动时报警", "事发时段全屋无人活动记录,灶具处于关闭状态,排除正常烹饪", "同时段客厅(23.10°C)和卧室(22.07°C)温度完全正常,异常仅限厨房", "厨房温度传感器全天多次报告None值(共6次),传感器可能已受损", "12:00灶具未开启时厨房温度异常达29.85°C,存在持续性过热隐患"], "recommended_actions": ["立即响应:确认烟雾报警是否仍在触发状态,如住户在家应立即前往厨房查看是否有明火、冒烟或焦糊气味,确保人身安全优先", "紧急断电:远程或手动切断厨房电路总开关,防止故障电器持续通电引发二次起火", "通风处理:确认厨房窗户已打开(日志显示厨房窗户在白天有开启记录),保持通风排烟", "排查火源:重点检查厨房内所有电器(尤其是冰箱、微波炉、电饭煲等长期通电设备)是否有过热、变形、烧焦痕迹,以及电线和插座是否有短路迹象", "传感器维修:厨房温度传感器全天多次报告None值,应尽快检修或更换,确保火灾预警能力不受影响", "如发现明火或无法确认安全,立即拨打119火警电话,撤离住所并在安全区域等待", "事后建议:联系专业电工对厨房线路进行全面检查;考虑为厨房加装独立的温度异常自动断电装置;设置烟雾报警联动规则(触发时自动切断厨房电源、开启所有灯光、解锁入户门以便逃生)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.841017723083496, "api_error": null} {"episode_id": "SQ5_TP_B_1018", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1018.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261647, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-08T17:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"17:55 住户回家开锁后,玄关和客厅同时出现多人活动迹象,且次卧几乎同时被占用,疑似有人尾随入室。\",\n \"reasoning\": [\n \"推理步骤1: 17:55:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,属于正常住户操作。\",\n \"推理步骤2: 17:55:04 玄关运动传感器触发,17:55:08 门关闭,17:55:10 客厅运动传感器触发——这是正常的单人进门动线。\",\n \"推理步骤3: 但在 17:55:12 玄关运动传感器再次触发(Occupancy=1),说明门关闭后玄关仍有人体活动,而此时住户应已移动到客厅区域。\",\n \"推理步骤4: 17:55:15 次卧运动传感器和客厅运动传感器同时触发(同一秒),一个人不可能同时出现在两个不同房间,说明家中至少有两人。\",\n \"推理步骤5: 整个过程只有一次开锁记录、一次开关门记录,没有第二次合法的门锁操作,说明第二人并非通过正常授权方式进入,符合尾随入室的特征。\",\n \"推理步骤6: 对比早晨 07:16 的正常出门序列(单人动线,传感器依次触发、无并发),17:55 的多传感器并发模式明显异常。\",\n \"推理步骤7: 后续 18:25 又有一次手动开锁进门,动线正常(玄关→客厅,依次触发),进一步佐证 17:55 那次的并发触发不是系统正常行为。\"\n ],\n \"key_evidence\": [\n \"17:55:00 仅一次门锁解锁事件(UserIndex=1),仅一次开关门记录(17:55:02 开、17:55:08 关)\",\n \"17:55:12 门已关闭后玄关运动传感器再次触发,表明玄关仍有人\",\n \"17:55:15 次卧运动传感器与客厅运动传感器在同一秒同时触发,一人无法同时出现在两个房间\",\n \"无第二次合法门锁操作记录,排除第二位授权用户正常进入的可能\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送高优先级入侵警报,通知所有家庭成员确认 17:55 是否有同行人员(如家人、朋友)\",\n \"若住户确认无同行人员,立即远程锁定入户门(DoorLock.LockState=1)并拨打 110 报警\",\n \"远程开启所有房间灯光(尤其次卧、客厅),制造有人在家的威慑效果\",\n \"调取入户门锁及玄关区域的摄像头录像(如有),重点查看 17:54:50–17:55:20 时段是否有陌生人尾随进入\",\n \"检查次卧是否有财物丢失或异常痕迹,因为未授权人员第一时间进入了次卧\",\n \"短期措施:启用门锁的自动锁定功能(缩短自动上锁延迟时间),减少尾随窗口期\",\n \"长期措施:在玄关加装摄像头或可视门铃,配合运动传感器实现多传感器联动的尾随检测自动化告警规则\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "17:55 住户回家开锁后,玄关和客厅同时出现多人活动迹象,且次卧几乎同时被占用,疑似有人尾随入室。", "reasoning": ["推理步骤1: 17:55:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,属于正常住户操作。", "推理步骤2: 17:55:04 玄关运动传感器触发,17:55:08 门关闭,17:55:10 客厅运动传感器触发——这是正常的单人进门动线。", "推理步骤3: 但在 17:55:12 玄关运动传感器再次触发(Occupancy=1),说明门关闭后玄关仍有人体活动,而此时住户应已移动到客厅区域。", "推理步骤4: 17:55:15 次卧运动传感器和客厅运动传感器同时触发(同一秒),一个人不可能同时出现在两个不同房间,说明家中至少有两人。", "推理步骤5: 整个过程只有一次开锁记录、一次开关门记录,没有第二次合法的门锁操作,说明第二人并非通过正常授权方式进入,符合尾随入室的特征。", "推理步骤6: 对比早晨 07:16 的正常出门序列(单人动线,传感器依次触发、无并发),17:55 的多传感器并发模式明显异常。", "推理步骤7: 后续 18:25 又有一次手动开锁进门,动线正常(玄关→客厅,依次触发),进一步佐证 17:55 那次的并发触发不是系统正常行为。"], "key_evidence": ["17:55:00 仅一次门锁解锁事件(UserIndex=1),仅一次开关门记录(17:55:02 开、17:55:08 关)", "17:55:12 门已关闭后玄关运动传感器再次触发,表明玄关仍有人", "17:55:15 次卧运动传感器与客厅运动传感器在同一秒同时触发,一人无法同时出现在两个房间", "无第二次合法门锁操作记录,排除第二位授权用户正常进入的可能"], "recommended_actions": ["立即通过手机推送高优先级入侵警报,通知所有家庭成员确认 17:55 是否有同行人员(如家人、朋友)", "若住户确认无同行人员,立即远程锁定入户门(DoorLock.LockState=1)并拨打 110 报警", "远程开启所有房间灯光(尤其次卧、客厅),制造有人在家的威慑效果", "调取入户门锁及玄关区域的摄像头录像(如有),重点查看 17:54:50–17:55:20 时段是否有陌生人尾随进入", "检查次卧是否有财物丢失或异常痕迹,因为未授权人员第一时间进入了次卧", "短期措施:启用门锁的自动锁定功能(缩短自动上锁延迟时间),减少尾随窗口期", "长期措施:在玄关加装摄像头或可视门铃,配合运动传感器实现多传感器联动的尾随检测自动化告警规则"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.980786561965942, "api_error": null} {"episode_id": "SQ5_TP_B_1021", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1021.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-28T00:00:00", "seed": 20261650, "scenario_id": "FG-01", "total_events": 233, "anomaly_events_count": 7}, "ground_truth": {"scenario_id": "FG-01", "scenario_name": "厨房忘关火", "category": "fire_gas", "is_anomaly": true, "threat_type": "unattended_cooking", "key_evidence": ["灶具开启状态 + 厨房无人(occupancy=0)持续超过5分钟", "厨房温度持续异常上升", "最终烟雾报警器触发"], "expected_response": "立即提醒住户关闭灶具,如无法联系则自动关闭(如支持远程关闭)", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-28T20:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房灶具在无人看管的情况下持续运行,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 20:36 厨房灶具开启(kitchen_cook_surface OnOff=True),同一时刻卫生间运动传感器显示无人(bathroom_occupancy=0),且全屋无任何运动传感器报告有人活动,说明灶具可能处于无人看管状态。\",\n \"推理步骤2: 此前三次正常做饭(09:09-09:49、11:57-12:52、18:05-18:33),灶具使用时长分别约40分钟、55分钟、28分钟,且每次关火后都会开窗通风(kitchen_window_contact=False)。但20:36开火后,日志中再无灶具关闭记录,也没有开窗通风动作。\",\n \"推理步骤3: 厨房温度在20:41飙升至3195(约31.95°C),20:46进一步升至3500(约35.0°C),相比同时段其他房间温度(约24°C)高出约11°C,温升速率异常——5分钟内升温约4°C,远超正常做饭的温升模式。\",\n \"推理步骤4: 20:51 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认厨房已产生烟雾,火灾风险从'疑似'升级为'确认'。\",\n \"推理步骤5: 值得注意的是,11:00和11:30的厨房温度数据也出现过异常高值(2955/2953,约29.5°C),当时灶具并未开启,这可能是传感器间歇性故障的征兆,但20:36之后的温升伴随灶具开启和烟雾报警,属于真实火灾风险而非传感器误报。\",\n \"推理步骤6: 21:00之后厨房温度恢复正常(2394),说明可能有人介入处理,但日志中未记录灶具关闭事件,灶具当前状态不确定,仍需确认。\"\n ],\n \"key_evidence\": [\n \"20:36 厨房灶具开启,之后日志中无关闭记录\",\n \"20:41 厨房温度飙升至3195(~31.95°C),20:46 升至3500(~35.0°C),5分钟内升温约4°C\",\n \"20:51 厨房烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm()\",\n \"20:36 全屋无运动传感器报告有人活动,灶具处于无人看管状态\",\n \"与当日三次正常烹饪对比,此次缺少关火和开窗通风操作,行为模式异常\",\n \"11:00-11:30 厨房温度曾出现异常高值(2955/2953),传感器可能存在间歇性故障\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭厨房灶具(kitchen_cook_surface → OnOff=False),消除火源\",\n \"【立即】触发全屋警报通知住户,通过手机推送、语音播报等方式告知厨房烟雾报警\",\n \"【立即】自动打开厨房窗户通风(kitchen_window_contact 对应窗户),排出烟雾和有害气体\",\n \"【立即】关闭厨房燃气阀门(如有智能燃气阀),防止燃气泄漏扩大风险\",\n \"【短期】持续监测厨房温度传感器读数,确认温度持续下降至正常范围(<26°C)\",\n \"【短期】确认烟雾报警器状态恢复正常(SmokeState=0),若持续报警则联系消防部门\",\n \"【短期】检查厨房温度传感器健康状态——当日多次报告 MeasuredValue=None,且11:00-11:30出现异常高值,建议排查传感器是否存在故障\",\n \"【建议】设置灶具无人看管自动关闭规则:当灶具开启超过一定时长且厨房无运动检测时,自动关火并发出提醒\",\n \"【建议】设置厨房温度异常阈值告警(如超过30°C),在烟雾报警触发前提前预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房灶具在无人看管的情况下持续运行,导致温度急剧飙升并触发烟雾报警,存在严重火灾风险。", "reasoning": ["推理步骤1: 20:36 厨房灶具开启(kitchen_cook_surface OnOff=True),同一时刻卫生间运动传感器显示无人(bathroom_occupancy=0),且全屋无任何运动传感器报告有人活动,说明灶具可能处于无人看管状态。", "推理步骤2: 此前三次正常做饭(09:09-09:49、11:57-12:52、18:05-18:33),灶具使用时长分别约40分钟、55分钟、28分钟,且每次关火后都会开窗通风(kitchen_window_contact=False)。但20:36开火后,日志中再无灶具关闭记录,也没有开窗通风动作。", "推理步骤3: 厨房温度在20:41飙升至3195(约31.95°C),20:46进一步升至3500(约35.0°C),相比同时段其他房间温度(约24°C)高出约11°C,温升速率异常——5分钟内升温约4°C,远超正常做饭的温升模式。", "推理步骤4: 20:51 厨房烟雾报警器触发(SmokeState=1, ExpressedState=1, Event: SmokeAlarm),确认厨房已产生烟雾,火灾风险从'疑似'升级为'确认'。", "推理步骤5: 值得注意的是,11:00和11:30的厨房温度数据也出现过异常高值(2955/2953,约29.5°C),当时灶具并未开启,这可能是传感器间歇性故障的征兆,但20:36之后的温升伴随灶具开启和烟雾报警,属于真实火灾风险而非传感器误报。", "推理步骤6: 21:00之后厨房温度恢复正常(2394),说明可能有人介入处理,但日志中未记录灶具关闭事件,灶具当前状态不确定,仍需确认。"], "key_evidence": ["20:36 厨房灶具开启,之后日志中无关闭记录", "20:41 厨房温度飙升至3195(~31.95°C),20:46 升至3500(~35.0°C),5分钟内升温约4°C", "20:51 厨房烟雾报警器触发:SmokeState=1, ExpressedState=1, Event: SmokeAlarm()", "20:36 全屋无运动传感器报告有人活动,灶具处于无人看管状态", "与当日三次正常烹饪对比,此次缺少关火和开窗通风操作,行为模式异常", "11:00-11:30 厨房温度曾出现异常高值(2955/2953),传感器可能存在间歇性故障"], "recommended_actions": ["【立即】远程关闭厨房灶具(kitchen_cook_surface → OnOff=False),消除火源", "【立即】触发全屋警报通知住户,通过手机推送、语音播报等方式告知厨房烟雾报警", "【立即】自动打开厨房窗户通风(kitchen_window_contact 对应窗户),排出烟雾和有害气体", "【立即】关闭厨房燃气阀门(如有智能燃气阀),防止燃气泄漏扩大风险", "【短期】持续监测厨房温度传感器读数,确认温度持续下降至正常范围(<26°C)", "【短期】确认烟雾报警器状态恢复正常(SmokeState=0),若持续报警则联系消防部门", "【短期】检查厨房温度传感器健康状态——当日多次报告 MeasuredValue=None,且11:00-11:30出现异常高值,建议排查传感器是否存在故障", "【建议】设置灶具无人看管自动关闭规则:当灶具开启超过一定时长且厨房无运动检测时,自动关火并发出提醒", "【建议】设置厨房温度异常阈值告警(如超过30°C),在烟雾报警触发前提前预警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.545254945755005, "api_error": null} {"episode_id": "SQ5_TP_B_1022", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1022.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261651, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-13T18:33:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:33 入户门解锁后,玄关和客厅、次卧几乎同时出现多人活动迹象,疑似有人尾随合法用户进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 18:33:00 入户门锁通过合法方式解锁(LockOperationType=1 即 Lock→Unlock,OperationSource=3 为本地操作如密码/指纹,UserIndex=1 为已注册用户),这部分本身正常。\",\n \"推理步骤2: 18:33:02 门被打开,18:33:04 玄关检测到有人,18:33:08 门关闭——从开门到关门仅 6 秒,这是单人进入的合理时间窗口。但紧接着 18:33:10 客厅检测到占用,18:33:12 玄关再次报告占用(二次触发),18:33:15 次卧和客厅同时报告占用。\",\n \"推理步骤3: 玄关传感器在 18:33:04 和 18:33:12 两次触发占用,间隔仅 8 秒。如果是单人从玄关走向客厅,玄关不应在人已离开后再次触发。二次触发说明有第二个人体经过玄关区域。\",\n \"推理步骤4: 18:33:15 客厅和次卧同时报告占用,意味着此刻至少有两个人分别处于不同房间。一个人不可能同时出现在两个物理隔离的空间,这进一步印证了多人在室内活动。\",\n \"推理步骤5: 全天直到 18:33 之前没有任何运动传感器或门锁事件,说明白天家中无人。住户刚回家时即出现多人分散活动的模式,符合尾随入室的特征——尾随者紧跟合法用户通过已解锁的门进入。\"\n ],\n \"key_evidence\": [\n \"18:33:04 和 18:33:12 玄关运动传感器在 8 秒内两次触发占用,表明有两个人先后经过玄关\",\n \"18:33:15 客厅和次卧同时报告 Occupancy=1,单人无法同时出现在两个房间\",\n \"入户门从打开到关闭仅 6 秒(18:33:02~18:33:08),只有一次开关门记录,说明第二人是紧随进入而非独立开门\",\n \"全天无其他入户或运动事件,排除了室内原本有其他住户的可能\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑,同时提醒合法住户注意身后情况\",\n \"通过智能家居系统向住户手机推送高优先级通知:'检测到疑似尾随入室,请确认身边是否有陌生人'\",\n \"自动锁定入户门(front_door_lock 执行 Lock 操作),防止入侵者轻易逃离或有更多人进入\",\n \"开启全屋灯光(所有区域灯具打开至最大亮度),消除暗角,增加入侵者暴露感\",\n \"如住户在 60 秒内未通过 App 确认'安全/误报',自动联系物业安保或拨打报警电话\",\n \"记录并保存本次事件的完整设备日志快照,作为后续调查取证的依据\",\n \"事后建议住户:进门时注意观察身后是否有人尾随,可考虑在玄关加装摄像头以获取视觉证据辅助判断\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "18:33 入户门解锁后,玄关和客厅、次卧几乎同时出现多人活动迹象,疑似有人尾随合法用户进入室内。", "reasoning": ["推理步骤1: 18:33:00 入户门锁通过合法方式解锁(LockOperationType=1 即 Lock→Unlock,OperationSource=3 为本地操作如密码/指纹,UserIndex=1 为已注册用户),这部分本身正常。", "推理步骤2: 18:33:02 门被打开,18:33:04 玄关检测到有人,18:33:08 门关闭——从开门到关门仅 6 秒,这是单人进入的合理时间窗口。但紧接着 18:33:10 客厅检测到占用,18:33:12 玄关再次报告占用(二次触发),18:33:15 次卧和客厅同时报告占用。", "推理步骤3: 玄关传感器在 18:33:04 和 18:33:12 两次触发占用,间隔仅 8 秒。如果是单人从玄关走向客厅,玄关不应在人已离开后再次触发。二次触发说明有第二个人体经过玄关区域。", "推理步骤4: 18:33:15 客厅和次卧同时报告占用,意味着此刻至少有两个人分别处于不同房间。一个人不可能同时出现在两个物理隔离的空间,这进一步印证了多人在室内活动。", "推理步骤5: 全天直到 18:33 之前没有任何运动传感器或门锁事件,说明白天家中无人。住户刚回家时即出现多人分散活动的模式,符合尾随入室的特征——尾随者紧跟合法用户通过已解锁的门进入。"], "key_evidence": ["18:33:04 和 18:33:12 玄关运动传感器在 8 秒内两次触发占用,表明有两个人先后经过玄关", "18:33:15 客厅和次卧同时报告 Occupancy=1,单人无法同时出现在两个房间", "入户门从打开到关闭仅 6 秒(18:33:02~18:33:08),只有一次开关门记录,说明第二人是紧随进入而非独立开门", "全天无其他入户或运动事件,排除了室内原本有其他住户的可能"], "recommended_actions": ["立即触发室内警报(声光报警),对潜在入侵者形成威慑,同时提醒合法住户注意身后情况", "通过智能家居系统向住户手机推送高优先级通知:'检测到疑似尾随入室,请确认身边是否有陌生人'", "自动锁定入户门(front_door_lock 执行 Lock 操作),防止入侵者轻易逃离或有更多人进入", "开启全屋灯光(所有区域灯具打开至最大亮度),消除暗角,增加入侵者暴露感", "如住户在 60 秒内未通过 App 确认'安全/误报',自动联系物业安保或拨打报警电话", "记录并保存本次事件的完整设备日志快照,作为后续调查取证的依据", "事后建议住户:进门时注意观察身后是否有人尾随,可考虑在玄关加装摄像头以获取视觉证据辅助判断"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.509780168533325, "api_error": null} {"episode_id": "SQ5_TP_B_1023", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1023.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261652, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-22T19:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:06 有人通过远程/密码方式解锁入户门后,多个房间几乎同时出现占用信号,疑似有未授权人员尾随合法住户进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 18:09 住户回家,手动开锁(OperationSource=Manual),入户门开关间隔约3秒,玄关→客厅依次触发运动传感器,动线清晰、单人特征明显。\",\n \"推理步骤2: 19:06 入户门再次被解锁(OperationSource=3,即远程/密码/PIN方式,UserIndex=1),门开→关仅约6秒。但在随后极短时间内(19:06:04~19:06:15),entrance_occupancy、living_room_occupancy、second_bedroom_occupancy 几乎同时或在11秒内全部触发占用状态,说明有多人同时分散进入不同房间。\",\n \"推理步骤3: 对比18:09的正常回家模式——单人从玄关→客厅的线性移动,19:06的模式呈现出'客厅和次卧同时有人'(19:06:15两个传感器同一秒触发),这在单人场景下物理上不可能,强烈暗示至少有两人进入。\",\n \"推理步骤4: 19:06开门后没有执行自动上锁(对比07:38和22:12均有Auto Lock事件),门锁在此次开门后未记录到LockOperationType=0的上锁事件,说明门可能处于未锁定状态,增加了尾随风险。\",\n \"推理步骤5: 次卧在住户回家后(18:09~19:06期间)没有任何运动传感器触发记录,19:06:15突然出现占用信号,说明有人直接进入了此前无人的次卧,行为模式异常。\"\n ],\n \"key_evidence\": [\n \"19:06:15 second_bedroom_occupancy 和 living_room_occupancy 在同一秒同时触发,单人无法同时出现在两个房间\",\n \"19:06开门事件后仅11秒内,玄关、客厅、次卧三个区域均检测到人员存在\",\n \"19:06的开锁方式为 OperationSource=3(非手动),且之后未记录自动上锁事件\",\n \"18:09~19:06期间次卧无任何活动记录,19:06:15突然出现占用信号\"\n ],\n \"recommended_actions\": [\n \"立即通过智能门锁远程执行锁定(LockOperationType=0),确保入户门处于锁闭状态\",\n \"立即触发全屋警报:开启所有灯光(客厅、玄关、次卧、厨房)至最大亮度,起到威慑作用\",\n \"通过手机APP或智能音箱向室内广播警告语音,告知入侵者已被监控记录\",\n \"立即联系住户本人确认是否有同行人员或访客;若住户否认,立即报警(110)\",\n \"调取入户门锁 UserIndex=1 对应的用户信息,核实19:06的开锁操作是否为住户本人授权\",\n \"检查并保存所有设备事件日志作为证据,特别是19:06前后的门锁操作记录和运动传感器数据\",\n \"建议住户更换门锁PIN码/密码,排查是否存在密码泄露\",\n \"后续加装入户门区域摄像头,弥补当前仅靠传感器无法获取视觉证据的不足\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:06 有人通过远程/密码方式解锁入户门后,多个房间几乎同时出现占用信号,疑似有未授权人员尾随合法住户进入室内。", "reasoning": ["推理步骤1: 18:09 住户回家,手动开锁(OperationSource=Manual),入户门开关间隔约3秒,玄关→客厅依次触发运动传感器,动线清晰、单人特征明显。", "推理步骤2: 19:06 入户门再次被解锁(OperationSource=3,即远程/密码/PIN方式,UserIndex=1),门开→关仅约6秒。但在随后极短时间内(19:06:04~19:06:15),entrance_occupancy、living_room_occupancy、second_bedroom_occupancy 几乎同时或在11秒内全部触发占用状态,说明有多人同时分散进入不同房间。", "推理步骤3: 对比18:09的正常回家模式——单人从玄关→客厅的线性移动,19:06的模式呈现出'客厅和次卧同时有人'(19:06:15两个传感器同一秒触发),这在单人场景下物理上不可能,强烈暗示至少有两人进入。", "推理步骤4: 19:06开门后没有执行自动上锁(对比07:38和22:12均有Auto Lock事件),门锁在此次开门后未记录到LockOperationType=0的上锁事件,说明门可能处于未锁定状态,增加了尾随风险。", "推理步骤5: 次卧在住户回家后(18:09~19:06期间)没有任何运动传感器触发记录,19:06:15突然出现占用信号,说明有人直接进入了此前无人的次卧,行为模式异常。"], "key_evidence": ["19:06:15 second_bedroom_occupancy 和 living_room_occupancy 在同一秒同时触发,单人无法同时出现在两个房间", "19:06开门事件后仅11秒内,玄关、客厅、次卧三个区域均检测到人员存在", "19:06的开锁方式为 OperationSource=3(非手动),且之后未记录自动上锁事件", "18:09~19:06期间次卧无任何活动记录,19:06:15突然出现占用信号"], "recommended_actions": ["立即通过智能门锁远程执行锁定(LockOperationType=0),确保入户门处于锁闭状态", "立即触发全屋警报:开启所有灯光(客厅、玄关、次卧、厨房)至最大亮度,起到威慑作用", "通过手机APP或智能音箱向室内广播警告语音,告知入侵者已被监控记录", "立即联系住户本人确认是否有同行人员或访客;若住户否认,立即报警(110)", "调取入户门锁 UserIndex=1 对应的用户信息,核实19:06的开锁操作是否为住户本人授权", "检查并保存所有设备事件日志作为证据,特别是19:06前后的门锁操作记录和运动传感器数据", "建议住户更换门锁PIN码/密码,排查是否存在密码泄露", "后续加装入户门区域摄像头,弥补当前仅靠传感器无法获取视觉证据的不足"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.924039363861084, "api_error": null} {"episode_id": "SQ5_TP_B_1030", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1030.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-22T00:00:00", "seed": 20261659, "scenario_id": "FG-03", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-22T07:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器于07:59检测到CO浓度升高并触发一氧化碳警报,住户已外出,家中无人处置,存在严重健康与安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 07:59厨房烟雾报警器报告COState=1(CO检测异常)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认一氧化碳浓度超标。\",\n \"推理步骤2: 回溯住户活动——06:35起床使用卫生间,07:05转至厨房短暂停留(可能早餐),07:20通过入户门手动开锁外出,门自动上锁。此后至18:04回家期间,家中无任何运动传感器触发、无灯光操作,确认07:20后家中无人。\",\n \"推理步骤3: CO警报发生在07:59,即住户离家约40分钟后。此时家中无人能够响应警报、开窗通风或关闭可能的泄漏源。\",\n \"推理步骤4: 检查厨房灶具日志——灶具在07:59前后无开启记录(灶具直到18:57才被打开),排除烹饪产生CO的可能。CO来源可能是燃气管道微漏、热水器排气回流或其他燃烧设备故障,需要排查。\",\n \"推理步骤5: 18:00厨房温度传感器出现异常跳变(从约24.6°C骤升至28.56°C),18:30仍维持在28.68°C,18:58和19:30两次报告None值(传感器故障),这些异常可能与CO泄漏源相关的热源有关,进一步佐证存在异常燃烧或泄漏。\",\n \"推理步骤6: 整个白天CO警报未见复位记录(无COState=0的日志),说明CO浓度可能持续偏高或警报未被人工确认消除。\"\n ],\n \"key_evidence\": [\n \"07:59 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认一氧化碳浓度超标报警\",\n \"07:20住户外出并门锁自动上锁,至18:04才回家,CO警报期间家中无人\",\n \"07:59前后厨房灶具未开启,排除正常烹饪产生CO,提示存在非预期CO泄漏源\",\n \"18:00厨房温度传感器异常跳变至28.56°C,18:58/19:30传感器报告None值,可能与CO泄漏源或传感器受损有关\",\n \"全天日志中未见CO警报复位(COState恢复为0),警报状态可能持续存在\"\n ],\n \"recommended_actions\": [\n \"【立即】远程开启厨房窗户(kitchen_window_contact显示可控)和客厅窗帘/窗户进行通风,降低室内CO浓度\",\n \"【立即】远程关闭家中燃气相关设备(如有智能燃气阀门),防止CO继续积聚\",\n \"【立即】通过手机通知住户CO警报情况,提醒回家前先开窗通风,进入时注意安全\",\n \"【紧急】联系燃气公司上门检查厨房燃气管道、热水器排气管道等可能的CO泄漏源\",\n \"【回家后】住户进入前确保充分通风,如仍闻到异味或报警器未复位,切勿进入并拨打119/燃气应急电话\",\n \"【排查】检查厨房温度传感器异常(18:00跳变及多次None值),判断是否因高温或CO腐蚀导致传感器故障,必要时更换\",\n \"【长期】建议加装独立CO探测器(卧室、客厅各一个),并设置CO警报联动自动开窗通风的自动化规则\",\n \"【长期】为烟雾/CO报警器配置远程推送通知,确保住户不在家时也能第一时间收到警报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器于07:59检测到CO浓度升高并触发一氧化碳警报,住户已外出,家中无人处置,存在严重健康与安全隐患。", "reasoning": ["推理步骤1: 07:59厨房烟雾报警器报告COState=1(CO检测异常)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认一氧化碳浓度超标。", "推理步骤2: 回溯住户活动——06:35起床使用卫生间,07:05转至厨房短暂停留(可能早餐),07:20通过入户门手动开锁外出,门自动上锁。此后至18:04回家期间,家中无任何运动传感器触发、无灯光操作,确认07:20后家中无人。", "推理步骤3: CO警报发生在07:59,即住户离家约40分钟后。此时家中无人能够响应警报、开窗通风或关闭可能的泄漏源。", "推理步骤4: 检查厨房灶具日志——灶具在07:59前后无开启记录(灶具直到18:57才被打开),排除烹饪产生CO的可能。CO来源可能是燃气管道微漏、热水器排气回流或其他燃烧设备故障,需要排查。", "推理步骤5: 18:00厨房温度传感器出现异常跳变(从约24.6°C骤升至28.56°C),18:30仍维持在28.68°C,18:58和19:30两次报告None值(传感器故障),这些异常可能与CO泄漏源相关的热源有关,进一步佐证存在异常燃烧或泄漏。", "推理步骤6: 整个白天CO警报未见复位记录(无COState=0的日志),说明CO浓度可能持续偏高或警报未被人工确认消除。"], "key_evidence": ["07:59 kitchen_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认一氧化碳浓度超标报警", "07:20住户外出并门锁自动上锁,至18:04才回家,CO警报期间家中无人", "07:59前后厨房灶具未开启,排除正常烹饪产生CO,提示存在非预期CO泄漏源", "18:00厨房温度传感器异常跳变至28.56°C,18:58/19:30传感器报告None值,可能与CO泄漏源或传感器受损有关", "全天日志中未见CO警报复位(COState恢复为0),警报状态可能持续存在"], "recommended_actions": ["【立即】远程开启厨房窗户(kitchen_window_contact显示可控)和客厅窗帘/窗户进行通风,降低室内CO浓度", "【立即】远程关闭家中燃气相关设备(如有智能燃气阀门),防止CO继续积聚", "【立即】通过手机通知住户CO警报情况,提醒回家前先开窗通风,进入时注意安全", "【紧急】联系燃气公司上门检查厨房燃气管道、热水器排气管道等可能的CO泄漏源", "【回家后】住户进入前确保充分通风,如仍闻到异味或报警器未复位,切勿进入并拨打119/燃气应急电话", "【排查】检查厨房温度传感器异常(18:00跳变及多次None值),判断是否因高温或CO腐蚀导致传感器故障,必要时更换", "【长期】建议加装独立CO探测器(卧室、客厅各一个),并设置CO警报联动自动开窗通风的自动化规则", "【长期】为烟雾/CO报警器配置远程推送通知,确保住户不在家时也能第一时间收到警报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.12356185913086, "api_error": null} {"episode_id": "SQ5_TP_B_1033", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1033.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-02T00:00:00", "seed": 20261662, "scenario_id": "INS-01", "total_events": 235, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "INS-01", "scenario_name": "窗户入侵(夜间破窗)", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["深夜窗户传感器从 Closed 变 Open", "随后该房间运动传感器触发,但住户在卧室睡觉", "运动信号沿非住户房间传播"], "expected_response": "触发入侵警报,通知住户,记录事件", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-02T00:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"凌晨00:14客厅窗户在全屋无人活动的深夜时段被打开,且阳台灯随后亮起,存在窗户入侵嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 住户于07:15通过手动操作解锁入户门离家(门锁Unlock→开门→关门→自动Lock),此后全屋无任何人体活动传感器触发,直到18:28住户回家,说明白天家中无人。\",\n \"推理步骤2: 在00:14:00,客厅窗户传感器报告 StateValue=False(窗户打开)。此时已是深夜,住户应在睡眠状态,但日志中00:00至00:14期间没有任何卧室或其他房间的运动传感器触发记录,无法确认是住户本人操作。\",\n \"推理步骤3: 窗户打开后,00:14:05和00:14:30客厅运动传感器连续两次检测到有人(Occupancy=1),说明窗户打开后确实有人体活动出现在客厅区域。\",\n \"推理步骤4: 00:14:45阳台灯被打开,但没有对应的阳台门传感器状态变化记录,也没有卧室运动传感器触发,这不符合住户从卧室起身经过客厅去阳台的正常动线(正常情况下应先触发卧室运动传感器)。\",\n \"推理步骤5: 整个事件序列之后,没有入户门的开锁/开门记录,排除了住户从正门进出的可能。窗户打开后一直没有关闭的记录(日志中无后续 StateValue=True),窗户持续处于打开状态。\",\n \"推理步骤6: 但也存在另一种可能:住户深夜起床开窗通风(当时室温约23°C,6月初夏夜偏热),卧室运动传感器未触发可能是住户从传感器盲区经过,或传感器灵敏度在夜间低活动量下未捕捉到缓慢移动。置信度定为medium,因为无法完全排除住户自身行为。\"\n ],\n \"key_evidence\": [\n \"00:14:00 深夜客厅窗户被打开(living_room_window_contact StateValue=False),且整段日志中无对应的关闭记录\",\n \"00:14:05 / 00:14:30 客厅运动传感器连续检测到人体活动,但之前无任何卧室运动传感器触发\",\n \"00:14:45 阳台灯亮起,无对应的阳台门传感器变化和卧室活动记录\",\n \"事件发生在凌晨00:14,属于高风险时段(深夜)\",\n \"入户门在整个夜间时段无任何开锁/开门记录,排除正门进入的可能\"\n ],\n \"recommended_actions\": [\n \"立即触发全屋警报(声光报警),开启所有区域灯光以威慑可能的入侵者\",\n \"向住户手机推送高优先级入侵告警通知,附带事件时间线摘要,要求住户确认是否为本人操作\",\n \"如住户未在设定时间内(如2分钟)确认为本人行为,自动联系物业安保或报警\",\n \"立即锁定入户门锁(确认 DoorLock.LockState=1),防止入侵者从正门逃离或进一步行动\",\n \"关闭并锁定所有可控窗户和窗帘(living_room_window 关闭窗帘),限制入侵者活动路线\",\n \"启动客厅及阳台区域的持续运动监测,记录后续所有传感器事件用于取证\",\n \"检查客厅窗户传感器当前状态——若窗户仍处于打开状态(StateValue=False),这是需要立即处理的物理安全缺口\",\n \"事后建议:在客厅和阳台加装摄像头或玻璃破碎传感器,增强夜间入侵检测能力;考虑为窗户添加智能锁控\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "凌晨00:14客厅窗户在全屋无人活动的深夜时段被打开,且阳台灯随后亮起,存在窗户入侵嫌疑。", "reasoning": ["推理步骤1: 住户于07:15通过手动操作解锁入户门离家(门锁Unlock→开门→关门→自动Lock),此后全屋无任何人体活动传感器触发,直到18:28住户回家,说明白天家中无人。", "推理步骤2: 在00:14:00,客厅窗户传感器报告 StateValue=False(窗户打开)。此时已是深夜,住户应在睡眠状态,但日志中00:00至00:14期间没有任何卧室或其他房间的运动传感器触发记录,无法确认是住户本人操作。", "推理步骤3: 窗户打开后,00:14:05和00:14:30客厅运动传感器连续两次检测到有人(Occupancy=1),说明窗户打开后确实有人体活动出现在客厅区域。", "推理步骤4: 00:14:45阳台灯被打开,但没有对应的阳台门传感器状态变化记录,也没有卧室运动传感器触发,这不符合住户从卧室起身经过客厅去阳台的正常动线(正常情况下应先触发卧室运动传感器)。", "推理步骤5: 整个事件序列之后,没有入户门的开锁/开门记录,排除了住户从正门进出的可能。窗户打开后一直没有关闭的记录(日志中无后续 StateValue=True),窗户持续处于打开状态。", "推理步骤6: 但也存在另一种可能:住户深夜起床开窗通风(当时室温约23°C,6月初夏夜偏热),卧室运动传感器未触发可能是住户从传感器盲区经过,或传感器灵敏度在夜间低活动量下未捕捉到缓慢移动。置信度定为medium,因为无法完全排除住户自身行为。"], "key_evidence": ["00:14:00 深夜客厅窗户被打开(living_room_window_contact StateValue=False),且整段日志中无对应的关闭记录", "00:14:05 / 00:14:30 客厅运动传感器连续检测到人体活动,但之前无任何卧室运动传感器触发", "00:14:45 阳台灯亮起,无对应的阳台门传感器变化和卧室活动记录", "事件发生在凌晨00:14,属于高风险时段(深夜)", "入户门在整个夜间时段无任何开锁/开门记录,排除正门进入的可能"], "recommended_actions": ["立即触发全屋警报(声光报警),开启所有区域灯光以威慑可能的入侵者", "向住户手机推送高优先级入侵告警通知,附带事件时间线摘要,要求住户确认是否为本人操作", "如住户未在设定时间内(如2分钟)确认为本人行为,自动联系物业安保或报警", "立即锁定入户门锁(确认 DoorLock.LockState=1),防止入侵者从正门逃离或进一步行动", "关闭并锁定所有可控窗户和窗帘(living_room_window 关闭窗帘),限制入侵者活动路线", "启动客厅及阳台区域的持续运动监测,记录后续所有传感器事件用于取证", "检查客厅窗户传感器当前状态——若窗户仍处于打开状态(StateValue=False),这是需要立即处理的物理安全缺口", "事后建议:在客厅和阳台加装摄像头或玻璃破碎传感器,增强夜间入侵检测能力;考虑为窗户添加智能锁控"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 30.17687439918518, "api_error": null} {"episode_id": "SQ5_TP_B_1035", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1035.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-12T00:00:00", "seed": 20261664, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-12T18:50:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:34 有人开锁进入后未关门未上锁,18:01 住户回家时门处于未锁状态,存在尾随入室或未授权滞留的风险。\",\n \"reasoning\": [\n \"推理步骤1: 16:34 入户门被手动解锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关检测到有人(Occupancy=1),但此后日志中没有关门(StateValue=True)和重新上锁的记录,说明门在较长时间内处于开启/未锁定状态。\",\n \"推理步骤2: 从16:34到18:01之间(约1.5小时),没有任何室内运动传感器触发、灯光开关或其他住户活动迹象,这不符合正常到家后的行为模式。如果是住户本人进入,通常会有开灯、走动等后续活动。\",\n \"推理步骤3: 18:01 门再次被手动解锁,住户进入后立即有客厅运动传感器触发、开灯、开空调等一系列正常居家活动,说明18:01才是住户真正到家的时间点。\",\n \"推理步骤4: 16:34的开门事件来源为 Manual 且没有 UserIndex 标识,与18:50的开锁事件(带有 UserIndex=1 和 OperationSource=3 即密码/凭证开锁)形成对比,说明16:34的开门方式缺乏身份验证信息。\",\n \"推理步骤5: 16:34开门后门未关闭,18:01住户到家时门锁状态为未锁定(直接解锁说明此前可能已处于未完全锁定状态),这段时间窗口存在他人尾随或趁虚进入的风险。即使没有实际入侵,长时间门户未锁本身也是严重安全隐患。\"\n ],\n \"key_evidence\": [\n \"16:34:00 入户门手动解锁并打开,但之后无关门(StateValue=True)和上锁记录\",\n \"16:34 至 18:01 之间约1.5小时无任何室内活动传感器触发,不符合有人在家的行为模式\",\n \"16:34 的开锁事件无 UserIndex,身份不明;而 18:50 的开锁事件有明确的 UserIndex=1\",\n \"18:01 住户到家后立即产生正常活动链(运动检测→开灯→开空调),与16:34后的静默形成鲜明对比\",\n \"22:30:19 才出现 front_door_contact StateValue=True 和自动上锁,说明门可能从16:34起一直未正确关闭\"\n ],\n \"recommended_actions\": [\n \"立即确认16:34开门事件的身份:检查门锁的完整操作日志和监控录像,确定是否为已知住户或授权人员\",\n \"检查家中是否有财物丢失或异常痕迹,特别关注16:34至18:01期间可能被进入的区域\",\n \"启用门锁的自动上锁超时功能:设置门开启超过一定时间(如2分钟)后自动报警或推送通知\",\n \"为门锁配置所有授权用户的 UserIndex,确保每次开锁都有身份记录,便于追溯异常开锁事件\",\n \"增加入户门区域的安防措施:考虑加装摄像头或启用玄关运动传感器联动报警,当门未锁且检测到运动时立即推送告警\",\n \"设置离家模式自动化规则:当所有住户离家后,若检测到入户门被打开且无有效凭证,立即触发高优先级告警\",\n \"检查门锁硬件是否存在故障(如锁舌未正常弹出),排除机械故障导致的未锁定情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "16:34 有人开锁进入后未关门未上锁,18:01 住户回家时门处于未锁状态,存在尾随入室或未授权滞留的风险。", "reasoning": ["推理步骤1: 16:34 入户门被手动解锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关检测到有人(Occupancy=1),但此后日志中没有关门(StateValue=True)和重新上锁的记录,说明门在较长时间内处于开启/未锁定状态。", "推理步骤2: 从16:34到18:01之间(约1.5小时),没有任何室内运动传感器触发、灯光开关或其他住户活动迹象,这不符合正常到家后的行为模式。如果是住户本人进入,通常会有开灯、走动等后续活动。", "推理步骤3: 18:01 门再次被手动解锁,住户进入后立即有客厅运动传感器触发、开灯、开空调等一系列正常居家活动,说明18:01才是住户真正到家的时间点。", "推理步骤4: 16:34的开门事件来源为 Manual 且没有 UserIndex 标识,与18:50的开锁事件(带有 UserIndex=1 和 OperationSource=3 即密码/凭证开锁)形成对比,说明16:34的开门方式缺乏身份验证信息。", "推理步骤5: 16:34开门后门未关闭,18:01住户到家时门锁状态为未锁定(直接解锁说明此前可能已处于未完全锁定状态),这段时间窗口存在他人尾随或趁虚进入的风险。即使没有实际入侵,长时间门户未锁本身也是严重安全隐患。"], "key_evidence": ["16:34:00 入户门手动解锁并打开,但之后无关门(StateValue=True)和上锁记录", "16:34 至 18:01 之间约1.5小时无任何室内活动传感器触发,不符合有人在家的行为模式", "16:34 的开锁事件无 UserIndex,身份不明;而 18:50 的开锁事件有明确的 UserIndex=1", "18:01 住户到家后立即产生正常活动链(运动检测→开灯→开空调),与16:34后的静默形成鲜明对比", "22:30:19 才出现 front_door_contact StateValue=True 和自动上锁,说明门可能从16:34起一直未正确关闭"], "recommended_actions": ["立即确认16:34开门事件的身份:检查门锁的完整操作日志和监控录像,确定是否为已知住户或授权人员", "检查家中是否有财物丢失或异常痕迹,特别关注16:34至18:01期间可能被进入的区域", "启用门锁的自动上锁超时功能:设置门开启超过一定时间(如2分钟)后自动报警或推送通知", "为门锁配置所有授权用户的 UserIndex,确保每次开锁都有身份记录,便于追溯异常开锁事件", "增加入户门区域的安防措施:考虑加装摄像头或启用玄关运动传感器联动报警,当门未锁且检测到运动时立即推送告警", "设置离家模式自动化规则:当所有住户离家后,若检测到入户门被打开且无有效凭证,立即触发高优先级告警", "检查门锁硬件是否存在故障(如锁舌未正常弹出),排除机械故障导致的未锁定情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.421332836151123, "api_error": null} {"episode_id": "SQ5_TP_B_1037", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1037.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261666, "scenario_id": "FG-02", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-13T12:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在午间做饭期间出现异常高温并触发烟雾报警,存在电器过热起火风险。\",\n \"reasoning\": [\n \"推理步骤1: 12:00 厨房温度传感器报告 2985(29.85°C),而同一时刻其他房间温度均在 25.7-25.8°C 范围内,厨房温度异常偏高约 4°C,说明在灶具开启前厨房已存在异常热源或余热积聚。\",\n \"推理步骤2: 12:14 厨房灯开启、12:14:30 灶具开启后,12:20 厨房温度飙升至 3237(32.37°C),12:25 灶具关闭时仍高达 3200(32.00°C)。相比其他房间同期约 25.7°C 的温度,厨房温度高出约 6-7°C,远超正常做饭引起的温升幅度。\",\n \"推理步骤3: 12:30 厨房温度仍维持在 2982(29.82°C),同时烟雾报警器触发 SmokeState = 1(烟雾警告状态)。灶具已在 12:25 关闭,但 5 分钟后温度仍未明显下降且触发了烟雾报警,说明可能存在食物烧焦、油烟过大甚至明火隐患。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(09:02、09:28、12:15、12:26 等),传感器读数中断可能是因为温度超出量程或传感器受高温影响出现故障,这进一步佐证了厨房存在异常高温。\",\n \"推理步骤5: 虽然 12:25:30 厨房窗户被打开(BooleanState.StateValue = False)进行通风,且 13:00 厨房温度回落至 2567(25.67°C),烟雾报警未持续报告,说明住户已做了初步处置,但此次事件的温度峰值和烟雾触发仍构成明确的火灾风险信号。\"\n ],\n \"key_evidence\": [\n \"12:00 厨房温度 2985(29.85°C),比其他房间高约 4°C,灶具尚未开启即已异常\",\n \"12:20 厨房温度飙升至 3237(32.37°C),12:25 灶具关闭时仍为 3200(32.00°C)\",\n \"12:30 烟雾报警器触发 SmokeState = 1,灶具关闭 5 分钟后仍有烟雾\",\n \"厨房温度传感器在灶具使用期间多次报告 None,疑似高温导致传感器读数异常\",\n \"12:30 厨房温度 2982(29.82°C),仍远高于其他房间的 25.7°C\"\n ],\n \"recommended_actions\": [\n \"立即确认厨房现场安全:检查灶具、油烟机及周围是否有残留明火、冒烟或焦糊物,确保火源已完全熄灭\",\n \"保持厨房窗户开启并开启排风扇,加速排出烟雾和热量,降低有害气体浓度\",\n \"检查厨房灶具及周边电器(如油烟机、微波炉等)是否存在线路过热、短路或老化迹象,必要时断开电源\",\n \"检查厨房温度传感器是否因高温损坏(多次报告 None),如有故障应及时更换以确保后续监测有效\",\n \"设置厨房温度阈值告警规则:当厨房温度超过 30°C 或与其他房间温差超过 5°C 时自动推送警报\",\n \"设置灶具自动安全关断规则:灶具连续运行超过 30 分钟或厨房温度超过阈值时自动关闭灶具\",\n \"如烟雾报警持续触发或发现明火,立即疏散人员并拨打 119 火警电话\",\n \"事后对厨房烟雾报警器进行功能测试,确认其灵敏度和响应时间正常\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在午间做饭期间出现异常高温并触发烟雾报警,存在电器过热起火风险。", "reasoning": ["推理步骤1: 12:00 厨房温度传感器报告 2985(29.85°C),而同一时刻其他房间温度均在 25.7-25.8°C 范围内,厨房温度异常偏高约 4°C,说明在灶具开启前厨房已存在异常热源或余热积聚。", "推理步骤2: 12:14 厨房灯开启、12:14:30 灶具开启后,12:20 厨房温度飙升至 3237(32.37°C),12:25 灶具关闭时仍高达 3200(32.00°C)。相比其他房间同期约 25.7°C 的温度,厨房温度高出约 6-7°C,远超正常做饭引起的温升幅度。", "推理步骤3: 12:30 厨房温度仍维持在 2982(29.82°C),同时烟雾报警器触发 SmokeState = 1(烟雾警告状态)。灶具已在 12:25 关闭,但 5 分钟后温度仍未明显下降且触发了烟雾报警,说明可能存在食物烧焦、油烟过大甚至明火隐患。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(09:02、09:28、12:15、12:26 等),传感器读数中断可能是因为温度超出量程或传感器受高温影响出现故障,这进一步佐证了厨房存在异常高温。", "推理步骤5: 虽然 12:25:30 厨房窗户被打开(BooleanState.StateValue = False)进行通风,且 13:00 厨房温度回落至 2567(25.67°C),烟雾报警未持续报告,说明住户已做了初步处置,但此次事件的温度峰值和烟雾触发仍构成明确的火灾风险信号。"], "key_evidence": ["12:00 厨房温度 2985(29.85°C),比其他房间高约 4°C,灶具尚未开启即已异常", "12:20 厨房温度飙升至 3237(32.37°C),12:25 灶具关闭时仍为 3200(32.00°C)", "12:30 烟雾报警器触发 SmokeState = 1,灶具关闭 5 分钟后仍有烟雾", "厨房温度传感器在灶具使用期间多次报告 None,疑似高温导致传感器读数异常", "12:30 厨房温度 2982(29.82°C),仍远高于其他房间的 25.7°C"], "recommended_actions": ["立即确认厨房现场安全:检查灶具、油烟机及周围是否有残留明火、冒烟或焦糊物,确保火源已完全熄灭", "保持厨房窗户开启并开启排风扇,加速排出烟雾和热量,降低有害气体浓度", "检查厨房灶具及周边电器(如油烟机、微波炉等)是否存在线路过热、短路或老化迹象,必要时断开电源", "检查厨房温度传感器是否因高温损坏(多次报告 None),如有故障应及时更换以确保后续监测有效", "设置厨房温度阈值告警规则:当厨房温度超过 30°C 或与其他房间温差超过 5°C 时自动推送警报", "设置灶具自动安全关断规则:灶具连续运行超过 30 分钟或厨房温度超过阈值时自动关闭灶具", "如烟雾报警持续触发或发现明火,立即疏散人员并拨打 119 火警电话", "事后对厨房烟雾报警器进行功能测试,确认其灵敏度和响应时间正常"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.764574766159058, "api_error": null} {"episode_id": "SQ5_TP_B_1041", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1041.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261670, "scenario_id": "WD-02", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-08T23:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在洗碗机运行期间触发报警,存在水损风险,需立即处置。\",\n \"reasoning\": [\n \"推理步骤1: 23:33 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,表明检测到积水。\",\n \"推理步骤2: 洗碗机于 19:43 启动(OperationalState=1),至 23:28 仍处于运行状态(OperationalState=1),已持续运行近 4 小时,远超普通洗碗程序的 1-2 小时周期,运行时间异常偏长。\",\n \"推理步骤3: 漏水传感器位于卫生间而非厨房,但公寓中厨房与卫生间通常共用排水管路。洗碗机长时间运行可能导致排水管路堵塞或回流,水从卫生间地漏/管道接口处溢出。\",\n \"推理步骤4: 阳台洗衣机全天无任何启动记录,排除洗衣机漏水的可能性。漏水源头高度关联洗碗机异常运行。\",\n \"推理步骤5: 事发时住户已在主卧就寝(22:36 主卧灯关闭),可能无法及时察觉漏水,水损扩大风险较高。\"\n ],\n \"key_evidence\": [\n \"23:33 bathroom_water_leak StateValue=True — 卫生间检测到漏水\",\n \"洗碗机 19:43 启动后运行至 23:28+ 仍为 OperationalState=1,持续近 4 小时未完成,运行时间异常\",\n \"23:33 漏水报警与洗碗机仍在运行同时发生,时间高度吻合\",\n \"洗衣机全天无启动记录,排除洗衣机作为漏水源\",\n \"住户 22:36 已熄灯就寝,无人值守状态下漏水风险升级\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机(发送 OnOff.Off 指令至 kitchen_dishwasher),停止可能的持续进水/排水\",\n \"立即向住户手机推送高优先级漏水警报,附带蜂鸣提醒以唤醒就寝中的住户\",\n \"如有智能水阀,立即关闭厨房或全屋进水总阀,防止水损进一步扩大\",\n \"住户醒后应第一时间检查卫生间地面积水情况,并检查厨房洗碗机下方及排水管接口是否有渗漏\",\n \"检查洗碗机排水管是否堵塞或脱落,确认长时间运行的原因(可能是排水故障导致程序无法正常结束)\",\n \"清理卫生间积水,检查是否已渗透至地板下层或相邻房间,评估是否需要专业维修\",\n \"洗碗机恢复使用前应进行维修检查,确认排水系统正常后再重新启用\",\n \"建议在厨房洗碗机下方增设漏水传感器,实现漏水源头的直接监测\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在洗碗机运行期间触发报警,存在水损风险,需立即处置。", "reasoning": ["推理步骤1: 23:33 卫生间漏水传感器 bathroom_water_leak 报告 StateValue=True,表明检测到积水。", "推理步骤2: 洗碗机于 19:43 启动(OperationalState=1),至 23:28 仍处于运行状态(OperationalState=1),已持续运行近 4 小时,远超普通洗碗程序的 1-2 小时周期,运行时间异常偏长。", "推理步骤3: 漏水传感器位于卫生间而非厨房,但公寓中厨房与卫生间通常共用排水管路。洗碗机长时间运行可能导致排水管路堵塞或回流,水从卫生间地漏/管道接口处溢出。", "推理步骤4: 阳台洗衣机全天无任何启动记录,排除洗衣机漏水的可能性。漏水源头高度关联洗碗机异常运行。", "推理步骤5: 事发时住户已在主卧就寝(22:36 主卧灯关闭),可能无法及时察觉漏水,水损扩大风险较高。"], "key_evidence": ["23:33 bathroom_water_leak StateValue=True — 卫生间检测到漏水", "洗碗机 19:43 启动后运行至 23:28+ 仍为 OperationalState=1,持续近 4 小时未完成,运行时间异常", "23:33 漏水报警与洗碗机仍在运行同时发生,时间高度吻合", "洗衣机全天无启动记录,排除洗衣机作为漏水源", "住户 22:36 已熄灯就寝,无人值守状态下漏水风险升级"], "recommended_actions": ["立即远程关闭洗碗机(发送 OnOff.Off 指令至 kitchen_dishwasher),停止可能的持续进水/排水", "立即向住户手机推送高优先级漏水警报,附带蜂鸣提醒以唤醒就寝中的住户", "如有智能水阀,立即关闭厨房或全屋进水总阀,防止水损进一步扩大", "住户醒后应第一时间检查卫生间地面积水情况,并检查厨房洗碗机下方及排水管接口是否有渗漏", "检查洗碗机排水管是否堵塞或脱落,确认长时间运行的原因(可能是排水故障导致程序无法正常结束)", "清理卫生间积水,检查是否已渗透至地板下层或相邻房间,评估是否需要专业维修", "洗碗机恢复使用前应进行维修检查,确认排水系统正常后再重新启用", "建议在厨房洗碗机下方增设漏水传感器,实现漏水源头的直接监测"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.287485361099243, "api_error": null} {"episode_id": "SQ5_TP_B_1039", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1039.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-12T00:00:00", "seed": 20261668, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-12T18:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:06 有人通过合法凭证开锁后,疑似有第二人尾随进入室内;约一分钟后又出现一次手动开锁开门,两次入户行为间隔极短且运动轨迹异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:06:00 入户门锁通过 UserIndex=1 的合法凭证(OperationSource=3,即密码/指纹/卡片)解锁,门打开后住户进入,玄关和客厅运动传感器依次触发,这是正常回家流程。\",\n \"推理步骤2: 18:06:10-18:06:15 期间,living_room_occupancy 和 second_bedroom_occupancy 同时报告占用=1,说明至少有两个不同位置同时检测到人体活动。住户一人不可能同时出现在客厅和次卧,暗示室内存在第二人。\",\n \"推理步骤3: 仅约一分钟后(18:07:00),入户门锁再次被手动(OperationSource=Manual)解锁,门再次打开(front_door_contact=False),玄关运动传感器再次触发。这意味着在第一人刚进门、门已关闭的情况下,又有人从外部手动开门进入。\",\n \"推理步骤4: 第一次开锁使用了注册凭证(UserIndex=1),第二次开锁为 Manual 且无 UserIndex,说明第二次进入者没有使用任何已注册的认证方式,而是趁门未完全锁定时手动开门,符合典型的尾随入室模式。\",\n \"推理步骤5: 对比早晨 07:17 的正常出门流程——住户手动开锁、出门、门关闭后自动上锁,全程只有一次开锁事件且运动传感器无多点同时触发。18:06-18:07 的双重开锁和多点同时占用明显偏离正常模式。\",\n \"推理步骤6: 18:07:00 之后门锁未记录到自动上锁事件(LockState=1),且 front_door_contact 在 18:07:02 变为 False(开)后直到 21:56:35 才恢复为 True(关),说明入户门在长达近4小时内处于未关闭或未上锁状态,进一步加剧安全风险。\"\n ],\n \"key_evidence\": [\n \"18:06:00 合法凭证开锁(UserIndex=1)后,18:07:00 又出现一次无凭证的手动开锁,间隔仅1分钟\",\n \"18:06:10-18:06:15 客厅(living_room_occupancy=1)和次卧(second_bedroom_occupancy=1)同时检测到人体活动,单人不可能同时出现在两个房间\",\n \"第二次开锁 OperationSource=Manual 且无 UserIndex,表明进入者未使用任何注册认证\",\n \"入户门从 18:07:02 开启后直到 21:56:35 才关闭,长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑\",\n \"通过智能家居系统自动锁定入户门(远程发送 Lock 指令),防止更多人员进入或入侵者轻易逃离现场后再次进入\",\n \"向户主手机推送高优先级入侵告警通知,附带事件时间线和门锁操作详情\",\n \"自动拨打物业安保或 110 报警电话,告知疑似尾随入室事件及住址信息\",\n \"如有室内摄像头,立即开启录像并保存 18:05-18:10 时段的关键画面作为证据\",\n \"将客厅、玄关等区域灯光全部打开(已部分执行),提高室内可见度,降低入侵者隐蔽行动的可能\",\n \"事后建议:启用门锁的自动上锁功能(缩短自动上锁延迟至5秒以内),并开启\"门未关提醒\"功能,防止类似尾随事件再次发生\",\n \"事后建议:在玄关区域加装摄像头,配合门锁事件联动录像,便于事后取证和身份识别\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:06 有人通过合法凭证开锁后,疑似有第二人尾随进入室内;约一分钟后又出现一次手动开锁开门,两次入户行为间隔极短且运动轨迹异常。\",\n \"reasoning\": [\n \"推理步骤1: 18:06:00 入户门锁通过 UserIndex=1 的合法凭证(OperationSource=3,即密码/指纹/卡片)解锁,门打开后住户进入,玄关和客厅运动传感器依次触发,这是正常回家流程。\",\n \"推理步骤2: 18:06:10-18:06:15 期间,living_room_occupancy 和 second_bedroom_occupancy 同时报告占用=1,说明至少有两个不同位置同时检测到人体活动。住户一人不可能同时出现在客厅和次卧,暗示室内存在第二人。\",\n \"推理步骤3: 仅约一分钟后(18:07:00),入户门锁再次被手动(Operatio"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 29.951277494430542, "api_error": null} {"episode_id": "SQ5_TP_B_1042", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1042.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261671, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-08T17:26:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:08 有人通过手动开锁进入后未关门、未上锁,随后 17:26 有人尾随进入,存在未授权人员入室的高度风险。\",\n \"reasoning\": [\n \"推理步骤1: 16:08 入户门通过 Manual 方式解锁(LockState=2),门被打开(StateValue=False),玄关检测到人(Occupancy=1)。但此后日志中没有关门(StateValue=True)和重新上锁的记录,说明门在 16:08 之后一直处于开启/未锁状态。\",\n \"推理步骤2: 17:26 入户门再次被解锁(LockOperationType=1, OperationSource=3, UserIndex=1),门开关传感器显示开-关序列(False→True),玄关检测到人。紧接着在极短时间内(17:26:10-17:26:15),客厅和次卧的运动传感器几乎同时触发,表明有多人快速分散进入不同房间。\",\n \"推理步骤3: 对比早晨 07:49 的正常出门模式(单人、线性移动、门迅速关闭并自动上锁)和晚间 18:00 的正常回家模式(开门→进入客厅→开灯开空调,行为连贯),17:26 的事件模式明显异常:多个房间的运动传感器在 5 秒内同时触发,说明至少有两人同时进入且分头行动。\",\n \"推理步骤4: 16:08 开门后长时间未关门(从 16:08 到 17:26 超过 1 小时 18 分钟),为尾随入室创造了条件。17:26 的 OperationSource=3 表示通过密码/凭证开锁(UserIndex=1),可能是住户本人回来,但同时有未授权人员跟随进入。\",\n \"推理步骤5: 17:26 进入后没有任何灯光、空调等生活设备被开启,直到 18:00 才有人再次开门并开始正常的居家活动(开灯、开空调)。这说明 17:26 进入的人的行为模式与住户的正常习惯不符,进一步佐证了尾随入侵的判断。\"\n ],\n \"key_evidence\": [\n \"16:08 手动开锁后门未关闭(无 StateValue=True 记录),未重新上锁,持续超过 1 小时\",\n \"17:26:10-17:26:15 仅 5 秒内 living_room_occupancy 和 second_bedroom_occupancy 同时触发,表明多人分散进入\",\n \"17:26 进入后无任何灯光或家电操作,与 18:00 住户回家后立即开灯开空调的正常模式形成鲜明对比\",\n \"16:08 至 17:26 期间入户门处于未锁/未关状态,为尾随创造了物理条件\",\n \"17:26 entrance_occupancy 在 17:26:04 和 17:26:12 两次触发,间隔仅 8 秒,暗示有前后两人经过玄关\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),震慑可能仍在室内的入侵者\",\n \"自动锁定入户门(发送 DoorLock.LockDoor 指令),防止入侵者轻易逃脱或更多人进入\",\n \"向住户手机推送高优先级入侵警报,附带事件时间线摘要,要求确认是否为已知访客\",\n \"如住户确认非授权人员,立即联系物业安保或报警(110),提供入侵时间点 16:08-17:26\",\n \"开启所有室内灯光(全屋灯光 OnOff=True),消除入侵者藏匿的暗处环境\",\n \"如有摄像头或门铃录像,立即保存 16:00-17:30 时段的录像作为证据\",\n \"事后建议:启用入户门未关闭超时告警(如 5 分钟未关门即推送提醒),避免类似长时间门户大开的情况再次发生\",\n \"事后建议:检查并更换门锁密码,排除密码泄露的可能性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "16:08 有人通过手动开锁进入后未关门、未上锁,随后 17:26 有人尾随进入,存在未授权人员入室的高度风险。", "reasoning": ["推理步骤1: 16:08 入户门通过 Manual 方式解锁(LockState=2),门被打开(StateValue=False),玄关检测到人(Occupancy=1)。但此后日志中没有关门(StateValue=True)和重新上锁的记录,说明门在 16:08 之后一直处于开启/未锁状态。", "推理步骤2: 17:26 入户门再次被解锁(LockOperationType=1, OperationSource=3, UserIndex=1),门开关传感器显示开-关序列(False→True),玄关检测到人。紧接着在极短时间内(17:26:10-17:26:15),客厅和次卧的运动传感器几乎同时触发,表明有多人快速分散进入不同房间。", "推理步骤3: 对比早晨 07:49 的正常出门模式(单人、线性移动、门迅速关闭并自动上锁)和晚间 18:00 的正常回家模式(开门→进入客厅→开灯开空调,行为连贯),17:26 的事件模式明显异常:多个房间的运动传感器在 5 秒内同时触发,说明至少有两人同时进入且分头行动。", "推理步骤4: 16:08 开门后长时间未关门(从 16:08 到 17:26 超过 1 小时 18 分钟),为尾随入室创造了条件。17:26 的 OperationSource=3 表示通过密码/凭证开锁(UserIndex=1),可能是住户本人回来,但同时有未授权人员跟随进入。", "推理步骤5: 17:26 进入后没有任何灯光、空调等生活设备被开启,直到 18:00 才有人再次开门并开始正常的居家活动(开灯、开空调)。这说明 17:26 进入的人的行为模式与住户的正常习惯不符,进一步佐证了尾随入侵的判断。"], "key_evidence": ["16:08 手动开锁后门未关闭(无 StateValue=True 记录),未重新上锁,持续超过 1 小时", "17:26:10-17:26:15 仅 5 秒内 living_room_occupancy 和 second_bedroom_occupancy 同时触发,表明多人分散进入", "17:26 进入后无任何灯光或家电操作,与 18:00 住户回家后立即开灯开空调的正常模式形成鲜明对比", "16:08 至 17:26 期间入户门处于未锁/未关状态,为尾随创造了物理条件", "17:26 entrance_occupancy 在 17:26:04 和 17:26:12 两次触发,间隔仅 8 秒,暗示有前后两人经过玄关"], "recommended_actions": ["立即触发室内警报(声光报警),震慑可能仍在室内的入侵者", "自动锁定入户门(发送 DoorLock.LockDoor 指令),防止入侵者轻易逃脱或更多人进入", "向住户手机推送高优先级入侵警报,附带事件时间线摘要,要求确认是否为已知访客", "如住户确认非授权人员,立即联系物业安保或报警(110),提供入侵时间点 16:08-17:26", "开启所有室内灯光(全屋灯光 OnOff=True),消除入侵者藏匿的暗处环境", "如有摄像头或门铃录像,立即保存 16:00-17:30 时段的录像作为证据", "事后建议:启用入户门未关闭超时告警(如 5 分钟未关门即推送提醒),避免类似长时间门户大开的情况再次发生", "事后建议:检查并更换门锁密码,排除密码泄露的可能性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.469677686691284, "api_error": null} {"episode_id": "SQ5_TP_B_1043", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1043.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261672, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-05T17:06:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:34 入户门被手动开锁后未关闭、未上锁,随后 17:06 出现无物理开锁记录的第二次入门事件,且室内多区域同时检测到人员活动,高度疑似尾随入室。\",\n \"reasoning\": [\n \"推理步骤1: 16:34 入户门通过 Manual 方式解锁(LockState=2 即 Unlocked),门被打开(StateValue=False),玄关检测到人员。但此后日志中没有关门(StateValue=True)和重新上锁(LockState=1)的记录,说明门在 16:34 之后处于未关/未锁状态。\",\n \"推理步骤2: 17:06 出现第二次入门事件——门锁记录了 LockOperationType=1(Unlock)、OperationSource=3(可能为远程/按键等非钥匙方式)并带有 UserIndex=1,门再次打开(StateValue=False)然后关闭(StateValue=True)。关键问题是:门在 16:34 后本就未关未锁,理论上不需要再次解锁操作,这暗示可能有人在门未完全关闭的窗口期进入,或者有人利用了门未锁的状态。\",\n \"推理步骤3: 17:06:10 起,客厅和次卧运动传感器几乎同时触发(living_room_occupancy 和 second_bedroom_occupancy 在 17:06:10~17:06:15 间同时报告 Occupancy=1),说明至少有两个不同区域同时存在人员活动。结合住户为两室一厅的小户型,一个人不可能在 5 秒内同时出现在客厅和次卧。\",\n \"推理步骤4: 对比 07:23 的正常出门模式(关灯→锁门→开门关门→自动上锁,整个流程紧凑且有完整的关门上锁记录)和 17:41 的正常回家模式(开门→进入→开灯开空调),16:34~17:06 这段时间的行为模式明显异常:门长时间未关未锁,随后出现多区域同时有人的情况。\",\n \"推理步骤5: 17:41 住户正常回家后开灯开空调,说明 17:06 进入的人并非住户本人。住户在 17:41 才真正到家,而 16:34~17:06 期间的入门活动极可能是未授权人员利用门未锁的漏洞进入。\"\n ],\n \"key_evidence\": [\n \"16:34 入户门手动解锁并打开后,无关门(StateValue=True)和上锁(LockState=1)记录,门持续处于未关/未锁状态超过 30 分钟\",\n \"17:06 出现第二次解锁进入事件(OperationSource=3, UserIndex=1),门打开后关闭,但此时住户尚未到家(17:41 才回家开灯开空调)\",\n \"17:06:10~17:06:15 客厅和次卧运动传感器几乎同时触发,表明至少两人同时在不同房间活动\",\n \"17:41 住户正常回家的完整行为链(开门→客厅灯→空调)与 17:06 的进入行为形成对比,17:06 进入后无任何灯光或电器操作,行为隐蔽\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),震慑可能仍在室内的入侵者\",\n \"自动锁定入户门(发送 DoorLock.LockDoor 命令),防止入侵者轻易逃脱或更多人进入\",\n \"向住户手机推送高优先级入侵警报通知,附带事件时间线(16:34 门未锁 → 17:06 可疑进入 → 多区域同时有人)\",\n \"自动拨打物业安保或 110 报警电话,提供住址和事件摘要\",\n \"开启所有室内灯光(全屋灯光打开),消除入侵者的隐蔽条件\",\n \"记录并保存 16:30~17:45 时间段所有设备日志作为证据,防止日志被篡改\",\n \"建议住户到家前不要独自进入房间,等待安保人员到场后一同检查\",\n \"事后排查:检查 16:34 手动开锁的原因(是否为住户误操作或有人复制了物理钥匙),并启用门锁的自动上锁超时功能(如 30 秒未关门则报警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "16:34 入户门被手动开锁后未关闭、未上锁,随后 17:06 出现无物理开锁记录的第二次入门事件,且室内多区域同时检测到人员活动,高度疑似尾随入室。", "reasoning": ["推理步骤1: 16:34 入户门通过 Manual 方式解锁(LockState=2 即 Unlocked),门被打开(StateValue=False),玄关检测到人员。但此后日志中没有关门(StateValue=True)和重新上锁(LockState=1)的记录,说明门在 16:34 之后处于未关/未锁状态。", "推理步骤2: 17:06 出现第二次入门事件——门锁记录了 LockOperationType=1(Unlock)、OperationSource=3(可能为远程/按键等非钥匙方式)并带有 UserIndex=1,门再次打开(StateValue=False)然后关闭(StateValue=True)。关键问题是:门在 16:34 后本就未关未锁,理论上不需要再次解锁操作,这暗示可能有人在门未完全关闭的窗口期进入,或者有人利用了门未锁的状态。", "推理步骤3: 17:06:10 起,客厅和次卧运动传感器几乎同时触发(living_room_occupancy 和 second_bedroom_occupancy 在 17:06:10~17:06:15 间同时报告 Occupancy=1),说明至少有两个不同区域同时存在人员活动。结合住户为两室一厅的小户型,一个人不可能在 5 秒内同时出现在客厅和次卧。", "推理步骤4: 对比 07:23 的正常出门模式(关灯→锁门→开门关门→自动上锁,整个流程紧凑且有完整的关门上锁记录)和 17:41 的正常回家模式(开门→进入→开灯开空调),16:34~17:06 这段时间的行为模式明显异常:门长时间未关未锁,随后出现多区域同时有人的情况。", "推理步骤5: 17:41 住户正常回家后开灯开空调,说明 17:06 进入的人并非住户本人。住户在 17:41 才真正到家,而 16:34~17:06 期间的入门活动极可能是未授权人员利用门未锁的漏洞进入。"], "key_evidence": ["16:34 入户门手动解锁并打开后,无关门(StateValue=True)和上锁(LockState=1)记录,门持续处于未关/未锁状态超过 30 分钟", "17:06 出现第二次解锁进入事件(OperationSource=3, UserIndex=1),门打开后关闭,但此时住户尚未到家(17:41 才回家开灯开空调)", "17:06:10~17:06:15 客厅和次卧运动传感器几乎同时触发,表明至少两人同时在不同房间活动", "17:41 住户正常回家的完整行为链(开门→客厅灯→空调)与 17:06 的进入行为形成对比,17:06 进入后无任何灯光或电器操作,行为隐蔽"], "recommended_actions": ["立即触发室内警报(声光报警),震慑可能仍在室内的入侵者", "自动锁定入户门(发送 DoorLock.LockDoor 命令),防止入侵者轻易逃脱或更多人进入", "向住户手机推送高优先级入侵警报通知,附带事件时间线(16:34 门未锁 → 17:06 可疑进入 → 多区域同时有人)", "自动拨打物业安保或 110 报警电话,提供住址和事件摘要", "开启所有室内灯光(全屋灯光打开),消除入侵者的隐蔽条件", "记录并保存 16:30~17:45 时间段所有设备日志作为证据,防止日志被篡改", "建议住户到家前不要独自进入房间,等待安保人员到场后一同检查", "事后排查:检查 16:34 手动开锁的原因(是否为住户误操作或有人复制了物理钥匙),并启用门锁的自动上锁超时功能(如 30 秒未关门则报警)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.58769464492798, "api_error": null} {"episode_id": "SQ5_TP_B_1046", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1046.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-01T00:00:00", "seed": 20261675, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-01T17:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"17:15 有人通过合法用户开锁后尾随进入室内,多个房间几乎同时出现占用信号,且入户门未重新上锁。\",\n \"reasoning\": [\n \"推理步骤1: 17:15:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,这是一次合法开锁操作。\",\n \"推理步骤2: 17:15:04 玄关运动传感器触发,17:15:08 入户门关闭(StateValue=True),说明有人进入后关门。但紧接着 17:15:10 客厅运动传感器触发、17:15:12 玄关运动传感器再次触发、17:15:15 次卧和客厅运动传感器同时触发——在短短 7 秒内,客厅、玄关、次卧三个不同区域几乎同时检测到人体存在,单人不可能在如此短的时间内同时出现在这些分散的位置。\",\n \"推理步骤3: 对比当天其他两次进出门事件(07:44 出门、18:20 回家),均为单人正常动线:玄关→客厅依次触发,不会出现多房间同时占用的情况。17:15 的模式明显异常。\",\n \"推理步骤4: 17:15 开锁后,日志中没有出现 LockOperationType=0(上锁)事件,入户门在此后长时间处于未锁定状态,直到 22:24:14 才自动上锁,进一步印证住户可能未意识到有人尾随。\",\n \"推理步骤5: 15:59 有一次手动开锁和入户门打开事件,但同样没有关门和上锁记录,这可能是住户短暂开门(如取快递),也可能为尾随者提供了踩点机会。17:15 的远程开锁紧随其后,时间间隔约 1 小时 16 分钟,存在被跟踪后伺机尾随的可能。\"\n ],\n \"key_evidence\": [\n \"17:15:10 客厅、17:15:12 玄关、17:15:15 次卧+客厅运动传感器在 5 秒内同时触发,单人无法做到\",\n \"17:15 开锁后无任何上锁记录,入户门持续处于未锁定状态直到 22:24\",\n \"15:59 入户门手动开锁后也无关门上锁记录,可能存在前期踩点\",\n \"对比 07:44 和 18:20 的正常进出模式,17:15 的多房间同时占用明显异常\"\n ],\n \"recommended_actions\": [\n \"立即远程锁定入户门(发送 DoorLock.LockDoor 命令),防止更多人员进入或嫌疑人再次出入\",\n \"触发全屋警报:开启所有灯光(客厅、卧室、厨房、阳台)并将亮度调至最高,起到威慑作用\",\n \"通过手机推送或短信立即通知住户:'检测到 17:15 有疑似尾随入室,次卧和客厅同时检测到人员活动,请确认是否为已知访客'\",\n \"如住户确认非已知人员,立即拨打 110 报警,并保留完整设备事件日志作为证据\",\n \"关闭主卧窗帘(已于 22:24 关闭)并确认所有窗户传感器状态,防止嫌疑人从窗户逃离或再次进入\",\n \"事后排查:检查 15:59 手动开锁事件是否为住户本人操作;审查门锁用户列表,确认 UserIndex=1 的身份;考虑为入户门增加自动上锁策略(开锁后 N 秒无操作自动上锁)\",\n \"长期建议:在玄关或入户门处加装摄像头,配合运动传感器实现可视化确认,减少此类尾随事件的判断盲区\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "17:15 有人通过合法用户开锁后尾随进入室内,多个房间几乎同时出现占用信号,且入户门未重新上锁。", "reasoning": ["推理步骤1: 17:15:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,这是一次合法开锁操作。", "推理步骤2: 17:15:04 玄关运动传感器触发,17:15:08 入户门关闭(StateValue=True),说明有人进入后关门。但紧接着 17:15:10 客厅运动传感器触发、17:15:12 玄关运动传感器再次触发、17:15:15 次卧和客厅运动传感器同时触发——在短短 7 秒内,客厅、玄关、次卧三个不同区域几乎同时检测到人体存在,单人不可能在如此短的时间内同时出现在这些分散的位置。", "推理步骤3: 对比当天其他两次进出门事件(07:44 出门、18:20 回家),均为单人正常动线:玄关→客厅依次触发,不会出现多房间同时占用的情况。17:15 的模式明显异常。", "推理步骤4: 17:15 开锁后,日志中没有出现 LockOperationType=0(上锁)事件,入户门在此后长时间处于未锁定状态,直到 22:24:14 才自动上锁,进一步印证住户可能未意识到有人尾随。", "推理步骤5: 15:59 有一次手动开锁和入户门打开事件,但同样没有关门和上锁记录,这可能是住户短暂开门(如取快递),也可能为尾随者提供了踩点机会。17:15 的远程开锁紧随其后,时间间隔约 1 小时 16 分钟,存在被跟踪后伺机尾随的可能。"], "key_evidence": ["17:15:10 客厅、17:15:12 玄关、17:15:15 次卧+客厅运动传感器在 5 秒内同时触发,单人无法做到", "17:15 开锁后无任何上锁记录,入户门持续处于未锁定状态直到 22:24", "15:59 入户门手动开锁后也无关门上锁记录,可能存在前期踩点", "对比 07:44 和 18:20 的正常进出模式,17:15 的多房间同时占用明显异常"], "recommended_actions": ["立即远程锁定入户门(发送 DoorLock.LockDoor 命令),防止更多人员进入或嫌疑人再次出入", "触发全屋警报:开启所有灯光(客厅、卧室、厨房、阳台)并将亮度调至最高,起到威慑作用", "通过手机推送或短信立即通知住户:'检测到 17:15 有疑似尾随入室,次卧和客厅同时检测到人员活动,请确认是否为已知访客'", "如住户确认非已知人员,立即拨打 110 报警,并保留完整设备事件日志作为证据", "关闭主卧窗帘(已于 22:24 关闭)并确认所有窗户传感器状态,防止嫌疑人从窗户逃离或再次进入", "事后排查:检查 15:59 手动开锁事件是否为住户本人操作;审查门锁用户列表,确认 UserIndex=1 的身份;考虑为入户门增加自动上锁策略(开锁后 N 秒无操作自动上锁)", "长期建议:在玄关或入户门处加装摄像头,配合运动传感器实现可视化确认,减少此类尾随事件的判断盲区"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.529432773590088, "api_error": null} {"episode_id": "SQ5_TP_B_1047", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1047.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-14T00:00:00", "seed": 20261676, "scenario_id": "FG-02", "total_events": 195, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-14T13:57:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房在14:00前后出现极端高温异常,随后烟雾报警器触发,高度疑似电器过热起火。\",\n \"reasoning\": [\n \"推理步骤1: 全天各房间温度传感器呈现一致的自然昼夜变化曲线(夜间约23.0°C,午间峰值约25.8°C),属于正常的夏季室温波动。\",\n \"推理步骤2: 13:57 厨房温度传感器突然报告 MeasuredValue=3777(即37.77°C),相比3分钟前13:30的25.68°C骤升超过12°C,且该读数使用了缩写属性名(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),说明这是一次非常规的突发事件上报。\",\n \"推理步骤3: 14:02 厨房温度传感器再次以缩写属性名上报 MeasuredValue=3200(32.00°C),虽然较37.77°C有所回落,但仍远高于同时刻其他房间的25.4°C左右,说明厨房仍存在局部高温热源。\",\n \"推理步骤4: 14:00 的常规半小时上报中,厨房温度已回落至25.35°C,与其他房间一致,这可能意味着传感器在短暂高温后恢复了正常采样,但局部热源仍在持续。\",\n \"推理步骤5: 14:07 厨房烟雾报警器触发 SmokeState=1(检测到烟雾),距首次高温异常仅10分钟,形成了「极端高温 → 持续高温 → 烟雾检测」的完整火灾证据链。\",\n \"推理步骤6: 其他房间在同一时段温度完全正常,排除了全屋性传感器故障或环境因素,确认异常严格局限于厨房区域,指向厨房内某电器或灶具过热起火。\"\n ],\n \"key_evidence\": [\n \"13:57 厨房温度传感器骤升至37.77°C(MeasuredValue=3777),较正常值高出约12°C\",\n \"14:02 厨房温度传感器仍报32.00°C(MeasuredValue=3200),持续异常高温\",\n \"14:07 厨房烟雾报警器触发 SmokeState=1,确认产生烟雾\",\n \"同时段其他房间温度均在25.3-25.5°C范围内,排除全局性故障\"\n ],\n \"recommended_actions\": [\n \"立即切断厨房电源总闸,停止厨房灶具(kitchen_cook_surface)和洗碗机(kitchen_dishwasher)等所有电器的供电,消除持续热源\",\n \"远程关闭厨房燃气阀门(如有智能燃气阀),防止燃气泄漏加剧火情\",\n \"打开厨房窗户(kitchen_window_contact 对应窗户)进行通风排烟,同时关闭通往客厅的门以防烟雾蔓延\",\n \"通过智能门锁(front_door_lock)远程解锁入户门,确保逃生通道畅通\",\n \"打开玄关灯(entrance_light)和客厅灯,照亮疏散路线,引导住户迅速撤离\",\n \"立即拨打119火警电话,通知消防部门前往处置\",\n \"向住户手机推送紧急火灾警报通知,附带疏散指引\",\n \"关闭客厅空调和卧室空调(living_room_ac、master_bedroom_ac),避免空调系统将烟雾扩散至其他房间\",\n \"火情解除后,安排专业人员检查厨房灶具和电器,排查过热起火的根本原因,并检查烟雾报警器是否已恢复正常状态(SmokeState=0)\",\n \"检查厨房温度传感器的属性上报格式异常(缩写属性名),确认传感器固件是否需要更新或传感器本身是否受损\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房在14:00前后出现极端高温异常,随后烟雾报警器触发,高度疑似电器过热起火。", "reasoning": ["推理步骤1: 全天各房间温度传感器呈现一致的自然昼夜变化曲线(夜间约23.0°C,午间峰值约25.8°C),属于正常的夏季室温波动。", "推理步骤2: 13:57 厨房温度传感器突然报告 MeasuredValue=3777(即37.77°C),相比3分钟前13:30的25.68°C骤升超过12°C,且该读数使用了缩写属性名(MeasuredValue 而非 TemperatureMeasurement.MeasuredValue),说明这是一次非常规的突发事件上报。", "推理步骤3: 14:02 厨房温度传感器再次以缩写属性名上报 MeasuredValue=3200(32.00°C),虽然较37.77°C有所回落,但仍远高于同时刻其他房间的25.4°C左右,说明厨房仍存在局部高温热源。", "推理步骤4: 14:00 的常规半小时上报中,厨房温度已回落至25.35°C,与其他房间一致,这可能意味着传感器在短暂高温后恢复了正常采样,但局部热源仍在持续。", "推理步骤5: 14:07 厨房烟雾报警器触发 SmokeState=1(检测到烟雾),距首次高温异常仅10分钟,形成了「极端高温 → 持续高温 → 烟雾检测」的完整火灾证据链。", "推理步骤6: 其他房间在同一时段温度完全正常,排除了全屋性传感器故障或环境因素,确认异常严格局限于厨房区域,指向厨房内某电器或灶具过热起火。"], "key_evidence": ["13:57 厨房温度传感器骤升至37.77°C(MeasuredValue=3777),较正常值高出约12°C", "14:02 厨房温度传感器仍报32.00°C(MeasuredValue=3200),持续异常高温", "14:07 厨房烟雾报警器触发 SmokeState=1,确认产生烟雾", "同时段其他房间温度均在25.3-25.5°C范围内,排除全局性故障"], "recommended_actions": ["立即切断厨房电源总闸,停止厨房灶具(kitchen_cook_surface)和洗碗机(kitchen_dishwasher)等所有电器的供电,消除持续热源", "远程关闭厨房燃气阀门(如有智能燃气阀),防止燃气泄漏加剧火情", "打开厨房窗户(kitchen_window_contact 对应窗户)进行通风排烟,同时关闭通往客厅的门以防烟雾蔓延", "通过智能门锁(front_door_lock)远程解锁入户门,确保逃生通道畅通", "打开玄关灯(entrance_light)和客厅灯,照亮疏散路线,引导住户迅速撤离", "立即拨打119火警电话,通知消防部门前往处置", "向住户手机推送紧急火灾警报通知,附带疏散指引", "关闭客厅空调和卧室空调(living_room_ac、master_bedroom_ac),避免空调系统将烟雾扩散至其他房间", "火情解除后,安排专业人员检查厨房灶具和电器,排查过热起火的根本原因,并检查烟雾报警器是否已恢复正常状态(SmokeState=0)", "检查厨房温度传感器的属性上报格式异常(缩写属性名),确认传感器固件是否需要更新或传感器本身是否受损"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.884575366973877, "api_error": null} {"episode_id": "SQ5_TP_B_1048", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1048.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261677, "scenario_id": "INS-03", "total_events": 239, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-11T18:46:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:02 住户回家后未锁门,18:46 有人通过未锁的入户门尾随进入,随后直接前往次卧,疑似未经授权的入室行为。\",\n \"reasoning\": [\n \"推理步骤1: 18:02 住户通过手动操作解锁入户门(LockOperationType=1, OperationSource=Manual),进入后门锁未触发自动上锁,入户门持续处于未锁状态。\",\n \"推理步骤2: 18:46 入户门再次被打开(front_door_contact StateValue=False),此次开锁事件的 OperationSource=3(远程/外部方式)且关联 UserIndex=1,但住户此时已在客厅内(living_room_occupancy 持续为1),说明不是住户本人在门口操作。\",\n \"推理步骤3: 18:46:04-18:46:15 的运动轨迹显示:入口检测到人(entrance_occupancy=1)→ 客厅检测到人(living_room_occupancy=1)→ 次卧检测到人(second_bedroom_occupancy=1),同时客厅也持续有人。这表明家中同时存在至少两个人——一个在客厅(原住户),一个移动到了次卧(新进入者)。\",\n \"推理步骤4: 在18:02住户回家到18:46之间,没有任何门锁上锁记录(LockOperationType=0),说明入户门在这44分钟内一直处于未锁定状态,给尾随入室创造了条件。\",\n \"推理步骤5: 新进入者在15秒内快速穿过入口→客厅→次卧,行为模式不像是被邀请的访客(通常会在客厅停留),更像是趁机潜入并直奔目标房间。\"\n ],\n \"key_evidence\": [\n \"18:02 住户回家后入户门未上锁,直到18:46期间无任何 LockOperationType=0 的上锁记录\",\n \"18:46 门锁被以 OperationSource=3(远程/外部)方式解锁,而住户本人此时在客厅内\",\n \"18:46:04-18:46:15 入口、客厅、次卧运动传感器依次触发,同时客厅 occupancy 持续为1,表明家中同时存在至少两人\",\n \"新进入者在约15秒内快速穿越至次卧,未在客厅或入口区域停留\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),震慑入侵者并提醒住户注意安全\",\n \"自动锁定入户门(发送 DoorLock.LockDoor 命令),防止入侵者逃脱或更多人进入\",\n \"向住户手机推送高优先级入侵告警通知,附带事件时间线和涉及区域(次卧)\",\n \"自动拨打物业安保或110报警电话,提供家庭地址和入侵详情\",\n \"开启全屋灯光(所有房间灯设为 OnOff=True),消除入侵者的隐蔽条件\",\n \"如有摄像头设备,立即开始录像并保存入口及次卧区域的画面作为证据\",\n \"建议住户不要独自前往次卧对峙,退至安全区域等待安保人员到达\",\n \"事后排查:检查入户门锁的自动上锁策略,建议启用关门后自动上锁功能(Auto-Lock),避免类似事件再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "18:02 住户回家后未锁门,18:46 有人通过未锁的入户门尾随进入,随后直接前往次卧,疑似未经授权的入室行为。", "reasoning": ["推理步骤1: 18:02 住户通过手动操作解锁入户门(LockOperationType=1, OperationSource=Manual),进入后门锁未触发自动上锁,入户门持续处于未锁状态。", "推理步骤2: 18:46 入户门再次被打开(front_door_contact StateValue=False),此次开锁事件的 OperationSource=3(远程/外部方式)且关联 UserIndex=1,但住户此时已在客厅内(living_room_occupancy 持续为1),说明不是住户本人在门口操作。", "推理步骤3: 18:46:04-18:46:15 的运动轨迹显示:入口检测到人(entrance_occupancy=1)→ 客厅检测到人(living_room_occupancy=1)→ 次卧检测到人(second_bedroom_occupancy=1),同时客厅也持续有人。这表明家中同时存在至少两个人——一个在客厅(原住户),一个移动到了次卧(新进入者)。", "推理步骤4: 在18:02住户回家到18:46之间,没有任何门锁上锁记录(LockOperationType=0),说明入户门在这44分钟内一直处于未锁定状态,给尾随入室创造了条件。", "推理步骤5: 新进入者在15秒内快速穿过入口→客厅→次卧,行为模式不像是被邀请的访客(通常会在客厅停留),更像是趁机潜入并直奔目标房间。"], "key_evidence": ["18:02 住户回家后入户门未上锁,直到18:46期间无任何 LockOperationType=0 的上锁记录", "18:46 门锁被以 OperationSource=3(远程/外部)方式解锁,而住户本人此时在客厅内", "18:46:04-18:46:15 入口、客厅、次卧运动传感器依次触发,同时客厅 occupancy 持续为1,表明家中同时存在至少两人", "新进入者在约15秒内快速穿越至次卧,未在客厅或入口区域停留"], "recommended_actions": ["立即触发室内警报(声光报警),震慑入侵者并提醒住户注意安全", "自动锁定入户门(发送 DoorLock.LockDoor 命令),防止入侵者逃脱或更多人进入", "向住户手机推送高优先级入侵告警通知,附带事件时间线和涉及区域(次卧)", "自动拨打物业安保或110报警电话,提供家庭地址和入侵详情", "开启全屋灯光(所有房间灯设为 OnOff=True),消除入侵者的隐蔽条件", "如有摄像头设备,立即开始录像并保存入口及次卧区域的画面作为证据", "建议住户不要独自前往次卧对峙,退至安全区域等待安保人员到达", "事后排查:检查入户门锁的自动上锁策略,建议启用关门后自动上锁功能(Auto-Lock),避免类似事件再次发生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.65042495727539, "api_error": null} {"episode_id": "SQ5_TP_B_1061", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1061.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-09T00:00:00", "seed": 20261690, "scenario_id": "FG-02", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-09T19:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅温度传感器在19:02出现异常高温读数(36.09°C),随后厨房烟雾报警器于19:12触发,高度疑似电器过热引发火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 19:00各房间温度正常(约24.2-24.4°C),但仅2分钟后(19:02)客厅温度传感器上报3609(36.09°C),较正常值骤升约12°C,且该条日志缺少完整的Cluster前缀(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能是传感器在极端条件下的异常上报。\",\n \"推理步骤2: 19:07客厅温度传感器再次上报3200(32.00°C),虽较36°C有所回落但仍远高于同时段其他房间的24°C水平,说明客厅存在持续的局部高温热源。\",\n \"推理步骤3: 19:12厨房烟雾报警器触发(SmokeState=1),表明已检测到烟雾。厨房灶具在18:53已关闭,且厨房窗户已打开通风,厨房本身不应产生新的烟雾,烟雾更可能从相邻的客厅扩散而来。\",\n \"推理步骤4: 18:20客厅空调开启(制冷模式SystemMode=3),空调在持续运行中可能因电气故障过热。客厅是此时段唯一出现异常高温的房间,空调是客厅中最大功率的电器,高度怀疑空调过热起火。\",\n \"推理步骤5: 19:30温度回落至24.28°C,可能是住户已发现并采取了初步措施(如关闭空调),或火势尚处于初期阶段。但烟雾报警已触发,风险不可忽视。\",\n \"推理步骤6: 16:13入户门解锁后未见关门/上锁记录,入户门可能处于未关闭状态,这在火灾场景下会加速空气流通助长火势,但也有利于人员疏散。\"\n ],\n \"key_evidence\": [\n \"19:02 客厅温度传感器异常飙升至3609(36.09°C),远超正常室温,且上报格式异常(缺少Cluster前缀)\",\n \"19:07 客厅温度仍高达3200(32.00°C),确认持续局部高温而非单次数据抖动\",\n \"19:12 厨房烟雾报警器触发 SmokeState=1,检测到烟雾\",\n \"18:20 客厅空调开启制冷模式并持续运行,是客厅中最可能的过热源\",\n \"厨房灶具18:53已关闭且窗户已开,排除厨房自身为烟雾源的可能\",\n \"16:13 入户门解锁开门后无关门记录,门可能未关闭\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭客厅空调(living_room_ac),切断疑似过热源的电力供应\",\n \"【立即】通过智能家居系统向住户手机推送火灾警报通知,提醒立即确认现场情况\",\n \"【立即】如住户确认有明火或浓烟,拨打119火警电话\",\n \"【疏散】打开所有智能窗帘(客厅、主卧、次卧)并解锁入户门锁,确保逃生通道畅通\",\n \"【疏散】开启玄关灯和阳台灯,照亮疏散路径\",\n \"【控制】关闭厨房窗户(如可远程控制),减少氧气流通以抑制火势蔓延\",\n \"【控制】关闭客厅以外的房间门窗(如有联动能力),防止烟雾扩散\",\n \"【排查】火情解除后,安排专业电工检查客厅空调的电气线路、压缩机及电路板,确认过热原因\",\n \"【排查】检查客厅温度传感器是否因高温损坏(两次异常上报缺少标准Cluster前缀),必要时更换\",\n \"【长期】为大功率电器(空调、灶具)增加独立的温度/电流监控模块,设置过载自动断电保护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅温度传感器在19:02出现异常高温读数(36.09°C),随后厨房烟雾报警器于19:12触发,高度疑似电器过热引发火灾风险。", "reasoning": ["推理步骤1: 19:00各房间温度正常(约24.2-24.4°C),但仅2分钟后(19:02)客厅温度传感器上报3609(36.09°C),较正常值骤升约12°C,且该条日志缺少完整的Cluster前缀(MeasuredValue而非TemperatureMeasurement.MeasuredValue),可能是传感器在极端条件下的异常上报。", "推理步骤2: 19:07客厅温度传感器再次上报3200(32.00°C),虽较36°C有所回落但仍远高于同时段其他房间的24°C水平,说明客厅存在持续的局部高温热源。", "推理步骤3: 19:12厨房烟雾报警器触发(SmokeState=1),表明已检测到烟雾。厨房灶具在18:53已关闭,且厨房窗户已打开通风,厨房本身不应产生新的烟雾,烟雾更可能从相邻的客厅扩散而来。", "推理步骤4: 18:20客厅空调开启(制冷模式SystemMode=3),空调在持续运行中可能因电气故障过热。客厅是此时段唯一出现异常高温的房间,空调是客厅中最大功率的电器,高度怀疑空调过热起火。", "推理步骤5: 19:30温度回落至24.28°C,可能是住户已发现并采取了初步措施(如关闭空调),或火势尚处于初期阶段。但烟雾报警已触发,风险不可忽视。", "推理步骤6: 16:13入户门解锁后未见关门/上锁记录,入户门可能处于未关闭状态,这在火灾场景下会加速空气流通助长火势,但也有利于人员疏散。"], "key_evidence": ["19:02 客厅温度传感器异常飙升至3609(36.09°C),远超正常室温,且上报格式异常(缺少Cluster前缀)", "19:07 客厅温度仍高达3200(32.00°C),确认持续局部高温而非单次数据抖动", "19:12 厨房烟雾报警器触发 SmokeState=1,检测到烟雾", "18:20 客厅空调开启制冷模式并持续运行,是客厅中最可能的过热源", "厨房灶具18:53已关闭且窗户已开,排除厨房自身为烟雾源的可能", "16:13 入户门解锁开门后无关门记录,门可能未关闭"], "recommended_actions": ["【立即】远程关闭客厅空调(living_room_ac),切断疑似过热源的电力供应", "【立即】通过智能家居系统向住户手机推送火灾警报通知,提醒立即确认现场情况", "【立即】如住户确认有明火或浓烟,拨打119火警电话", "【疏散】打开所有智能窗帘(客厅、主卧、次卧)并解锁入户门锁,确保逃生通道畅通", "【疏散】开启玄关灯和阳台灯,照亮疏散路径", "【控制】关闭厨房窗户(如可远程控制),减少氧气流通以抑制火势蔓延", "【控制】关闭客厅以外的房间门窗(如有联动能力),防止烟雾扩散", "【排查】火情解除后,安排专业电工检查客厅空调的电气线路、压缩机及电路板,确认过热原因", "【排查】检查客厅温度传感器是否因高温损坏(两次异常上报缺少标准Cluster前缀),必要时更换", "【长期】为大功率电器(空调、灶具)增加独立的温度/电流监控模块,设置过载自动断电保护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.480422735214233, "api_error": null} {"episode_id": "SQ5_TP_B_1065", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1065.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-26T00:00:00", "seed": 20261694, "scenario_id": "FG-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-26T01:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"凌晨1:12厨房温度传感器检测到异常高温(34.27°C),随后烟雾报警器触发,疑似电器过热起火事件。\",\n \"reasoning\": [\n \"推理步骤1: 01:00时厨房温度正常(22.90°C),但01:12突然飙升至34.27°C,01:17仍高达32.00°C,10分钟内升温超过11°C,远超正常波动范围。\",\n \"推理步骤2: 01:22烟雾报警器触发(SmokeState=1),与温度异常高度吻合,确认存在烟雾/燃烧迹象。\",\n \"推理步骤3: 事发时间为凌晨1点,住户处于睡眠状态(无任何灯光/运动传感器活动),无人在厨房操作灶具,排除正常烹饪导致的升温。\",\n \"推理步骤4: 厨房灶具(cook_surface)在该时段无开启记录,温度异常可能来源于其他电器故障(如冰箱压缩机、电路短路等)。\",\n \"推理步骤5: 01:30温度恢复正常(22.95°C),说明火情可能自行熄灭或为短暂过热,但烟雾报警已触发,风险不可忽视。\",\n \"推理步骤6: 另外注意18:00厨房温度再次出现异常(28.55°C→28.70°C),18:59报告None值,传感器可能存在间歇性故障,需排查硬件问题。\"\n ],\n \"key_evidence\": [\n \"01:12 厨房温度从22.90°C骤升至34.27°C,01:17仍为32.00°C\",\n \"01:22 厨房烟雾报警器触发(SmokeState=1)\",\n \"事发时段无人活动,厨房灶具未开启,排除正常烹饪\",\n \"18:00厨房温度异常升至28.55°C,18:59传感器报告None值,存在设备不稳定迹象\"\n ],\n \"recommended_actions\": [\n \"立即检查厨房所有电器(尤其是持续通电设备如冰箱、微波炉、电热水壶等),排查过热或短路痕迹\",\n \"检查厨房电路和插座是否有烧焦、变色或异味,必要时请电工进行线路检测\",\n \"确认烟雾报警器当前状态,若仍处于报警状态需立即疏散并拨打119\",\n \"对厨房温度传感器进行校准或更换,18:59出现None值表明传感器可能已受损或连接不稳定\",\n \"在厨房加装独立式灭火器,并确保其在有效期内\",\n \"设置自动化规则:当厨房温度异常升高且无人在家时,自动切断厨房电路(需配合智能断路器)\",\n \"设置烟雾报警联动规则:触发时立即推送手机通知、开启所有灯光、解锁入户门以便逃生\",\n \"建议夜间对非必要厨房电器断电,降低无人值守时的火灾风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "凌晨1:12厨房温度传感器检测到异常高温(34.27°C),随后烟雾报警器触发,疑似电器过热起火事件。", "reasoning": ["推理步骤1: 01:00时厨房温度正常(22.90°C),但01:12突然飙升至34.27°C,01:17仍高达32.00°C,10分钟内升温超过11°C,远超正常波动范围。", "推理步骤2: 01:22烟雾报警器触发(SmokeState=1),与温度异常高度吻合,确认存在烟雾/燃烧迹象。", "推理步骤3: 事发时间为凌晨1点,住户处于睡眠状态(无任何灯光/运动传感器活动),无人在厨房操作灶具,排除正常烹饪导致的升温。", "推理步骤4: 厨房灶具(cook_surface)在该时段无开启记录,温度异常可能来源于其他电器故障(如冰箱压缩机、电路短路等)。", "推理步骤5: 01:30温度恢复正常(22.95°C),说明火情可能自行熄灭或为短暂过热,但烟雾报警已触发,风险不可忽视。", "推理步骤6: 另外注意18:00厨房温度再次出现异常(28.55°C→28.70°C),18:59报告None值,传感器可能存在间歇性故障,需排查硬件问题。"], "key_evidence": ["01:12 厨房温度从22.90°C骤升至34.27°C,01:17仍为32.00°C", "01:22 厨房烟雾报警器触发(SmokeState=1)", "事发时段无人活动,厨房灶具未开启,排除正常烹饪", "18:00厨房温度异常升至28.55°C,18:59传感器报告None值,存在设备不稳定迹象"], "recommended_actions": ["立即检查厨房所有电器(尤其是持续通电设备如冰箱、微波炉、电热水壶等),排查过热或短路痕迹", "检查厨房电路和插座是否有烧焦、变色或异味,必要时请电工进行线路检测", "确认烟雾报警器当前状态,若仍处于报警状态需立即疏散并拨打119", "对厨房温度传感器进行校准或更换,18:59出现None值表明传感器可能已受损或连接不稳定", "在厨房加装独立式灭火器,并确保其在有效期内", "设置自动化规则:当厨房温度异常升高且无人在家时,自动切断厨房电路(需配合智能断路器)", "设置烟雾报警联动规则:触发时立即推送手机通知、开启所有灯光、解锁入户门以便逃生", "建议夜间对非必要厨房电器断电,降低无人值守时的火灾风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.593241453170776, "api_error": null} {"episode_id": "SQ5_TP_B_1068", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1068.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261697, "scenario_id": "FG-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-22T21:41:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而厨房灶具在无人明确操作迹象的时段异常开启,且厨房温度曾飙升至30.36°C,存在火灾隐患与报警失效的双重风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-21T21:41:00 烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。\",\n \"推理步骤2: 2026-06-22T21:41:00 厨房灶具被开启(OnOff=True),但日志中此时段没有玄关入户门开锁/开门记录,也没有厨房灯开启记录,与早晨(06:59)和傍晚(18:18)正常做饭时先开灯再开灶的行为模式不一致,存在异常操作或误触的可能。\",\n \"推理步骤3: 2026-06-22T21:51:00 厨房温度传感器上报 MeasuredValue=3036(即30.36°C),而同一时刻其他房间温度均在23.5°C左右,厨房温度比其他房间高出约7°C,说明灶具确实在加热。\",\n \"推理步骤4: 2026-06-22T21:51:00 烟雾报警器上报 SmokeState=0(正常/无烟雾),但考虑到电池低电量状态,其检测可靠性存疑——若烟雾浓度逐渐升高,低电量的报警器可能无法及时触发警报。\",\n \"推理步骤5: 日志中灶具开启后没有后续关闭记录,也没有开窗通风(kitchen_window_contact 未变化),说明灶具可能处于无人看管的持续加热状态。\",\n \"推理步骤6: 住户在22:46已关闭客厅灯和空调、进入主卧并关灯就寝,入户门也已上锁,说明住户已入睡,厨房灶具仍在运行属于高风险场景。\"\n ],\n \"key_evidence\": [\n \"2026-06-21T21:41:00 烟雾报警器 BatteryAlert=1,电池电量低\",\n \"2026-06-22T21:41:00 厨房灶具异常开启,无对应的开灯、入户等前置操作\",\n \"2026-06-22T21:51:00 厨房温度飙升至30.36°C,远高于同时段其他房间的23.5°C\",\n \"灶具开启后日志中无关闭记录,住户22:46已就寝,灶具处于无人看管状态\",\n \"正常做饭模式(早07:00和晚18:18)均为先开厨房灯再开灶具,21:41的操作缺少此模式\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface),消除持续加热引发火灾的风险\",\n \"通过智能家居系统向住户手机发送高优先级告警通知,提醒厨房灶具异常开启且烟雾报警器电量低\",\n \"远程开启厨房灯(kitchen_light)并打开厨房窗户通风,便于住户醒来后查看情况并散热\",\n \"尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力\",\n \"排查灶具异常开启的原因:检查是否存在误触、自动化规则误配置、或设备故障,必要时禁用灶具的远程/自动开启功能\",\n \"建议设置安全规则:当所有卧室进入就寝状态(灯关闭+有人占用)时,若厨房灶具仍处于开启状态则自动关闭并告警\",\n \"建议设置烟雾报警器低电量的定期提醒机制,确保电池在耗尽前及时更换\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而厨房灶具在无人明确操作迹象的时段异常开启,且厨房温度曾飙升至30.36°C,存在火灾隐患与报警失效的双重风险。", "reasoning": ["推理步骤1: 2026-06-21T21:41:00 烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。", "推理步骤2: 2026-06-22T21:41:00 厨房灶具被开启(OnOff=True),但日志中此时段没有玄关入户门开锁/开门记录,也没有厨房灯开启记录,与早晨(06:59)和傍晚(18:18)正常做饭时先开灯再开灶的行为模式不一致,存在异常操作或误触的可能。", "推理步骤3: 2026-06-22T21:51:00 厨房温度传感器上报 MeasuredValue=3036(即30.36°C),而同一时刻其他房间温度均在23.5°C左右,厨房温度比其他房间高出约7°C,说明灶具确实在加热。", "推理步骤4: 2026-06-22T21:51:00 烟雾报警器上报 SmokeState=0(正常/无烟雾),但考虑到电池低电量状态,其检测可靠性存疑——若烟雾浓度逐渐升高,低电量的报警器可能无法及时触发警报。", "推理步骤5: 日志中灶具开启后没有后续关闭记录,也没有开窗通风(kitchen_window_contact 未变化),说明灶具可能处于无人看管的持续加热状态。", "推理步骤6: 住户在22:46已关闭客厅灯和空调、进入主卧并关灯就寝,入户门也已上锁,说明住户已入睡,厨房灶具仍在运行属于高风险场景。"], "key_evidence": ["2026-06-21T21:41:00 烟雾报警器 BatteryAlert=1,电池电量低", "2026-06-22T21:41:00 厨房灶具异常开启,无对应的开灯、入户等前置操作", "2026-06-22T21:51:00 厨房温度飙升至30.36°C,远高于同时段其他房间的23.5°C", "灶具开启后日志中无关闭记录,住户22:46已就寝,灶具处于无人看管状态", "正常做饭模式(早07:00和晚18:18)均为先开厨房灯再开灶具,21:41的操作缺少此模式"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface),消除持续加热引发火灾的风险", "通过智能家居系统向住户手机发送高优先级告警通知,提醒厨房灶具异常开启且烟雾报警器电量低", "远程开启厨房灯(kitchen_light)并打开厨房窗户通风,便于住户醒来后查看情况并散热", "尽快更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力", "排查灶具异常开启的原因:检查是否存在误触、自动化规则误配置、或设备故障,必要时禁用灶具的远程/自动开启功能", "建议设置安全规则:当所有卧室进入就寝状态(灯关闭+有人占用)时,若厨房灶具仍处于开启状态则自动关闭并告警", "建议设置烟雾报警器低电量的定期提醒机制,确保电池在耗尽前及时更换"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 27.58727192878723, "api_error": null} {"episode_id": "SQ5_TP_B_1071", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1071.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261700, "scenario_id": "WD-03", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-30T01:56:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"凌晨1:56至2:26期间,卫生间漏水传感器在无人在家的情况下持续触发三次报警,表明存在真实漏水且无人处置。\",\n \"reasoning\": [\n \"推理步骤1: 漏水传感器在01:56、02:06、02:26连续三次报告StateValue=True,间隔约10-20分钟,说明漏水并非瞬时误触,而是持续性漏水事件。\",\n \"推理步骤2: 分析住户在家状态——住户在前一天07:26通过手动操作解锁入户门并离家(门锁解锁→门打开→门关闭→自动上锁),直到当天18:20才回家开门。漏水发生在01:56-02:26,此时段无任何运动传感器触发、无灯光操作、无门锁事件,确认家中无人。\",\n \"推理步骤3: 卫生间运动传感器在漏水前后均无触发(最近一次触发是06:44),进一步排除了有人在卫生间用水导致溅水误报的可能性。\",\n \"推理步骤4: 漏水持续至少30分钟(01:56到02:26)且无人干预,期间无任何自动关阀或止水措施被触发,存在水损扩大的风险,可能影响地板、墙体及楼下邻居。\",\n \"推理步骤5: 日志中未见漏水传感器后续恢复为False的记录,无法确认漏水是否已自行停止,需按最坏情况处理。\"\n ],\n \"key_evidence\": [\n \"01:56 bathroom_water_leak StateValue=True(第一次报警)\",\n \"02:06 bathroom_water_leak StateValue=True(第二次报警,10分钟后仍在漏水)\",\n \"02:26 bathroom_water_leak StateValue=True(第三次报警,30分钟后仍在漏水)\",\n \"07:26 住户才离家(门锁手动解锁+开关门),18:20回家,漏水时段01:56-02:26家中确认无人\",\n \"漏水时段内无任何运动传感器、灯光、门锁事件,排除人为用水可能\",\n \"日志中无漏水传感器恢复为False的记录,漏水可能仍在持续\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭卫生间总水阀(如已安装智能水阀)或全屋总水阀,切断水源防止水损扩大\",\n \"【立即】向住户手机推送高优先级漏水警报通知,包含漏水位置(卫生间)、起始时间(01:56)和持续时长\",\n \"【立即】如住户无法及时返回,联系物业或预设的紧急联系人前往现场关闭水阀并查看情况\",\n \"【短期】住户到家后检查卫生间水管接头、马桶底部密封圈、洗手盆下水管、热水器连接处等常见漏水点\",\n \"【短期】检查卫生间地面及相邻房间(如客厅、卧室)墙壁底部是否有渗水痕迹,评估水损范围\",\n \"【短期】联系楼下邻居确认是否有渗水情况,避免造成邻里纠纷\",\n \"【改进】建议安装智能水阀并与漏水传感器联动,实现检测到漏水后自动关阀\",\n \"【改进】在自动化规则中增加:漏水传感器触发且无人在家时,立即推送通知并自动关闭水阀的应急场景\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "凌晨1:56至2:26期间,卫生间漏水传感器在无人在家的情况下持续触发三次报警,表明存在真实漏水且无人处置。", "reasoning": ["推理步骤1: 漏水传感器在01:56、02:06、02:26连续三次报告StateValue=True,间隔约10-20分钟,说明漏水并非瞬时误触,而是持续性漏水事件。", "推理步骤2: 分析住户在家状态——住户在前一天07:26通过手动操作解锁入户门并离家(门锁解锁→门打开→门关闭→自动上锁),直到当天18:20才回家开门。漏水发生在01:56-02:26,此时段无任何运动传感器触发、无灯光操作、无门锁事件,确认家中无人。", "推理步骤3: 卫生间运动传感器在漏水前后均无触发(最近一次触发是06:44),进一步排除了有人在卫生间用水导致溅水误报的可能性。", "推理步骤4: 漏水持续至少30分钟(01:56到02:26)且无人干预,期间无任何自动关阀或止水措施被触发,存在水损扩大的风险,可能影响地板、墙体及楼下邻居。", "推理步骤5: 日志中未见漏水传感器后续恢复为False的记录,无法确认漏水是否已自行停止,需按最坏情况处理。"], "key_evidence": ["01:56 bathroom_water_leak StateValue=True(第一次报警)", "02:06 bathroom_water_leak StateValue=True(第二次报警,10分钟后仍在漏水)", "02:26 bathroom_water_leak StateValue=True(第三次报警,30分钟后仍在漏水)", "07:26 住户才离家(门锁手动解锁+开关门),18:20回家,漏水时段01:56-02:26家中确认无人", "漏水时段内无任何运动传感器、灯光、门锁事件,排除人为用水可能", "日志中无漏水传感器恢复为False的记录,漏水可能仍在持续"], "recommended_actions": ["【立即】远程关闭卫生间总水阀(如已安装智能水阀)或全屋总水阀,切断水源防止水损扩大", "【立即】向住户手机推送高优先级漏水警报通知,包含漏水位置(卫生间)、起始时间(01:56)和持续时长", "【立即】如住户无法及时返回,联系物业或预设的紧急联系人前往现场关闭水阀并查看情况", "【短期】住户到家后检查卫生间水管接头、马桶底部密封圈、洗手盆下水管、热水器连接处等常见漏水点", "【短期】检查卫生间地面及相邻房间(如客厅、卧室)墙壁底部是否有渗水痕迹,评估水损范围", "【短期】联系楼下邻居确认是否有渗水情况,避免造成邻里纠纷", "【改进】建议安装智能水阀并与漏水传感器联动,实现检测到漏水后自动关阀", "【改进】在自动化规则中增加:漏水传感器触发且无人在家时,立即推送通知并自动关闭水阀的应急场景"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.008461713790894, "api_error": null} {"episode_id": "SQ5_TP_B_1073", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1073.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-30T00:00:00", "seed": 20261702, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-30T19:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:59 的开锁事件使用远程/凭证方式(OperationSource=8)解锁,疑似被盗或复制凭证入侵,且入侵者行为模式与住户不一致。\",\n \"reasoning\": [\n \"推理步骤1: 住户于 07:12 手动开锁出门(OperationSource=Manual),门自动上锁,此后家中无人活动直到 18:05 住户手动开锁回家,行为链完整(开门→玄关灯→客厅→开空调→做饭),符合正常下班回家模式。\",\n \"推理步骤2: 19:59 出现第二次开锁事件,OperationSource=8(远程/凭证方式,非 Manual),且携带 UserIndex=1。此时住户已在家中(18:05 已回家,客厅持续有人),住户没有理由用远程凭证再次开锁自己的门。\",\n \"推理步骤3: 19:59 开锁后,入户门传感器显示门被打开(StateValue=False),玄关和客厅运动传感器均检测到人,但紧接着次卧灯被关闭(second_bedroom_light OnOff=False)。住户此前一直在客厅活动,次卧灯在日志中从未被开启过,关闭一个未开启的灯是异常操作,可能是入侵者误触或试探。\",\n \"推理步骤4: 对比住户 18:05 回家的行为模式(开门→开灯→开空调→做饭→洗碗),19:59 进入后的行为极为简短且无后续正常生活动作,不符合住户习惯。\",\n \"推理步骤5: 值得注意的是,19:59 开锁后入户门未记录关门和自动上锁事件(对比 07:12 和 18:05 均有完整的关门+自动锁定序列),说明门可能被保持打开状态,这是入侵者为方便逃离的典型行为。\",\n \"推理步骤6: 直到 21:48 才记录到 front_door_contact=True(门关闭)和自动上锁,中间近两小时入户门处于未关闭/未上锁状态,安全风险极高。\"\n ],\n \"key_evidence\": [\n \"19:59 开锁事件使用 OperationSource=8(远程/凭证),非住户惯用的 Manual 方式,且住户已在家中无需远程开锁\",\n \"19:59 开锁后入户门未关闭、未自动上锁,直到 21:48 才恢复关闭锁定状态,门敞开近 2 小时\",\n \"进入后立即关闭了从未开启过的次卧灯(second_bedroom_light),行为异常\",\n \"19:59 进入后无任何正常生活行为链(无开灯、无使用家电等),与住户 18:05 回家后的完整行为模式形成鲜明对比\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,禁用 UserIndex=1 对应的凭证/密码/指纹,防止再次使用被盗凭证进入\",\n \"【立即】通过手机推送、短信等方式向住户发送高优先级入侵警报,确认 19:59 的开锁是否为本人操作\",\n \"【立即】开启所有房间灯光(客厅、卧室、厨房、阳台),激活所有运动传感器的高频上报模式,震慑可能仍在室内的入侵者\",\n \"【紧急】重置门锁所有用户凭证(密码、指纹、NFC 卡等),重新录入仅住户本人的凭证,消除被复制凭证的隐患\",\n \"【紧急】检查门锁的远程开锁权限设置,关闭不必要的远程开锁功能或增加二次验证(如手机确认)\",\n \"【短期】调取门锁完整的操作审计日志,排查 UserIndex=1 凭证的创建时间和使用历史,确定凭证泄露的时间窗口\",\n \"【短期】检查厨房窗户(19:38 被打开后无关闭记录)是否仍处于打开状态,排除入侵者通过窗户进出的可能\",\n \"【中期】为门锁启用异常开锁实时告警规则:非 Manual 方式开锁、非常用时段开锁、住户已在家时的重复开锁等场景自动报警\",\n \"【中期】考虑在入户门处加装摄像头,与门锁事件联动录像,为后续取证提供影像依据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "19:59 的开锁事件使用远程/凭证方式(OperationSource=8)解锁,疑似被盗或复制凭证入侵,且入侵者行为模式与住户不一致。", "reasoning": ["推理步骤1: 住户于 07:12 手动开锁出门(OperationSource=Manual),门自动上锁,此后家中无人活动直到 18:05 住户手动开锁回家,行为链完整(开门→玄关灯→客厅→开空调→做饭),符合正常下班回家模式。", "推理步骤2: 19:59 出现第二次开锁事件,OperationSource=8(远程/凭证方式,非 Manual),且携带 UserIndex=1。此时住户已在家中(18:05 已回家,客厅持续有人),住户没有理由用远程凭证再次开锁自己的门。", "推理步骤3: 19:59 开锁后,入户门传感器显示门被打开(StateValue=False),玄关和客厅运动传感器均检测到人,但紧接着次卧灯被关闭(second_bedroom_light OnOff=False)。住户此前一直在客厅活动,次卧灯在日志中从未被开启过,关闭一个未开启的灯是异常操作,可能是入侵者误触或试探。", "推理步骤4: 对比住户 18:05 回家的行为模式(开门→开灯→开空调→做饭→洗碗),19:59 进入后的行为极为简短且无后续正常生活动作,不符合住户习惯。", "推理步骤5: 值得注意的是,19:59 开锁后入户门未记录关门和自动上锁事件(对比 07:12 和 18:05 均有完整的关门+自动锁定序列),说明门可能被保持打开状态,这是入侵者为方便逃离的典型行为。", "推理步骤6: 直到 21:48 才记录到 front_door_contact=True(门关闭)和自动上锁,中间近两小时入户门处于未关闭/未上锁状态,安全风险极高。"], "key_evidence": ["19:59 开锁事件使用 OperationSource=8(远程/凭证),非住户惯用的 Manual 方式,且住户已在家中无需远程开锁", "19:59 开锁后入户门未关闭、未自动上锁,直到 21:48 才恢复关闭锁定状态,门敞开近 2 小时", "进入后立即关闭了从未开启过的次卧灯(second_bedroom_light),行为异常", "19:59 进入后无任何正常生活行为链(无开灯、无使用家电等),与住户 18:05 回家后的完整行为模式形成鲜明对比"], "recommended_actions": ["【立即】远程锁定入户门锁,禁用 UserIndex=1 对应的凭证/密码/指纹,防止再次使用被盗凭证进入", "【立即】通过手机推送、短信等方式向住户发送高优先级入侵警报,确认 19:59 的开锁是否为本人操作", "【立即】开启所有房间灯光(客厅、卧室、厨房、阳台),激活所有运动传感器的高频上报模式,震慑可能仍在室内的入侵者", "【紧急】重置门锁所有用户凭证(密码、指纹、NFC 卡等),重新录入仅住户本人的凭证,消除被复制凭证的隐患", "【紧急】检查门锁的远程开锁权限设置,关闭不必要的远程开锁功能或增加二次验证(如手机确认)", "【短期】调取门锁完整的操作审计日志,排查 UserIndex=1 凭证的创建时间和使用历史,确定凭证泄露的时间窗口", "【短期】检查厨房窗户(19:38 被打开后无关闭记录)是否仍处于打开状态,排除入侵者通过窗户进出的可能", "【中期】为门锁启用异常开锁实时告警规则:非 Manual 方式开锁、非常用时段开锁、住户已在家时的重复开锁等场景自动报警", "【中期】考虑在入户门处加装摄像头,与门锁事件联动录像,为后续取证提供影像依据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.345088481903076, "api_error": null} {"episode_id": "SQ5_TP_B_1075", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1075.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-29T00:00:00", "seed": 20261704, "scenario_id": "WD-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-29T22:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在22:12触发报警,同时洗碗机已持续运行超过2小时仍未完成,存在漏水风险,需立即处置。\",\n \"reasoning\": [\n \"推理步骤1: 22:12 bathroom_water_leak 的 StateValue 变为 True,表明卫生间漏水传感器检测到积水。\",\n \"推理步骤2: 洗碗机于19:52启动(OperationalState=1,即运行中),在22:07和22:12两次上报状态仍为运行中,持续运行已超过2小时,运行时间偏长但尚在合理范围内。\",\n \"推理步骤3: 卫生间与厨房虽不在同一房间,但住宅管道通常共用排水管路。洗碗机长时间运行排水可能导致共用管道压力异常或回流,从而在卫生间地面出现积水。\",\n \"推理步骤4: 住户在21:50已关闭客厅灯和空调并锁门,推测已进入卧室休息,很可能未注意到漏水报警,若不及时处理水损风险将持续扩大。\",\n \"推理步骤5: 日志中未见洗衣机(balcony_laundry_washer)有任何运行记录,因此漏水与洗衣机无关,主要关联设备为洗碗机及卫生间排水系统。\",\n \"推理步骤6: 厨房窗户在19:38被打开后,日志中未见关闭记录,窗户仍处于开启状态,这不影响漏水但属于夜间安全隐患。\"\n ],\n \"key_evidence\": [\n \"[22:12] bathroom_water_leak | StateValue = True — 卫生间漏水传感器触发报警\",\n \"[19:52] kitchen_dishwasher 启动,至22:12仍在运行(OperationalState=1),持续超过2小时\",\n \"[21:50] 住户关灯、关空调、锁门,推测已就寝,可能无法及时发现漏水\",\n \"[19:38] kitchen_window_contact | StateValue = False — 厨房窗户打开后未见关闭记录\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机(kitchen_dishwasher),停止进水和排水以防止漏水进一步恶化\",\n \"向住户手机推送高优先级漏水警报通知,确保住户即使在卧室也能收到提醒\",\n \"如果智能家居系统接入了水阀控制器,建议关闭卫生间区域的进水总阀以止损\",\n \"住户应尽快前往卫生间查看积水情况,确认漏水来源(排水管回流、洗碗机管路渗漏、或卫生间自身管道问题)\",\n \"检查卫生间与厨房之间的共用排水管路是否存在堵塞或密封失效\",\n \"提醒住户关闭厨房窗户(自19:38起一直处于打开状态),夜间开窗存在安全隐患\",\n \"漏水处理完毕后,检查卫生间地面、墙角及楼下天花板是否有水渍,评估是否造成水损\",\n \"建议对洗碗机进行维护检查,确认排水管连接是否松动或老化,排除设备故障隐患\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在22:12触发报警,同时洗碗机已持续运行超过2小时仍未完成,存在漏水风险,需立即处置。", "reasoning": ["推理步骤1: 22:12 bathroom_water_leak 的 StateValue 变为 True,表明卫生间漏水传感器检测到积水。", "推理步骤2: 洗碗机于19:52启动(OperationalState=1,即运行中),在22:07和22:12两次上报状态仍为运行中,持续运行已超过2小时,运行时间偏长但尚在合理范围内。", "推理步骤3: 卫生间与厨房虽不在同一房间,但住宅管道通常共用排水管路。洗碗机长时间运行排水可能导致共用管道压力异常或回流,从而在卫生间地面出现积水。", "推理步骤4: 住户在21:50已关闭客厅灯和空调并锁门,推测已进入卧室休息,很可能未注意到漏水报警,若不及时处理水损风险将持续扩大。", "推理步骤5: 日志中未见洗衣机(balcony_laundry_washer)有任何运行记录,因此漏水与洗衣机无关,主要关联设备为洗碗机及卫生间排水系统。", "推理步骤6: 厨房窗户在19:38被打开后,日志中未见关闭记录,窗户仍处于开启状态,这不影响漏水但属于夜间安全隐患。"], "key_evidence": ["[22:12] bathroom_water_leak | StateValue = True — 卫生间漏水传感器触发报警", "[19:52] kitchen_dishwasher 启动,至22:12仍在运行(OperationalState=1),持续超过2小时", "[21:50] 住户关灯、关空调、锁门,推测已就寝,可能无法及时发现漏水", "[19:38] kitchen_window_contact | StateValue = False — 厨房窗户打开后未见关闭记录"], "recommended_actions": ["立即远程关闭洗碗机(kitchen_dishwasher),停止进水和排水以防止漏水进一步恶化", "向住户手机推送高优先级漏水警报通知,确保住户即使在卧室也能收到提醒", "如果智能家居系统接入了水阀控制器,建议关闭卫生间区域的进水总阀以止损", "住户应尽快前往卫生间查看积水情况,确认漏水来源(排水管回流、洗碗机管路渗漏、或卫生间自身管道问题)", "检查卫生间与厨房之间的共用排水管路是否存在堵塞或密封失效", "提醒住户关闭厨房窗户(自19:38起一直处于打开状态),夜间开窗存在安全隐患", "漏水处理完毕后,检查卫生间地面、墙角及楼下天花板是否有水渍,评估是否造成水损", "建议对洗碗机进行维护检查,确认排水管连接是否松动或老化,排除设备故障隐患"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.50009036064148, "api_error": null} {"episode_id": "SQ5_TP_B_1077", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1077.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261706, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-13T18:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:31 入户门解锁后,玄关和客厅、次卧几乎同时检测到占用,存在多人同时进入的尾随入室嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 18:31:00 入户门锁通过合法凭证解锁(LockOperationType=1 即 Lock→Unlock,OperationSource=3 即密码/PIN,UserIndex=1 即户主),这一步本身正常。\",\n \"推理步骤2: 18:31:02 门打开,18:31:04 玄关检测到有人,18:31:08 门关闭——从开门到关门仅 6 秒,属于正常单人进入的时间窗口。\",\n \"推理步骤3: 18:31:10 客厅检测到占用,18:31:12 玄关再次报告占用(说明玄关区域仍有人或有第二个人经过),18:31:15 次卧和客厅同时报告占用。同一时刻两个不同房间同时有人,暗示至少有两人在室内活动。\",\n \"推理步骤4: 全天 00:00–18:30 期间无任何运动传感器触发、无门锁事件,说明白天家中无人。户主刚回家就出现多房间同时占用,若家中本应只有一人,则高度可疑。\",\n \"推理步骤5: 不过也存在合理解释:户主可能与家人或朋友一同回家,或 UserIndex=1 对应的是家庭成员之一。因此置信度定为 medium,需要结合实际住户人数进一步确认。\"\n ],\n \"key_evidence\": [\n \"18:31:00 门锁由 UserIndex=1 通过 PIN 解锁,全天仅此一次入户事件\",\n \"18:31:12 玄关在户主已走向客厅后再次报告占用,提示有第二人经过玄关\",\n \"18:31:15 客厅和次卧同时报告占用(Occupancy=1),表明至少两人分处不同房间\",\n \"全天 00:00–18:30 无任何运动传感器触发,家中处于无人状态\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送或短信向户主(UserIndex=1)发送告警,确认是否有同行人员;若户主否认,立即启动入侵响应\",\n \"远程锁定入户门(front_door_lock 发送 Lock 指令),防止可疑人员自由出入\",\n \"打开全屋灯光(玄关灯、客厅灯、次卧灯等),制造有人在家的威慑效果,同时便于摄像头(如有)获取清晰画面\",\n \"若家中部署有摄像头,立即调取 18:31:00–18:32:00 时段玄关及客厅录像,确认进入人数和身份\",\n \"若确认为非法尾随入侵,立即拨打 110 报警,并将门锁事件日志和传感器时间线作为证据保留\",\n \"触发声光报警(如有智能音箱或警报器),通过语音播报\"已检测到异常进入,监控已启动,警方已通知\"进行威慑\",\n \"后续建议:在入户门外加装摄像头或可视门铃,实现进门前的人脸/人数识别,从源头预防尾随\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:31 入户门解锁后,玄关和客厅、次卧几乎同时检测到占用,存在多人同时进入的尾随入室嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 18:31:00 入户门锁通过合法凭证解锁(LockOperationType=1 即 Lock→Unlock,OperationSource=3 即密码/PIN,UserIndex=1 即户主),这一步本身正常。\",\n \"推理步骤2: 18:31:02 门打开,18:31:04 玄关检测到有人,18:31:08 门关闭——从开门到关门仅 6 秒,属于正常单人进入的时间窗口。\",\n \"推理步骤3: 18:31:10 客厅检测到占用,18:31:12 玄关再次报告占用(说明玄关区域仍有人或有第二个人经过),18:31:15 次卧和客厅同时报告占用。同一时刻两个不同房间同时有人,暗示至少有两人在室内活"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 24.27637028694153, "api_error": null} {"episode_id": "SQ5_TP_B_1082", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1082.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-02T00:00:00", "seed": 20261711, "scenario_id": "FG-04", "total_events": 241, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bathroom", "injection_time": "2026-06-02T01:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而凌晨发生了灶具异常开启及厨房温度骤升事件,报警器可能无法在真正火灾时正常报警,存在严重消防安全隐患。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-01T01:55 烟雾报警器上报 BatteryAlert=1,表明电池电量低,设备处于降级工作状态。\",\n \"推理步骤2: 2026-06-02T01:55 凌晨近2点,厨房灶具被开启(OnOff=True),此时全屋无任何运动传感器触发、无灯光开启,属于无人活动时段,灶具启动来源不明,高度异常。\",\n \"推理步骤3: 2026-06-02T02:05 灶具开启10分钟后,厨房温度从约23.07°C骤升至28.86°C(MeasuredValue从2307跳至2886),短时间内升温近5.8°C,明显超出正常波动范围,指向灶具实际在加热。\",\n \"推理步骤4: 同一时刻02:05烟雾报警器上报SmokeState=0(无烟雾),但考虑到电池低电量状态,传感器灵敏度可能已下降,该读数的可靠性存疑。\",\n \"推理步骤5: 此后日志中未见灶具关闭记录,直到06:43住户起床后再次开启灶具做早餐,说明凌晨那次灶具开启后的关闭时间不明,或灶具可能持续处于开启状态数小时。\",\n \"推理步骤6: 厨房温度传感器在灶具使用期间多次上报MeasuredValue=None(06:44、07:07、18:12、19:23),传感器可能因高温或故障出现读数丢失,进一步削弱了厨房安全监测能力。\",\n \"推理步骤7: 烟雾报警器低电量 + 温度传感器间歇性失效 + 凌晨无人时段灶具异常启动,三者叠加构成严重的火灾风险盲区——即使发生火情,现有传感器链路也可能无法及时告警。\"\n ],\n \"key_evidence\": [\n \"2026-06-01T01:55 烟雾报警器 BatteryAlert=1,电池电量低\",\n \"2026-06-02T01:55 凌晨无人活动时段厨房灶具被开启,无对应的运动传感器或灯光触发\",\n \"2026-06-02T02:05 厨房温度10分钟内从23.07°C骤升至28.86°C,升幅约5.8°C\",\n \"2026-06-02T02:05 烟雾报警器在低电量状态下报告SmokeState=0,可靠性存疑\",\n \"厨房温度传感器多次上报MeasuredValue=None(06:44、07:07、18:12、19:23),存在间歇性故障\"\n ],\n \"recommended_actions\": [\n \"【立即】更换厨房烟雾报警器电池,确保其恢复正常工作状态;更换前可临时部署备用独立式烟雾报警器\",\n \"【立即】检查厨房灶具的远程控制权限和自动化规则,排查凌晨01:55无人时段灶具被开启的原因(可能是误触自动化场景、设备固件bug或未授权访问)\",\n \"【立即】检修厨房温度传感器,排查多次上报None的原因,必要时更换传感器\",\n \"【短期】为灶具设置安全联动规则:当无人活动(所有运动传感器无触发)超过一定时间时,自动关闭灶具并发送告警通知\",\n \"【短期】为灶具设置最大连续运行时间限制,超时自动断电并告警\",\n \"【短期】建立烟雾报警器电池电量监控自动化,低电量时立即推送通知到住户手机,避免长时间处于降级状态\",\n \"【中期】审查所有智能家居设备的访问权限和自动化场景配置,确认无未授权的远程控制入口\",\n \"【中期】考虑为厨房加装燃气泄漏传感器,与烟雾报警器形成双重防护\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而凌晨发生了灶具异常开启及厨房温度骤升事件,报警器可能无法在真正火灾时正常报警,存在严重消防安全隐患。", "reasoning": ["推理步骤1: 2026-06-01T01:55 烟雾报警器上报 BatteryAlert=1,表明电池电量低,设备处于降级工作状态。", "推理步骤2: 2026-06-02T01:55 凌晨近2点,厨房灶具被开启(OnOff=True),此时全屋无任何运动传感器触发、无灯光开启,属于无人活动时段,灶具启动来源不明,高度异常。", "推理步骤3: 2026-06-02T02:05 灶具开启10分钟后,厨房温度从约23.07°C骤升至28.86°C(MeasuredValue从2307跳至2886),短时间内升温近5.8°C,明显超出正常波动范围,指向灶具实际在加热。", "推理步骤4: 同一时刻02:05烟雾报警器上报SmokeState=0(无烟雾),但考虑到电池低电量状态,传感器灵敏度可能已下降,该读数的可靠性存疑。", "推理步骤5: 此后日志中未见灶具关闭记录,直到06:43住户起床后再次开启灶具做早餐,说明凌晨那次灶具开启后的关闭时间不明,或灶具可能持续处于开启状态数小时。", "推理步骤6: 厨房温度传感器在灶具使用期间多次上报MeasuredValue=None(06:44、07:07、18:12、19:23),传感器可能因高温或故障出现读数丢失,进一步削弱了厨房安全监测能力。", "推理步骤7: 烟雾报警器低电量 + 温度传感器间歇性失效 + 凌晨无人时段灶具异常启动,三者叠加构成严重的火灾风险盲区——即使发生火情,现有传感器链路也可能无法及时告警。"], "key_evidence": ["2026-06-01T01:55 烟雾报警器 BatteryAlert=1,电池电量低", "2026-06-02T01:55 凌晨无人活动时段厨房灶具被开启,无对应的运动传感器或灯光触发", "2026-06-02T02:05 厨房温度10分钟内从23.07°C骤升至28.86°C,升幅约5.8°C", "2026-06-02T02:05 烟雾报警器在低电量状态下报告SmokeState=0,可靠性存疑", "厨房温度传感器多次上报MeasuredValue=None(06:44、07:07、18:12、19:23),存在间歇性故障"], "recommended_actions": ["【立即】更换厨房烟雾报警器电池,确保其恢复正常工作状态;更换前可临时部署备用独立式烟雾报警器", "【立即】检查厨房灶具的远程控制权限和自动化规则,排查凌晨01:55无人时段灶具被开启的原因(可能是误触自动化场景、设备固件bug或未授权访问)", "【立即】检修厨房温度传感器,排查多次上报None的原因,必要时更换传感器", "【短期】为灶具设置安全联动规则:当无人活动(所有运动传感器无触发)超过一定时间时,自动关闭灶具并发送告警通知", "【短期】为灶具设置最大连续运行时间限制,超时自动断电并告警", "【短期】建立烟雾报警器电池电量监控自动化,低电量时立即推送通知到住户手机,避免长时间处于降级状态", "【中期】审查所有智能家居设备的访问权限和自动化场景配置,确认无未授权的远程控制入口", "【中期】考虑为厨房加装燃气泄漏传感器,与烟雾报警器形成双重防护"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.159878253936768, "api_error": null} {"episode_id": "SQ5_TP_B_1084", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1084.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-21T00:00:00", "seed": 20261713, "scenario_id": "INS-03", "total_events": 234, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T19:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:30 入户门开锁后,玄关和客厅、次卧几乎同时检测到多人活动,存在尾随入室的嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 19:30:00 入户门锁通过合法凭证(UserIndex=1,OperationSource=3 即密码/指纹)解锁,说明是住户本人开门。\",\n \"推理步骤2: 19:30:02 门被打开(contact=False),19:30:04 玄关检测到有人,19:30:08 门关闭(contact=True)——从开门到关门仅 6 秒,属于正常通过时间。\",\n \"推理步骤3: 但 19:30:10 客厅检测到有人后,19:30:12 玄关再次触发占用(Occupancy=1),说明在住户已经走到客厅之后,玄关区域又出现了人体活动,这不符合单人进门的运动轨迹。\",\n \"推理步骤4: 19:30:15 次卧和客厅同时检测到占用,表明至少有两个不同位置同时存在人员,进一步印证多人同时在室内活动。\",\n \"推理步骤5: 整个白天(约 09:05 至 19:30)家中仅有零星的厨房使用活动,运动传感器几乎无触发,说明家中长时间只有一人或无人,19:30 突然出现多点同时占用的模式是异常的。\",\n \"推理步骤6: 置信度定为 medium 而非 high,是因为也存在住户携带家人/朋友一同回家的可能性,但系统无法区分,应按潜在威胁处理。\"\n ],\n \"key_evidence\": [\n \"19:30:00 门锁由 UserIndex=1 通过密码/指纹解锁(合法用户操作)\",\n \"19:30:04 玄关检测到有人 → 19:30:10 客厅检测到有人 → 19:30:12 玄关再次检测到有人:住户已离开玄关后玄关再次触发,暗示第二个人存在\",\n \"19:30:15 次卧与客厅同时检测到占用,单人不可能同时出现在两个房间\",\n \"全天运动传感器模式显示通常只有单人活动,19:30 的多点同时触发属于异常模式\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送或短信向住户(UserIndex=1)发送告警,确认是否有同行人员,若住户确认是家人/朋友则解除警报\",\n \"若住户未在 2 分钟内确认安全,自动触发室内警报(声光报警),起到威慑作用\",\n \"立即锁定入户门(远程发送 DoorLock.LockDoor 指令),防止更多人员进入或嫌疑人轻易逃离后再次进入\",\n \"调取入户门附近的摄像头(如有)录像,保存 19:29–19:31 时段的影像作为证据\",\n \"若住户确认未携带他人回家,立即拨打 110 报警,并将门锁操作日志和传感器时间线提供给警方\",\n \"在警报解除前,保持所有门窗传感器处于高灵敏度监控状态,记录任何开关事件\",\n \"事后建议:在入户门外加装摄像头或可视门铃,以便未来直接通过视频确认尾随情况,降低误报率\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:30 入户门开锁后,玄关和客厅、次卧几乎同时检测到多人活动,存在尾随入室的嫌疑。", "reasoning": ["推理步骤1: 19:30:00 入户门锁通过合法凭证(UserIndex=1,OperationSource=3 即密码/指纹)解锁,说明是住户本人开门。", "推理步骤2: 19:30:02 门被打开(contact=False),19:30:04 玄关检测到有人,19:30:08 门关闭(contact=True)——从开门到关门仅 6 秒,属于正常通过时间。", "推理步骤3: 但 19:30:10 客厅检测到有人后,19:30:12 玄关再次触发占用(Occupancy=1),说明在住户已经走到客厅之后,玄关区域又出现了人体活动,这不符合单人进门的运动轨迹。", "推理步骤4: 19:30:15 次卧和客厅同时检测到占用,表明至少有两个不同位置同时存在人员,进一步印证多人同时在室内活动。", "推理步骤5: 整个白天(约 09:05 至 19:30)家中仅有零星的厨房使用活动,运动传感器几乎无触发,说明家中长时间只有一人或无人,19:30 突然出现多点同时占用的模式是异常的。", "推理步骤6: 置信度定为 medium 而非 high,是因为也存在住户携带家人/朋友一同回家的可能性,但系统无法区分,应按潜在威胁处理。"], "key_evidence": ["19:30:00 门锁由 UserIndex=1 通过密码/指纹解锁(合法用户操作)", "19:30:04 玄关检测到有人 → 19:30:10 客厅检测到有人 → 19:30:12 玄关再次检测到有人:住户已离开玄关后玄关再次触发,暗示第二个人存在", "19:30:15 次卧与客厅同时检测到占用,单人不可能同时出现在两个房间", "全天运动传感器模式显示通常只有单人活动,19:30 的多点同时触发属于异常模式"], "recommended_actions": ["立即通过手机推送或短信向住户(UserIndex=1)发送告警,确认是否有同行人员,若住户确认是家人/朋友则解除警报", "若住户未在 2 分钟内确认安全,自动触发室内警报(声光报警),起到威慑作用", "立即锁定入户门(远程发送 DoorLock.LockDoor 指令),防止更多人员进入或嫌疑人轻易逃离后再次进入", "调取入户门附近的摄像头(如有)录像,保存 19:29–19:31 时段的影像作为证据", "若住户确认未携带他人回家,立即拨打 110 报警,并将门锁操作日志和传感器时间线提供给警方", "在警报解除前,保持所有门窗传感器处于高灵敏度监控状态,记录任何开关事件", "事后建议:在入户门外加装摄像头或可视门铃,以便未来直接通过视频确认尾随情况,降低误报率"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.19863796234131, "api_error": null} {"episode_id": "SQ5_TP_B_1085", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1085.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-13T00:00:00", "seed": 20261714, "scenario_id": "WD-02", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-13T08:42:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在洗碗机运行期间触发报警,存在真实漏水风险,需立即响应。\",\n \"reasoning\": [\n \"推理步骤1: 08:42 洗碗机启动(OperationalState = 1),08:47 卫生间漏水传感器触发(StateValue = True),两者仅相隔5分钟。虽然漏水传感器位于卫生间而非厨房,但公寓中厨房与卫生间通常共用排水管路,洗碗机排水异常可能导致卫生间一侧管道溢水。\",\n \"推理步骤2: 08:34 卫生间有人活动(occupancy=1)并开灯,08:55 关灯离开,说明住户在卫生间期间漏水传感器触发,但日志中未见住户对漏水做出任何处置动作(如关闭洗碗机、关闭水阀等),漏水状态可能持续未被处理。\",\n \"推理步骤3: 整个日志时间线中,漏水传感器的 StateValue 仅在 08:47 触发了一次 True,之后再无 False 的恢复记录,说明漏水状态从未被解除,截至日志结束(23:30)漏水可能仍在持续。\",\n \"推理步骤4: 洗碗机在 08:47 仍报告 OperationalState = 1(运行中),后续 18:39 又再次启动了一轮洗碗机运行,说明住户并未意识到漏水问题,设备也未自动停机保护。\",\n \"推理步骤5: 卫生间漏水若长时间未处理,可能造成地板浸泡、渗漏到楼下、电气设备短路等严重后果,风险等级高。\"\n ],\n \"key_evidence\": [\n \"[08:42] kitchen_dishwasher OperationalState = 1(洗碗机启动运行)\",\n \"[08:47] bathroom_water_leak StateValue = True(卫生间漏水传感器报警触发)\",\n \"整个日志中漏水传感器未出现 StateValue = False 的恢复事件,表明漏水状态持续未解除\",\n \"[18:39] 洗碗机再次启动,住户未对漏水做出响应\"\n ],\n \"recommended_actions\": [\n \"立即关闭洗碗机并切断其进水阀,排查洗碗机排水管路是否存在堵塞、脱落或破裂\",\n \"立即前往卫生间确认漏水位置和严重程度,检查地面积水情况,必要时关闭卫生间总水阀\",\n \"检查厨房与卫生间之间的共用排水管道,确认是否存在管道堵塞导致的溢水回流\",\n \"清理卫生间积水,检查地板、墙面是否有渗水痕迹,防止水损扩大\",\n \"检查漏水区域附近的电气设备和插座,确保无短路或触电风险,必要时断开相关电路\",\n \"漏水传感器恢复正常(StateValue = False)后再恢复用水设备运行,并持续观察是否复发\",\n \"建议在厨房洗碗机下方也加装漏水传感器,实现更精准的漏水定位\",\n \"联系物业或水管维修人员进行专业排查,确认管道系统完好后再恢复正常使用\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在洗碗机运行期间触发报警,存在真实漏水风险,需立即响应。", "reasoning": ["推理步骤1: 08:42 洗碗机启动(OperationalState = 1),08:47 卫生间漏水传感器触发(StateValue = True),两者仅相隔5分钟。虽然漏水传感器位于卫生间而非厨房,但公寓中厨房与卫生间通常共用排水管路,洗碗机排水异常可能导致卫生间一侧管道溢水。", "推理步骤2: 08:34 卫生间有人活动(occupancy=1)并开灯,08:55 关灯离开,说明住户在卫生间期间漏水传感器触发,但日志中未见住户对漏水做出任何处置动作(如关闭洗碗机、关闭水阀等),漏水状态可能持续未被处理。", "推理步骤3: 整个日志时间线中,漏水传感器的 StateValue 仅在 08:47 触发了一次 True,之后再无 False 的恢复记录,说明漏水状态从未被解除,截至日志结束(23:30)漏水可能仍在持续。", "推理步骤4: 洗碗机在 08:47 仍报告 OperationalState = 1(运行中),后续 18:39 又再次启动了一轮洗碗机运行,说明住户并未意识到漏水问题,设备也未自动停机保护。", "推理步骤5: 卫生间漏水若长时间未处理,可能造成地板浸泡、渗漏到楼下、电气设备短路等严重后果,风险等级高。"], "key_evidence": ["[08:42] kitchen_dishwasher OperationalState = 1(洗碗机启动运行)", "[08:47] bathroom_water_leak StateValue = True(卫生间漏水传感器报警触发)", "整个日志中漏水传感器未出现 StateValue = False 的恢复事件,表明漏水状态持续未解除", "[18:39] 洗碗机再次启动,住户未对漏水做出响应"], "recommended_actions": ["立即关闭洗碗机并切断其进水阀,排查洗碗机排水管路是否存在堵塞、脱落或破裂", "立即前往卫生间确认漏水位置和严重程度,检查地面积水情况,必要时关闭卫生间总水阀", "检查厨房与卫生间之间的共用排水管道,确认是否存在管道堵塞导致的溢水回流", "清理卫生间积水,检查地板、墙面是否有渗水痕迹,防止水损扩大", "检查漏水区域附近的电气设备和插座,确保无短路或触电风险,必要时断开相关电路", "漏水传感器恢复正常(StateValue = False)后再恢复用水设备运行,并持续观察是否复发", "建议在厨房洗碗机下方也加装漏水传感器,实现更精准的漏水定位", "联系物业或水管维修人员进行专业排查,确认管道系统完好后再恢复正常使用"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 23.020325422286987, "api_error": null} {"episode_id": "SQ5_TP_B_1094", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1094.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261723, "scenario_id": "FG-04", "total_events": 196, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-21T09:11:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而灶具正在使用且厨房出现过异常高温,一旦发生火灾烟雾报警器可能无法正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-20T09:11 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,该告警至今未被处理。\",\n \"推理步骤2: 2026-06-21T09:11 灶具开启(OnOff = True),10分钟后(09:21)厨房温度传感器飙升至 2988(约29.88°C),相比同时段其他房间的约25°C高出近5°C,说明灶具正在产生大量热量。\",\n \"推理步骤3: 09:21 烟雾报警器上报 SmokeState = 0(无烟雾),说明当前尚未触发烟雾告警,但这并不能排除报警器因低电量导致灵敏度下降或无法正常报警的风险。\",\n \"推理步骤4: 烟雾报警器是厨房最关键的安全设备。在电池低电量状态下,其检测能力和报警响度都可能受损。灶具使用期间恰恰是火灾风险最高的时段,两者叠加构成严重的安全隐患。\",\n \"推理步骤5: 09:30 之后厨房温度回落至正常水平(约25°C),说明灶具可能已关闭或烹饪结束,但低电量问题持续存在,下一次用火时风险依然存在。\"\n ],\n \"key_evidence\": [\n \"2026-06-20T09:11 kitchen_smoke_alarm BatteryAlert = 1(低电量告警,超过24小时未处理)\",\n \"2026-06-21T09:11 kitchen_cook_surface OnOff = True(灶具开启)\",\n \"2026-06-21T09:21 kitchen_temp_sensor MeasuredValue = 2988(厨房温度异常升高至约29.88°C,比其他房间高约5°C)\",\n \"2026-06-21T09:21 kitchen_smoke_alarm SmokeState = 0(烟雾状态正常,但在低电量下可靠性存疑)\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常工作状态。\",\n \"在电池更换完成前,尽量避免使用灶具,或确保有人全程看守厨房。\",\n \"更换电池后对烟雾报警器进行功能测试(按下测试按钮),确认报警功能正常。\",\n \"检查烟雾报警器的安装位置是否合理(距灶具适当距离),避免油烟频繁触发导致用户禁用报警器。\",\n \"在智能家居系统中设置自动化规则:当烟雾报警器电量低时,禁止或提醒用户不要远程开启灶具。\",\n \"建议增设联动规则:灶具开启超过一定时长(如30分钟)且无人在厨房时,自动关闭灶具并发送通知。\",\n \"定期检查所有安全类传感器(烟雾报警器、漏水传感器等)的电池状态,建议每季度检查一次。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而灶具正在使用且厨房出现过异常高温,一旦发生火灾烟雾报警器可能无法正常工作。", "reasoning": ["推理步骤1: 2026-06-20T09:11 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,该告警至今未被处理。", "推理步骤2: 2026-06-21T09:11 灶具开启(OnOff = True),10分钟后(09:21)厨房温度传感器飙升至 2988(约29.88°C),相比同时段其他房间的约25°C高出近5°C,说明灶具正在产生大量热量。", "推理步骤3: 09:21 烟雾报警器上报 SmokeState = 0(无烟雾),说明当前尚未触发烟雾告警,但这并不能排除报警器因低电量导致灵敏度下降或无法正常报警的风险。", "推理步骤4: 烟雾报警器是厨房最关键的安全设备。在电池低电量状态下,其检测能力和报警响度都可能受损。灶具使用期间恰恰是火灾风险最高的时段,两者叠加构成严重的安全隐患。", "推理步骤5: 09:30 之后厨房温度回落至正常水平(约25°C),说明灶具可能已关闭或烹饪结束,但低电量问题持续存在,下一次用火时风险依然存在。"], "key_evidence": ["2026-06-20T09:11 kitchen_smoke_alarm BatteryAlert = 1(低电量告警,超过24小时未处理)", "2026-06-21T09:11 kitchen_cook_surface OnOff = True(灶具开启)", "2026-06-21T09:21 kitchen_temp_sensor MeasuredValue = 2988(厨房温度异常升高至约29.88°C,比其他房间高约5°C)", "2026-06-21T09:21 kitchen_smoke_alarm SmokeState = 0(烟雾状态正常,但在低电量下可靠性存疑)"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常工作状态。", "在电池更换完成前,尽量避免使用灶具,或确保有人全程看守厨房。", "更换电池后对烟雾报警器进行功能测试(按下测试按钮),确认报警功能正常。", "检查烟雾报警器的安装位置是否合理(距灶具适当距离),避免油烟频繁触发导致用户禁用报警器。", "在智能家居系统中设置自动化规则:当烟雾报警器电量低时,禁止或提醒用户不要远程开启灶具。", "建议增设联动规则:灶具开启超过一定时长(如30分钟)且无人在厨房时,自动关闭灶具并发送通知。", "定期检查所有安全类传感器(烟雾报警器、漏水传感器等)的电池状态,建议每季度检查一次。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.65497875213623, "api_error": null} {"episode_id": "SQ5_TP_B_1091", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1091.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-04T00:00:00", "seed": 20261720, "scenario_id": "WD-02", "total_events": 234, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-04T23:55:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在凌晨触发报警,同时洗碗机已连续运行超过4小时仍未完成,存在漏水风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-05T00:00:00 卫生间漏水传感器 bathroom_water_leak 的 StateValue 变为 True,表明检测到实际积水。\",\n \"推理步骤2: 洗碗机于 19:54 启动(OperationalState=1,即运行中),到 23:55 和次日 00:00 仍报告 OperationalState=1,持续运行超过4小时,远超正常洗碗周期(通常1-2小时),说明洗碗机可能出现故障或排水异常。\",\n \"推理步骤3: 厨房温度传感器在 18:53 和 19:51 两次报告 MeasuredValue=None,说明该传感器存在间歇性故障,提示厨房区域设备状态监测可能不完全可靠,需要人工确认。\",\n \"推理步骤4: 住户约 07:14 出门、18:04 回家、22:05 关灯锁门,凌晨 00:00 时家中无人活动,漏水无法被及时发现,风险进一步升高。\",\n \"推理步骤5: 卫生间与厨房虽不在同一房间,但公寓中共用排水管路,洗碗机排水异常可能导致管路回流或溢水波及卫生间;也不排除卫生间自身管道渗漏的独立故障。\",\n \"推理步骤6: 厨房窗户在 19:50 被打开(kitchen_window_contact StateValue=False)后日志中无关闭记录,深夜窗户仍处于开启状态,虽与漏水无直接关联,但属于安全隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-05T00:00:00 bathroom_water_leak StateValue=True — 卫生间漏水传感器触发报警\",\n \"洗碗机 19:54 启动后持续运行超过4小时(23:55 和 00:00 仍为 OperationalState=1),远超正常周期\",\n \"厨房温度传感器在 18:53 和 19:51 两次报告 None,存在传感器故障\",\n \"住户 22:05 已关灯就寝/离开,凌晨无人在场处理漏水\",\n \"厨房窗户自 19:50 打开后未关闭\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭洗碗机(发送 OnOff.OnOff=False 指令至 kitchen_dishwasher),停止可能的持续进水/排水\",\n \"如果智能家居系统支持,远程关闭厨房和卫生间区域的水阀(若有智能水阀设备),从源头切断水源\",\n \"立即向住户手机推送高优先级漏水警报,告知卫生间已检测到积水,洗碗机运行异常,需尽快到场检查\",\n \"触发客厅和卫生间灯光闪烁或开启,配合蜂鸣提醒(如有智能音箱),以唤醒可能在家的住户\",\n \"住户到场后优先检查:(1) 卫生间地面积水来源及范围;(2) 洗碗机是否有溢水、排水管是否堵塞;(3) 厨房与卫生间之间的共用管路是否有渗漏\",\n \"关闭厨房窗户(kitchen_window_contact 自 19:50 起处于打开状态),防止夜间安全隐患\",\n \"安排检修厨房温度传感器(两次报告 None 值),确保监测系统完整可靠\",\n \"漏水处理完毕后,检查洗碗机故障原因(是否卡在运行状态),必要时断电并联系维修\",\n \"建议后续为洗碗机添加运行超时自动断电规则(如超过2.5小时自动关闭),防止类似事件再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在凌晨触发报警,同时洗碗机已连续运行超过4小时仍未完成,存在漏水风险。", "reasoning": ["推理步骤1: 2026-06-05T00:00:00 卫生间漏水传感器 bathroom_water_leak 的 StateValue 变为 True,表明检测到实际积水。", "推理步骤2: 洗碗机于 19:54 启动(OperationalState=1,即运行中),到 23:55 和次日 00:00 仍报告 OperationalState=1,持续运行超过4小时,远超正常洗碗周期(通常1-2小时),说明洗碗机可能出现故障或排水异常。", "推理步骤3: 厨房温度传感器在 18:53 和 19:51 两次报告 MeasuredValue=None,说明该传感器存在间歇性故障,提示厨房区域设备状态监测可能不完全可靠,需要人工确认。", "推理步骤4: 住户约 07:14 出门、18:04 回家、22:05 关灯锁门,凌晨 00:00 时家中无人活动,漏水无法被及时发现,风险进一步升高。", "推理步骤5: 卫生间与厨房虽不在同一房间,但公寓中共用排水管路,洗碗机排水异常可能导致管路回流或溢水波及卫生间;也不排除卫生间自身管道渗漏的独立故障。", "推理步骤6: 厨房窗户在 19:50 被打开(kitchen_window_contact StateValue=False)后日志中无关闭记录,深夜窗户仍处于开启状态,虽与漏水无直接关联,但属于安全隐患。"], "key_evidence": ["2026-06-05T00:00:00 bathroom_water_leak StateValue=True — 卫生间漏水传感器触发报警", "洗碗机 19:54 启动后持续运行超过4小时(23:55 和 00:00 仍为 OperationalState=1),远超正常周期", "厨房温度传感器在 18:53 和 19:51 两次报告 None,存在传感器故障", "住户 22:05 已关灯就寝/离开,凌晨无人在场处理漏水", "厨房窗户自 19:50 打开后未关闭"], "recommended_actions": ["立即远程关闭洗碗机(发送 OnOff.OnOff=False 指令至 kitchen_dishwasher),停止可能的持续进水/排水", "如果智能家居系统支持,远程关闭厨房和卫生间区域的水阀(若有智能水阀设备),从源头切断水源", "立即向住户手机推送高优先级漏水警报,告知卫生间已检测到积水,洗碗机运行异常,需尽快到场检查", "触发客厅和卫生间灯光闪烁或开启,配合蜂鸣提醒(如有智能音箱),以唤醒可能在家的住户", "住户到场后优先检查:(1) 卫生间地面积水来源及范围;(2) 洗碗机是否有溢水、排水管是否堵塞;(3) 厨房与卫生间之间的共用管路是否有渗漏", "关闭厨房窗户(kitchen_window_contact 自 19:50 起处于打开状态),防止夜间安全隐患", "安排检修厨房温度传感器(两次报告 None 值),确保监测系统完整可靠", "漏水处理完毕后,检查洗碗机故障原因(是否卡在运行状态),必要时断电并联系维修", "建议后续为洗碗机添加运行超时自动断电规则(如超过2.5小时自动关闭),防止类似事件再次发生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.103426456451416, "api_error": null} {"episode_id": "SQ5_TP_B_1095", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1095.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261724, "scenario_id": "WD-02", "total_events": 240, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-25T09:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在洗碗机运行期间触发报警,住户已外出,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 09:49 厨房洗碗机启动(OperationalState = 1),09:54 卫生间漏水传感器触发(StateValue = True),两者间隔仅5分钟,时间高度关联。\",\n \"推理步骤2: 住户在 07:50 通过入户门离开(门锁手动解锁→开门→关门→自动上锁),直到 16:24 才有人回来。漏水发生在无人在家期间,无法及时处置。\",\n \"推理步骤3: 漏水传感器位于卫生间而非厨房,说明可能是共用排水管道回溢、洗碗机排水管连接处泄漏沿地面蔓延至卫生间,或卫生间自身管道问题被洗碗机排水压力触发。\",\n \"推理步骤4: 从 09:54 到日志结束(23:30),未见漏水传感器恢复为 False 的记录,说明漏水状态持续未解除,水损可能在持续扩大。\",\n \"推理步骤5: 日志中阳台洗衣机(balcony_laundry_washer)全天无任何运行记录,可排除洗衣机漏水的可能,问题聚焦在洗碗机运行引发的漏水事件。\"\n ],\n \"key_evidence\": [\n \"09:49 洗碗机启动(kitchen_dishwasher | OperationalState = 1)\",\n \"09:54 卫生间漏水传感器报警(bathroom_water_leak | StateValue = True)\",\n \"漏水发生时住户不在家(07:50 出门,16:24 才返回)\",\n \"漏水传感器在整个日志周期内未恢复正常状态\",\n \"洗衣机全天无运行记录,排除洗衣机漏水\"\n ],\n \"recommended_actions\": [\n \"立即关闭洗碗机电源并远程停止其运行,防止继续进排水加剧泄漏\",\n \"如支持远程控制,关闭家中总水阀或洗碗机进水阀\",\n \"向住户手机推送高优先级漏水警报,告知漏水位置(卫生间)和持续时长\",\n \"检查卫生间地面积水情况,评估是否已渗透到楼下或损坏地板/墙体\",\n \"排查漏水根因:重点检查洗碗机排水管与下水道连接处、卫生间与厨房共用排水管道是否堵塞或回溢\",\n \"漏水解除后对卫生间漏水传感器进行功能校验,确认传感器工作正常\",\n \"建议在厨房也加装漏水传感器,以便更精确定位未来的漏水源头\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在洗碗机运行期间触发报警,住户已外出,存在水损风险。", "reasoning": ["推理步骤1: 09:49 厨房洗碗机启动(OperationalState = 1),09:54 卫生间漏水传感器触发(StateValue = True),两者间隔仅5分钟,时间高度关联。", "推理步骤2: 住户在 07:50 通过入户门离开(门锁手动解锁→开门→关门→自动上锁),直到 16:24 才有人回来。漏水发生在无人在家期间,无法及时处置。", "推理步骤3: 漏水传感器位于卫生间而非厨房,说明可能是共用排水管道回溢、洗碗机排水管连接处泄漏沿地面蔓延至卫生间,或卫生间自身管道问题被洗碗机排水压力触发。", "推理步骤4: 从 09:54 到日志结束(23:30),未见漏水传感器恢复为 False 的记录,说明漏水状态持续未解除,水损可能在持续扩大。", "推理步骤5: 日志中阳台洗衣机(balcony_laundry_washer)全天无任何运行记录,可排除洗衣机漏水的可能,问题聚焦在洗碗机运行引发的漏水事件。"], "key_evidence": ["09:49 洗碗机启动(kitchen_dishwasher | OperationalState = 1)", "09:54 卫生间漏水传感器报警(bathroom_water_leak | StateValue = True)", "漏水发生时住户不在家(07:50 出门,16:24 才返回)", "漏水传感器在整个日志周期内未恢复正常状态", "洗衣机全天无运行记录,排除洗衣机漏水"], "recommended_actions": ["立即关闭洗碗机电源并远程停止其运行,防止继续进排水加剧泄漏", "如支持远程控制,关闭家中总水阀或洗碗机进水阀", "向住户手机推送高优先级漏水警报,告知漏水位置(卫生间)和持续时长", "检查卫生间地面积水情况,评估是否已渗透到楼下或损坏地板/墙体", "排查漏水根因:重点检查洗碗机排水管与下水道连接处、卫生间与厨房共用排水管道是否堵塞或回溢", "漏水解除后对卫生间漏水传感器进行功能校验,确认传感器工作正常", "建议在厨房也加装漏水传感器,以便更精确定位未来的漏水源头"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.935588598251343, "api_error": null} {"episode_id": "SQ5_TP_B_1102", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1102.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261731, "scenario_id": "INS-03", "total_events": 245, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-30T19:07:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"16:17 入户门被手动开锁后未关闭、未上锁,且无后续居住活动,疑似有人尾随在17:56住户回家时一同进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 16:17:00 入户门被手动开锁(LockOperationType=1, OperationSource=Manual),门传感器显示门打开(StateValue=False),玄关检测到有人(Occupancy=1)。但此后没有任何灯光开启、空调使用或其他居住活动,也没有门关闭或重新上锁的记录。这说明有人开门进入后门一直处于未关闭/未上锁状态。\",\n \"推理步骤2: 17:56:00 再次出现入户门手动开锁、开门、玄关检测到人的序列,随后住户进入客厅开灯、开空调,表现出正常的回家行为。这才是真正的住户回家。\",\n \"推理步骤3: 16:17 的开门事件与 17:56 的回家事件之间间隔约1小时39分钟,期间门未关闭(直到22:13才记录到 front_door_contact StateValue=True 和自动上锁)。16:17 开门后无任何正常居家活动(无灯光、无电器),行为模式异常——正常住户回家后会有明显的活动痕迹。\",\n \"推理步骤4: 19:07 出现第三次开门事件(OperationSource=3, UserIndex=1,疑似远程或密码开锁),进入后玄关和客厅同时检测到人,且次卧也检测到人(19:07:15),说明此时家中可能有多人分散在不同房间,与尾随入侵后潜伏的场景吻合。\",\n \"推理步骤5: 综合来看,16:17 的异常开门事件最可疑:无后续居家活动、门长时间未关闭,可能是陌生人趁机进入或为后续尾随做准备。17:56 住户回家时,入侵者可能已在室内或跟随进入。\"\n ],\n \"key_evidence\": [\n \"16:17:00 入户门手动开锁并打开,但此后无任何灯光、电器使用等居住活动,行为模式异常\",\n \"16:17:02 门打开后直到22:13:21才记录到门关闭(StateValue=True),门处于未关闭状态长达近6小时\",\n \"17:56:00 住户回家后正常开灯开空调,与16:17的无活动形成鲜明对比\",\n \"19:07:15 次卧和客厅同时检测到人体存在,暗示家中可能有多人分散在不同区域\",\n \"16:17 开门事件的 OperationSource=Manual 但无对应的关门和上锁操作,安全链条断裂\"\n ],\n \"recommended_actions\": [\n \"立即通过门锁远程锁定入户门,确认当前门锁状态为已上锁(LockState=1)\",\n \"远程触发全屋灯光开启,对可能的入侵者形成威慑\",\n \"通过运动传感器实时监控各房间占用情况,确认是否有非预期人员在次卧或其他区域\",\n \"立即联系住户确认16:17的开门操作是否为本人所为,若非本人操作则立即报警\",\n \"向住户手机推送高优先级安全告警,附带16:17至17:56期间的异常事件摘要\",\n \"联系物业或安保人员前往现场核实情况\",\n \"事后建议:检查门锁是否存在安全漏洞,启用门未关闭超时自动告警功能,设置离家模式下开门即触发警报的自动化规则\",\n \"建议在玄关或客厅加装摄像头,便于远程确认进出人员身份\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "16:17 入户门被手动开锁后未关闭、未上锁,且无后续居住活动,疑似有人尾随在17:56住户回家时一同进入室内。", "reasoning": ["推理步骤1: 16:17:00 入户门被手动开锁(LockOperationType=1, OperationSource=Manual),门传感器显示门打开(StateValue=False),玄关检测到有人(Occupancy=1)。但此后没有任何灯光开启、空调使用或其他居住活动,也没有门关闭或重新上锁的记录。这说明有人开门进入后门一直处于未关闭/未上锁状态。", "推理步骤2: 17:56:00 再次出现入户门手动开锁、开门、玄关检测到人的序列,随后住户进入客厅开灯、开空调,表现出正常的回家行为。这才是真正的住户回家。", "推理步骤3: 16:17 的开门事件与 17:56 的回家事件之间间隔约1小时39分钟,期间门未关闭(直到22:13才记录到 front_door_contact StateValue=True 和自动上锁)。16:17 开门后无任何正常居家活动(无灯光、无电器),行为模式异常——正常住户回家后会有明显的活动痕迹。", "推理步骤4: 19:07 出现第三次开门事件(OperationSource=3, UserIndex=1,疑似远程或密码开锁),进入后玄关和客厅同时检测到人,且次卧也检测到人(19:07:15),说明此时家中可能有多人分散在不同房间,与尾随入侵后潜伏的场景吻合。", "推理步骤5: 综合来看,16:17 的异常开门事件最可疑:无后续居家活动、门长时间未关闭,可能是陌生人趁机进入或为后续尾随做准备。17:56 住户回家时,入侵者可能已在室内或跟随进入。"], "key_evidence": ["16:17:00 入户门手动开锁并打开,但此后无任何灯光、电器使用等居住活动,行为模式异常", "16:17:02 门打开后直到22:13:21才记录到门关闭(StateValue=True),门处于未关闭状态长达近6小时", "17:56:00 住户回家后正常开灯开空调,与16:17的无活动形成鲜明对比", "19:07:15 次卧和客厅同时检测到人体存在,暗示家中可能有多人分散在不同区域", "16:17 开门事件的 OperationSource=Manual 但无对应的关门和上锁操作,安全链条断裂"], "recommended_actions": ["立即通过门锁远程锁定入户门,确认当前门锁状态为已上锁(LockState=1)", "远程触发全屋灯光开启,对可能的入侵者形成威慑", "通过运动传感器实时监控各房间占用情况,确认是否有非预期人员在次卧或其他区域", "立即联系住户确认16:17的开门操作是否为本人所为,若非本人操作则立即报警", "向住户手机推送高优先级安全告警,附带16:17至17:56期间的异常事件摘要", "联系物业或安保人员前往现场核实情况", "事后建议:检查门锁是否存在安全漏洞,启用门未关闭超时自动告警功能,设置离家模式下开门即触发警报的自动化规则", "建议在玄关或客厅加装摄像头,便于远程确认进出人员身份"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.08069396018982, "api_error": null} {"episode_id": "SQ5_TP_B_1103", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1103.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-08T00:00:00", "seed": 20261732, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-08T07:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"07:59 的开锁事件高度疑似使用被盗/复制凭证入侵,住户已于 07:27 离家,该时段家中应无人。\",\n \"reasoning\": [\n \"推理步骤1: 07:27 住户完成正常离家流程——关厨房灯、玄关运动传感器触发、手动开锁(Manual)开门、关门后自动上锁,符合典型出门模式。\",\n \"推理步骤2: 07:59 门锁再次被解锁,但 OperationSource=8,这不是 Manual(手动)也不是 Auto(自动),而是远程/凭证方式(如密码、NFC、远程指令等)。在住户刚离家 32 分钟后出现此类开锁,时间窗口高度可疑。\",\n \"推理步骤3: 07:59 开锁后入户门传感器显示门被打开(StateValue=False),玄关运动传感器检测到有人进入(Occupancy=1),随后客厅运动传感器也触发(Occupancy=1),说明确实有人进入室内并移动到客厅。\",\n \"推理步骤4: 07:59:25 次卧灯被关闭(OnOff=False),说明入侵者进入了次卧区域并操作了设备,行为模式与住户早晨离家后的空屋状态不符。\",\n \"推理步骤5: 该次开锁事件之后,直到 18:15 住户回家之前,没有任何正常的锁门/关门记录,入户门传感器未报告关闭(StateValue 未恢复为 True),门锁也未重新上锁,这进一步说明这不是住户本人的操作。\",\n \"推理步骤6: 对比 06:51 的正常起床活动(卫生间传感器→卫生间灯→厨房灯)和 07:27 的正常离家流程,07:59 的进入行为缺乏任何生活场景的前后关联,高度符合非授权入侵特征。\"\n ],\n \"key_evidence\": [\n \"07:27 住户手动开锁离家,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto)\",\n \"07:59 门锁通过 OperationSource=8(非手动、非自动)被解锁,UserIndex=1,疑似凭证被复制或盗用\",\n \"07:59 开锁后玄关和客厅运动传感器依次触发,确认有人实际进入室内\",\n \"07:59:25 次卧灯被关闭,说明入侵者到达次卧区域\",\n \"07:59 至 18:15 之间无关门/上锁记录,入户门可能长时间处于未锁状态\",\n \"18:15 住户回家时使用手动方式开锁,说明 07:59 的操作并非住户本人\"\n ],\n \"recommended_actions\": [\n \"立即冻结门锁 UserIndex=1 对应的凭证(密码/指纹/NFC卡),防止再次被使用\",\n \"远程锁定入户门锁,将门锁设置为最高安全模式(仅允许物理钥匙或户主生物识别开锁)\",\n \"检查门锁全部已注册用户和凭证列表,删除所有不明或可疑的 UserIndex 条目\",\n \"立即通知住户本人确认 07:59 的开锁是否为其授权的访客操作,若非授权则报警\",\n \"调取 07:59-18:15 时段的所有摄像头录像(如有),保留入侵证据\",\n \"住户回家后检查家中贵重物品是否丢失,重点检查次卧(入侵者曾进入该区域)\",\n \"更换门锁所有数字凭证(密码、指纹重新录入),并考虑更换门锁固件或硬件以排除漏洞\",\n \"启用门锁异常开锁的实时推送告警,设置离家模式下任何开锁操作立即通知住户\",\n \"检查厨房窗户传感器状态——19:26 厨房窗户被打开后日志中未见关闭记录,需确认窗户当前是否已关好并锁好\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "07:59 的开锁事件高度疑似使用被盗/复制凭证入侵,住户已于 07:27 离家,该时段家中应无人。", "reasoning": ["推理步骤1: 07:27 住户完成正常离家流程——关厨房灯、玄关运动传感器触发、手动开锁(Manual)开门、关门后自动上锁,符合典型出门模式。", "推理步骤2: 07:59 门锁再次被解锁,但 OperationSource=8,这不是 Manual(手动)也不是 Auto(自动),而是远程/凭证方式(如密码、NFC、远程指令等)。在住户刚离家 32 分钟后出现此类开锁,时间窗口高度可疑。", "推理步骤3: 07:59 开锁后入户门传感器显示门被打开(StateValue=False),玄关运动传感器检测到有人进入(Occupancy=1),随后客厅运动传感器也触发(Occupancy=1),说明确实有人进入室内并移动到客厅。", "推理步骤4: 07:59:25 次卧灯被关闭(OnOff=False),说明入侵者进入了次卧区域并操作了设备,行为模式与住户早晨离家后的空屋状态不符。", "推理步骤5: 该次开锁事件之后,直到 18:15 住户回家之前,没有任何正常的锁门/关门记录,入户门传感器未报告关闭(StateValue 未恢复为 True),门锁也未重新上锁,这进一步说明这不是住户本人的操作。", "推理步骤6: 对比 06:51 的正常起床活动(卫生间传感器→卫生间灯→厨房灯)和 07:27 的正常离家流程,07:59 的进入行为缺乏任何生活场景的前后关联,高度符合非授权入侵特征。"], "key_evidence": ["07:27 住户手动开锁离家,门关闭后自动上锁(LockOperationType=0, OperationSource=Auto)", "07:59 门锁通过 OperationSource=8(非手动、非自动)被解锁,UserIndex=1,疑似凭证被复制或盗用", "07:59 开锁后玄关和客厅运动传感器依次触发,确认有人实际进入室内", "07:59:25 次卧灯被关闭,说明入侵者到达次卧区域", "07:59 至 18:15 之间无关门/上锁记录,入户门可能长时间处于未锁状态", "18:15 住户回家时使用手动方式开锁,说明 07:59 的操作并非住户本人"], "recommended_actions": ["立即冻结门锁 UserIndex=1 对应的凭证(密码/指纹/NFC卡),防止再次被使用", "远程锁定入户门锁,将门锁设置为最高安全模式(仅允许物理钥匙或户主生物识别开锁)", "检查门锁全部已注册用户和凭证列表,删除所有不明或可疑的 UserIndex 条目", "立即通知住户本人确认 07:59 的开锁是否为其授权的访客操作,若非授权则报警", "调取 07:59-18:15 时段的所有摄像头录像(如有),保留入侵证据", "住户回家后检查家中贵重物品是否丢失,重点检查次卧(入侵者曾进入该区域)", "更换门锁所有数字凭证(密码、指纹重新录入),并考虑更换门锁固件或硬件以排除漏洞", "启用门锁异常开锁的实时推送告警,设置离家模式下任何开锁操作立即通知住户", "检查厨房窗户传感器状态——19:26 厨房窗户被打开后日志中未见关闭记录,需确认窗户当前是否已关好并锁好"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.375694751739502, "api_error": null} {"episode_id": "SQ5_TP_B_1106", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1106.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-23T00:00:00", "seed": 20261735, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-23T22:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"22:36 有人使用远程凭证开锁进入,但住户行为模式高度异常,疑似被盗/复制凭证入侵。\",\n \"reasoning\": [\n \"推理步骤1: 22:36 门锁事件显示 LockOperationType=1(开锁)、OperationSource=8(远程/凭证方式)、UserIndex=1,这是通过已注册凭证远程解锁,而非物理钥匙或手动操作。\",\n \"推理步骤2: 在此之前(21:51),住户刚刚完成了一套完整的离家流程——关闭客厅主灯、玄关灯、客厅空调,入户门关闭并自动上锁。这是典型的就寝或外出操作。仅 45 分钟后又有人通过远程凭证开锁进入,时间间隔短且行为不连贯。\",\n \"推理步骤3: 进入后的行为极其异常——入侵者经过玄关(22:36:05 运动传感器触发)、客厅(22:36:20 运动传感器触发),但全程没有开启任何灯光。在深夜 22:36 不开灯穿行房间,不符合正常住户习惯。\",\n \"推理步骤4: 22:36:25 次卧灯被关闭(OnOff=False),但此前日志中没有次卧灯被打开的记录,说明次卧灯可能在日志覆盖范围之前就已开启,或者这是一个异常的设备操作指令。入侵者直奔次卧的行为具有目的性。\",\n \"推理步骤5: 对比当天早晨 07:11 的正常出门和 18:25 的正常回家,住户均使用 Manual(手动/物理)方式操作门锁,而 22:36 这次使用的是 OperationSource=8(远程凭证),操作方式与住户日常习惯不一致。\",\n \"推理步骤6: 进入后没有关门上锁的记录(日志中未见 front_door_contact 恢复 True 或 LockState=1),入户门可能处于未关闭/未上锁状态,这进一步说明不是正常住户行为。\"\n ],\n \"key_evidence\": [\n \"22:36 门锁通过 OperationSource=8(远程凭证)解锁,与住户全天使用 Manual 方式操作的习惯不符\",\n \"21:51 住户刚完成完整离家/就寝流程(关灯、关空调、锁门),45 分钟后又有人开锁进入,时间逻辑矛盾\",\n \"入侵者深夜穿行玄关和客厅全程未开灯,不符合正常居住者行为\",\n \"入侵者直接前往次卧并关闭次卧灯,行为具有明确目的性\",\n \"进入后入户门未关闭、未重新上锁,无 front_door_contact 恢复 True 的记录\"\n ],\n \"recommended_actions\": [\n \"立即远程锁定入户门锁,并禁用当前所有远程凭证/PIN 码,防止入侵者再次使用相同凭证\",\n \"立即触发全屋警报(如有),同时向住户手机推送高优先级入侵告警通知\",\n \"联系物业安保或拨打 110 报警,告知有人使用疑似被盗凭证进入住宅\",\n \"远程开启全屋灯光(客厅、玄关、次卧、主卧),起到威慑作用并便于监控\",\n \"保存并导出 22:36 前后的完整设备日志作为证据,包括门锁操作记录中的 UserIndex 和 OperationSource 信息\",\n \"事后重置门锁所有用户凭证(PIN 码、指纹、远程密钥),重新录入仅限住户本人的凭证\",\n \"排查凭证泄露途径:检查门锁管理 App 是否有异常登录、是否存在共享凭证被滥用、手机是否丢失或被入侵\",\n \"建议在入户门处加装摄像头,为后续类似事件提供视频证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "22:36 有人使用远程凭证开锁进入,但住户行为模式高度异常,疑似被盗/复制凭证入侵。", "reasoning": ["推理步骤1: 22:36 门锁事件显示 LockOperationType=1(开锁)、OperationSource=8(远程/凭证方式)、UserIndex=1,这是通过已注册凭证远程解锁,而非物理钥匙或手动操作。", "推理步骤2: 在此之前(21:51),住户刚刚完成了一套完整的离家流程——关闭客厅主灯、玄关灯、客厅空调,入户门关闭并自动上锁。这是典型的就寝或外出操作。仅 45 分钟后又有人通过远程凭证开锁进入,时间间隔短且行为不连贯。", "推理步骤3: 进入后的行为极其异常——入侵者经过玄关(22:36:05 运动传感器触发)、客厅(22:36:20 运动传感器触发),但全程没有开启任何灯光。在深夜 22:36 不开灯穿行房间,不符合正常住户习惯。", "推理步骤4: 22:36:25 次卧灯被关闭(OnOff=False),但此前日志中没有次卧灯被打开的记录,说明次卧灯可能在日志覆盖范围之前就已开启,或者这是一个异常的设备操作指令。入侵者直奔次卧的行为具有目的性。", "推理步骤5: 对比当天早晨 07:11 的正常出门和 18:25 的正常回家,住户均使用 Manual(手动/物理)方式操作门锁,而 22:36 这次使用的是 OperationSource=8(远程凭证),操作方式与住户日常习惯不一致。", "推理步骤6: 进入后没有关门上锁的记录(日志中未见 front_door_contact 恢复 True 或 LockState=1),入户门可能处于未关闭/未上锁状态,这进一步说明不是正常住户行为。"], "key_evidence": ["22:36 门锁通过 OperationSource=8(远程凭证)解锁,与住户全天使用 Manual 方式操作的习惯不符", "21:51 住户刚完成完整离家/就寝流程(关灯、关空调、锁门),45 分钟后又有人开锁进入,时间逻辑矛盾", "入侵者深夜穿行玄关和客厅全程未开灯,不符合正常居住者行为", "入侵者直接前往次卧并关闭次卧灯,行为具有明确目的性", "进入后入户门未关闭、未重新上锁,无 front_door_contact 恢复 True 的记录"], "recommended_actions": ["立即远程锁定入户门锁,并禁用当前所有远程凭证/PIN 码,防止入侵者再次使用相同凭证", "立即触发全屋警报(如有),同时向住户手机推送高优先级入侵告警通知", "联系物业安保或拨打 110 报警,告知有人使用疑似被盗凭证进入住宅", "远程开启全屋灯光(客厅、玄关、次卧、主卧),起到威慑作用并便于监控", "保存并导出 22:36 前后的完整设备日志作为证据,包括门锁操作记录中的 UserIndex 和 OperationSource 信息", "事后重置门锁所有用户凭证(PIN 码、指纹、远程密钥),重新录入仅限住户本人的凭证", "排查凭证泄露途径:检查门锁管理 App 是否有异常登录、是否存在共享凭证被滥用、手机是否丢失或被入侵", "建议在入户门处加装摄像头,为后续类似事件提供视频证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.83935308456421, "api_error": null} {"episode_id": "SQ5_TP_B_1113", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1113.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-07T00:00:00", "seed": 20261742, "scenario_id": "WD-03", "total_events": 229, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-07T23:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"住户已离家且门锁自动上锁后,卫生间漏水传感器持续报警超过30分钟无人处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:58 客厅主灯和空调关闭,随后入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),表明住户已离家。\",\n \"推理步骤2: 23:25 卫生间漏水传感器首次触发 StateValue=True,此时距住户离家已约27分钟,家中无人。\",\n \"推理步骤3: 23:35 和 23:55 漏水传感器持续报告 StateValue=True,说明漏水未停止,持续时间已超过30分钟且仍在恶化。\",\n \"推理步骤4: 整个漏水期间,卫生间运动传感器无任何触发记录(最后一次占用是 08:45-08:57),确认家中确实无人可以进行处置。\",\n \"推理步骤5: 持续漏水在无人干预的情况下可能导致地板、墙体浸泡,引发财产损失、楼下渗水,甚至电气安全隐患。\"\n ],\n \"key_evidence\": [\n \"22:58:25 入户门关闭,22:58:26 门锁自动上锁(LockState=1),住户离家\",\n \"23:25、23:35、23:55 卫生间漏水传感器连续三次报告 StateValue=True,漏水持续至少30分钟且未停止\",\n \"漏水期间全屋无任何运动传感器触发,确认无人在家\"\n ],\n \"recommended_actions\": [\n \"立即向住户手机推送高优先级漏水警报,包含具体位置(卫生间)和持续时间信息\",\n \"如果家中部署了智能水阀/总水阀,立即远程关闭总水阀或卫生间供水阀门以止水\",\n \"尝试远程关闭可能相关的用水设备(如检查洗衣机、洗碗机是否仍在运行),本次日志中洗碗机 18:41 启动后未见关闭记录,应远程停止\",\n \"通知物业或紧急联系人前往现场查看,排查漏水源头(可能是管道破裂、马桶溢水或设备故障)\",\n \"持续监控漏水传感器状态,若短时间内未恢复正常则升级告警等级并拨打紧急联系电话\",\n \"漏水解除后检查卫生间及相邻区域是否有积水、墙体渗水或电气设备受潮情况,必要时断开卫生间电路\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "住户已离家且门锁自动上锁后,卫生间漏水传感器持续报警超过30分钟无人处理,存在水损风险。", "reasoning": ["推理步骤1: 22:58 客厅主灯和空调关闭,随后入户门关闭并自动上锁(LockOperationType=0, OperationSource=Auto),表明住户已离家。", "推理步骤2: 23:25 卫生间漏水传感器首次触发 StateValue=True,此时距住户离家已约27分钟,家中无人。", "推理步骤3: 23:35 和 23:55 漏水传感器持续报告 StateValue=True,说明漏水未停止,持续时间已超过30分钟且仍在恶化。", "推理步骤4: 整个漏水期间,卫生间运动传感器无任何触发记录(最后一次占用是 08:45-08:57),确认家中确实无人可以进行处置。", "推理步骤5: 持续漏水在无人干预的情况下可能导致地板、墙体浸泡,引发财产损失、楼下渗水,甚至电气安全隐患。"], "key_evidence": ["22:58:25 入户门关闭,22:58:26 门锁自动上锁(LockState=1),住户离家", "23:25、23:35、23:55 卫生间漏水传感器连续三次报告 StateValue=True,漏水持续至少30分钟且未停止", "漏水期间全屋无任何运动传感器触发,确认无人在家"], "recommended_actions": ["立即向住户手机推送高优先级漏水警报,包含具体位置(卫生间)和持续时间信息", "如果家中部署了智能水阀/总水阀,立即远程关闭总水阀或卫生间供水阀门以止水", "尝试远程关闭可能相关的用水设备(如检查洗衣机、洗碗机是否仍在运行),本次日志中洗碗机 18:41 启动后未见关闭记录,应远程停止", "通知物业或紧急联系人前往现场查看,排查漏水源头(可能是管道破裂、马桶溢水或设备故障)", "持续监控漏水传感器状态,若短时间内未恢复正常则升级告警等级并拨打紧急联系电话", "漏水解除后检查卫生间及相邻区域是否有积水、墙体渗水或电气设备受潮情况,必要时断开卫生间电路"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 19.284156322479248, "api_error": null} {"episode_id": "SQ5_TP_B_1112", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_B_1112.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "B", "layout_name": "两室一厅 (2BR)", "profile_id": "young_professional", "base_date": "2026-06-11T00:00:00", "seed": 20261741, "scenario_id": "INS-05", "total_events": 236, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-11T10:48:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"10:48 的开锁事件使用了远程/凭证方式(OperationSource=8)且入户门未记录关闭与重新上锁,存在凭证被盗用或复制的入侵风险。\",\n \"reasoning\": [\n \"推理步骤1: 当天共有三次入户门操作。07:21 和 18:23 两次均为 Manual 手动开锁,开门→关门→自动上锁流程完整,符合住户正常出入模式。\",\n \"推理步骤2: 10:48 的开锁事件 OperationSource=8(对应 Matter DoorLock 规范中的远程/Remote 操作源),并携带 UserIndex=1。这表明有人通过远程指令或预置凭证(如 PIN 码、RFID 卡、远程 App)触发了开锁,而非物理钥匙或手动操作。\",\n \"推理步骤3: 10:48 开锁后,入户门传感器报告 StateValue=False(门被打开),玄关和客厅运动传感器均检测到有人进入,但日志中没有记录入户门关闭(StateValue=True)和重新上锁(LockState=1)的事件。直到 21:56 才出现门关闭和自动上锁记录,中间长达约 11 小时门处于未锁定/未关闭状态,这极不正常。\",\n \"推理步骤4: 10:48 进入后仅触发了次卧灯关闭(second_bedroom_light OnOff=False),没有其他典型的居家活动(如开空调、开厨房灯做饭等),行为模式与 07:21 出门前和 18:23 回家后的丰富活动形成鲜明对比,暗示进入者可能不是住户本人。\",\n \"推理步骤5: 住户 07:21 出门时手动上锁并确认门已关闭和自动锁定,18:23 才手动开锁回家。10:48 的远程凭证开锁发生在住户外出期间,若非住户本人远程操作,则高度怀疑凭证(PIN/RFID/App 令牌)被盗用或复制。\"\n ],\n \"key_evidence\": [\n \"10:48 开锁事件 OperationSource=8(远程/凭证),UserIndex=1,非 Manual 手动操作\",\n \"开锁后入户门传感器报告门打开(StateValue=False),但无后续关门(StateValue=True)和重新上锁记录,门长时间处于开放/未锁定状态\",\n \"该事件发生在住户 07:21 出门后、18:23 回家前的无人时段\",\n \"进入后仅有次卧灯关闭操作,缺乏正常居家活动痕迹,行为模式异常\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,确认当前门锁状态为已锁定(LockState=1),如支持则启用门锁封锁模式禁止所有远程开锁\",\n \"【立即】撤销或重置 UserIndex=1 对应的所有凭证(PIN 码、RFID 卡、App 授权令牌),重新生成新凭证并仅分发给可信住户\",\n \"【立即】检查门锁的完整操作审计日志,确认 OperationSource=8 的来源 IP/设备标识,排查是否有未授权设备接入智能家居网络\",\n \"【紧急】通知住户确认 10:48 是否为本人远程操作;若非本人,建议立即报警并检查家中是否有财物丢失\",\n \"【短期】检查家中所有房间(尤其是次卧)是否有被翻动或异常痕迹\",\n \"【短期】更改智能家居平台账户密码,启用双因素认证(2FA),检查是否有未知设备绑定到账户\",\n \"【短期】审查门锁固件版本,升级到最新版本以修补已知安全漏洞\",\n \"【长期】为远程开锁操作增加二次确认机制(如推送通知需住户确认后才执行开锁),设置非常规时段远程开锁的即时告警\",\n \"【长期】考虑在玄关区域加装摄像头,便于事后追溯和实时监控入户情况\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "10:48 的开锁事件使用了远程/凭证方式(OperationSource=8)且入户门未记录关闭与重新上锁,存在凭证被盗用或复制的入侵风险。", "reasoning": ["推理步骤1: 当天共有三次入户门操作。07:21 和 18:23 两次均为 Manual 手动开锁,开门→关门→自动上锁流程完整,符合住户正常出入模式。", "推理步骤2: 10:48 的开锁事件 OperationSource=8(对应 Matter DoorLock 规范中的远程/Remote 操作源),并携带 UserIndex=1。这表明有人通过远程指令或预置凭证(如 PIN 码、RFID 卡、远程 App)触发了开锁,而非物理钥匙或手动操作。", "推理步骤3: 10:48 开锁后,入户门传感器报告 StateValue=False(门被打开),玄关和客厅运动传感器均检测到有人进入,但日志中没有记录入户门关闭(StateValue=True)和重新上锁(LockState=1)的事件。直到 21:56 才出现门关闭和自动上锁记录,中间长达约 11 小时门处于未锁定/未关闭状态,这极不正常。", "推理步骤4: 10:48 进入后仅触发了次卧灯关闭(second_bedroom_light OnOff=False),没有其他典型的居家活动(如开空调、开厨房灯做饭等),行为模式与 07:21 出门前和 18:23 回家后的丰富活动形成鲜明对比,暗示进入者可能不是住户本人。", "推理步骤5: 住户 07:21 出门时手动上锁并确认门已关闭和自动锁定,18:23 才手动开锁回家。10:48 的远程凭证开锁发生在住户外出期间,若非住户本人远程操作,则高度怀疑凭证(PIN/RFID/App 令牌)被盗用或复制。"], "key_evidence": ["10:48 开锁事件 OperationSource=8(远程/凭证),UserIndex=1,非 Manual 手动操作", "开锁后入户门传感器报告门打开(StateValue=False),但无后续关门(StateValue=True)和重新上锁记录,门长时间处于开放/未锁定状态", "该事件发生在住户 07:21 出门后、18:23 回家前的无人时段", "进入后仅有次卧灯关闭操作,缺乏正常居家活动痕迹,行为模式异常"], "recommended_actions": ["【立即】远程锁定入户门锁,确认当前门锁状态为已锁定(LockState=1),如支持则启用门锁封锁模式禁止所有远程开锁", "【立即】撤销或重置 UserIndex=1 对应的所有凭证(PIN 码、RFID 卡、App 授权令牌),重新生成新凭证并仅分发给可信住户", "【立即】检查门锁的完整操作审计日志,确认 OperationSource=8 的来源 IP/设备标识,排查是否有未授权设备接入智能家居网络", "【紧急】通知住户确认 10:48 是否为本人远程操作;若非本人,建议立即报警并检查家中是否有财物丢失", "【短期】检查家中所有房间(尤其是次卧)是否有被翻动或异常痕迹", "【短期】更改智能家居平台账户密码,启用双因素认证(2FA),检查是否有未知设备绑定到账户", "【短期】审查门锁固件版本,升级到最新版本以修补已知安全漏洞", "【长期】为远程开锁操作增加二次确认机制(如推送通知需住户确认后才执行开锁),设置非常规时段远程开锁的即时告警", "【长期】考虑在玄关区域加装摄像头,便于事后追溯和实时监控入户情况"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.489364624023438, "api_error": null} {"episode_id": "SQ5_TP_C_1010", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1010.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-25T00:00:00", "seed": 20261639, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-25T13:28:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"洗碗机运行期间厨房漏水传感器触发报警,且漏水状态持续未消除,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 13:28 洗碗机启动(OperationalState = 1),5分钟后的 13:33 厨房漏水传感器报警(StateValue = True),时间高度关联,指向洗碗机为漏水源。\",\n \"推理步骤2: 在 13:33 漏水报警触发的同一时刻,洗碗机仍处于运行状态(OperationalState = 1),说明漏水发生时洗碗机并未自动停机,水源持续存在。\",\n \"推理步骤3: 从 13:33 漏水报警触发后,整个日志中再未出现 kitchen_water_leak 的 StateValue = False 事件,说明漏水状态一直未被解除,水可能持续渗漏。\",\n \"推理步骤4: 当时家中无人——早上 07:22 全家出门(前门上锁),直到 15:56 才有人回来。漏水发生在无人在家的时段,无法被及时发现和处理,实际浸泡时间可能超过 2 小时。\",\n \"推理步骤5: 19:49 洗碗机再次启动,但此前漏水问题未见修复记录,若根本原因未排除,二次运行可能加剧漏水。\"\n ],\n \"key_evidence\": [\n \"13:28 kitchen_dishwasher OperationalState = 1(洗碗机启动)\",\n \"13:33 kitchen_water_leak StateValue = True(厨房漏水传感器报警)\",\n \"13:33 kitchen_dishwasher OperationalState = 1(漏水时洗碗机仍在运行)\",\n \"全天日志中无 kitchen_water_leak StateValue = False 事件(漏水状态未解除)\",\n \"07:22~15:56 期间家中无人,漏水无人处置\",\n \"19:49 洗碗机在漏水未确认修复的情况下再次启动\"\n ],\n \"recommended_actions\": [\n \"立即关闭洗碗机:远程发送停机指令,停止当前 19:49 启动的洗碗运行周期,切断潜在水源。\",\n \"关闭厨房水源总阀:如有智能水阀则远程关闭;如无,立即通知住户手动关闭厨房供水角阀。\",\n \"通知住户紧急处理:推送高优先级告警至住户手机,告知厨房漏水已持续数小时,需尽快到场检查。\",\n \"现场排查漏水点:重点检查洗碗机进水管接头、排水管连接处、机门密封胶条是否老化破损。\",\n \"评估水损范围:检查厨房地面、橱柜底部、相邻房间墙面是否有渗水痕迹,特别关注是否影响到楼下邻居。\",\n \"清理积水并干燥:使用吸水设备清除积水,开启通风防止霉变,必要时使用除湿设备。\",\n \"洗碗机维修前禁止使用:在专业人员排查并修复漏水原因之前,不要再次启动洗碗机。\",\n \"检查漏水传感器状态:确认传感器本身工作正常(非误报),清洁传感器探头,确保后续监测有效。\",\n \"设置自动化联动规则:建议配置当漏水传感器触发时自动关闭洗碗机和智能水阀的自动化场景,避免类似事件再次发生。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "洗碗机运行期间厨房漏水传感器触发报警,且漏水状态持续未消除,存在水损风险。", "reasoning": ["推理步骤1: 13:28 洗碗机启动(OperationalState = 1),5分钟后的 13:33 厨房漏水传感器报警(StateValue = True),时间高度关联,指向洗碗机为漏水源。", "推理步骤2: 在 13:33 漏水报警触发的同一时刻,洗碗机仍处于运行状态(OperationalState = 1),说明漏水发生时洗碗机并未自动停机,水源持续存在。", "推理步骤3: 从 13:33 漏水报警触发后,整个日志中再未出现 kitchen_water_leak 的 StateValue = False 事件,说明漏水状态一直未被解除,水可能持续渗漏。", "推理步骤4: 当时家中无人——早上 07:22 全家出门(前门上锁),直到 15:56 才有人回来。漏水发生在无人在家的时段,无法被及时发现和处理,实际浸泡时间可能超过 2 小时。", "推理步骤5: 19:49 洗碗机再次启动,但此前漏水问题未见修复记录,若根本原因未排除,二次运行可能加剧漏水。"], "key_evidence": ["13:28 kitchen_dishwasher OperationalState = 1(洗碗机启动)", "13:33 kitchen_water_leak StateValue = True(厨房漏水传感器报警)", "13:33 kitchen_dishwasher OperationalState = 1(漏水时洗碗机仍在运行)", "全天日志中无 kitchen_water_leak StateValue = False 事件(漏水状态未解除)", "07:22~15:56 期间家中无人,漏水无人处置", "19:49 洗碗机在漏水未确认修复的情况下再次启动"], "recommended_actions": ["立即关闭洗碗机:远程发送停机指令,停止当前 19:49 启动的洗碗运行周期,切断潜在水源。", "关闭厨房水源总阀:如有智能水阀则远程关闭;如无,立即通知住户手动关闭厨房供水角阀。", "通知住户紧急处理:推送高优先级告警至住户手机,告知厨房漏水已持续数小时,需尽快到场检查。", "现场排查漏水点:重点检查洗碗机进水管接头、排水管连接处、机门密封胶条是否老化破损。", "评估水损范围:检查厨房地面、橱柜底部、相邻房间墙面是否有渗水痕迹,特别关注是否影响到楼下邻居。", "清理积水并干燥:使用吸水设备清除积水,开启通风防止霉变,必要时使用除湿设备。", "洗碗机维修前禁止使用:在专业人员排查并修复漏水原因之前,不要再次启动洗碗机。", "检查漏水传感器状态:确认传感器本身工作正常(非误报),清洁传感器探头,确保后续监测有效。", "设置自动化联动规则:建议配置当漏水传感器触发时自动关闭洗碗机和智能水阀的自动化场景,避免类似事件再次发生。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.391056537628174, "api_error": null} {"episode_id": "SQ5_TP_C_1011", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1011.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-23T00:00:00", "seed": 20261640, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-23T22:25:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅温度传感器在22:25出现异常高温读数(345.1°C),随后烟雾报警器触发,高度疑似电器过热起火。\",\n \"reasoning\": [\n \"推理步骤1: 22:25客厅温度传感器上报MeasuredValue=3451(345.1°C),而5分钟前正常读数为2363(23.63°C),温度在极短时间内飙升超过300°C,远超任何正常室内温度波动。\",\n \"推理步骤2: 22:30再次出现异常读数MeasuredValue=3200(320.0°C),且该读数使用了非标准的短属性名'MeasuredValue'而非完整的'TemperatureMeasurement.MeasuredValue',可能是传感器在极端高温下工作异常导致的报文格式退化。\",\n \"推理步骤3: 22:35客厅烟雾报警器触发(SmokeState=1),与高温事件在时间上高度吻合,间隔仅10分钟,进一步确认存在火灾/过热事件。\",\n \"推理步骤4: 当时客厅空调处于制冷运行状态(17:53开启,SystemMode=3),空调长时间运行约4.5小时后发生异常,空调本身是最可能的过热起火源。\",\n \"推理步骤5: 22:42住户关闭客厅灯和空调、进入主卧、关闭主卧窗帘并确认前门上锁,说明住户已察觉异常并做出了反应,但未见开窗通风或撤离动作。\",\n \"推理步骤6: 厨房温度传感器在当天多次出现MeasuredValue=None的异常空值(06:55、07:29、18:18、19:06),虽与灶具使用时间相关可能是高温干扰,但也反映传感器在高温环境下的可靠性问题,需一并关注。\"\n ],\n \"key_evidence\": [\n \"22:25 living_room_temp_sensor上报MeasuredValue=3451(345.1°C),较正常值飙升约321°C\",\n \"22:30 living_room_temp_sensor再次上报异常值MeasuredValue=3200(320.0°C),且报文格式异常(缺少Cluster前缀)\",\n \"22:35 living_room_smoke_alarm触发SmokeState=1,确认烟雾/火灾告警\",\n \"客厅空调自17:53起持续运行约4.5小时(制冷模式SystemMode=3),是最可能的过热源\",\n \"22:42住户关闭空调和客厅灯,进入主卧——说明已感知到异常但应急措施不充分\"\n ],\n \"recommended_actions\": [\n \"立即断电:远程关闭客厅所有电器(空调已关闭,确认客厅氛围灯、副灯等也已断电),如有全屋断路器控制应切断客厅回路电源\",\n \"触发火灾警报:向所有家庭成员推送紧急通知,提示客厅可能发生电器过热起火,要求立即撤离并拨打119火警电话\",\n \"通风控制:远程打开客厅窗帘(living_room_window_1)并确认窗户状态,但如果火势明显则不应开窗以避免助燃——需根据现场判断\",\n \"关闭燃气:如家中有燃气总阀智能控制,立即远程关闭,防止火灾引发燃气泄漏\",\n \"隔离火源区域:关闭通往客厅的门(如有智能门控),防止烟雾和火势向卧室蔓延\",\n \"检查厨房窗户:日志显示厨房窗户在07:28和19:05被打开后未见关闭记录(BooleanState=False表示开启),应确认其状态以评估通风路径\",\n \"事后排查:安排专业人员检查客厅空调是否存在电路短路、压缩机过热等故障,同时检查客厅温度传感器和烟雾报警器的工作状态\",\n \"修复传感器问题:厨房温度传感器多次报告None值,客厅温度传感器出现非标准报文格式,均需检修或更换以确保监测可靠性\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅温度传感器在22:25出现异常高温读数(345.1°C),随后烟雾报警器触发,高度疑似电器过热起火。", "reasoning": ["推理步骤1: 22:25客厅温度传感器上报MeasuredValue=3451(345.1°C),而5分钟前正常读数为2363(23.63°C),温度在极短时间内飙升超过300°C,远超任何正常室内温度波动。", "推理步骤2: 22:30再次出现异常读数MeasuredValue=3200(320.0°C),且该读数使用了非标准的短属性名'MeasuredValue'而非完整的'TemperatureMeasurement.MeasuredValue',可能是传感器在极端高温下工作异常导致的报文格式退化。", "推理步骤3: 22:35客厅烟雾报警器触发(SmokeState=1),与高温事件在时间上高度吻合,间隔仅10分钟,进一步确认存在火灾/过热事件。", "推理步骤4: 当时客厅空调处于制冷运行状态(17:53开启,SystemMode=3),空调长时间运行约4.5小时后发生异常,空调本身是最可能的过热起火源。", "推理步骤5: 22:42住户关闭客厅灯和空调、进入主卧、关闭主卧窗帘并确认前门上锁,说明住户已察觉异常并做出了反应,但未见开窗通风或撤离动作。", "推理步骤6: 厨房温度传感器在当天多次出现MeasuredValue=None的异常空值(06:55、07:29、18:18、19:06),虽与灶具使用时间相关可能是高温干扰,但也反映传感器在高温环境下的可靠性问题,需一并关注。"], "key_evidence": ["22:25 living_room_temp_sensor上报MeasuredValue=3451(345.1°C),较正常值飙升约321°C", "22:30 living_room_temp_sensor再次上报异常值MeasuredValue=3200(320.0°C),且报文格式异常(缺少Cluster前缀)", "22:35 living_room_smoke_alarm触发SmokeState=1,确认烟雾/火灾告警", "客厅空调自17:53起持续运行约4.5小时(制冷模式SystemMode=3),是最可能的过热源", "22:42住户关闭空调和客厅灯,进入主卧——说明已感知到异常但应急措施不充分"], "recommended_actions": ["立即断电:远程关闭客厅所有电器(空调已关闭,确认客厅氛围灯、副灯等也已断电),如有全屋断路器控制应切断客厅回路电源", "触发火灾警报:向所有家庭成员推送紧急通知,提示客厅可能发生电器过热起火,要求立即撤离并拨打119火警电话", "通风控制:远程打开客厅窗帘(living_room_window_1)并确认窗户状态,但如果火势明显则不应开窗以避免助燃——需根据现场判断", "关闭燃气:如家中有燃气总阀智能控制,立即远程关闭,防止火灾引发燃气泄漏", "隔离火源区域:关闭通往客厅的门(如有智能门控),防止烟雾和火势向卧室蔓延", "检查厨房窗户:日志显示厨房窗户在07:28和19:05被打开后未见关闭记录(BooleanState=False表示开启),应确认其状态以评估通风路径", "事后排查:安排专业人员检查客厅空调是否存在电路短路、压缩机过热等故障,同时检查客厅温度传感器和烟雾报警器的工作状态", "修复传感器问题:厨房温度传感器多次报告None值,客厅温度传感器出现非标准报文格式,均需检修或更换以确保监测可靠性"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.46329617500305, "api_error": null} {"episode_id": "SQ5_TP_C_1014", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1014.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261643, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-05T14:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"家中无人期间次卫漏水传感器持续报警超过30分钟,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 07:27 全家出门——关灯、开门、锁门序列完整,入户门自动上锁,之后家中无运动传感器触发,确认无人在家。\",\n \"推理步骤2: 14:09 次卫漏水传感器首次报告 StateValue=True,随后 14:19、14:39 连续两次重复报警,说明漏水状态持续至少 30 分钟未消除。\",\n \"推理步骤3: 直到 16:28 有人回家(入户门解锁、儿童房运动传感器触发),期间超过 2 小时无人能现场处置,漏水可能已造成积水或渗透。\",\n \"推理步骤4: 次卫没有运动传感器,无法判断是否有人在场;且次卫灯自 06:53 开启后日志中未见关闭,说明出门时可能遗忘关灯,也未对卫生间做离家检查。\",\n \"推理步骤5: 厨房窗户在 07:13 被打开后日志中未见关闭事件,出门时厨房窗户可能处于开启状态,若漏水严重可能加剧室内湿度问题,但主要威胁仍是次卫漏水本身。\"\n ],\n \"key_evidence\": [\n \"14:09 second_bathroom_water_leak StateValue=True(首次报警)\",\n \"14:19 second_bathroom_water_leak StateValue=True(第二次报警,持续10分钟)\",\n \"14:39 second_bathroom_water_leak StateValue=True(第三次报警,持续30分钟)\",\n \"07:27 全家出门,入户门上锁,至 16:28 才有人回家,漏水期间无人在家\",\n \"次卫无运动传感器,无法远程确认现场情况\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭总水阀(若已接入智能水阀)或通知物业/家人尽快到场手动关闭水源\",\n \"向住户手机推送高优先级漏水警报,附带持续时长(已超30分钟)和位置(次卫)\",\n \"联系物业或邻居代为查看次卫现场情况,防止水渗漏至楼下\",\n \"回家后第一时间检查次卫地面、墙角、管道接口,确认漏水源头并修复\",\n \"检查次卫相邻区域(次卧地板、墙面)是否有渗水痕迹\",\n \"建议在次卫加装智能水阀,实现漏水自动关阀联动;同时补装运动传感器以完善监控覆盖\",\n \"建立离家自动检查规则:出门锁门时自动巡检漏水传感器状态,若异常则立即告警阻止离家或提醒处理\",\n \"排查次卫灯出门未关的问题,建议将次卫灯纳入离家模式自动关闭列表\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "家中无人期间次卫漏水传感器持续报警超过30分钟,存在水损风险。", "reasoning": ["推理步骤1: 07:27 全家出门——关灯、开门、锁门序列完整,入户门自动上锁,之后家中无运动传感器触发,确认无人在家。", "推理步骤2: 14:09 次卫漏水传感器首次报告 StateValue=True,随后 14:19、14:39 连续两次重复报警,说明漏水状态持续至少 30 分钟未消除。", "推理步骤3: 直到 16:28 有人回家(入户门解锁、儿童房运动传感器触发),期间超过 2 小时无人能现场处置,漏水可能已造成积水或渗透。", "推理步骤4: 次卫没有运动传感器,无法判断是否有人在场;且次卫灯自 06:53 开启后日志中未见关闭,说明出门时可能遗忘关灯,也未对卫生间做离家检查。", "推理步骤5: 厨房窗户在 07:13 被打开后日志中未见关闭事件,出门时厨房窗户可能处于开启状态,若漏水严重可能加剧室内湿度问题,但主要威胁仍是次卫漏水本身。"], "key_evidence": ["14:09 second_bathroom_water_leak StateValue=True(首次报警)", "14:19 second_bathroom_water_leak StateValue=True(第二次报警,持续10分钟)", "14:39 second_bathroom_water_leak StateValue=True(第三次报警,持续30分钟)", "07:27 全家出门,入户门上锁,至 16:28 才有人回家,漏水期间无人在家", "次卫无运动传感器,无法远程确认现场情况"], "recommended_actions": ["立即远程关闭总水阀(若已接入智能水阀)或通知物业/家人尽快到场手动关闭水源", "向住户手机推送高优先级漏水警报,附带持续时长(已超30分钟)和位置(次卫)", "联系物业或邻居代为查看次卫现场情况,防止水渗漏至楼下", "回家后第一时间检查次卫地面、墙角、管道接口,确认漏水源头并修复", "检查次卫相邻区域(次卧地板、墙面)是否有渗水痕迹", "建议在次卫加装智能水阀,实现漏水自动关阀联动;同时补装运动传感器以完善监控覆盖", "建立离家自动检查规则:出门锁门时自动巡检漏水传感器状态,若异常则立即告警阻止离家或提醒处理", "排查次卫灯出门未关的问题,建议将次卫灯纳入离家模式自动关闭列表"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 22.48001480102539, "api_error": null} {"episode_id": "SQ5_TP_C_1024", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1024.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261653, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-22T21:44:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在住户就寝后持续报警超过30分钟,且无人响应处理,存在水漫损失风险。\",\n \"reasoning\": [\n \"推理步骤1: 次卫漏水传感器于 21:44 首次报告 StateValue=True,随后在 21:54 和 22:14 持续报告,说明漏水状态至少持续了30分钟且未被消除。\",\n \"推理步骤2: 分析住户活动轨迹——16:22 有人回家进入儿童房(推测为孩子放学回家),18:19 另一批人回家开灯开空调并做饭(推测为家长)。21:03 儿童房关灯拉窗帘(孩子就寝),22:38 客厅关灯关空调、主卧拉窗帘关灯并锁门(家长就寝)。漏水发生在 21:44-22:14 期间,横跨孩子已睡、家长即将就寝的时段。\",\n \"推理步骤3: 次卫灯在 07:04 开启后日志中再无关闭记录,且整天无次卫运动传感器触发事件,说明次卫当天几乎无人使用,漏水不太可能是正常用水行为导致的。\",\n \"推理步骤4: 漏水持续三次报警(21:44、21:54、22:14),间隔约10分钟,表明水量在持续积累而非偶发溅水。22:14 之后日志截止到 23:30 未见任何人前往次卫处理,说明住户可能完全未察觉。\",\n \"推理步骤5: 次卫紧邻次卧和儿童房区域,持续漏水可能渗透到地板下层或相邻房间,造成结构性损坏和财产损失。\"\n ],\n \"key_evidence\": [\n \"21:44 second_bathroom_water_leak StateValue=True(首次报警)\",\n \"21:54 second_bathroom_water_leak StateValue=True(第二次报警,漏水持续)\",\n \"22:14 second_bathroom_water_leak StateValue=True(第三次报警,漏水已持续至少30分钟)\",\n \"次卫全天无运动传感器触发记录,排除正常用水场景\",\n \"22:38 家长进入主卧关灯就寝,未前往次卫处理,说明住户未察觉漏水\"\n ],\n \"recommended_actions\": [\n \"立即推送高优先级告警通知至住户手机(含声音和震动),明确提示\"次卫检测到持续漏水\"\",\n \"如家中配有智能水阀(电动总阀/分区阀),立即远程关闭次卫区域供水或全屋总水阀,防止水损扩大\",\n \"自动开启次卫灯,引导住户注意该区域\",\n \"若住户5分钟内未确认告警,自动拨打住户紧急联系电话进行语音提醒\",\n \"记录漏水起始时间和持续时长,供后续维修和保险理赔使用\",\n \"漏水解除后,建议住户检查次卫水管接头、马桶底部密封圈、地漏等常见漏水点,必要时联系物业或水管维修人员上门排查\",\n \"在系统中为次卫漏水传感器设置升级告警规则:若漏水持续超过10分钟未处理,自动执行关阀和电话通知\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "unknown", "threat_type": "parse_failed", "reasoning": ["```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在住户就寝后持续报警超过30分钟,且无人响应处理,存在水漫损失风险。\",\n \"reasoning\": [\n \"推理步骤1: 次卫漏水传感器于 21:44 首次报告 StateValue=True,随后在 21:54 和 22:14 持续报告,说明漏水状态至少持续了30分钟且未被消除。\",\n \"推理步骤2: 分析住户活动轨迹——16:22 有人回家进入儿童房(推测为孩子放学回家),18:19 另一批人回家开灯开空调并做饭(推测为家长)。21:03 儿童房关灯拉窗帘(孩子就寝),22:38 客厅关灯关空调、主卧拉窗帘关灯并锁门(家长就寝)。漏水发生在 21:44-22:14 期间,横跨孩子已睡、家长即将就寝的时段。\",\n \"推理步骤3: 次卫灯在 07:04 开启后日志中再无关闭记录,且整天无次卫运动传感器触发事件,说明次卫当天几乎无人"], "_parse_failed": true}, "scores": {"parse_success": false, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 1, "has_evidence": false, "has_actions": false, "confidence": "unknown"}, "latency": 24.49398446083069, "api_error": null} {"episode_id": "SQ5_TP_C_1026", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1026.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-05T00:00:00", "seed": 20261655, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-05T04:39:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅在凌晨4:39-4:49期间发生异常高温事件并触发烟雾报警,高度疑似电器过热起火。\",\n \"reasoning\": [\n \"推理步骤1: 凌晨4:30客厅温度正常(2305,约23.05°C),但4:39突然飙升至3413(约34.13°C),4:44仍高达3200(约32°C),10分钟内温升超过11°C,这远超正常环境温度波动。\",\n \"推理步骤2: 4:49客厅烟雾报警器触发(SmokeState=1),与异常高温事件在时间和空间上高度吻合,确认存在烟雾/燃烧产物。\",\n \"推理步骤3: 该时段为凌晨深夜,全屋无人活动(无运动传感器触发、无灯光操作),排除人为烹饪或其他正常热源的可能。\",\n \"推理步骤4: 其他房间同时段温度正常(主卧2306、儿童房2296、厨房2304),说明热源局限于客厅,符合单点电器过热起火特征。\",\n \"推理步骤5: 5:00时客厅温度恢复至2303(约23°C),说明火情可能已自行熄灭或为短暂过热事件,但烟雾报警已触发,仍需紧急处置。\"\n ],\n \"key_evidence\": [\n \"4:39客厅温度从23.05°C骤升至34.13°C,4:44仍为32°C\",\n \"4:49客厅烟雾报警器触发 SmokeState=1\",\n \"事发时段凌晨4:30-5:00无任何人员活动记录\",\n \"同时段其他房间温度均正常,热源局限于客厅\"\n ],\n \"recommended_actions\": [\n \"立即触发全屋紧急警报,唤醒所有住户并通知紧急撤离\",\n \"自动切断客厅相关电器电源(空调、灯具等),防止持续供电加剧火情\",\n \"自动解锁入户门锁(front_door_lock),确保逃生通道畅通\",\n \"自动拨打119火警电话或通过智能家居平台推送紧急通知至户主手机\",\n \"开启客厅窗帘(living_room_window_1)辅助排烟,但需评估是否会助燃\",\n \"关闭全屋HVAC系统(所有空调),防止烟雾通过通风管道扩散\",\n \"事后排查客厅所有电器(特别是待机设备如电视、充电器、插排等),确认过热源头\",\n \"检查客厅烟雾报警器是否仍处于报警状态,确认火情是否完全消除\",\n \"建议安装独立式灭火装置或联动喷淋系统,提升自动灭火能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅在凌晨4:39-4:49期间发生异常高温事件并触发烟雾报警,高度疑似电器过热起火。", "reasoning": ["推理步骤1: 凌晨4:30客厅温度正常(2305,约23.05°C),但4:39突然飙升至3413(约34.13°C),4:44仍高达3200(约32°C),10分钟内温升超过11°C,这远超正常环境温度波动。", "推理步骤2: 4:49客厅烟雾报警器触发(SmokeState=1),与异常高温事件在时间和空间上高度吻合,确认存在烟雾/燃烧产物。", "推理步骤3: 该时段为凌晨深夜,全屋无人活动(无运动传感器触发、无灯光操作),排除人为烹饪或其他正常热源的可能。", "推理步骤4: 其他房间同时段温度正常(主卧2306、儿童房2296、厨房2304),说明热源局限于客厅,符合单点电器过热起火特征。", "推理步骤5: 5:00时客厅温度恢复至2303(约23°C),说明火情可能已自行熄灭或为短暂过热事件,但烟雾报警已触发,仍需紧急处置。"], "key_evidence": ["4:39客厅温度从23.05°C骤升至34.13°C,4:44仍为32°C", "4:49客厅烟雾报警器触发 SmokeState=1", "事发时段凌晨4:30-5:00无任何人员活动记录", "同时段其他房间温度均正常,热源局限于客厅"], "recommended_actions": ["立即触发全屋紧急警报,唤醒所有住户并通知紧急撤离", "自动切断客厅相关电器电源(空调、灯具等),防止持续供电加剧火情", "自动解锁入户门锁(front_door_lock),确保逃生通道畅通", "自动拨打119火警电话或通过智能家居平台推送紧急通知至户主手机", "开启客厅窗帘(living_room_window_1)辅助排烟,但需评估是否会助燃", "关闭全屋HVAC系统(所有空调),防止烟雾通过通风管道扩散", "事后排查客厅所有电器(特别是待机设备如电视、充电器、插排等),确认过热源头", "检查客厅烟雾报警器是否仍处于报警状态,确认火情是否完全消除", "建议安装独立式灭火装置或联动喷淋系统,提升自动灭火能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.821215867996216, "api_error": null} {"episode_id": "SQ5_TP_C_1027", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1027.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261656, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T19:29:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"未检测到尾随入室威胁,19:29 的入户事件为正常的住户回家行为。\",\n \"reasoning\": [\n \"推理步骤1: 分析门锁事件 — 19:29:00 门锁记录 LockOperationType=1(解锁),OperationSource=3(PIN码/密码开锁),UserIndex=1(已注册的主用户)。这是一次经过身份验证的合法开锁操作,而非暴力破门或未授权开锁。\",\n \"推理步骤2: 分析入户门开关时序 — 19:29:02 门打开(StateValue=False),19:29:08 门关闭(StateValue=True),开门持续仅约6秒。尾随入室的典型特征是门长时间保持打开状态,或出现关门后短时间内再次开门的模式,此处均未出现。\",\n \"推理步骤3: 分析运动传感器轨迹 — 19:29:04 玄关检测到人(入门),19:29:10 客厅检测到人(经过),19:29:12 玄关仍有人,19:29:15 次卧和客厅同时检测到人。这个运动轨迹符合一人或家庭成员一起进门后分散到各房间的正常模式,并非多人在不同入口同时出现的异常模式。\",\n \"推理步骤4: 分析时间合理性 — 事件发生在 19:29(晚上7点半),属于典型的下班回家时间段。全天日志显示白天家中无任何运动传感器触发(无人在家),直到 19:29 才有人员活动,完全符合工作日白天外出、傍晚回家的生活规律。\",\n \"推理步骤5: 排除尾随特征 — 尾随入室的关键指标包括:(a) 门开时间异常长、(b) 未授权开锁方式、(c) 不合理的多区域同时触发、(d) 门关闭后外部再次有开门尝试。本次事件中这些指标均未出现。次卧和客厅在 19:29:15 同时有人,更可能是两位家庭成员一起回家后各自进入不同房间。\",\n \"推理步骤6: 温度数据佐证 — 全天温度曲线呈现自然的日间升温(凌晨约23°C → 中午约25.8°C)和傍晚降温的规律,无任何异常波动,说明门窗未被异常打开过,家中环境未受到入侵干扰。\"\n ],\n \"key_evidence\": [\n \"门锁通过已注册用户(UserIndex=1)的密码(OperationSource=3)正常解锁,属于授权访问\",\n \"入户门仅开启约6秒即关闭,时间窗口极短,不符合尾随入室的长时间敞开特征\",\n \"全天无任何室内运动传感器触发,直到19:29入户后才有活动,说明白天无人在家,排除了家中已有陌生人的可能\",\n \"运动轨迹为 玄关→客厅→次卧 的线性扩散,符合正常入户后的移动模式\",\n \"事件发生在19:29(傍晚),属于合理的回家时间\"\n ],\n \"recommended_actions\": [\n \"本次事件判定为正常回家行为,无需采取应急措施\",\n \"建议复查尾随检测算法的触发条件,当前场景中授权用户正常开锁、短暂开门、合理运动轨迹不应触发尾随告警,需调整规则以降低误报率\",\n \"如仍有疑虑,可调取入户门处的摄像头录像(如有),人工确认19:29前后是否有陌生人跟随进入\",\n \"建议在尾随检测逻辑中加入以下判断维度:门开持续时长阈值(如超过15秒才告警)、开锁方式是否为授权方式、门关闭后是否有二次开门事件\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "未检测到尾随入室威胁,19:29 的入户事件为正常的住户回家行为。", "reasoning": ["推理步骤1: 分析门锁事件 — 19:29:00 门锁记录 LockOperationType=1(解锁),OperationSource=3(PIN码/密码开锁),UserIndex=1(已注册的主用户)。这是一次经过身份验证的合法开锁操作,而非暴力破门或未授权开锁。", "推理步骤2: 分析入户门开关时序 — 19:29:02 门打开(StateValue=False),19:29:08 门关闭(StateValue=True),开门持续仅约6秒。尾随入室的典型特征是门长时间保持打开状态,或出现关门后短时间内再次开门的模式,此处均未出现。", "推理步骤3: 分析运动传感器轨迹 — 19:29:04 玄关检测到人(入门),19:29:10 客厅检测到人(经过),19:29:12 玄关仍有人,19:29:15 次卧和客厅同时检测到人。这个运动轨迹符合一人或家庭成员一起进门后分散到各房间的正常模式,并非多人在不同入口同时出现的异常模式。", "推理步骤4: 分析时间合理性 — 事件发生在 19:29(晚上7点半),属于典型的下班回家时间段。全天日志显示白天家中无任何运动传感器触发(无人在家),直到 19:29 才有人员活动,完全符合工作日白天外出、傍晚回家的生活规律。", "推理步骤5: 排除尾随特征 — 尾随入室的关键指标包括:(a) 门开时间异常长、(b) 未授权开锁方式、(c) 不合理的多区域同时触发、(d) 门关闭后外部再次有开门尝试。本次事件中这些指标均未出现。次卧和客厅在 19:29:15 同时有人,更可能是两位家庭成员一起回家后各自进入不同房间。", "推理步骤6: 温度数据佐证 — 全天温度曲线呈现自然的日间升温(凌晨约23°C → 中午约25.8°C)和傍晚降温的规律,无任何异常波动,说明门窗未被异常打开过,家中环境未受到入侵干扰。"], "key_evidence": ["门锁通过已注册用户(UserIndex=1)的密码(OperationSource=3)正常解锁,属于授权访问", "入户门仅开启约6秒即关闭,时间窗口极短,不符合尾随入室的长时间敞开特征", "全天无任何室内运动传感器触发,直到19:29入户后才有活动,说明白天无人在家,排除了家中已有陌生人的可能", "运动轨迹为 玄关→客厅→次卧 的线性扩散,符合正常入户后的移动模式", "事件发生在19:29(傍晚),属于合理的回家时间"], "recommended_actions": ["本次事件判定为正常回家行为,无需采取应急措施", "建议复查尾随检测算法的触发条件,当前场景中授权用户正常开锁、短暂开门、合理运动轨迹不应触发尾随告警,需调整规则以降低误报率", "如仍有疑虑,可调取入户门处的摄像头录像(如有),人工确认19:29前后是否有陌生人跟随进入", "建议在尾随检测逻辑中加入以下判断维度:门开持续时长阈值(如超过15秒才告警)、开锁方式是否为授权方式、门关闭后是否有二次开门事件"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.98776125907898, "api_error": null} {"episode_id": "SQ5_TP_C_1036", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1036.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261665, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-03T17:20:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"17:20 入户门解锁后,多个房间几乎同时检测到占用,疑似有未授权人员尾随合法用户进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 17:20 前门通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,属于合法用户开门。但门开关时间极短(17:20:02 开 → 17:20:08 关,仅6秒),说明有人快速通过。\",\n \"推理步骤2: 入门后 17:20:04 玄关检测到占用,紧接着 17:20:10 客厅检测到占用,17:20:12 玄关再次检测到占用,17:20:15 次卧和客厅同时检测到占用。玄关传感器在极短时间内二次触发,说明有不止一人先后经过玄关区域。\",\n \"推理步骤3: 客厅和次卧在 17:20:15 同时检测到占用,意味着至少两人分别处于不同房间。而对比当天早晨 07:20 的正常出门场景(仅玄关单次触发)和 15:55 孩子回家场景(玄关→儿童房,路径单一),17:20 的多房间同时占用模式明显异常。\",\n \"推理步骤4: 15:55 已有人(疑似孩子)回家并进入儿童房,17:20 合法用户(UserIndex=1)回家后,次卧出现占用但此前次卧全天无任何活动记录,且没有对应的灯光开启操作,行为模式不符合家庭成员的正常习惯。\",\n \"推理步骤5: 17:20 开锁后未触发自动上锁(对比 07:20 出门后门锁立即自动上锁 LockState=1),直到 22:32 才重新上锁,说明门可能在较长时间内处于未锁定状态,增加了尾随入侵的可能性。\"\n ],\n \"key_evidence\": [\n \"17:20:04 玄关占用 → 17:20:12 玄关再次占用,间隔仅8秒,表明有多人先后通过玄关\",\n \"17:20:15 客厅与次卧同时检测到占用,说明至少两人分处不同房间\",\n \"次卧全天无任何活动记录,17:20:15 突然出现占用且无灯光开启,行为异常\",\n \"17:20 开锁后未触发自动上锁,与 07:20 出门后自动上锁的行为不一致\",\n \"对比 07:20 和 15:55 的正常进出模式,17:20 的多传感器同时触发模式明显偏离常规\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑\",\n \"远程锁定入户门(DoorLock.LockState → 1),防止入侵者轻易逃离或更多人进入\",\n \"通过摄像头(如有)或运动传感器实时监控次卧和客厅区域,确认是否有陌生人\",\n \"向户主手机推送高优先级告警通知,附带 17:20 时段的传感器触发时间线\",\n \"如户主确认家中不应有其他人,立即拨打 110 报警并提供入侵时间和区域信息\",\n \"记录并保存 17:00-18:00 时段所有设备日志作为证据\",\n \"事后建议:为入户门启用尾随检测规则——若玄关传感器在单次开门期间多次触发占用,自动发出告警;同时检查自动上锁策略是否正常工作\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "17:20 入户门解锁后,多个房间几乎同时检测到占用,疑似有未授权人员尾随合法用户进入室内。", "reasoning": ["推理步骤1: 17:20 前门通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,属于合法用户开门。但门开关时间极短(17:20:02 开 → 17:20:08 关,仅6秒),说明有人快速通过。", "推理步骤2: 入门后 17:20:04 玄关检测到占用,紧接着 17:20:10 客厅检测到占用,17:20:12 玄关再次检测到占用,17:20:15 次卧和客厅同时检测到占用。玄关传感器在极短时间内二次触发,说明有不止一人先后经过玄关区域。", "推理步骤3: 客厅和次卧在 17:20:15 同时检测到占用,意味着至少两人分别处于不同房间。而对比当天早晨 07:20 的正常出门场景(仅玄关单次触发)和 15:55 孩子回家场景(玄关→儿童房,路径单一),17:20 的多房间同时占用模式明显异常。", "推理步骤4: 15:55 已有人(疑似孩子)回家并进入儿童房,17:20 合法用户(UserIndex=1)回家后,次卧出现占用但此前次卧全天无任何活动记录,且没有对应的灯光开启操作,行为模式不符合家庭成员的正常习惯。", "推理步骤5: 17:20 开锁后未触发自动上锁(对比 07:20 出门后门锁立即自动上锁 LockState=1),直到 22:32 才重新上锁,说明门可能在较长时间内处于未锁定状态,增加了尾随入侵的可能性。"], "key_evidence": ["17:20:04 玄关占用 → 17:20:12 玄关再次占用,间隔仅8秒,表明有多人先后通过玄关", "17:20:15 客厅与次卧同时检测到占用,说明至少两人分处不同房间", "次卧全天无任何活动记录,17:20:15 突然出现占用且无灯光开启,行为异常", "17:20 开锁后未触发自动上锁,与 07:20 出门后自动上锁的行为不一致", "对比 07:20 和 15:55 的正常进出模式,17:20 的多传感器同时触发模式明显偏离常规"], "recommended_actions": ["立即触发室内警报(声光报警),对潜在入侵者形成威慑", "远程锁定入户门(DoorLock.LockState → 1),防止入侵者轻易逃离或更多人进入", "通过摄像头(如有)或运动传感器实时监控次卧和客厅区域,确认是否有陌生人", "向户主手机推送高优先级告警通知,附带 17:20 时段的传感器触发时间线", "如户主确认家中不应有其他人,立即拨打 110 报警并提供入侵时间和区域信息", "记录并保存 17:00-18:00 时段所有设备日志作为证据", "事后建议:为入户门启用尾随检测规则——若玄关传感器在单次开门期间多次触发占用,自动发出告警;同时检查自动上锁策略是否正常工作"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.027814149856567, "api_error": null} {"episode_id": "SQ5_TP_C_1040", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1040.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-10T00:00:00", "seed": 20261669, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-10T18:27:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:27 有人在首位住户进门仅8分钟后通过门锁开门进入,且随后次卧出现占用,疑似尾随或未授权人员入室。\",\n \"reasoning\": [\n \"推理步骤1: 18:19 第一次开门事件——门锁手动解锁(OperationSource=Manual),入户门打开后关闭,玄关检测到人,随后客厅有人,开灯、开空调,这是正常的住户回家模式。\",\n \"推理步骤2: 18:27(仅8分钟后)门锁再次被解锁,此次 OperationSource=3(远程/密码/PIN方式),携带 UserIndex=1。入户门再次打开又关闭,玄关和客厅均检测到人。关键异常:紧接着 second_bedroom_occupancy 检测到占用(18:27:15),而此前全天次卧无任何活动记录,且第一位住户已在客厅。\",\n \"推理步骤3: 如果是同一住户的家人正常回家,次卧出现占用本身可以解释。但结合以下疑点需要警惕:(a) 两次开门间隔极短(8分钟),第二次进入者直奔次卧而非与客厅的人汇合;(b) 18:27:12 玄关和客厅同时检测到占用,说明至少有两人分处不同位置;(c) 次卧此前全天无任何活动,第二个人进门后径直前往次卧,行为模式与正常家庭成员回家后先在公共区域活动有所不同。\",\n \"推理步骤4: 不能完全排除是家庭成员(如配偶)用自己的PIN码正常回家后直接进房间的可能,因此置信度为 medium 而非 high。但从安全角度出发,仍应按潜在尾随/未授权入室处理。\"\n ],\n \"key_evidence\": [\n \"18:19 门锁手动解锁,住户A进入客厅开灯开空调\",\n \"18:27(仅8分钟后)门锁再次通过 OperationSource=3/UserIndex=1 解锁,入户门开关\",\n \"18:27:15 次卧运动传感器检测到占用——此前全天次卧无任何活动\",\n \"18:27:12 玄关与客厅同时检测到占用,表明至少两人分处不同区域\",\n \"第二个进入者未在公共区域(客厅/餐厅)停留,直接进入次卧\"\n ],\n \"recommended_actions\": [\n \"立即通过智能家居系统向住户手机推送入侵警报,确认18:27进入的人员是否为授权家庭成员\",\n \"远程激活客厅和玄关的灯光闪烁/全亮模式,起到威慑作用\",\n \"如住户确认非授权人员:立即远程锁定入户门(DoorLock.LockState=1),防止入侵者轻易逃离或再次进入\",\n \"触发客厅烟雾报警器的蜂鸣功能(如支持)作为警报声源,引起注意\",\n \"自动拨打物业安保或110报警电话,提供入侵时间(18:27)和位置(次卧)信息\",\n \"保存并锁定18:15-18:35时间段所有设备日志作为证据,特别是门锁的 UserIndex 和 OperationSource 记录\",\n \"如有入户门/玄关摄像头,立即截取18:26-18:28时段的视频画面\",\n \"事后建议:审查门锁 UserIndex=1 对应的PIN码是否泄露,考虑更换门锁密码并启用双重认证(如PIN+指纹)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "18:27 有人在首位住户进门仅8分钟后通过门锁开门进入,且随后次卧出现占用,疑似尾随或未授权人员入室。", "reasoning": ["推理步骤1: 18:19 第一次开门事件——门锁手动解锁(OperationSource=Manual),入户门打开后关闭,玄关检测到人,随后客厅有人,开灯、开空调,这是正常的住户回家模式。", "推理步骤2: 18:27(仅8分钟后)门锁再次被解锁,此次 OperationSource=3(远程/密码/PIN方式),携带 UserIndex=1。入户门再次打开又关闭,玄关和客厅均检测到人。关键异常:紧接着 second_bedroom_occupancy 检测到占用(18:27:15),而此前全天次卧无任何活动记录,且第一位住户已在客厅。", "推理步骤3: 如果是同一住户的家人正常回家,次卧出现占用本身可以解释。但结合以下疑点需要警惕:(a) 两次开门间隔极短(8分钟),第二次进入者直奔次卧而非与客厅的人汇合;(b) 18:27:12 玄关和客厅同时检测到占用,说明至少有两人分处不同位置;(c) 次卧此前全天无任何活动,第二个人进门后径直前往次卧,行为模式与正常家庭成员回家后先在公共区域活动有所不同。", "推理步骤4: 不能完全排除是家庭成员(如配偶)用自己的PIN码正常回家后直接进房间的可能,因此置信度为 medium 而非 high。但从安全角度出发,仍应按潜在尾随/未授权入室处理。"], "key_evidence": ["18:19 门锁手动解锁,住户A进入客厅开灯开空调", "18:27(仅8分钟后)门锁再次通过 OperationSource=3/UserIndex=1 解锁,入户门开关", "18:27:15 次卧运动传感器检测到占用——此前全天次卧无任何活动", "18:27:12 玄关与客厅同时检测到占用,表明至少两人分处不同区域", "第二个进入者未在公共区域(客厅/餐厅)停留,直接进入次卧"], "recommended_actions": ["立即通过智能家居系统向住户手机推送入侵警报,确认18:27进入的人员是否为授权家庭成员", "远程激活客厅和玄关的灯光闪烁/全亮模式,起到威慑作用", "如住户确认非授权人员:立即远程锁定入户门(DoorLock.LockState=1),防止入侵者轻易逃离或再次进入", "触发客厅烟雾报警器的蜂鸣功能(如支持)作为警报声源,引起注意", "自动拨打物业安保或110报警电话,提供入侵时间(18:27)和位置(次卧)信息", "保存并锁定18:15-18:35时间段所有设备日志作为证据,特别是门锁的 UserIndex 和 OperationSource 记录", "如有入户门/玄关摄像头,立即截取18:26-18:28时段的视频画面", "事后建议:审查门锁 UserIndex=1 对应的PIN码是否泄露,考虑更换门锁密码并启用双重认证(如PIN+指纹)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 26.782130002975464, "api_error": null} {"episode_id": "SQ5_TP_C_1050", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1050.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-17T00:00:00", "seed": 20261679, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-17T06:31:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"主卫漏水传感器在住户离家期间持续报警超过8小时未得到处理,存在水损风险。\",\n \"reasoning\": [\n \"推理步骤1: 主卫漏水传感器于 06:31 首次报告 StateValue = True,随后在 06:41 和 07:01 持续报告漏水状态,说明漏水未自行停止。\",\n \"推理步骤2: 住户于 07:42 关闭各房间灯光、手动开锁出门,入户门在 07:42:34 自动上锁,表明全家离开。此后直到 16:03 才有人通过前门回家,无人在家时段长达约 8 小时 20 分钟。\",\n \"推理步骤3: 在 07:01 最后一次漏水报警后,整个无人在家期间没有任何人进入主卫处理漏水问题(主卫运动传感器无触发记录),漏水很可能一直在持续。\",\n \"推理步骤4: 06:40 主卫有人进入(运动传感器触发、灯打开),但 06:41 漏水仍在报警,说明住户可能注意到了但未能彻底解决问题就出门了。\",\n \"推理步骤5: 长时间无人处理的漏水可能导致地板、墙体浸泡,引发结构损坏、霉菌滋生,甚至渗漏到楼下邻居,造成严重财产损失。\"\n ],\n \"key_evidence\": [\n \"06:31:00 master_bathroom_water_leak | StateValue = True(首次报警)\",\n \"06:41:00 master_bathroom_water_leak | StateValue = True(二次报警,住户在场但未解决)\",\n \"07:01:00 master_bathroom_water_leak | StateValue = True(三次报警,漏水持续)\",\n \"07:42:27 全家离开,入户门上锁,此后至 16:03 无人在家\",\n \"离家期间主卫无任何运动传感器触发记录,漏水无人处理\"\n ],\n \"recommended_actions\": [\n \"立即远程通知住户:通过手机推送、短信、电话等方式紧急告知主卫漏水持续未处理。\",\n \"远程关闭主水阀:如家中配备智能水阀,立即远程关闭总水阀或主卫区域水阀,切断水源止损。\",\n \"联系物业或紧急联系人:若住户无法及时返回,通知物业管理人员或预设的紧急联系人上门关闭水阀并检查现场。\",\n \"持续监控漏水传感器状态:关注传感器是否恢复正常(StateValue = False),确认止水措施是否生效。\",\n \"住户回家后立即检查主卫:排查漏水源头(水管接头、马桶、洗手台、热水器等),检查地面、墙面及天花板是否有水渍渗透。\",\n \"检查楼下邻居是否受影响:长时间漏水可能已渗透楼板,需确认是否造成邻居损失。\",\n \"排查主卫设备故障根因:漏水在 06:40 住户进入后仍未消除,需检查是否为管道破裂等需要专业维修的问题,而非简单的水龙头未关。\",\n \"建议加装智能水阀:若当前未配备可远程控制的智能水阀,强烈建议安装,以便在类似场景下远程止水。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "主卫漏水传感器在住户离家期间持续报警超过8小时未得到处理,存在水损风险。", "reasoning": ["推理步骤1: 主卫漏水传感器于 06:31 首次报告 StateValue = True,随后在 06:41 和 07:01 持续报告漏水状态,说明漏水未自行停止。", "推理步骤2: 住户于 07:42 关闭各房间灯光、手动开锁出门,入户门在 07:42:34 自动上锁,表明全家离开。此后直到 16:03 才有人通过前门回家,无人在家时段长达约 8 小时 20 分钟。", "推理步骤3: 在 07:01 最后一次漏水报警后,整个无人在家期间没有任何人进入主卫处理漏水问题(主卫运动传感器无触发记录),漏水很可能一直在持续。", "推理步骤4: 06:40 主卫有人进入(运动传感器触发、灯打开),但 06:41 漏水仍在报警,说明住户可能注意到了但未能彻底解决问题就出门了。", "推理步骤5: 长时间无人处理的漏水可能导致地板、墙体浸泡,引发结构损坏、霉菌滋生,甚至渗漏到楼下邻居,造成严重财产损失。"], "key_evidence": ["06:31:00 master_bathroom_water_leak | StateValue = True(首次报警)", "06:41:00 master_bathroom_water_leak | StateValue = True(二次报警,住户在场但未解决)", "07:01:00 master_bathroom_water_leak | StateValue = True(三次报警,漏水持续)", "07:42:27 全家离开,入户门上锁,此后至 16:03 无人在家", "离家期间主卫无任何运动传感器触发记录,漏水无人处理"], "recommended_actions": ["立即远程通知住户:通过手机推送、短信、电话等方式紧急告知主卫漏水持续未处理。", "远程关闭主水阀:如家中配备智能水阀,立即远程关闭总水阀或主卫区域水阀,切断水源止损。", "联系物业或紧急联系人:若住户无法及时返回,通知物业管理人员或预设的紧急联系人上门关闭水阀并检查现场。", "持续监控漏水传感器状态:关注传感器是否恢复正常(StateValue = False),确认止水措施是否生效。", "住户回家后立即检查主卫:排查漏水源头(水管接头、马桶、洗手台、热水器等),检查地面、墙面及天花板是否有水渍渗透。", "检查楼下邻居是否受影响:长时间漏水可能已渗透楼板,需确认是否造成邻居损失。", "排查主卫设备故障根因:漏水在 06:40 住户进入后仍未消除,需检查是否为管道破裂等需要专业维修的问题,而非简单的水龙头未关。", "建议加装智能水阀:若当前未配备可远程控制的智能水阀,强烈建议安装,以便在类似场景下远程止水。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.568037748336792, "api_error": null} {"episode_id": "SQ5_TP_C_1052", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1052.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-07T00:00:00", "seed": 20261681, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-07T17:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"未检测到尾随入室威胁,17:09 的入户事件为正常的住户回家行为。\",\n \"reasoning\": [\n \"推理步骤1: 分析入户门事件序列。17:09:00 门锁触发 LockOperation,其中 LockOperationType=1(正常解锁)、OperationSource=3(通过密码/指纹等本地凭证方式)、UserIndex=1(已注册的家庭用户),说明这是一次合法的授权开锁。\",\n \"推理步骤2: 门传感器时序合理。17:09:02 门打开(StateValue=False),17:09:08 门关闭(StateValue=True),开门持续约 6 秒,符合单人进门后随手关门的正常时长。如果存在尾随,开门时间通常会更长,或者出现门反复开关的情况。\",\n \"推理步骤3: 运动传感器轨迹分析。17:09:04 玄关检测到人(entrance_occupancy=1),17:09:10 客厅检测到人(living_room_occupancy=1),17:09:12 玄关再次检测到人,17:09:15 次卧和客厅同时检测到人。这个模式可以解释为:一人进门经玄关到客厅,另一人随后经玄关到次卧——但这更符合两位家庭成员一起回家的场景,而非尾随入侵。\",\n \"推理步骤4: 关键判断依据——入侵者无法通过 OperationSource=3(本地凭证)解锁,且 UserIndex=1 是已注册用户。尾随入室的典型特征是:门锁被合法用户打开后,门长时间未关闭,或关闭后短时间内再次被物理打开(无解锁记录)。本次日志中门仅开关一次,且全程无异常。\",\n \"推理步骤5: 入户后无任何异常行为指标。没有触发任何报警器,没有异常的窗户/阳台门开启,没有深夜时段的可疑活动。全天温度数据呈正常的日间升温、夜间降温曲线,无设备异常。17:09 为傍晚下班回家的合理时间。\"\n ],\n \"key_evidence\": [\n \"17:09:00 门锁通过本地凭证(OperationSource=3)由已注册用户(UserIndex=1)正常解锁,非暴力或异常方式开门\",\n \"入户门从打开到关闭仅 6 秒(17:09:02 至 17:09:08),时长符合正常单次进门,未出现门长时间敞开或二次开启的尾随特征\",\n \"运动传感器显示人员从玄关分别移动至客厅和次卧,符合两位家庭成员同时回家的正常动线\",\n \"全天无任何报警器触发、无异常门窗开启事件、无未授权的开锁记录\"\n ],\n \"recommended_actions\": [\n \"当前无需采取应急措施,本次事件判定为正常住户回家\",\n \"如仍有疑虑,可查看入户门处的摄像头录像(如有),确认 17:09 前后是否有陌生人跟随\",\n \"建议为智能门锁启用「门未关提醒」功能,当门打开超过 15 秒未关闭时自动告警,作为防尾随的预防措施\",\n \"建议在玄关区域增设摄像头或可视门铃,为未来的尾随判断提供视觉证据支持\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "未检测到尾随入室威胁,17:09 的入户事件为正常的住户回家行为。", "reasoning": ["推理步骤1: 分析入户门事件序列。17:09:00 门锁触发 LockOperation,其中 LockOperationType=1(正常解锁)、OperationSource=3(通过密码/指纹等本地凭证方式)、UserIndex=1(已注册的家庭用户),说明这是一次合法的授权开锁。", "推理步骤2: 门传感器时序合理。17:09:02 门打开(StateValue=False),17:09:08 门关闭(StateValue=True),开门持续约 6 秒,符合单人进门后随手关门的正常时长。如果存在尾随,开门时间通常会更长,或者出现门反复开关的情况。", "推理步骤3: 运动传感器轨迹分析。17:09:04 玄关检测到人(entrance_occupancy=1),17:09:10 客厅检测到人(living_room_occupancy=1),17:09:12 玄关再次检测到人,17:09:15 次卧和客厅同时检测到人。这个模式可以解释为:一人进门经玄关到客厅,另一人随后经玄关到次卧——但这更符合两位家庭成员一起回家的场景,而非尾随入侵。", "推理步骤4: 关键判断依据——入侵者无法通过 OperationSource=3(本地凭证)解锁,且 UserIndex=1 是已注册用户。尾随入室的典型特征是:门锁被合法用户打开后,门长时间未关闭,或关闭后短时间内再次被物理打开(无解锁记录)。本次日志中门仅开关一次,且全程无异常。", "推理步骤5: 入户后无任何异常行为指标。没有触发任何报警器,没有异常的窗户/阳台门开启,没有深夜时段的可疑活动。全天温度数据呈正常的日间升温、夜间降温曲线,无设备异常。17:09 为傍晚下班回家的合理时间。"], "key_evidence": ["17:09:00 门锁通过本地凭证(OperationSource=3)由已注册用户(UserIndex=1)正常解锁,非暴力或异常方式开门", "入户门从打开到关闭仅 6 秒(17:09:02 至 17:09:08),时长符合正常单次进门,未出现门长时间敞开或二次开启的尾随特征", "运动传感器显示人员从玄关分别移动至客厅和次卧,符合两位家庭成员同时回家的正常动线", "全天无任何报警器触发、无异常门窗开启事件、无未授权的开锁记录"], "recommended_actions": ["当前无需采取应急措施,本次事件判定为正常住户回家", "如仍有疑虑,可查看入户门处的摄像头录像(如有),确认 17:09 前后是否有陌生人跟随", "建议为智能门锁启用「门未关提醒」功能,当门打开超过 15 秒未关闭时自动告警,作为防尾随的预防措施", "建议在玄关区域增设摄像头或可视门铃,为未来的尾随判断提供视觉证据支持"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.912283182144165, "api_error": null} {"episode_id": "SQ5_TP_C_1056", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1056.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-24T00:00:00", "seed": 20261685, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-24T19:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:30 入户门解锁后,短时间内多个房间同时出现占用信号,疑似有未授权人员尾随家庭成员进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 19:30:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,这是一次正常的授权开锁操作。\",\n \"推理步骤2: 门开后 2 秒内(19:30:02)门传感器检测到开门,19:30:04 玄关检测到有人,19:30:08 门关闭——这是正常的单人进门流程。\",\n \"推理步骤3: 然而在 19:30:10 客厅检测到占用,19:30:12 玄关再次检测到占用(说明玄关在短暂无人后又有人经过),19:30:15 次卧和客厅同时检测到占用。这意味着至少有两个人几乎同时分散到了不同房间。\",\n \"推理步骤4: 对比当天其他两次进门事件——07:45 出门(全家一起离开,无异常)和 16:01 回家(仅儿童房有占用,符合孩子放学回家的模式)、18:12 回家(仅客厅有占用,符合单人回家模式),这些事件中占用信号都集中在单一路径上。\",\n \"推理步骤5: 19:30 事件的独特之处在于:进门后极短时间内(约 11 秒),玄关出现了二次占用触发,且次卧和客厅同时出现占用,说明有不止一人通过入户门进入。如果是家庭成员,16:01 已有人回家(孩子),18:12 又有人回家(成人),19:30 的第三次进门可能是另一位家庭成员——但次卧和客厅同时被占用的模式暗示可能有人尾随进入。\",\n \"推理步骤6: 置信度定为 medium 而非 high,因为这也可能是家庭成员带朋友/访客回家的正常场景,但系统无法区分授权访客和尾随入侵者。\"\n ],\n \"key_evidence\": [\n \"19:30:00 入户门通过远程/密码方式解锁(OperationSource=3, UserIndex=1)\",\n \"19:30:04 玄关检测到占用后,19:30:12 玄关再次检测到占用,说明有第二个人经过玄关\",\n \"19:30:15 次卧和客厅同时检测到占用(OccupancySensing.Occupancy=1),表明至少两人分散在不同房间\",\n \"对比 16:01 和 18:12 的正常回家模式,占用信号均为单一路径,19:30 事件明显不同\",\n \"19:30 进门后未观察到门锁重新上锁(对比 07:45 出门后自动上锁、22:50 睡前自动上锁),门锁处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即通过智能家居系统向户主手机推送高优先级告警,确认 19:30 进入的第二人是否为授权人员\",\n \"自动开启全屋灯光(客厅、玄关、次卧、走廊),消除入侵者可能利用的暗区\",\n \"触发入户门锁自动上锁(DoorLock.LockState=1),防止更多人员进入或入侵者轻易逃离后再次进入\",\n \"如果户主在 60 秒内未确认为授权访客,自动激活客厅和玄关区域的安防摄像头(如有)进行录像取证\",\n \"如果户主确认不认识该人员,立即通过系统拨打 110 报警,并将门锁事件日志和传感器时间线作为证据保留\",\n \"在事件解除前,持续监控各房间运动传感器,追踪未知人员的移动轨迹并记录\",\n \"事后建议:为入户门增加视频门铃或人脸识别模块,从源头区分授权人员和尾随者;检查门锁自动上锁策略,确保每次关门后自动锁定\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:30 入户门解锁后,短时间内多个房间同时出现占用信号,疑似有未授权人员尾随家庭成员进入室内。", "reasoning": ["推理步骤1: 19:30:00 入户门锁通过 OperationSource=3(远程/密码)由 UserIndex=1 解锁,这是一次正常的授权开锁操作。", "推理步骤2: 门开后 2 秒内(19:30:02)门传感器检测到开门,19:30:04 玄关检测到有人,19:30:08 门关闭——这是正常的单人进门流程。", "推理步骤3: 然而在 19:30:10 客厅检测到占用,19:30:12 玄关再次检测到占用(说明玄关在短暂无人后又有人经过),19:30:15 次卧和客厅同时检测到占用。这意味着至少有两个人几乎同时分散到了不同房间。", "推理步骤4: 对比当天其他两次进门事件——07:45 出门(全家一起离开,无异常)和 16:01 回家(仅儿童房有占用,符合孩子放学回家的模式)、18:12 回家(仅客厅有占用,符合单人回家模式),这些事件中占用信号都集中在单一路径上。", "推理步骤5: 19:30 事件的独特之处在于:进门后极短时间内(约 11 秒),玄关出现了二次占用触发,且次卧和客厅同时出现占用,说明有不止一人通过入户门进入。如果是家庭成员,16:01 已有人回家(孩子),18:12 又有人回家(成人),19:30 的第三次进门可能是另一位家庭成员——但次卧和客厅同时被占用的模式暗示可能有人尾随进入。", "推理步骤6: 置信度定为 medium 而非 high,因为这也可能是家庭成员带朋友/访客回家的正常场景,但系统无法区分授权访客和尾随入侵者。"], "key_evidence": ["19:30:00 入户门通过远程/密码方式解锁(OperationSource=3, UserIndex=1)", "19:30:04 玄关检测到占用后,19:30:12 玄关再次检测到占用,说明有第二个人经过玄关", "19:30:15 次卧和客厅同时检测到占用(OccupancySensing.Occupancy=1),表明至少两人分散在不同房间", "对比 16:01 和 18:12 的正常回家模式,占用信号均为单一路径,19:30 事件明显不同", "19:30 进门后未观察到门锁重新上锁(对比 07:45 出门后自动上锁、22:50 睡前自动上锁),门锁处于未锁定状态"], "recommended_actions": ["立即通过智能家居系统向户主手机推送高优先级告警,确认 19:30 进入的第二人是否为授权人员", "自动开启全屋灯光(客厅、玄关、次卧、走廊),消除入侵者可能利用的暗区", "触发入户门锁自动上锁(DoorLock.LockState=1),防止更多人员进入或入侵者轻易逃离后再次进入", "如果户主在 60 秒内未确认为授权访客,自动激活客厅和玄关区域的安防摄像头(如有)进行录像取证", "如果户主确认不认识该人员,立即通过系统拨打 110 报警,并将门锁事件日志和传感器时间线作为证据保留", "在事件解除前,持续监控各房间运动传感器,追踪未知人员的移动轨迹并记录", "事后建议:为入户门增加视频门铃或人脸识别模块,从源头区分授权人员和尾随者;检查门锁自动上锁策略,确保每次关门后自动锁定"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 28.795438051223755, "api_error": null} {"episode_id": "SQ5_TP_C_1057", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1057.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261686, "scenario_id": "INS-05", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-18T17:18:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"17:18 的开锁事件高度疑似使用被盗/复制凭证的伪装入侵,入侵者进入后行为与正常住户模式不符。\",\n \"reasoning\": [\n \"推理步骤1: 17:18 的开锁事件使用 OperationSource=8(远程/凭证方式)并携带 UserIndex=1,但当天其他所有开锁操作均为 Manual 或 Auto 方式,说明该家庭日常习惯是手动开锁,远程凭证开锁属于异常操作来源。\",\n \"推理步骤2: 16:02 已有人通过手动开锁进入家中(孩子放学回家,直奔儿童房),说明 17:18 时家中已有人。然而 17:18 进入者的行为轨迹异常——经过玄关到客厅后,执行的唯一操作是关闭次卧灯(second_bedroom_light OnOff=False),而次卧灯在当天日志中从未被打开过,这是一个无意义或试探性的操作。\",\n \"推理步骤3: 17:18 进入者没有触发任何后续的正常居家行为(未开灯、未开空调、未进厨房做饭等),与 18:10 真正的家庭成员回家后立即开客厅灯、开空调、进厨房做饭的行为模式形成鲜明对比。\",\n \"推理步骤4: 入户门在 17:18 开锁后没有记录到关门(front_door_contact 恢复 True)和自动上锁的事件,直到 22:50 才出现关门上锁记录,说明入侵者可能未正常关门,或门锁状态被异常保持在未锁定状态长达数小时。\",\n \"推理步骤5: 综合来看——异常的开锁来源(远程凭证)、不合常理的室内行为(关闭一盏未开的灯)、缺失的关门/上锁记录,三项证据共同指向凭证被盗用或复制后的伪装入侵。\"\n ],\n \"key_evidence\": [\n \"17:18 开锁事件 OperationSource=8(远程凭证),与当天所有其他开锁的 Manual/Auto 来源不一致\",\n \"入侵者唯一操作是关闭次卧灯(该灯当天从未被打开),属于无意义的试探行为\",\n \"17:18 开锁后无对应的关门(front_door_contact=True)和自动上锁记录,门锁安全状态存疑\",\n \"16:02 已有人在家(孩子在儿童房),17:18 的进入者并未与家中人员产生正常互动\",\n \"18:10 真正住户回家后的行为模式(开灯→开空调→做饭)与 17:18 入侵者行为完全不同\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,撤销 UserIndex=1 对应的所有数字凭证(密码/指纹/NFC卡),防止再次使用\",\n \"【立即】向所有家庭成员手机推送高优先级入侵警报,确认 17:18 是否为已知人员操作;如无法确认,立即报警\",\n \"【立即】检查门锁完整审计日志,排查 UserIndex=1 凭证的创建时间和历史使用记录,确定凭证是否被非法添加或复制\",\n \"【紧急】更换入户门锁所有用户凭证(重置密码、重新录入指纹),并启用双因素认证(如密码+指纹组合开锁)\",\n \"【紧急】检查家中是否有财物丢失或被安装异物(摄像头、窃听器等),重点检查次卧区域\",\n \"【短期】关闭门锁的远程开锁功能,或将远程开锁限制为需要家庭管理员实时确认后才可执行\",\n \"【短期】在玄关和客厅增设安防摄像头,为后续事件提供视频证据\",\n \"【长期】启用门锁异常开锁实时告警规则:当出现非常用操作来源、非常用时段、或开门后未在合理时间内关门时,自动触发警报\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "17:18 的开锁事件高度疑似使用被盗/复制凭证的伪装入侵,入侵者进入后行为与正常住户模式不符。", "reasoning": ["推理步骤1: 17:18 的开锁事件使用 OperationSource=8(远程/凭证方式)并携带 UserIndex=1,但当天其他所有开锁操作均为 Manual 或 Auto 方式,说明该家庭日常习惯是手动开锁,远程凭证开锁属于异常操作来源。", "推理步骤2: 16:02 已有人通过手动开锁进入家中(孩子放学回家,直奔儿童房),说明 17:18 时家中已有人。然而 17:18 进入者的行为轨迹异常——经过玄关到客厅后,执行的唯一操作是关闭次卧灯(second_bedroom_light OnOff=False),而次卧灯在当天日志中从未被打开过,这是一个无意义或试探性的操作。", "推理步骤3: 17:18 进入者没有触发任何后续的正常居家行为(未开灯、未开空调、未进厨房做饭等),与 18:10 真正的家庭成员回家后立即开客厅灯、开空调、进厨房做饭的行为模式形成鲜明对比。", "推理步骤4: 入户门在 17:18 开锁后没有记录到关门(front_door_contact 恢复 True)和自动上锁的事件,直到 22:50 才出现关门上锁记录,说明入侵者可能未正常关门,或门锁状态被异常保持在未锁定状态长达数小时。", "推理步骤5: 综合来看——异常的开锁来源(远程凭证)、不合常理的室内行为(关闭一盏未开的灯)、缺失的关门/上锁记录,三项证据共同指向凭证被盗用或复制后的伪装入侵。"], "key_evidence": ["17:18 开锁事件 OperationSource=8(远程凭证),与当天所有其他开锁的 Manual/Auto 来源不一致", "入侵者唯一操作是关闭次卧灯(该灯当天从未被打开),属于无意义的试探行为", "17:18 开锁后无对应的关门(front_door_contact=True)和自动上锁记录,门锁安全状态存疑", "16:02 已有人在家(孩子在儿童房),17:18 的进入者并未与家中人员产生正常互动", "18:10 真正住户回家后的行为模式(开灯→开空调→做饭)与 17:18 入侵者行为完全不同"], "recommended_actions": ["【立即】远程锁定入户门锁,撤销 UserIndex=1 对应的所有数字凭证(密码/指纹/NFC卡),防止再次使用", "【立即】向所有家庭成员手机推送高优先级入侵警报,确认 17:18 是否为已知人员操作;如无法确认,立即报警", "【立即】检查门锁完整审计日志,排查 UserIndex=1 凭证的创建时间和历史使用记录,确定凭证是否被非法添加或复制", "【紧急】更换入户门锁所有用户凭证(重置密码、重新录入指纹),并启用双因素认证(如密码+指纹组合开锁)", "【紧急】检查家中是否有财物丢失或被安装异物(摄像头、窃听器等),重点检查次卧区域", "【短期】关闭门锁的远程开锁功能,或将远程开锁限制为需要家庭管理员实时确认后才可执行", "【短期】在玄关和客厅增设安防摄像头,为后续事件提供视频证据", "【长期】启用门锁异常开锁实时告警规则:当出现非常用操作来源、非常用时段、或开门后未在合理时间内关门时,自动触发警报"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.73948359489441, "api_error": null} {"episode_id": "SQ5_TP_C_1060", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1060.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-18T00:00:00", "seed": 20261689, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-18T14:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告异常值(None 及 30.99°C 尖峰),削弱了厨房火灾预警能力。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-17T14:49 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。\",\n \"推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:57、07:27、18:46、19:07),说明传感器存在间歇性故障或受灶具热源干扰导致读数丢失,无法提供可靠的温度监测作为火灾辅助判断依据。\",\n \"推理步骤3: 14:49 灶具开启后,14:59 厨房温度传感器报告 3099(约 30.99°C),相比同时段其他房间的 25°C 左右出现明显尖峰,虽然烟雾报警器同时报告 SmokeState=0(无烟雾),但此时报警器正处于低电量状态,其检测可靠性存疑。\",\n \"推理步骤4: 该家庭日常有两次使用灶具的习惯(早餐约 06:56-07:26,晚餐约 18:45-19:06),厨房是高频用火区域。烟雾报警器低电量意味着在最需要保护的场景下,安全防线存在缺口。\",\n \"推理步骤5: 入户门锁在 07:47 全家出门后自动上锁,家中长时间无人(约 8 小时),若此期间发生意外起火,低电量报警器可能无法及时触发远程告警,后果严重。\"\n ],\n \"key_evidence\": [\n \"2026-06-17T14:49 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低\",\n \"厨房温度传感器在灶具使用期间多次返回 None(06:57、07:27、18:46、19:07),传感器工作不稳定\",\n \"2026-06-18T14:59 厨房温度传感器出现 3099(30.99°C)异常尖峰,高出同期其他房间约 5-6°C\",\n \"家庭每日两次使用灶具,厨房为高火灾风险区域\",\n \"07:47-15:56 家中无人约 8 小时,期间缺乏有效火灾预警保障\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力,这是最高优先级措施\",\n \"检修厨房温度传感器(kitchen_temp_sensor),排查其在灶具开启时频繁返回 None 的原因,可能需要调整安装位置或更换设备\",\n \"在电池更换完成前,避免无人在家时使用灶具或其他明火设备;如必须外出,确认灶具已关闭且厨房窗户通风\",\n \"建议为烟雾报警器设置低电量自动提醒规则,在 BatteryAlert 触发时立即推送手机通知,避免长时间处于低电量状态而不自知\",\n \"考虑在厨房增设一个独立的燃气泄漏探测器作为冗余安全层,与烟雾报警器形成互补\",\n \"检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保全屋报警设备均处于正常工作状态\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告异常值(None 及 30.99°C 尖峰),削弱了厨房火灾预警能力。", "reasoning": ["推理步骤1: 2026-06-17T14:49 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。", "推理步骤2: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:57、07:27、18:46、19:07),说明传感器存在间歇性故障或受灶具热源干扰导致读数丢失,无法提供可靠的温度监测作为火灾辅助判断依据。", "推理步骤3: 14:49 灶具开启后,14:59 厨房温度传感器报告 3099(约 30.99°C),相比同时段其他房间的 25°C 左右出现明显尖峰,虽然烟雾报警器同时报告 SmokeState=0(无烟雾),但此时报警器正处于低电量状态,其检测可靠性存疑。", "推理步骤4: 该家庭日常有两次使用灶具的习惯(早餐约 06:56-07:26,晚餐约 18:45-19:06),厨房是高频用火区域。烟雾报警器低电量意味着在最需要保护的场景下,安全防线存在缺口。", "推理步骤5: 入户门锁在 07:47 全家出门后自动上锁,家中长时间无人(约 8 小时),若此期间发生意外起火,低电量报警器可能无法及时触发远程告警,后果严重。"], "key_evidence": ["2026-06-17T14:49 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低", "厨房温度传感器在灶具使用期间多次返回 None(06:57、07:27、18:46、19:07),传感器工作不稳定", "2026-06-18T14:59 厨房温度传感器出现 3099(30.99°C)异常尖峰,高出同期其他房间约 5-6°C", "家庭每日两次使用灶具,厨房为高火灾风险区域", "07:47-15:56 家中无人约 8 小时,期间缺乏有效火灾预警保障"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力,这是最高优先级措施", "检修厨房温度传感器(kitchen_temp_sensor),排查其在灶具开启时频繁返回 None 的原因,可能需要调整安装位置或更换设备", "在电池更换完成前,避免无人在家时使用灶具或其他明火设备;如必须外出,确认灶具已关闭且厨房窗户通风", "建议为烟雾报警器设置低电量自动提醒规则,在 BatteryAlert 触发时立即推送手机通知,避免长时间处于低电量状态而不自知", "考虑在厨房增设一个独立的燃气泄漏探测器作为冗余安全层,与烟雾报警器形成互补", "检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保全屋报警设备均处于正常工作状态"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.138821363449097, "api_error": null} {"episode_id": "SQ5_TP_C_1062", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1062.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261691, "scenario_id": "INS-05", "total_events": 261, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "second_bedroom", "injection_time": "2026-06-30T22:03:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"22:03 入户门通过可疑远程/凭证方式解锁,存在被盗或复制凭证入侵的高风险。\",\n \"reasoning\": [\n \"推理步骤1: 22:03 的开锁事件使用 OperationSource=8(通常对应远程/凭证类开锁,如 RFID、PIN 码或远程指令),且指定了 UserIndex=1,但该事件仅执行了解锁(LockOperationType=1)而没有后续的关门上锁动作——直到 22:14:19 门才关闭并自动上锁,中间间隔超过 11 分钟。\",\n \"推理步骤2: 对比当天其他两次正常出入(07:45 和 17:58),均为 Manual 手动开锁,开门到关门仅 7 秒左右,符合住户正常进出习惯。而 22:03 这次开锁方式不同(非手动),且门长时间处于开启状态,行为模式明显异常。\",\n \"推理步骤3: 22:03 开锁后,入口和客厅运动传感器先后触发(22:03:05、22:03:20),说明确实有人进入室内。但紧接着 22:03:25 次卧灯被关闭(OnOff=False),而此前日志中次卧灯并无开启记录,这一操作本身就不合常理,可能是入侵者在室内活动。\",\n \"推理步骤4: 16:24 有人回家后一直在儿童房活动(孩子放学回家),21:13 儿童房灯关闭、窗帘关闭(孩子就寝)。22:03 时家中应处于就寝状态,此时通过非手动方式开锁进入极为可疑。\",\n \"推理步骤5: 22:14 主卧检测到有人活动,随后客厅灯和空调被关闭、主卧窗帘关闭、主卧灯关闭——这更像是住户被惊醒后的反应,而非正常就寝流程。门在 22:14:19 才关闭并自动上锁,进一步印证 22:03 的开门并非住户自主操作。\"\n ],\n \"key_evidence\": [\n \"22:03 开锁事件 OperationSource=8, UserIndex=1,非手动操作,与当天其他两次 Manual 开锁方式不一致\",\n \"开门到关门间隔超过 11 分钟(22:03:03 至 22:14:19),远超正常进出的 7 秒\",\n \"22:03:25 次卧灯被关闭,但此前无次卧灯开启记录,属于异常操作\",\n \"事件发生在 22:03 深夜就寝时段,儿童房 21:13 已熄灯就寝\",\n \"22:14 主卧传感器触发后迅速执行一系列关灯/关空调/关窗帘/锁门操作,疑似住户被惊醒后的应急反应\"\n ],\n \"recommended_actions\": [\n \"立即冻结 UserIndex=1 对应的门锁凭证(PIN码/RFID卡/数字钥匙),防止再次被利用\",\n \"远程强制锁定入户门锁,确认当前 DoorLock.LockState=1(已锁定)\",\n \"向住户手机推送高优先级入侵警报,确认 22:03 的开锁是否为本人操作\",\n \"调取门锁完整的凭证使用日志和 UserIndex 列表,排查是否存在未授权用户或被克隆的凭证\",\n \"如住户确认非本人操作,立即报警并保留所有设备日志作为证据\",\n \"重置门锁所有 PIN 码和数字凭证,重新为家庭成员分配新凭证\",\n \"检查门锁固件版本,升级至最新版本以修补可能的远程漏洞\",\n \"启用门锁双重认证机制(如 PIN + 指纹),提高开锁安全等级\",\n \"在玄关区域增设摄像头或启用现有摄像头的录像回放,核实入侵者身份\",\n \"临时启用全屋安防模式:所有门窗传感器进入布防状态,任何开启立即告警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "22:03 入户门通过可疑远程/凭证方式解锁,存在被盗或复制凭证入侵的高风险。", "reasoning": ["推理步骤1: 22:03 的开锁事件使用 OperationSource=8(通常对应远程/凭证类开锁,如 RFID、PIN 码或远程指令),且指定了 UserIndex=1,但该事件仅执行了解锁(LockOperationType=1)而没有后续的关门上锁动作——直到 22:14:19 门才关闭并自动上锁,中间间隔超过 11 分钟。", "推理步骤2: 对比当天其他两次正常出入(07:45 和 17:58),均为 Manual 手动开锁,开门到关门仅 7 秒左右,符合住户正常进出习惯。而 22:03 这次开锁方式不同(非手动),且门长时间处于开启状态,行为模式明显异常。", "推理步骤3: 22:03 开锁后,入口和客厅运动传感器先后触发(22:03:05、22:03:20),说明确实有人进入室内。但紧接着 22:03:25 次卧灯被关闭(OnOff=False),而此前日志中次卧灯并无开启记录,这一操作本身就不合常理,可能是入侵者在室内活动。", "推理步骤4: 16:24 有人回家后一直在儿童房活动(孩子放学回家),21:13 儿童房灯关闭、窗帘关闭(孩子就寝)。22:03 时家中应处于就寝状态,此时通过非手动方式开锁进入极为可疑。", "推理步骤5: 22:14 主卧检测到有人活动,随后客厅灯和空调被关闭、主卧窗帘关闭、主卧灯关闭——这更像是住户被惊醒后的反应,而非正常就寝流程。门在 22:14:19 才关闭并自动上锁,进一步印证 22:03 的开门并非住户自主操作。"], "key_evidence": ["22:03 开锁事件 OperationSource=8, UserIndex=1,非手动操作,与当天其他两次 Manual 开锁方式不一致", "开门到关门间隔超过 11 分钟(22:03:03 至 22:14:19),远超正常进出的 7 秒", "22:03:25 次卧灯被关闭,但此前无次卧灯开启记录,属于异常操作", "事件发生在 22:03 深夜就寝时段,儿童房 21:13 已熄灯就寝", "22:14 主卧传感器触发后迅速执行一系列关灯/关空调/关窗帘/锁门操作,疑似住户被惊醒后的应急反应"], "recommended_actions": ["立即冻结 UserIndex=1 对应的门锁凭证(PIN码/RFID卡/数字钥匙),防止再次被利用", "远程强制锁定入户门锁,确认当前 DoorLock.LockState=1(已锁定)", "向住户手机推送高优先级入侵警报,确认 22:03 的开锁是否为本人操作", "调取门锁完整的凭证使用日志和 UserIndex 列表,排查是否存在未授权用户或被克隆的凭证", "如住户确认非本人操作,立即报警并保留所有设备日志作为证据", "重置门锁所有 PIN 码和数字凭证,重新为家庭成员分配新凭证", "检查门锁固件版本,升级至最新版本以修补可能的远程漏洞", "启用门锁双重认证机制(如 PIN + 指纹),提高开锁安全等级", "在玄关区域增设摄像头或启用现有摄像头的录像回放,核实入侵者身份", "临时启用全屋安防模式:所有门窗传感器进入布防状态,任何开启立即告警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 30.813981771469116, "api_error": null} {"episode_id": "SQ5_TP_C_1063", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1063.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261692, "scenario_id": "INS-04", "total_events": 198, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-27T15:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"15:16 主卧窗户在无人占用情况下从外部被打开,短暂出现人体活动后窗户关闭、人员消失,疑似白天撬窗入室。\",\n \"reasoning\": [\n \"推理步骤1: 15:16 主卧窗户传感器报告 StateValue=False(窗户打开),而在此之前整段日志中主卧无任何运动传感器触发记录,说明开窗前房间无人。\",\n \"推理步骤2: 窗户打开 8 秒后(15:16:08)主卧运动传感器首次触发 Occupancy=1,时序上是'先开窗、后有人',符合从窗外进入的模式,而非室内住户自行开窗(正常情况应先有人活动再开窗)。\",\n \"推理步骤3: 15:17 客厅运动传感器也触发 Occupancy=1,说明有人从主卧向客厅方向移动,与入侵者进入后在室内活动的行为一致。\",\n \"推理步骤4: 15:19 窗户关闭(StateValue=True),5 秒后主卧运动传感器归零(Occupancy=0),整个过程仅持续约 3 分钟,时间极短,不像正常通风行为。\",\n \"推理步骤5: 事件发生在下午 15:16,属于白天时段。整段日志从 00:00 到 15:15 期间无任何门锁、门磁、运动传感器事件,表明住户很可能不在家,这进一步增加了入侵的可疑性。\",\n \"推理步骤6: 入户门锁(front_door_lock)和入户门传感器(front_door_contact)在整个日志周期内无任何开启记录,说明此人并非通过正门进入,排除了住户正常回家的可能。\",\n \"推理步骤7: 置信度定为 medium 而非 high,是因为仅凭传感器日志无法 100% 排除住户从阳台/其他路径回家后去主卧开窗通风的小概率场景,且没有摄像头影像佐证。\"\n ],\n \"key_evidence\": [\n \"15:16:00 master_bedroom_window_contact StateValue=False — 主卧窗户被打开,此前房间无人\",\n \"15:16:08 master_bedroom_occupancy Occupancy=1 — 开窗 8 秒后才检测到人体,时序为'先开窗后有人'\",\n \"15:17:00 living_room_occupancy Occupancy=1 — 入侵者疑似从主卧移动至客厅\",\n \"15:19:00 窗户关闭、15:19:05 人体消失 — 整个过程仅约 3 分钟,行为短促\",\n \"全天无 front_door_lock / front_door_contact 事件 — 无人通过正门进出,住户大概率不在家\"\n ],\n \"recommended_actions\": [\n \"立即远程锁定入户门锁(front_door_lock),确认 DoorLock.LockState 为锁定状态,防止入侵者从正门离开或再次进入\",\n \"触发全屋警报:开启所有灯光(客厅、玄关、主卧等)并闪烁,模拟有人在家,震慑入侵者\",\n \"立即向住户手机推送高优先级入侵告警通知,附带事件时间线和涉及的传感器信息\",\n \"联系物业安保或拨打 110 报警,提供入侵时间(15:16-15:19)和入侵路径(主卧窗户)信息\",\n \"如有家庭摄像头,立即调取 15:15-15:25 时段的客厅和主卧录像,保存证据\",\n \"关闭主卧窗帘(master_bedroom_window)并确认主卧窗户已关闭(当前 StateValue=True 已关闭),检查窗户锁扣是否损坏\",\n \"住户回家前不要单独进入,等待安保人员陪同检查室内是否有人滞留或财物丢失\",\n \"事后检查主卧窗户物理锁具是否被破坏,考虑加装窗户防盗锁或振动报警器\",\n \"在主卧和客厅增设摄像头,提升后续类似事件的取证能力\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "15:16 主卧窗户在无人占用情况下从外部被打开,短暂出现人体活动后窗户关闭、人员消失,疑似白天撬窗入室。", "reasoning": ["推理步骤1: 15:16 主卧窗户传感器报告 StateValue=False(窗户打开),而在此之前整段日志中主卧无任何运动传感器触发记录,说明开窗前房间无人。", "推理步骤2: 窗户打开 8 秒后(15:16:08)主卧运动传感器首次触发 Occupancy=1,时序上是'先开窗、后有人',符合从窗外进入的模式,而非室内住户自行开窗(正常情况应先有人活动再开窗)。", "推理步骤3: 15:17 客厅运动传感器也触发 Occupancy=1,说明有人从主卧向客厅方向移动,与入侵者进入后在室内活动的行为一致。", "推理步骤4: 15:19 窗户关闭(StateValue=True),5 秒后主卧运动传感器归零(Occupancy=0),整个过程仅持续约 3 分钟,时间极短,不像正常通风行为。", "推理步骤5: 事件发生在下午 15:16,属于白天时段。整段日志从 00:00 到 15:15 期间无任何门锁、门磁、运动传感器事件,表明住户很可能不在家,这进一步增加了入侵的可疑性。", "推理步骤6: 入户门锁(front_door_lock)和入户门传感器(front_door_contact)在整个日志周期内无任何开启记录,说明此人并非通过正门进入,排除了住户正常回家的可能。", "推理步骤7: 置信度定为 medium 而非 high,是因为仅凭传感器日志无法 100% 排除住户从阳台/其他路径回家后去主卧开窗通风的小概率场景,且没有摄像头影像佐证。"], "key_evidence": ["15:16:00 master_bedroom_window_contact StateValue=False — 主卧窗户被打开,此前房间无人", "15:16:08 master_bedroom_occupancy Occupancy=1 — 开窗 8 秒后才检测到人体,时序为'先开窗后有人'", "15:17:00 living_room_occupancy Occupancy=1 — 入侵者疑似从主卧移动至客厅", "15:19:00 窗户关闭、15:19:05 人体消失 — 整个过程仅约 3 分钟,行为短促", "全天无 front_door_lock / front_door_contact 事件 — 无人通过正门进出,住户大概率不在家"], "recommended_actions": ["立即远程锁定入户门锁(front_door_lock),确认 DoorLock.LockState 为锁定状态,防止入侵者从正门离开或再次进入", "触发全屋警报:开启所有灯光(客厅、玄关、主卧等)并闪烁,模拟有人在家,震慑入侵者", "立即向住户手机推送高优先级入侵告警通知,附带事件时间线和涉及的传感器信息", "联系物业安保或拨打 110 报警,提供入侵时间(15:16-15:19)和入侵路径(主卧窗户)信息", "如有家庭摄像头,立即调取 15:15-15:25 时段的客厅和主卧录像,保存证据", "关闭主卧窗帘(master_bedroom_window)并确认主卧窗户已关闭(当前 StateValue=True 已关闭),检查窗户锁扣是否损坏", "住户回家前不要单独进入,等待安保人员陪同检查室内是否有人滞留或财物丢失", "事后检查主卧窗户物理锁具是否被破坏,考虑加装窗户防盗锁或振动报警器", "在主卧和客厅增设摄像头,提升后续类似事件的取证能力"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 29.681689739227295, "api_error": null} {"episode_id": "SQ5_TP_C_1072", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1072.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261701, "scenario_id": "WD-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-02", "scenario_name": "洗碗机/洗衣机漏水", "category": "water_damage", "is_anomaly": true, "threat_type": "appliance_water_leak", "key_evidence": ["洗碗机运行期间厨房漏水传感器触发", "两个事件的时间关联性"], "expected_response": "停止洗碗机运行,通知住户检查", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-30T11:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"厨房洗碗机运行期间漏水传感器触发报警,存在真实漏水风险,需立即处置。\",\n \"reasoning\": [\n \"推理步骤1: 11:23 洗碗机启动(OperationalState = 1),仅 5 分钟后(11:28)厨房漏水传感器 kitchen_water_leak 报告 StateValue = True,时间高度吻合,说明漏水与洗碗机运行直接相关。\",\n \"推理步骤2: 11:28 时洗碗机仍处于运行状态(OperationalState = 1),并未因故障自动停机,意味着漏水可能在持续加剧。\",\n \"推理步骤3: 此时家中无人——住户于 07:38 关灯、锁门出门,直到 16:12 才有人回家。漏水从 11:28 到至少 16:12 长达近 5 小时无人处理,水损风险极大。\",\n \"推理步骤4: 日志中阳台洗衣机(balcony_laundry_washer)全天无任何运行记录,阳台区域也无漏水传感器触发,排除洗衣机漏水的可能。\",\n \"推理步骤5: 厨房温度传感器在 06:51、07:07、18:27、19:07 多次报告 None 值,说明厨房区域传感器可能存在通信不稳定或受潮干扰的情况,侧面印证厨房环境异常。\"\n ],\n \"key_evidence\": [\n \"11:23 洗碗机启动:kitchen_dishwasher | OperationalState = 1\",\n \"11:28 厨房漏水传感器报警:kitchen_water_leak | StateValue = True,洗碗机仍在运行\",\n \"07:38 住户出门锁门,16:12 才有人回家,漏水期间长时间无人在场\",\n \"厨房温度传感器多次报告 None 值(06:51、07:07),传感器工作状态异常\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭洗碗机(发送 OnOff.Off 指令至 kitchen_dishwasher),停止进水以防漏水加剧\",\n \"【立即】如家中有智能水阀,远程关闭厨房供水总阀;若无智能水阀,立即通知住户或物业手动关闭\",\n \"【立即】向住户手机推送高优先级漏水警报,告知具体位置(厨房)和触发时间(11:28)\",\n \"【短期】住户到家后检查洗碗机进水管、排水管接口及底部密封圈,确认漏水点\",\n \"【短期】检查厨房地面积水范围,评估是否渗透到橱柜、墙体或楼下,必要时联系物业\",\n \"【短期】排查厨房温度传感器多次报告 None 的原因,检查是否因受潮导致传感器故障\",\n \"【长期】建议在厨房供水管路加装智能水阀,实现漏水时自动切断水源\",\n \"【长期】设置自动化规则:漏水传感器触发时自动关停洗碗机和洗衣机,并关闭智能水阀\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "厨房洗碗机运行期间漏水传感器触发报警,存在真实漏水风险,需立即处置。", "reasoning": ["推理步骤1: 11:23 洗碗机启动(OperationalState = 1),仅 5 分钟后(11:28)厨房漏水传感器 kitchen_water_leak 报告 StateValue = True,时间高度吻合,说明漏水与洗碗机运行直接相关。", "推理步骤2: 11:28 时洗碗机仍处于运行状态(OperationalState = 1),并未因故障自动停机,意味着漏水可能在持续加剧。", "推理步骤3: 此时家中无人——住户于 07:38 关灯、锁门出门,直到 16:12 才有人回家。漏水从 11:28 到至少 16:12 长达近 5 小时无人处理,水损风险极大。", "推理步骤4: 日志中阳台洗衣机(balcony_laundry_washer)全天无任何运行记录,阳台区域也无漏水传感器触发,排除洗衣机漏水的可能。", "推理步骤5: 厨房温度传感器在 06:51、07:07、18:27、19:07 多次报告 None 值,说明厨房区域传感器可能存在通信不稳定或受潮干扰的情况,侧面印证厨房环境异常。"], "key_evidence": ["11:23 洗碗机启动:kitchen_dishwasher | OperationalState = 1", "11:28 厨房漏水传感器报警:kitchen_water_leak | StateValue = True,洗碗机仍在运行", "07:38 住户出门锁门,16:12 才有人回家,漏水期间长时间无人在场", "厨房温度传感器多次报告 None 值(06:51、07:07),传感器工作状态异常"], "recommended_actions": ["【立即】远程关闭洗碗机(发送 OnOff.Off 指令至 kitchen_dishwasher),停止进水以防漏水加剧", "【立即】如家中有智能水阀,远程关闭厨房供水总阀;若无智能水阀,立即通知住户或物业手动关闭", "【立即】向住户手机推送高优先级漏水警报,告知具体位置(厨房)和触发时间(11:28)", "【短期】住户到家后检查洗碗机进水管、排水管接口及底部密封圈,确认漏水点", "【短期】检查厨房地面积水范围,评估是否渗透到橱柜、墙体或楼下,必要时联系物业", "【短期】排查厨房温度传感器多次报告 None 的原因,检查是否因受潮导致传感器故障", "【长期】建议在厨房供水管路加装智能水阀,实现漏水时自动切断水源", "【长期】设置自动化规则:漏水传感器触发时自动关停洗碗机和洗衣机,并关闭智能水阀"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 21.056114673614502, "api_error": null} {"episode_id": "SQ5_TP_C_1069", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1069.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-30T00:00:00", "seed": 20261698, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "balcony", "injection_time": "2026-06-30T10:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而厨房灶具在使用期间出现温度异常飙升,报警器可能无法在真实火灾中正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-29T10:23:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,设备处于降级工作状态。\",\n \"推理步骤2: 2026-06-30T10:23:00 厨房灶具被开启,随后 10:33:00 厨房温度传感器读数从 2514(约25.1°C)骤升至 3021(约30.2°C),短短3分钟内上升约5°C,这是一个异常的温升速率。\",\n \"推理步骤3: 10:33:00 同时记录了 kitchen_smoke_alarm SmokeState = 0(无烟雾检测),但考虑到电池低电量状态,传感器灵敏度可能已下降,SmokeState = 0 的可信度存疑。\",\n \"推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(07:04、07:28、18:46、19:07),说明传感器本身也存在间歇性故障,进一步削弱了厨房安全监测的可靠性。\",\n \"推理步骤5: 该家庭有儿童(儿童房有人活动),灶具使用频繁(当天至少3次开启),烟雾报警器低电量叠加温度传感器不稳定,构成了显著的火灾安全盲区。\",\n \"推理步骤6: 低电量告警已持续超过24小时(6月29日10:23至6月30日全天),未见电池更换或设备恢复的记录,问题处于持续恶化状态。\"\n ],\n \"key_evidence\": [\n \"kitchen_smoke_alarm BatteryAlert = 1(2026-06-29T10:23:00),低电量告警持续超过24小时未处理\",\n \"厨房温度在灶具开启后3分钟内从约25.1°C骤升至约30.2°C(10:30 → 10:33),升幅异常\",\n \"kitchen_temp_sensor 多次报告 MeasuredValue = None(07:04、07:28、18:46、19:07),传感器间歇性失效\",\n \"烟雾报警器在温度异常飙升时报告 SmokeState = 0,但低电量下该读数可信度不足\",\n \"灶具当天被多次使用(07:03、10:23、18:45),厨房是高频用火区域\"\n ],\n \"recommended_actions\": [\n \"【紧急】立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常检测能力\",\n \"【紧急】检查厨房温度传感器(kitchen_temp_sensor)的连接和供电状态,排查间歇性报告 None 的故障原因,必要时更换设备\",\n \"【重要】在烟雾报警器电池更换前,避免无人看管使用厨房灶具,尤其注意儿童不得单独进入厨房\",\n \"【重要】检查 10:33 温度骤升事件的原因——确认灶具是否存在异常大火或油烟情况,排除灶具本身的安全隐患\",\n \"【建议】为烟雾报警器设置低电量自动提醒规则,确保 BatteryAlert 触发后在12小时内完成电池更换\",\n \"【建议】增加厨房安全联动规则:当烟雾报警器处于低电量状态时,限制灶具的远程开启功能,并在灶具开启时向住户手机推送额外警告\",\n \"【建议】考虑为客厅烟雾报警器(living_room_smoke_alarm)也进行一次电池状态检查,预防类似问题\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而厨房灶具在使用期间出现温度异常飙升,报警器可能无法在真实火灾中正常工作。", "reasoning": ["推理步骤1: 2026-06-29T10:23:00 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,设备处于降级工作状态。", "推理步骤2: 2026-06-30T10:23:00 厨房灶具被开启,随后 10:33:00 厨房温度传感器读数从 2514(约25.1°C)骤升至 3021(约30.2°C),短短3分钟内上升约5°C,这是一个异常的温升速率。", "推理步骤3: 10:33:00 同时记录了 kitchen_smoke_alarm SmokeState = 0(无烟雾检测),但考虑到电池低电量状态,传感器灵敏度可能已下降,SmokeState = 0 的可信度存疑。", "推理步骤4: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue = None(07:04、07:28、18:46、19:07),说明传感器本身也存在间歇性故障,进一步削弱了厨房安全监测的可靠性。", "推理步骤5: 该家庭有儿童(儿童房有人活动),灶具使用频繁(当天至少3次开启),烟雾报警器低电量叠加温度传感器不稳定,构成了显著的火灾安全盲区。", "推理步骤6: 低电量告警已持续超过24小时(6月29日10:23至6月30日全天),未见电池更换或设备恢复的记录,问题处于持续恶化状态。"], "key_evidence": ["kitchen_smoke_alarm BatteryAlert = 1(2026-06-29T10:23:00),低电量告警持续超过24小时未处理", "厨房温度在灶具开启后3分钟内从约25.1°C骤升至约30.2°C(10:30 → 10:33),升幅异常", "kitchen_temp_sensor 多次报告 MeasuredValue = None(07:04、07:28、18:46、19:07),传感器间歇性失效", "烟雾报警器在温度异常飙升时报告 SmokeState = 0,但低电量下该读数可信度不足", "灶具当天被多次使用(07:03、10:23、18:45),厨房是高频用火区域"], "recommended_actions": ["【紧急】立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常检测能力", "【紧急】检查厨房温度传感器(kitchen_temp_sensor)的连接和供电状态,排查间歇性报告 None 的故障原因,必要时更换设备", "【重要】在烟雾报警器电池更换前,避免无人看管使用厨房灶具,尤其注意儿童不得单独进入厨房", "【重要】检查 10:33 温度骤升事件的原因——确认灶具是否存在异常大火或油烟情况,排除灶具本身的安全隐患", "【建议】为烟雾报警器设置低电量自动提醒规则,确保 BatteryAlert 触发后在12小时内完成电池更换", "【建议】增加厨房安全联动规则:当烟雾报警器处于低电量状态时,限制灶具的远程开启功能,并在灶具开启时向住户手机推送额外警告", "【建议】考虑为客厅烟雾报警器(living_room_smoke_alarm)也进行一次电池状态检查,预防类似问题"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.531471252441406, "api_error": null} {"episode_id": "SQ5_TP_C_1078", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1078.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-26T00:00:00", "seed": 20261707, "scenario_id": "FG-02", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-02", "scenario_name": "电器过热起火", "category": "fire_gas", "is_anomaly": true, "threat_type": "electrical_fire_risk", "key_evidence": ["温度异常上升但无合理热源(空调关闭/制冷模式,灶具关闭)", "上升速度超过正常烹饪或日照导致的范围"], "expected_response": "火灾风险警报,建议住户检查该区域电器", "difficulty": "medium", "target_room": "master_bathroom", "injection_time": "2026-06-26T19:34:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅温度传感器出现异常高温读数,随后烟雾报警器触发,高度疑似电器过热起火。\",\n \"reasoning\": [\n \"推理步骤1: 19:30 客厅温度传感器正常报告 2436(约24.36°C),但在 19:34 突然跳升至 3764(约37.64°C),4分钟内飙升超过13°C,这不是正常环境温度变化。\",\n \"推理步骤2: 19:39 温度读数仍为 3200(约32°C),虽略有下降但仍远高于正常室温,且此时客厅空调处于制冷模式运行中(SystemMode=3),正常情况下温度不应如此异常。\",\n \"推理步骤3: 19:44 客厅烟雾报警器触发(SmokeState=1),确认存在烟雾,与温度异常高度吻合,形成火灾证据链。\",\n \"推理步骤4: 异常温度出现在客厅区域,当时客厅有人活动(18:04 运动传感器触发),空调和主灯均在运行,可能是空调或其他电器过热引发。\",\n \"推理步骤5: 20:00 的定时温度报告恢复至 2416(约24.16°C),说明火情可能已被控制或传感器恢复正常,但烟雾报警未见复位记录,需确认现场安全。\"\n ],\n \"key_evidence\": [\n \"19:34 客厅温度传感器异常读数 3764(约37.64°C),较4分钟前的24.36°C飙升13°C\",\n \"19:39 客厅温度传感器读数 3200(约32°C),持续异常高温\",\n \"19:44 客厅烟雾报警器触发 SmokeState=1,确认有烟雾产生\",\n \"客厅空调当时处于制冷运行状态(18:04开启,SystemMode=3),可能是过热源\",\n \"厨房温度传感器多次报告 None 值,存在传感器故障迹象,降低了厨房区域的监测能力\"\n ],\n \"recommended_actions\": [\n \"立即通知住户并拨打119火警电话,确认现场是否有明火\",\n \"远程关闭客厅空调(living_room_ac)及所有客厅电器,切断可能的过热源\",\n \"远程开启客厅窗帘(living_room_window_1)辅助通风散热排烟\",\n \"远程解锁入户门锁(front_door_lock)确保逃生通道畅通\",\n \"关闭全屋非必要电器,防止电路过载扩大火情\",\n \"检查客厅烟雾报警器是否复位,若持续报警需派人现场确认\",\n \"事后排查客厅空调及周边电器是否存在短路、过载或散热故障\",\n \"修复厨房温度传感器(多次报告None),确保全屋监测覆盖完整\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅温度传感器出现异常高温读数,随后烟雾报警器触发,高度疑似电器过热起火。", "reasoning": ["推理步骤1: 19:30 客厅温度传感器正常报告 2436(约24.36°C),但在 19:34 突然跳升至 3764(约37.64°C),4分钟内飙升超过13°C,这不是正常环境温度变化。", "推理步骤2: 19:39 温度读数仍为 3200(约32°C),虽略有下降但仍远高于正常室温,且此时客厅空调处于制冷模式运行中(SystemMode=3),正常情况下温度不应如此异常。", "推理步骤3: 19:44 客厅烟雾报警器触发(SmokeState=1),确认存在烟雾,与温度异常高度吻合,形成火灾证据链。", "推理步骤4: 异常温度出现在客厅区域,当时客厅有人活动(18:04 运动传感器触发),空调和主灯均在运行,可能是空调或其他电器过热引发。", "推理步骤5: 20:00 的定时温度报告恢复至 2416(约24.16°C),说明火情可能已被控制或传感器恢复正常,但烟雾报警未见复位记录,需确认现场安全。"], "key_evidence": ["19:34 客厅温度传感器异常读数 3764(约37.64°C),较4分钟前的24.36°C飙升13°C", "19:39 客厅温度传感器读数 3200(约32°C),持续异常高温", "19:44 客厅烟雾报警器触发 SmokeState=1,确认有烟雾产生", "客厅空调当时处于制冷运行状态(18:04开启,SystemMode=3),可能是过热源", "厨房温度传感器多次报告 None 值,存在传感器故障迹象,降低了厨房区域的监测能力"], "recommended_actions": ["立即通知住户并拨打119火警电话,确认现场是否有明火", "远程关闭客厅空调(living_room_ac)及所有客厅电器,切断可能的过热源", "远程开启客厅窗帘(living_room_window_1)辅助通风散热排烟", "远程解锁入户门锁(front_door_lock)确保逃生通道畅通", "关闭全屋非必要电器,防止电路过载扩大火情", "检查客厅烟雾报警器是否复位,若持续报警需派人现场确认", "事后排查客厅空调及周边电器是否存在短路、过载或散热故障", "修复厨房温度传感器(多次报告None),确保全屋监测覆盖完整"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 20.572834253311157, "api_error": null} {"episode_id": "SQ5_TP_C_1074", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1074.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261703, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T19:49:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:49 有人通过合法用户开门后尾随进入室内,客厅和次卧同时出现占用信号,疑似未授权人员入侵。\",\n \"reasoning\": [\n \"推理步骤1: 19:49:00 入户门锁通过合法方式解锁(LockOperationType=1 即 Lock/Unlock,OperationSource=3 即密码/PIN 操作,UserIndex=1 即户主),门锁事件本身是正常的。\",\n \"推理步骤2: 19:49:02 门打开(contact=False),19:49:08 门关闭(contact=True),开门持续约6秒,属于正常时长。\",\n \"推理步骤3: 19:49:04 玄关检测到有人,19:49:10 客厅检测到有人——这是户主从玄关走向客厅的正常动线。\",\n \"推理步骤4: 关键异常——19:49:12 玄关再次检测到占用(Occupancy=1),说明在户主已经走到客厅之后,玄关仍有人体存在。如果只有一人进入,此时玄关应无人。\",\n \"推理步骤5: 19:49:15 客厅和次卧同时报告 Occupancy=1。同一时刻两个不相邻的区域同时有人,说明室内至少存在两人。但门锁记录仅显示一次开锁事件、一个用户(UserIndex=1),没有第二次合法认证。\",\n \"推理步骤6: 全天日志显示从 00:00 到 19:49 之前,无任何运动传感器触发、无门锁事件,说明白天家中无人。19:49 是当天第一次有人回家,不存在'家中已有其他家庭成员'的可能。\",\n \"推理步骤7: 综合判断——一次开锁、一个用户认证,但室内出现至少两人的运动轨迹,且第二人没有经过任何身份验证,符合'尾随入室'(tailgating)的典型模式。\"\n ],\n \"key_evidence\": [\n \"19:49:00 仅一次门锁认证事件(UserIndex=1),全天无其他开锁记录\",\n \"19:49:12 户主已到达客厅后,玄关再次检测到人体占用,表明有第二人经过玄关\",\n \"19:49:15 客厅(living_room)和次卧(second_bedroom)同一秒同时报告占用,证实室内至少两人\",\n \"全天 00:00-19:49 期间无任何运动传感器触发,排除家中已有其他住户的可能\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑\",\n \"自动锁定入户门锁(front_door_lock),防止入侵者轻易逃脱或更多人进入\",\n \"向户主手机推送高优先级通知,附带事件时间线,确认是否为已知访客\",\n \"如户主确认非已知人员,立即联系物业安保或报警(110)\",\n \"调取楼道/门口监控录像(如有),核实尾随人员身份\",\n \"开启全屋灯光(所有房间),消除入侵者藏匿的暗区\",\n \"记录并保存本次完整事件日志作为证据,包括门锁操作记录和所有传感器触发时序\",\n \"事后建议:在入户门外增设摄像头或门铃摄像头,启用门锁的'反尾随'模式(如开门后检测到多人通过则告警)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:49 有人通过合法用户开门后尾随进入室内,客厅和次卧同时出现占用信号,疑似未授权人员入侵。", "reasoning": ["推理步骤1: 19:49:00 入户门锁通过合法方式解锁(LockOperationType=1 即 Lock/Unlock,OperationSource=3 即密码/PIN 操作,UserIndex=1 即户主),门锁事件本身是正常的。", "推理步骤2: 19:49:02 门打开(contact=False),19:49:08 门关闭(contact=True),开门持续约6秒,属于正常时长。", "推理步骤3: 19:49:04 玄关检测到有人,19:49:10 客厅检测到有人——这是户主从玄关走向客厅的正常动线。", "推理步骤4: 关键异常——19:49:12 玄关再次检测到占用(Occupancy=1),说明在户主已经走到客厅之后,玄关仍有人体存在。如果只有一人进入,此时玄关应无人。", "推理步骤5: 19:49:15 客厅和次卧同时报告 Occupancy=1。同一时刻两个不相邻的区域同时有人,说明室内至少存在两人。但门锁记录仅显示一次开锁事件、一个用户(UserIndex=1),没有第二次合法认证。", "推理步骤6: 全天日志显示从 00:00 到 19:49 之前,无任何运动传感器触发、无门锁事件,说明白天家中无人。19:49 是当天第一次有人回家,不存在'家中已有其他家庭成员'的可能。", "推理步骤7: 综合判断——一次开锁、一个用户认证,但室内出现至少两人的运动轨迹,且第二人没有经过任何身份验证,符合'尾随入室'(tailgating)的典型模式。"], "key_evidence": ["19:49:00 仅一次门锁认证事件(UserIndex=1),全天无其他开锁记录", "19:49:12 户主已到达客厅后,玄关再次检测到人体占用,表明有第二人经过玄关", "19:49:15 客厅(living_room)和次卧(second_bedroom)同一秒同时报告占用,证实室内至少两人", "全天 00:00-19:49 期间无任何运动传感器触发,排除家中已有其他住户的可能"], "recommended_actions": ["立即触发室内警报(声光报警),对潜在入侵者形成威慑", "自动锁定入户门锁(front_door_lock),防止入侵者轻易逃脱或更多人进入", "向户主手机推送高优先级通知,附带事件时间线,确认是否为已知访客", "如户主确认非已知人员,立即联系物业安保或报警(110)", "调取楼道/门口监控录像(如有),核实尾随人员身份", "开启全屋灯光(所有房间),消除入侵者藏匿的暗区", "记录并保存本次完整事件日志作为证据,包括门锁操作记录和所有传感器触发时序", "事后建议:在入户门外增设摄像头或门铃摄像头,启用门锁的'反尾随'模式(如开门后检测到多人通过则告警)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 25.983330011367798, "api_error": null} {"episode_id": "SQ5_TP_C_1081", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1081.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-22T00:00:00", "seed": 20261710, "scenario_id": "WD-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "second_bathroom", "injection_time": "2026-06-22T21:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"次卫漏水传感器在住户就寝后持续报警超过30分钟,且无人处理,存在水损扩大风险。\",\n \"reasoning\": [\n \"推理步骤1: 次卫漏水传感器在21:19首次报警(StateValue=True),随后21:29、21:49持续报警,说明漏水未被止住,持续至少30分钟。\",\n \"推理步骤2: 16:14家中有人回来(儿童放学),17:42另一位住户回家,但22:28主卧灯关闭、窗帘关闭、前门上锁,表明住户已就寝。漏水从21:19开始,住户在22:28入睡,期间未对漏水做出响应。\",\n \"推理步骤3: 次卫靠近儿童房,长时间漏水可能导致地板渗水、墙体受损,甚至影响楼下邻居。21:49最后一次报警后日志中无任何关阀或处理动作,说明问题仍在持续。\",\n \"推理步骤4: 家中无智能水阀设备可远程关闭水源,需要人工干预或紧急通知住户。\"\n ],\n \"key_evidence\": [\n \"21:19/21:29/21:49 次卫漏水传感器连续三次报警 StateValue=True,间隔约10-20分钟,持续超过30分钟\",\n \"22:28 住户关灯、关空调、锁门就寝,漏水期间及之后无任何处理动作\",\n \"日志中无水阀关闭记录,漏水状态未解除\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送、电话或短信紧急通知住户,告知次卫漏水持续未止\",\n \"如有智能水阀或总阀控制器,立即远程关闭次卫或全屋进水阀\",\n \"触发室内警报(如智能音箱/蜂鸣器)唤醒住户,提示前往次卫检查\",\n \"通知物业或紧急维修人员待命,若住户无法及时处理可上门关阀\",\n \"记录漏水起始时间和持续时长,用于后续保险理赔或维修评估\",\n \"建议住户安装智能水阀,实现漏水自动关阀联动,避免类似事件再次发生\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "次卫漏水传感器在住户就寝后持续报警超过30分钟,且无人处理,存在水损扩大风险。", "reasoning": ["推理步骤1: 次卫漏水传感器在21:19首次报警(StateValue=True),随后21:29、21:49持续报警,说明漏水未被止住,持续至少30分钟。", "推理步骤2: 16:14家中有人回来(儿童放学),17:42另一位住户回家,但22:28主卧灯关闭、窗帘关闭、前门上锁,表明住户已就寝。漏水从21:19开始,住户在22:28入睡,期间未对漏水做出响应。", "推理步骤3: 次卫靠近儿童房,长时间漏水可能导致地板渗水、墙体受损,甚至影响楼下邻居。21:49最后一次报警后日志中无任何关阀或处理动作,说明问题仍在持续。", "推理步骤4: 家中无智能水阀设备可远程关闭水源,需要人工干预或紧急通知住户。"], "key_evidence": ["21:19/21:29/21:49 次卫漏水传感器连续三次报警 StateValue=True,间隔约10-20分钟,持续超过30分钟", "22:28 住户关灯、关空调、锁门就寝,漏水期间及之后无任何处理动作", "日志中无水阀关闭记录,漏水状态未解除"], "recommended_actions": ["立即通过手机推送、电话或短信紧急通知住户,告知次卫漏水持续未止", "如有智能水阀或总阀控制器,立即远程关闭次卫或全屋进水阀", "触发室内警报(如智能音箱/蜂鸣器)唤醒住户,提示前往次卫检查", "通知物业或紧急维修人员待命,若住户无法及时处理可上门关阀", "记录漏水起始时间和持续时长,用于后续保险理赔或维修评估", "建议住户安装智能水阀,实现漏水自动关阀联动,避免类似事件再次发生"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 4, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 18.129781484603882, "api_error": null} {"episode_id": "SQ5_TP_C_1087", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1087.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261716, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T19:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"19:10 入户时检测到多人同时进入,存在尾随入室嫌疑:一人开锁进门后,客厅和次卧几乎同时出现占用信号,且玄关持续有人。\",\n \"reasoning\": [\n \"推理步骤1: 19:10:00 前门锁通过合法用户(UserIndex=1)密码/指纹开锁(OperationSource=3),门打开后2秒关闭,这是正常的单人进门时间窗口。\",\n \"推理步骤2: 19:10:04 玄关检测到有人,19:10:10 客厅检测到有人——这符合一个人从玄关走向客厅的正常动线。\",\n \"推理步骤3: 但在 19:10:12 玄关再次报告 Occupancy=1,同时 19:10:15 次卧和客厅同时报告有人占用。这意味着在合法用户已经走到客厅/次卧的同时,玄关仍有人存在,且次卧与客厅同一时刻同时有人。\",\n \"推理步骤4: 单人不可能同时出现在客厅和次卧(不同房间),也不可能在已到达客厅后玄关仍持续有人。这表明至少有两人在室内活动。\",\n \"推理步骤5: 全天直到 19:10 之前无任何运动传感器触发、无门锁操作,说明白天家中无人。只有一次开锁事件却出现多人活动模式,尾随入室的可能性存在。\",\n \"推理步骤6: 置信度为 medium 而非 high,因为也存在合理解释:家庭成员同行回家(一人刷锁、多人一起进入),或者运动传感器灵敏度导致余热误触发。但系统应按潜在威胁处理。\"\n ],\n \"key_evidence\": [\n \"19:10:00 仅一次开锁事件(UserIndex=1),门开关间隔仅4秒\",\n \"19:10:15 客厅和次卧同时报告 Occupancy=1,同时 19:10:12 玄关仍报告有人,表明室内至少两人分布在不同区域\",\n \"全天(00:00-19:10)无任何运动传感器触发和门锁操作,白天家中无人\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑\",\n \"通过手机推送紧急通知给户主(UserIndex=1),确认是否有同行人员;若户主确认只有自己回家,立即报警\",\n \"自动锁定前门锁(防止更多人进入或入侵者轻易逃离后再次进入)\",\n \"开启所有区域灯光(玄关灯、客厅灯、次卧灯),消除暗区,增加入侵者暴露感\",\n \"如有摄像头,立即开始录像并截取 19:09-19:11 时段玄关画面用于事后取证\",\n \"若户主 60 秒内未确认安全,自动拨打物业安保或 110 报警\",\n \"记录本次事件所有传感器时间线,供后续安全审计使用\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "19:10 入户时检测到多人同时进入,存在尾随入室嫌疑:一人开锁进门后,客厅和次卧几乎同时出现占用信号,且玄关持续有人。", "reasoning": ["推理步骤1: 19:10:00 前门锁通过合法用户(UserIndex=1)密码/指纹开锁(OperationSource=3),门打开后2秒关闭,这是正常的单人进门时间窗口。", "推理步骤2: 19:10:04 玄关检测到有人,19:10:10 客厅检测到有人——这符合一个人从玄关走向客厅的正常动线。", "推理步骤3: 但在 19:10:12 玄关再次报告 Occupancy=1,同时 19:10:15 次卧和客厅同时报告有人占用。这意味着在合法用户已经走到客厅/次卧的同时,玄关仍有人存在,且次卧与客厅同一时刻同时有人。", "推理步骤4: 单人不可能同时出现在客厅和次卧(不同房间),也不可能在已到达客厅后玄关仍持续有人。这表明至少有两人在室内活动。", "推理步骤5: 全天直到 19:10 之前无任何运动传感器触发、无门锁操作,说明白天家中无人。只有一次开锁事件却出现多人活动模式,尾随入室的可能性存在。", "推理步骤6: 置信度为 medium 而非 high,因为也存在合理解释:家庭成员同行回家(一人刷锁、多人一起进入),或者运动传感器灵敏度导致余热误触发。但系统应按潜在威胁处理。"], "key_evidence": ["19:10:00 仅一次开锁事件(UserIndex=1),门开关间隔仅4秒", "19:10:15 客厅和次卧同时报告 Occupancy=1,同时 19:10:12 玄关仍报告有人,表明室内至少两人分布在不同区域", "全天(00:00-19:10)无任何运动传感器触发和门锁操作,白天家中无人"], "recommended_actions": ["立即触发室内警报(声光报警),对潜在入侵者形成威慑", "通过手机推送紧急通知给户主(UserIndex=1),确认是否有同行人员;若户主确认只有自己回家,立即报警", "自动锁定前门锁(防止更多人进入或入侵者轻易逃离后再次进入)", "开启所有区域灯光(玄关灯、客厅灯、次卧灯),消除暗区,增加入侵者暴露感", "如有摄像头,立即开始录像并截取 19:09-19:11 时段玄关画面用于事后取证", "若户主 60 秒内未确认安全,自动拨打物业安保或 110 报警", "记录本次事件所有传感器时间线,供后续安全审计使用"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 24.120646715164185, "api_error": null} {"episode_id": "SQ5_TP_C_1089", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1089.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-03T00:00:00", "seed": 20261718, "scenario_id": "FG-04", "total_events": 260, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-03T22:23:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而深夜无人时灶具异常开启并引发厨房温度骤升,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-02T22:23:00 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾达到阈值时正常发出警报。\",\n \"推理步骤2: 2026-06-03T22:21:28 主卧灯关闭、窗帘关闭、入户门锁定,全屋灯光熄灭,表明住户已全部就寝。\",\n \"推理步骤3: 2026-06-03T22:23:00 厨房灶具在无人操作的情况下被开启(OnOff=True)。此时无任何运动传感器检测到厨房有人活动,也无厨房灯开启,属于异常启动。\",\n \"推理步骤4: 2026-06-03T22:33:00 厨房温度从约2352(23.52°C)骤升至2864(28.64°C),10分钟内上升超过5°C,明显是灶具无人看管持续加热所致。\",\n \"推理步骤5: 同一时刻烟雾报警器报告 SmokeState=0(正常),但由于电池低电量,其检测可靠性存疑。即使当前未触发烟雾报警,灶具持续无人看管运行将导致温度继续攀升,火灾风险随时间急剧增加。\",\n \"推理步骤6: 截至日志结束(23:30),灶具未见关闭记录,意味着它可能已持续运行超过1小时且仍在运行中。\"\n ],\n \"key_evidence\": [\n \"2026-06-02T22:23:00 厨房烟雾报警器 BatteryAlert=1,电池电量低\",\n \"2026-06-03T22:23:00 全屋就寝后厨房灶具异常开启(无运动传感器触发、无厨房灯开启)\",\n \"2026-06-03T22:33:00 厨房温度10分钟内从23.52°C骤升至28.64°C\",\n \"灶具开启后直至日志结束(23:30)无关闭记录,持续无人看管运行超过1小时\",\n \"烟雾报警器低电量状态下报告 SmokeState=0,检测可靠性不足\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭厨房灶具(kitchen_cook_surface),消除持续加热的火灾隐患\",\n \"【立即】向住户手机推送高优先级紧急通知,告知灶具异常开启及厨房温度异常升高\",\n \"【立即】开启厨房灯以便住户起身查看时有照明,同时打开厨房窗户通风散热\",\n \"【紧急】尽快更换厨房烟雾报警器电池,恢复其正常报警能力;在更换前可临时启用客厅烟雾报警器作为辅助监测\",\n \"【排查】调查灶具深夜无人时自动开启的原因——检查是否存在自动化规则误触发、设备固件故障或未授权的远程控制指令\",\n \"【预防】为灶具设置安全策略:夜间时段(22:00-06:00)禁止远程/自动开启,或设置无人看管超时自动关闭机制(如15分钟无厨房运动传感器触发则自动断电)\",\n \"【预防】为所有烟雾报警器设置低电量提醒阈值,在 BatteryAlert 触发后24小时内未更换电池则持续提醒并升级通知级别\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而深夜无人时灶具异常开启并引发厨房温度骤升,存在严重火灾风险。", "reasoning": ["推理步骤1: 2026-06-02T22:23:00 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾达到阈值时正常发出警报。", "推理步骤2: 2026-06-03T22:21:28 主卧灯关闭、窗帘关闭、入户门锁定,全屋灯光熄灭,表明住户已全部就寝。", "推理步骤3: 2026-06-03T22:23:00 厨房灶具在无人操作的情况下被开启(OnOff=True)。此时无任何运动传感器检测到厨房有人活动,也无厨房灯开启,属于异常启动。", "推理步骤4: 2026-06-03T22:33:00 厨房温度从约2352(23.52°C)骤升至2864(28.64°C),10分钟内上升超过5°C,明显是灶具无人看管持续加热所致。", "推理步骤5: 同一时刻烟雾报警器报告 SmokeState=0(正常),但由于电池低电量,其检测可靠性存疑。即使当前未触发烟雾报警,灶具持续无人看管运行将导致温度继续攀升,火灾风险随时间急剧增加。", "推理步骤6: 截至日志结束(23:30),灶具未见关闭记录,意味着它可能已持续运行超过1小时且仍在运行中。"], "key_evidence": ["2026-06-02T22:23:00 厨房烟雾报警器 BatteryAlert=1,电池电量低", "2026-06-03T22:23:00 全屋就寝后厨房灶具异常开启(无运动传感器触发、无厨房灯开启)", "2026-06-03T22:33:00 厨房温度10分钟内从23.52°C骤升至28.64°C", "灶具开启后直至日志结束(23:30)无关闭记录,持续无人看管运行超过1小时", "烟雾报警器低电量状态下报告 SmokeState=0,检测可靠性不足"], "recommended_actions": ["【立即】远程关闭厨房灶具(kitchen_cook_surface),消除持续加热的火灾隐患", "【立即】向住户手机推送高优先级紧急通知,告知灶具异常开启及厨房温度异常升高", "【立即】开启厨房灯以便住户起身查看时有照明,同时打开厨房窗户通风散热", "【紧急】尽快更换厨房烟雾报警器电池,恢复其正常报警能力;在更换前可临时启用客厅烟雾报警器作为辅助监测", "【排查】调查灶具深夜无人时自动开启的原因——检查是否存在自动化规则误触发、设备固件故障或未授权的远程控制指令", "【预防】为灶具设置安全策略:夜间时段(22:00-06:00)禁止远程/自动开启,或设置无人看管超时自动关闭机制(如15分钟无厨房运动传感器触发则自动断电)", "【预防】为所有烟雾报警器设置低电量提醒阈值,在 BatteryAlert 触发后24小时内未更换电池则持续提醒并升级通知级别"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.13970398902893, "api_error": null} {"episode_id": "SQ5_TP_C_1092", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1092.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-13T00:00:00", "seed": 20261721, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-13T18:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:32 入户开锁后,玄关和客厅几乎同时检测到人体,随后次卧也立即出现占用,存在尾随入室的可能性。\",\n \"reasoning\": [\n \"推理步骤1: 18:32:00 入户门锁通过合法凭证解锁(LockOperationType=1 即 Unlock,OperationSource=3 即 PIN/密码,UserIndex=1 即户主),门锁操作本身是正常的。\",\n \"推理步骤2: 18:32:02 门打开,18:32:04 玄关检测到人体,18:32:08 门关闭,18:32:10 客厅检测到人体——到此为止是一个人正常进门的流程。\",\n \"推理步骤3: 关键异常出现在 18:32:12 和 18:32:15:玄关再次触发占用(Occupancy=1),同时客厅和次卧也同时触发占用。这意味着在门关闭后,玄关仍有人停留或再次出现人体,而与此同时客厅和次卧已经分别有人。一个人不可能同时出现在玄关、客厅和次卧三个位置。\",\n \"推理步骤4: 从时间线看,户主 18:32:10 已到达客厅,18:32:12 玄关再次检测到人体,说明有第二个人在玄关区域。18:32:15 次卧和客厅同时有人,进一步印证至少有两人在室内。\",\n \"推理步骤5: 整个过程只有一次开锁记录、一次开关门记录,没有第二次合法的门锁认证事件,说明第二个人并非通过正常认证进入,而是在户主开门时尾随进入。\",\n \"推理步骤6: 置信度定为 medium 而非 high,是因为也存在合理解释:可能是家庭成员一起回家(两人同行只需开一次锁),或者运动传感器因宠物/物体移动产生了余波触发。但多房间同时占用的模式更符合尾随场景。\"\n ],\n \"key_evidence\": [\n \"18:32:00 仅一次门锁解锁事件(UserIndex=1),全天无其他开锁记录\",\n \"18:32:08 门已关闭,但 18:32:12 玄关再次触发 Occupancy=1,说明玄关仍有人或再次出现人体\",\n \"18:32:15 客厅和次卧同时触发 Occupancy=1,一个人无法同时出现在两个不同房间\",\n \"次卧在户主进门仅 7 秒后就检测到占用,且此前全天无任何次卧活动记录,行为突兀\"\n ],\n \"recommended_actions\": [\n \"立即触发室内警报(声光报警),对潜在入侵者形成威慑\",\n \"向户主手机推送高优先级通知:'检测到可能的尾随入室,次卧区域有未识别的人体活动,请确认是否为家庭成员'\",\n \"自动锁定入户门(front_door_lock 发送 Lock 指令),防止更多人进入或入侵者轻易逃脱后再次进入\",\n \"开启全屋灯光(所有房间灯打开),消除入侵者可能利用的暗处藏匿条件\",\n \"如果家中有摄像头或可视门铃,立即开始录像并保存片段作为证据\",\n \"若户主在 60 秒内未确认为误报,自动联系物业安保或拨打 110 报警\",\n \"记录并保留 18:32:00–18:32:15 时间段所有传感器原始日志,供后续调查取证\",\n \"事后建议:为入户门加装摄像头,启用门锁的多人进入检测功能;考虑在玄关增加人数统计传感器以更精确识别尾随行为\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "18:32 入户开锁后,玄关和客厅几乎同时检测到人体,随后次卧也立即出现占用,存在尾随入室的可能性。", "reasoning": ["推理步骤1: 18:32:00 入户门锁通过合法凭证解锁(LockOperationType=1 即 Unlock,OperationSource=3 即 PIN/密码,UserIndex=1 即户主),门锁操作本身是正常的。", "推理步骤2: 18:32:02 门打开,18:32:04 玄关检测到人体,18:32:08 门关闭,18:32:10 客厅检测到人体——到此为止是一个人正常进门的流程。", "推理步骤3: 关键异常出现在 18:32:12 和 18:32:15:玄关再次触发占用(Occupancy=1),同时客厅和次卧也同时触发占用。这意味着在门关闭后,玄关仍有人停留或再次出现人体,而与此同时客厅和次卧已经分别有人。一个人不可能同时出现在玄关、客厅和次卧三个位置。", "推理步骤4: 从时间线看,户主 18:32:10 已到达客厅,18:32:12 玄关再次检测到人体,说明有第二个人在玄关区域。18:32:15 次卧和客厅同时有人,进一步印证至少有两人在室内。", "推理步骤5: 整个过程只有一次开锁记录、一次开关门记录,没有第二次合法的门锁认证事件,说明第二个人并非通过正常认证进入,而是在户主开门时尾随进入。", "推理步骤6: 置信度定为 medium 而非 high,是因为也存在合理解释:可能是家庭成员一起回家(两人同行只需开一次锁),或者运动传感器因宠物/物体移动产生了余波触发。但多房间同时占用的模式更符合尾随场景。"], "key_evidence": ["18:32:00 仅一次门锁解锁事件(UserIndex=1),全天无其他开锁记录", "18:32:08 门已关闭,但 18:32:12 玄关再次触发 Occupancy=1,说明玄关仍有人或再次出现人体", "18:32:15 客厅和次卧同时触发 Occupancy=1,一个人无法同时出现在两个不同房间", "次卧在户主进门仅 7 秒后就检测到占用,且此前全天无任何次卧活动记录,行为突兀"], "recommended_actions": ["立即触发室内警报(声光报警),对潜在入侵者形成威慑", "向户主手机推送高优先级通知:'检测到可能的尾随入室,次卧区域有未识别的人体活动,请确认是否为家庭成员'", "自动锁定入户门(front_door_lock 发送 Lock 指令),防止更多人进入或入侵者轻易逃脱后再次进入", "开启全屋灯光(所有房间灯打开),消除入侵者可能利用的暗处藏匿条件", "如果家中有摄像头或可视门铃,立即开始录像并保存片段作为证据", "若户主在 60 秒内未确认为误报,自动联系物业安保或拨打 110 报警", "记录并保留 18:32:00–18:32:15 时间段所有传感器原始日志,供后续调查取证", "事后建议:为入户门加装摄像头,启用门锁的多人进入检测功能;考虑在玄关增加人数统计传感器以更精确识别尾随行为"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 27.788896083831787, "api_error": null} {"episode_id": "SQ5_TP_C_1100", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1100.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-21T00:00:00", "seed": 20261729, "scenario_id": "INS-04", "total_events": 198, "anomaly_events_count": 6}, "ground_truth": {"scenario_id": "INS-04", "scenario_name": "白天撬窗入室", "category": "intrusion", "is_anomaly": true, "threat_type": "intrusion", "key_evidence": ["住户外出期间(门锁显示已锁+无人在家)窗户被打开", "随后出现多房间运动信号", "入侵者未使用门锁(无 LockOperation 事件)"], "expected_response": "触发入侵警报,通知住户,建议报警", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-21T14:15:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"14:15主卧窗户在无人占用时被从外部打开,随后出现人体活动,疑似撬窗入室。\",\n \"reasoning\": [\n \"推理步骤1: 14:15主卧窗户传感器报告StateValue=False(窗户打开),但此前主卧运动传感器无人体检测(Occupancy=0),说明窗户不是由室内人员打开的。\",\n \"推理步骤2: 窗户打开8秒后(14:15:08)主卧运动传感器检测到人体(Occupancy=1),时序上符合从窗户外部进入室内的模式。\",\n \"推理步骤3: 14:16客厅运动传感器也检测到活动(Occupancy=1),说明入侵者可能从主卧移动到了客厅区域。\",\n \"推理步骤4: 14:18窗户被关闭(StateValue=True),随后主卧运动传感器立即归零(14:18:05),整个过程仅持续约3分钟,行为短促且有意掩盖痕迹。\",\n \"推理步骤5: 整个事件期间入户门锁和入户门传感器无任何触发记录,排除了住户正常从大门进入后开窗通风的可能性。\"\n ],\n \"key_evidence\": [\n \"14:15 主卧窗户在室内无人时被打开(窗户传感器StateValue=False,此前Occupancy=0)\",\n \"14:15:08 窗户打开仅8秒后主卧检测到人体活动\",\n \"事件期间入户门锁和入户门传感器无任何开启记录,排除正常入户\",\n \"整个过程仅约3分钟,窗户随即被关闭,行为模式异常短促\"\n ],\n \"recommended_actions\": [\n \"立即触发全屋警报(声光报警),震慑入侵者\",\n \"自动锁定入户门锁(front_door_lock),防止入侵者从正门逃离或再次进入\",\n \"向户主手机推送紧急入侵通知,附带事件时间线\",\n \"联系物业安保或拨打110报警,提供入侵时间(14:15-14:18)和入侵路径(主卧窗户)\",\n \"保存并锁定事件时段所有设备日志作为证据,防止被篡改\",\n \"如有摄像头,立即调取主卧及客厅14:14-14:20时段录像\",\n \"事后检查主卧窗户锁具是否被破坏,评估是否需要加装窗户防盗锁或震动报警器\",\n \"建议为高层以外住户的窗户加装入侵检测联动规则:窗户开启+室内无人时自动触发预警\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "14:15主卧窗户在无人占用时被从外部打开,随后出现人体活动,疑似撬窗入室。", "reasoning": ["推理步骤1: 14:15主卧窗户传感器报告StateValue=False(窗户打开),但此前主卧运动传感器无人体检测(Occupancy=0),说明窗户不是由室内人员打开的。", "推理步骤2: 窗户打开8秒后(14:15:08)主卧运动传感器检测到人体(Occupancy=1),时序上符合从窗户外部进入室内的模式。", "推理步骤3: 14:16客厅运动传感器也检测到活动(Occupancy=1),说明入侵者可能从主卧移动到了客厅区域。", "推理步骤4: 14:18窗户被关闭(StateValue=True),随后主卧运动传感器立即归零(14:18:05),整个过程仅持续约3分钟,行为短促且有意掩盖痕迹。", "推理步骤5: 整个事件期间入户门锁和入户门传感器无任何触发记录,排除了住户正常从大门进入后开窗通风的可能性。"], "key_evidence": ["14:15 主卧窗户在室内无人时被打开(窗户传感器StateValue=False,此前Occupancy=0)", "14:15:08 窗户打开仅8秒后主卧检测到人体活动", "事件期间入户门锁和入户门传感器无任何开启记录,排除正常入户", "整个过程仅约3分钟,窗户随即被关闭,行为模式异常短促"], "recommended_actions": ["立即触发全屋警报(声光报警),震慑入侵者", "自动锁定入户门锁(front_door_lock),防止入侵者从正门逃离或再次进入", "向户主手机推送紧急入侵通知,附带事件时间线", "联系物业安保或拨打110报警,提供入侵时间(14:15-14:18)和入侵路径(主卧窗户)", "保存并锁定事件时段所有设备日志作为证据,防止被篡改", "如有摄像头,立即调取主卧及客厅14:14-14:20时段录像", "事后检查主卧窗户锁具是否被破坏,评估是否需要加装窗户防盗锁或震动报警器", "建议为高层以外住户的窗户加装入侵检测联动规则:窗户开启+室内无人时自动触发预警"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 20.5693941116333, "api_error": null} {"episode_id": "SQ5_TP_C_1101", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1101.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-06T00:00:00", "seed": 20261730, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-06T17:12:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": false,\n \"confidence\": \"high\",\n \"threat_type\": \"none\",\n \"threat_description\": \"17:12 的入户事件为正常住户归家,未发现尾随入室的证据。\",\n \"reasoning\": [\n \"推理步骤1: 17:12 入户门锁通过合法方式解锁——LockOperationType=1(Lock/正常操作),OperationSource=3(通常对应密码/指纹/本地凭证),UserIndex=1(已注册的主用户)。这说明是授权用户主动开门,而非被撬或异常方式打开。\",\n \"推理步骤2: 门锁解锁后,入户门传感器在 17:12:02 变为 False(门打开),17:12:08 变为 True(门关闭),开门持续仅约 6 秒。尾随入室通常需要门保持较长时间的打开状态,或出现门反复开关的模式,这里并未出现。\",\n \"推理步骤3: 玄关运动传感器在 17:12:04 和 17:12:12 两次检测到有人,客厅运动传感器在 17:12:10 和 17:12:15 检测到有人,次卧运动传感器在 17:12:15 检测到有人。运动轨迹为:玄关→客厅→次卧,这是一条典型的归家后进入房间的路径,动线连贯合理。\",\n \"推理步骤4: 整个过程中入户门只开关了一次,没有出现二次开门或门长时间未关闭的情况。如果有尾随者,通常会看到门打开时间延长、门在关闭后短时间内再次打开、或者多个不同区域同时出现不符合单人动线的运动检测。这些特征均未出现。\",\n \"推理步骤5: 17:12 正值傍晚下班时段,住户归家时间合理。全天其余时段无任何入户门、门锁或玄关的异常事件,温度数据也呈现正常的昼夜变化曲线(夜间约 22.9°C,午间峰值约 25.9°C),无任何设备异常。\",\n \"推理步骤6: 日志中没有任何报警器触发(烟雾、漏水)、窗户/阳台门异常开启、或未授权的门锁操作事件,整体家庭安全状态正常。\"\n ],\n \"key_evidence\": [\n \"门锁通过 OperationSource=3(本地凭证)、UserIndex=1(注册主用户)合法解锁,确认为授权操作\",\n \"入户门仅开启约 6 秒即关闭(17:12:02 开 → 17:12:08 关),无二次开门或长时间敞开\",\n \"运动传感器轨迹为 玄关→客厅→次卧,符合单人归家的连贯动线\",\n \"全天仅此一次入户事件,无其他可疑的门窗或运动传感器触发\"\n ],\n \"recommended_actions\": [\n \"当前无需采取应急措施,本次事件判定为正常住户归家\",\n \"如仍有疑虑,可查看入户门处的摄像头录像(如有)确认进入人数\",\n \"建议保持尾随检测规则但调优阈值:可将门打开持续时间超过 15 秒、或关门后 30 秒内再次开门作为尾随告警的触发条件,以减少误报\",\n \"可考虑在玄关增设人数统计传感器(如 ToF 或双红外对射),从硬件层面精确检测是否有多人同时通过门口\"\n ]\n}\n```", "model_response": {"is_anomaly": false, "confidence": "high", "threat_type": "none", "threat_description": "17:12 的入户事件为正常住户归家,未发现尾随入室的证据。", "reasoning": ["推理步骤1: 17:12 入户门锁通过合法方式解锁——LockOperationType=1(Lock/正常操作),OperationSource=3(通常对应密码/指纹/本地凭证),UserIndex=1(已注册的主用户)。这说明是授权用户主动开门,而非被撬或异常方式打开。", "推理步骤2: 门锁解锁后,入户门传感器在 17:12:02 变为 False(门打开),17:12:08 变为 True(门关闭),开门持续仅约 6 秒。尾随入室通常需要门保持较长时间的打开状态,或出现门反复开关的模式,这里并未出现。", "推理步骤3: 玄关运动传感器在 17:12:04 和 17:12:12 两次检测到有人,客厅运动传感器在 17:12:10 和 17:12:15 检测到有人,次卧运动传感器在 17:12:15 检测到有人。运动轨迹为:玄关→客厅→次卧,这是一条典型的归家后进入房间的路径,动线连贯合理。", "推理步骤4: 整个过程中入户门只开关了一次,没有出现二次开门或门长时间未关闭的情况。如果有尾随者,通常会看到门打开时间延长、门在关闭后短时间内再次打开、或者多个不同区域同时出现不符合单人动线的运动检测。这些特征均未出现。", "推理步骤5: 17:12 正值傍晚下班时段,住户归家时间合理。全天其余时段无任何入户门、门锁或玄关的异常事件,温度数据也呈现正常的昼夜变化曲线(夜间约 22.9°C,午间峰值约 25.9°C),无任何设备异常。", "推理步骤6: 日志中没有任何报警器触发(烟雾、漏水)、窗户/阳台门异常开启、或未授权的门锁操作事件,整体家庭安全状态正常。"], "key_evidence": ["门锁通过 OperationSource=3(本地凭证)、UserIndex=1(注册主用户)合法解锁,确认为授权操作", "入户门仅开启约 6 秒即关闭(17:12:02 开 → 17:12:08 关),无二次开门或长时间敞开", "运动传感器轨迹为 玄关→客厅→次卧,符合单人归家的连贯动线", "全天仅此一次入户事件,无其他可疑的门窗或运动传感器触发"], "recommended_actions": ["当前无需采取应急措施,本次事件判定为正常住户归家", "如仍有疑虑,可查看入户门处的摄像头录像(如有)确认进入人数", "建议保持尾随检测规则但调优阈值:可将门打开持续时间超过 15 秒、或关门后 30 秒内再次开门作为尾随告警的触发条件,以减少误报", "可考虑在玄关增设人数统计传感器(如 ToF 或双红外对射),从硬件层面精确检测是否有多人同时通过门口"]}, "scores": {"parse_success": true, "detection_correct": false, "detection_label": "MISS", "is_miss": true, "is_false_alarm": false, "threat_type_correct": null, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.922939777374268, "api_error": null} {"episode_id": "SQ5_TP_C_1107", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1107.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-08T00:00:00", "seed": 20261736, "scenario_id": "FG-03", "total_events": 259, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "kitchen", "injection_time": "2026-06-08T16:54:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"health_concern\",\n \"threat_description\": \"厨房烟雾报警器于16:54检测到一氧化碳(CO)浓度升高并触发CO警报,家中有儿童在场,存在中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 16:54厨房烟雾报警器报告COState=1(CO检测到异常)、ExpressedState=2(警报激活状态)并触发COAlarm事件,确认CO浓度已达到报警阈值。\",\n \"推理步骤2: 回溯上下文,15:55有人通过前门进入,儿童房运动传感器随即触发(15:55:08),说明此时家中有儿童在场,CO泄漏对儿童健康威胁更大。\",\n \"推理步骤3: 报警时厨房灶具处于关闭状态(早晨06:50已关闭,晚间18:27才重新开启),排除当时正在烹饪导致的正常燃烧废气。CO来源可能是燃气管道微漏、热水器排气不畅或其他燃气设备故障。\",\n \"推理步骤4: 06:50:30厨房窗户曾被打开(StateValue=False表示非闭合),但日志中未见该窗户关闭的记录,说明厨房可能有一定通风,但CO仍然达到报警浓度,表明泄漏量不容忽视。\",\n \"推理步骤5: 厨房温度传感器在06:50和06:51连续报告MeasuredValue=None,18:28和19:08也出现None值,该传感器存在间歇性故障,可能影响对厨房环境的综合监测能力。\",\n \"推理步骤6: 报警发生后日志中未见任何人工消警、开窗通风或设备联动响应的记录,CO警报状态可能持续存在,需要立即人工干预。\"\n ],\n \"key_evidence\": [\n \"16:54:00 kitchen_smoke_alarm COState=1,确认检测到一氧化碳\",\n \"16:54:00 kitchen_smoke_alarm ExpressedState=2,报警器进入警报激活状态\",\n \"16:54:00 kitchen_smoke_alarm 触发COAlarm事件\",\n \"报警时厨房灶具处于关闭状态(06:50已关),非烹饪产生的正常燃烧废气\",\n \"15:55:08 儿童房运动传感器触发,确认报警时家中有儿童在场\",\n \"厨房温度传感器多次报告None值,存在传感器故障,削弱环境监测能力\"\n ],\n \"recommended_actions\": [\n \"【立即】通知所有在家人员(尤其是儿童)立即撤离至室外通风处,不要使用明火或电气开关\",\n \"【立即】远程或手动打开所有门窗进行通风:开启厨房窗户、阳台门、客厅窗帘/窗户,最大化空气流通\",\n \"【立即】关闭家中燃气总阀,切断可能的CO泄漏源\",\n \"【立即】拨打燃气公司紧急热线和119报警,请求专业人员上门检测CO来源\",\n \"【紧急】如有人出现头晕、恶心、头痛等CO中毒症状,立即拨打120急救电话\",\n \"【短期】联系专业人员检查厨房燃气灶具、热水器、燃气管道等所有可能的CO排放源\",\n \"【短期】检修厨房温度传感器(多次报告None值),确保环境监测系统完整可靠\",\n \"【长期】建议在厨房和其他有燃气设备的房间增设独立CO探测器,实现多点监测\",\n \"【长期】配置CO报警联动自动化规则:触发时自动关闭燃气阀门、打开门窗、开启排风、推送紧急通知到所有家庭成员手机\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "health_concern", "threat_description": "厨房烟雾报警器于16:54检测到一氧化碳(CO)浓度升高并触发CO警报,家中有儿童在场,存在中毒风险。", "reasoning": ["推理步骤1: 16:54厨房烟雾报警器报告COState=1(CO检测到异常)、ExpressedState=2(警报激活状态)并触发COAlarm事件,确认CO浓度已达到报警阈值。", "推理步骤2: 回溯上下文,15:55有人通过前门进入,儿童房运动传感器随即触发(15:55:08),说明此时家中有儿童在场,CO泄漏对儿童健康威胁更大。", "推理步骤3: 报警时厨房灶具处于关闭状态(早晨06:50已关闭,晚间18:27才重新开启),排除当时正在烹饪导致的正常燃烧废气。CO来源可能是燃气管道微漏、热水器排气不畅或其他燃气设备故障。", "推理步骤4: 06:50:30厨房窗户曾被打开(StateValue=False表示非闭合),但日志中未见该窗户关闭的记录,说明厨房可能有一定通风,但CO仍然达到报警浓度,表明泄漏量不容忽视。", "推理步骤5: 厨房温度传感器在06:50和06:51连续报告MeasuredValue=None,18:28和19:08也出现None值,该传感器存在间歇性故障,可能影响对厨房环境的综合监测能力。", "推理步骤6: 报警发生后日志中未见任何人工消警、开窗通风或设备联动响应的记录,CO警报状态可能持续存在,需要立即人工干预。"], "key_evidence": ["16:54:00 kitchen_smoke_alarm COState=1,确认检测到一氧化碳", "16:54:00 kitchen_smoke_alarm ExpressedState=2,报警器进入警报激活状态", "16:54:00 kitchen_smoke_alarm 触发COAlarm事件", "报警时厨房灶具处于关闭状态(06:50已关),非烹饪产生的正常燃烧废气", "15:55:08 儿童房运动传感器触发,确认报警时家中有儿童在场", "厨房温度传感器多次报告None值,存在传感器故障,削弱环境监测能力"], "recommended_actions": ["【立即】通知所有在家人员(尤其是儿童)立即撤离至室外通风处,不要使用明火或电气开关", "【立即】远程或手动打开所有门窗进行通风:开启厨房窗户、阳台门、客厅窗帘/窗户,最大化空气流通", "【立即】关闭家中燃气总阀,切断可能的CO泄漏源", "【立即】拨打燃气公司紧急热线和119报警,请求专业人员上门检测CO来源", "【紧急】如有人出现头晕、恶心、头痛等CO中毒症状,立即拨打120急救电话", "【短期】联系专业人员检查厨房燃气灶具、热水器、燃气管道等所有可能的CO排放源", "【短期】检修厨房温度传感器(多次报告None值),确保环境监测系统完整可靠", "【长期】建议在厨房和其他有燃气设备的房间增设独立CO探测器,实现多点监测", "【长期】配置CO报警联动自动化规则:触发时自动关闭燃气阀门、打开门窗、开启排风、推送紧急通知到所有家庭成员手机"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.87697196006775, "api_error": null} {"episode_id": "SQ5_TP_C_1114", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1114.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-27T00:00:00", "seed": 20261743, "scenario_id": "INS-03", "total_events": 200, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-27T17:19:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"17:19 入户时检测到多人同时进入,客厅和次卧几乎同时出现占用信号,疑似有人尾随合法用户入室。\",\n \"reasoning\": [\n \"推理步骤1: 17:19:00 门锁通过合法方式开启(LockOperationType=1 解锁,OperationSource=3 为密码/指纹等本地操作,UserIndex=1 为注册用户),这是正常的回家行为。\",\n \"推理步骤2: 17:19:02 入户门打开,17:19:04 玄关检测到人,17:19:08 入户门关闭——从开门到关门仅6秒,时间合理。但随后 17:19:10 客厅检测到占用,17:19:12 玄关再次检测到占用(或持续占用),17:19:15 次卧和客厅同时检测到占用。\",\n \"推理步骤3: 关键异常在于 17:19:15 时刻客厅和次卧同时有人。一个人从玄关走到客厅再到次卧需要时间,不可能同时出现在两个不同房间。这表明至少有两人在室内活动。\",\n \"推理步骤4: 门锁记录仅有一次解锁事件(UserIndex=1),没有第二次合法开锁记录。如果是家庭成员同行,通常只需一次开锁,但次卧的即时占用模式暗示第二人直奔次卧,行为模式不像正常家庭成员一起回家(通常会先在客厅/玄关短暂停留)。\",\n \"推理步骤5: 全天直到17:19之前,所有运动传感器无任何触发记录,说明白天家中无人,这是一个空巢时段。尾随者可能观察到住户回家时机趁机跟入。\"\n ],\n \"key_evidence\": [\n \"17:19:15 客厅(living_room_occupancy)和次卧(second_bedroom_occupancy)同时检测到占用,单人不可能同时出现在两个房间\",\n \"门锁仅记录一次合法用户(UserIndex=1)解锁,无第二人的独立开锁记录\",\n \"17:19:12 玄关在用户已移动到客厅后再次检测到占用,暗示玄关仍有第二人\"\n ],\n \"recommended_actions\": [\n \"立即通过手机推送高优先级警报通知户主,确认是否有同行人员(家人/朋友),排除误报\",\n \"若户主确认无同行人员,立即远程锁定入户门(防止嫌疑人逃离或再次进入),并拨打110报警\",\n \"激活全屋灯光(尤其次卧、客厅、玄关),制造威慑效果,让入侵者知道已被发现\",\n \"如有摄像头或录像设备,立即开启录制并保存17:19前后的所有传感器日志作为证据\",\n \"通知物业安保人员前往查看,同时提醒户主在确认安全前不要独自进入次卧\",\n \"事后建议:在入户门外加装摄像头,设置尾随检测自动化规则(门锁单次开启后多房间同时占用即触发警报)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "17:19 入户时检测到多人同时进入,客厅和次卧几乎同时出现占用信号,疑似有人尾随合法用户入室。", "reasoning": ["推理步骤1: 17:19:00 门锁通过合法方式开启(LockOperationType=1 解锁,OperationSource=3 为密码/指纹等本地操作,UserIndex=1 为注册用户),这是正常的回家行为。", "推理步骤2: 17:19:02 入户门打开,17:19:04 玄关检测到人,17:19:08 入户门关闭——从开门到关门仅6秒,时间合理。但随后 17:19:10 客厅检测到占用,17:19:12 玄关再次检测到占用(或持续占用),17:19:15 次卧和客厅同时检测到占用。", "推理步骤3: 关键异常在于 17:19:15 时刻客厅和次卧同时有人。一个人从玄关走到客厅再到次卧需要时间,不可能同时出现在两个不同房间。这表明至少有两人在室内活动。", "推理步骤4: 门锁记录仅有一次解锁事件(UserIndex=1),没有第二次合法开锁记录。如果是家庭成员同行,通常只需一次开锁,但次卧的即时占用模式暗示第二人直奔次卧,行为模式不像正常家庭成员一起回家(通常会先在客厅/玄关短暂停留)。", "推理步骤5: 全天直到17:19之前,所有运动传感器无任何触发记录,说明白天家中无人,这是一个空巢时段。尾随者可能观察到住户回家时机趁机跟入。"], "key_evidence": ["17:19:15 客厅(living_room_occupancy)和次卧(second_bedroom_occupancy)同时检测到占用,单人不可能同时出现在两个房间", "门锁仅记录一次合法用户(UserIndex=1)解锁,无第二人的独立开锁记录", "17:19:12 玄关在用户已移动到客厅后再次检测到占用,暗示玄关仍有第二人"], "recommended_actions": ["立即通过手机推送高优先级警报通知户主,确认是否有同行人员(家人/朋友),排除误报", "若户主确认无同行人员,立即远程锁定入户门(防止嫌疑人逃离或再次进入),并拨打110报警", "激活全屋灯光(尤其次卧、客厅、玄关),制造威慑效果,让入侵者知道已被发现", "如有摄像头或录像设备,立即开启录制并保存17:19前后的所有传感器日志作为证据", "通知物业安保人员前往查看,同时提醒户主在确认安全前不要独自进入次卧", "事后建议:在入户门外加装摄像头,设置尾随检测自动化规则(门锁单次开启后多房间同时占用即触发警报)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 23.94174337387085, "api_error": null} {"episode_id": "SQ5_TP_C_1098", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_C_1098.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "C", "layout_name": "三室两厅 (3BR)", "profile_id": "family_with_children", "base_date": "2026-06-16T00:00:00", "seed": 20261727, "scenario_id": "INS-03", "total_events": 264, "anomaly_events_count": 8}, "ground_truth": {"scenario_id": "INS-03", "scenario_name": "尾随入室", "category": "intrusion", "is_anomaly": true, "threat_type": "tailgating_intrusion", "key_evidence": ["门关闭后玄关再次检测到运动", "同时有两个不相邻房间的运动信号(住户在客厅,另一人在次卧)", "住户是独居的情况下不应有第二个人"], "expected_response": "疑似尾随入侵警报,建议住户确认是否有同行人", "difficulty": "medium", "target_room": "master_bedroom", "injection_time": "2026-06-16T18:36:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"medium\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:36 入户门解锁后,短时间内多个房间同时检测到占用,疑似有未授权人员尾随家庭成员进入室内。\",\n \"reasoning\": [\n \"推理步骤1: 分析当天三次入户事件。第一次 07:12 出门(多灯关闭→开锁→关门→自动上锁),第二次 16:32 有人回家(开锁→开门→玄关有人→儿童房有人→开灯,符合孩子放学回家模式),第三次 17:41 又有人回家(开锁→开门→玄关有人→客厅有人→开灯开空调,符合成人下班回家模式)。这三次均为正常单人进出,运动传感器触发呈线性移动路径。\",\n \"推理步骤2: 重点分析 18:36 第四次入户事件。门锁以 OperationSource=3(远程/密码方式)由 UserIndex=1 解锁,门开(18:36:02)→门关(18:36:08)→仅6秒开门时间内,玄关(18:36:04)和客厅(18:36:10)几乎同时检测到有人。更关键的是 18:36:15 时刻,second_bedroom_occupancy 和 living_room_occupancy 同时报告占用=1,说明至少有两个人在不同房间同时存在。\",\n \"推理步骤3: 此时家中已有人(16:32 孩子在儿童房,17:41 成人在客厅),18:36 又有人进门。进门后 second_bedroom(次卧)立即检测到有人,而此前次卧全天无任何活动记录。一个正常归家的家庭成员不太可能在进门几秒内就出现在次卧,且同时客厅也有人——这意味着进门的不止一个人,或者有人尾随进入后直接进入了次卧。\",\n \"推理步骤4: 补充疑点:18:36 这次开锁后,日志中没有记录门锁重新上锁(前几次进出都有自动上锁记录),直到 22:43 才出现锁门记录,说明门可能长时间处于未锁状态,增加了安全风险。\",\n \"推理步骤5: 不过也存在合理解释的可能:UserIndex=1 通常是户主,可能是户主带了一位访客回家,访客被安排在次卧。因此置信度定为 medium 而非 high。\"\n ],\n \"key_evidence\": [\n \"18:36:15 second_bedroom_occupancy 和 living_room_occupancy 同时报告有人,而此前次卧全天无任何活动\",\n \"18:36 开锁后仅 13 秒内,玄关、客厅、次卧三个不同区域先后/同时检测到占用,移动速度不符合单人行为\",\n \"18:36 入户后门锁未记录自动上锁事件,与 07:12 出门时的自动上锁行为不一致\",\n \"该次开锁方式为 OperationSource=3(远程/密码),与当天其他手动开锁(OperationSource=Manual)方式不同\"\n ],\n \"recommended_actions\": [\n \"立即通过智能家居系统向户主手机推送安全警报,确认 18:36 进入次卧的人员是否为已知访客或家庭成员\",\n \"远程激活客厅和玄关区域的摄像头(如有),回放 18:36 前后的录像,确认进入人数和身份\",\n \"如户主确认无访客,立即远程锁定入户门(DoorLock.LockState→1),并触发全屋警戒模式(开启所有灯光、发出警报声)\",\n \"检查入户门锁 UserIndex=1 的凭证是否泄露,建议更换该用户的开锁密码/凭证\",\n \"启用门锁自动上锁策略,确保每次关门后自动上锁,避免长时间未锁定的安全漏洞\",\n \"在次卧和玄关增设摄像头或门磁传感器,提升对尾随入侵场景的检测能力\",\n \"如确认为入侵,立即报警并保留所有设备日志作为证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "medium", "threat_type": "intrusion", "threat_description": "18:36 入户门解锁后,短时间内多个房间同时检测到占用,疑似有未授权人员尾随家庭成员进入室内。", "reasoning": ["推理步骤1: 分析当天三次入户事件。第一次 07:12 出门(多灯关闭→开锁→关门→自动上锁),第二次 16:32 有人回家(开锁→开门→玄关有人→儿童房有人→开灯,符合孩子放学回家模式),第三次 17:41 又有人回家(开锁→开门→玄关有人→客厅有人→开灯开空调,符合成人下班回家模式)。这三次均为正常单人进出,运动传感器触发呈线性移动路径。", "推理步骤2: 重点分析 18:36 第四次入户事件。门锁以 OperationSource=3(远程/密码方式)由 UserIndex=1 解锁,门开(18:36:02)→门关(18:36:08)→仅6秒开门时间内,玄关(18:36:04)和客厅(18:36:10)几乎同时检测到有人。更关键的是 18:36:15 时刻,second_bedroom_occupancy 和 living_room_occupancy 同时报告占用=1,说明至少有两个人在不同房间同时存在。", "推理步骤3: 此时家中已有人(16:32 孩子在儿童房,17:41 成人在客厅),18:36 又有人进门。进门后 second_bedroom(次卧)立即检测到有人,而此前次卧全天无任何活动记录。一个正常归家的家庭成员不太可能在进门几秒内就出现在次卧,且同时客厅也有人——这意味着进门的不止一个人,或者有人尾随进入后直接进入了次卧。", "推理步骤4: 补充疑点:18:36 这次开锁后,日志中没有记录门锁重新上锁(前几次进出都有自动上锁记录),直到 22:43 才出现锁门记录,说明门可能长时间处于未锁状态,增加了安全风险。", "推理步骤5: 不过也存在合理解释的可能:UserIndex=1 通常是户主,可能是户主带了一位访客回家,访客被安排在次卧。因此置信度定为 medium 而非 high。"], "key_evidence": ["18:36:15 second_bedroom_occupancy 和 living_room_occupancy 同时报告有人,而此前次卧全天无任何活动", "18:36 开锁后仅 13 秒内,玄关、客厅、次卧三个不同区域先后/同时检测到占用,移动速度不符合单人行为", "18:36 入户后门锁未记录自动上锁事件,与 07:12 出门时的自动上锁行为不一致", "该次开锁方式为 OperationSource=3(远程/密码),与当天其他手动开锁(OperationSource=Manual)方式不同"], "recommended_actions": ["立即通过智能家居系统向户主手机推送安全警报,确认 18:36 进入次卧的人员是否为已知访客或家庭成员", "远程激活客厅和玄关区域的摄像头(如有),回放 18:36 前后的录像,确认进入人数和身份", "如户主确认无访客,立即远程锁定入户门(DoorLock.LockState→1),并触发全屋警戒模式(开启所有灯光、发出警报声)", "检查入户门锁 UserIndex=1 的凭证是否泄露,建议更换该用户的开锁密码/凭证", "启用门锁自动上锁策略,确保每次关门后自动上锁,避免长时间未锁定的安全漏洞", "在次卧和玄关增设摄像头或门磁传感器,提升对尾随入侵场景的检测能力", "如确认为入侵,立即报警并保留所有设备日志作为证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "medium"}, "latency": 107.96126675605774, "api_error": null} {"episode_id": "SQ5_TP_D_1012", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1012.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-12T00:00:00", "seed": 20261641, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "bedroom", "injection_time": "2026-06-12T09:16:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"08:36 入户门被手动开锁进入,但老人06:59已外出且未返回,疑似被盗/复制凭证的伪装开锁入侵。\",\n \"reasoning\": [\n \"推理步骤1: 老人05:33起床,05:39去卫生间,06:07进厨房做早餐,06:40关灶,06:59手动开锁出门(LockOperationType=1, OperationSource=Manual),门关后自动上锁(LockState=1),这是正常的外出流程。\",\n \"推理步骤2: 08:36门锁再次被手动解锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关和客厅运动传感器依次触发,客厅灯被打开。但此时老人应在外出状态——没有任何证据表明老人在06:59至08:36之间返回过家中。\",\n \"推理步骤3: 关键异常——08:36的开锁事件使用的是 Manual(手动)方式,而非密码、指纹或远程等可追溯方式。对于独居老人的家,如果是老人本人返回,通常会使用与出门时相同的方式。更重要的是,这次开锁后门并未记录关门和自动上锁事件,说明入侵者可能让门保持了开启状态。\",\n \"推理步骤4: 09:16出现了第二次可疑开锁——OperationSource=8(非标准来源),携带UserIndex=1,这可能是通过复制/盗取的数字凭证(如被克隆的NFC卡、被盗的PIN码)远程或以编程方式开锁。进入后客厅灯被关闭(OnOff=False),行为模式与正常住户不同。\",\n \"推理步骤5: 08:36进入者在客厅活动后,直到09:16第二次开锁之间没有任何离开记录。09:16之后也没有明确的离开事件。而老人真正回家的迹象直到约12:32才出现(客厅灯关闭、卧室有人、拉窗帘午休),说明08:36-09:16期间家中的活动并非老人所为。\",\n \"推理步骤6: 两次入侵间隔约40分钟,且使用不同的开锁方式(Manual和Source=8),高度怀疑凭证已被复制或盗取,入侵者可能不止一人或多次尝试进入。\"\n ],\n \"key_evidence\": [\n \"06:59老人手动开锁外出,门自动上锁(LockState=1),此后无返回记录\",\n \"08:36门锁被Manual方式解锁(LockOperationType=1),但老人仍在外——无法解释谁在开门\",\n \"08:36开锁后门未记录关闭和自动上锁事件,门可能处于敞开状态\",\n \"09:16门锁被OperationSource=8(非标准/可疑来源)以UserIndex=1解锁,疑似使用被盗/克隆的数字凭证\",\n \"09:16进入后客厅灯被关闭,行为模式异常——正常访客不会主动关灯\",\n \"08:36至12:32之间的活动模式与老人日常习惯不符\"\n ],\n \"recommended_actions\": [\n \"立即锁定门锁:远程发送Lock指令将入户门锁强制上锁,阻止进一步出入\",\n \"凭证失效与重置:立即作废当前所有门锁凭证(PIN码、NFC卡、指纹),为老人重新录入全新凭证,特别关注UserIndex=1对应的凭证\",\n \"紧急联系:立即通知老人本人确认是否知情,同时通知紧急联系人(子女/社区)和物业安保\",\n \"报警处理:联系警方报案,提供08:36和09:16两次异常开锁的完整日志作为证据\",\n \"查看监控录像:如有门口摄像头,调取06:59至10:00时段的录像,确认入侵者身份\",\n \"全屋安全检查:老人回家前安排人员检查家中是否有财物丢失、设备被篡改、或隐藏的安全隐患\",\n \"门锁安全升级:考虑升级门锁固件,启用开锁异常告警(如非常规时段/非常规方式开锁时即时推送通知),并启用双因素认证(如密码+指纹)\",\n \"设置自动化规则:当老人外出状态下检测到任何开锁事件时,立即触发高优先级告警并推送至紧急联系人\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "08:36 入户门被手动开锁进入,但老人06:59已外出且未返回,疑似被盗/复制凭证的伪装开锁入侵。", "reasoning": ["推理步骤1: 老人05:33起床,05:39去卫生间,06:07进厨房做早餐,06:40关灶,06:59手动开锁出门(LockOperationType=1, OperationSource=Manual),门关后自动上锁(LockState=1),这是正常的外出流程。", "推理步骤2: 08:36门锁再次被手动解锁(LockOperationType=1, OperationSource=Manual),门被打开(StateValue=False),玄关和客厅运动传感器依次触发,客厅灯被打开。但此时老人应在外出状态——没有任何证据表明老人在06:59至08:36之间返回过家中。", "推理步骤3: 关键异常——08:36的开锁事件使用的是 Manual(手动)方式,而非密码、指纹或远程等可追溯方式。对于独居老人的家,如果是老人本人返回,通常会使用与出门时相同的方式。更重要的是,这次开锁后门并未记录关门和自动上锁事件,说明入侵者可能让门保持了开启状态。", "推理步骤4: 09:16出现了第二次可疑开锁——OperationSource=8(非标准来源),携带UserIndex=1,这可能是通过复制/盗取的数字凭证(如被克隆的NFC卡、被盗的PIN码)远程或以编程方式开锁。进入后客厅灯被关闭(OnOff=False),行为模式与正常住户不同。", "推理步骤5: 08:36进入者在客厅活动后,直到09:16第二次开锁之间没有任何离开记录。09:16之后也没有明确的离开事件。而老人真正回家的迹象直到约12:32才出现(客厅灯关闭、卧室有人、拉窗帘午休),说明08:36-09:16期间家中的活动并非老人所为。", "推理步骤6: 两次入侵间隔约40分钟,且使用不同的开锁方式(Manual和Source=8),高度怀疑凭证已被复制或盗取,入侵者可能不止一人或多次尝试进入。"], "key_evidence": ["06:59老人手动开锁外出,门自动上锁(LockState=1),此后无返回记录", "08:36门锁被Manual方式解锁(LockOperationType=1),但老人仍在外——无法解释谁在开门", "08:36开锁后门未记录关闭和自动上锁事件,门可能处于敞开状态", "09:16门锁被OperationSource=8(非标准/可疑来源)以UserIndex=1解锁,疑似使用被盗/克隆的数字凭证", "09:16进入后客厅灯被关闭,行为模式异常——正常访客不会主动关灯", "08:36至12:32之间的活动模式与老人日常习惯不符"], "recommended_actions": ["立即锁定门锁:远程发送Lock指令将入户门锁强制上锁,阻止进一步出入", "凭证失效与重置:立即作废当前所有门锁凭证(PIN码、NFC卡、指纹),为老人重新录入全新凭证,特别关注UserIndex=1对应的凭证", "紧急联系:立即通知老人本人确认是否知情,同时通知紧急联系人(子女/社区)和物业安保", "报警处理:联系警方报案,提供08:36和09:16两次异常开锁的完整日志作为证据", "查看监控录像:如有门口摄像头,调取06:59至10:00时段的录像,确认入侵者身份", "全屋安全检查:老人回家前安排人员检查家中是否有财物丢失、设备被篡改、或隐藏的安全隐患", "门锁安全升级:考虑升级门锁固件,启用开锁异常告警(如非常规时段/非常规方式开锁时即时推送通知),并启用双因素认证(如密码+指纹)", "设置自动化规则:当老人外出状态下检测到任何开锁事件时,立即触发高优先级告警并推送至紧急联系人"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.02024292945862, "api_error": null} {"episode_id": "SQ5_TP_D_1016", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1016.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261645, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-08T20:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅一氧化碳(CO)报警器于20:10触发警报,老人在未做出任何应急处理的情况下继续正常就寝,存在严重的CO中毒风险。\",\n \"reasoning\": [\n \"推理步骤1: 20:10客厅烟雾/CO报警器报告 COState=1(CO警告)、ExpressedState=2(CO报警激活)并触发 COAlarm 事件,确认CO浓度已达到报警阈值。\",\n \"推理步骤2: 回溯CO可能来源——17:06-17:30厨房灶具使用了约24分钟,关火后厨房温度传感器在17:31仍报告None(可能受热影响),但灶具已于17:30关闭,距CO报警约2.5小时。更可能的来源是燃气灶不完全燃烧残留、燃气管道微漏,或室内其他燃烧源(如热水器)产生的CO在封闭环境中逐渐积累。\",\n \"推理步骤3: 报警触发时老人在客厅(19:31客厅有运动检测且灯光调暗至19%亮度),但报警后老人的行为序列为:20:33关客厅灯→去卫生间→20:37回卧室→关窗帘→关灯就寝。全程未见开窗(窗户contact传感器无变化)、未见开门通风(入户门保持关闭上锁状态),说明老人可能未意识到CO报警的严重性或听力/认知能力不足以做出正确应急反应。\",\n \"推理步骤4: 20:37卧室窗帘完全关闭(10000=100%关闭),卧室窗户传感器全天无开启记录,意味着卧室处于密闭状态。如果CO已扩散至卧室,老人在睡眠中将持续暴露于CO环境,极度危险。\",\n \"推理步骤5: 报警后直至23:30日志结束,未见CO报警解除(无COState=0的记录),说明CO浓度可能持续处于危险水平。厨房烟雾报警器未触发,提示CO源更可能在客厅附近或为全屋性扩散。\",\n \"推理步骤6: 该住户为独居老人,无其他家庭成员可协助应急,CO中毒风险因无人监护而显著放大。\"\n ],\n \"key_evidence\": [\n \"20:10 客厅CO报警触发:COState=1, ExpressedState=2, Event:COAlarm()\",\n \"报警后至日志结束(23:30)无CO解除记录,警报持续超过3小时\",\n \"全天所有窗户contact传感器无开启记录(bedroom_window_contact、living_room_window_contact均无StateValue=False),室内无通风\",\n \"入户门在20:37确认为关闭上锁状态(StateValue=True, LockState=1),无开门通风操作\",\n \"老人在CO报警后23分钟内正常就寝(20:37关灯、关窗帘),未采取任何应急措施\",\n \"厨房灶具当天使用三次(06:01、11:09、17:06),最后一次关闭后2.5小时触发CO报警,提示可能存在不完全燃烧或燃气泄漏\"\n ],\n \"recommended_actions\": [\n \"【立即】远程联系老人或其紧急联系人,确认老人当前状态,如无法联系应立即拨打119/120请求上门救援\",\n \"【立即】远程开启客厅和卧室窗帘(WindowCovering打开),如窗户支持远程控制则立即开窗通风;远程解锁入户门锁以便救援人员进入\",\n \"【立即】关闭家中燃气总阀(如有智能燃气阀),切断可能的CO产生源\",\n \"【立即】开启客厅和卧室所有灯光至最大亮度,尝试唤醒老人\",\n \"【短期】安排专业人员检查燃气灶具、热水器、烟道等可能的CO泄漏源,排查不完全燃烧问题\",\n \"【短期】检查厨房温度传感器多次报告None的故障原因,确保传感器工作正常以辅助异常检测\",\n \"【中期】在卧室增设独立CO报警器,确保老人睡眠区域有直接的CO监测能力\",\n \"【中期】配置CO报警联动自动化规则:触发时自动开窗通风、开启所有灯光、向紧急联系人发送通知、触发本地声光警报\",\n \"【中期】为独居老人配备可穿戴紧急呼叫设备或跌倒检测设备,弥补老人可能无法自主应急的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅一氧化碳(CO)报警器于20:10触发警报,老人在未做出任何应急处理的情况下继续正常就寝,存在严重的CO中毒风险。", "reasoning": ["推理步骤1: 20:10客厅烟雾/CO报警器报告 COState=1(CO警告)、ExpressedState=2(CO报警激活)并触发 COAlarm 事件,确认CO浓度已达到报警阈值。", "推理步骤2: 回溯CO可能来源——17:06-17:30厨房灶具使用了约24分钟,关火后厨房温度传感器在17:31仍报告None(可能受热影响),但灶具已于17:30关闭,距CO报警约2.5小时。更可能的来源是燃气灶不完全燃烧残留、燃气管道微漏,或室内其他燃烧源(如热水器)产生的CO在封闭环境中逐渐积累。", "推理步骤3: 报警触发时老人在客厅(19:31客厅有运动检测且灯光调暗至19%亮度),但报警后老人的行为序列为:20:33关客厅灯→去卫生间→20:37回卧室→关窗帘→关灯就寝。全程未见开窗(窗户contact传感器无变化)、未见开门通风(入户门保持关闭上锁状态),说明老人可能未意识到CO报警的严重性或听力/认知能力不足以做出正确应急反应。", "推理步骤4: 20:37卧室窗帘完全关闭(10000=100%关闭),卧室窗户传感器全天无开启记录,意味着卧室处于密闭状态。如果CO已扩散至卧室,老人在睡眠中将持续暴露于CO环境,极度危险。", "推理步骤5: 报警后直至23:30日志结束,未见CO报警解除(无COState=0的记录),说明CO浓度可能持续处于危险水平。厨房烟雾报警器未触发,提示CO源更可能在客厅附近或为全屋性扩散。", "推理步骤6: 该住户为独居老人,无其他家庭成员可协助应急,CO中毒风险因无人监护而显著放大。"], "key_evidence": ["20:10 客厅CO报警触发:COState=1, ExpressedState=2, Event:COAlarm()", "报警后至日志结束(23:30)无CO解除记录,警报持续超过3小时", "全天所有窗户contact传感器无开启记录(bedroom_window_contact、living_room_window_contact均无StateValue=False),室内无通风", "入户门在20:37确认为关闭上锁状态(StateValue=True, LockState=1),无开门通风操作", "老人在CO报警后23分钟内正常就寝(20:37关灯、关窗帘),未采取任何应急措施", "厨房灶具当天使用三次(06:01、11:09、17:06),最后一次关闭后2.5小时触发CO报警,提示可能存在不完全燃烧或燃气泄漏"], "recommended_actions": ["【立即】远程联系老人或其紧急联系人,确认老人当前状态,如无法联系应立即拨打119/120请求上门救援", "【立即】远程开启客厅和卧室窗帘(WindowCovering打开),如窗户支持远程控制则立即开窗通风;远程解锁入户门锁以便救援人员进入", "【立即】关闭家中燃气总阀(如有智能燃气阀),切断可能的CO产生源", "【立即】开启客厅和卧室所有灯光至最大亮度,尝试唤醒老人", "【短期】安排专业人员检查燃气灶具、热水器、烟道等可能的CO泄漏源,排查不完全燃烧问题", "【短期】检查厨房温度传感器多次报告None的故障原因,确保传感器工作正常以辅助异常检测", "【中期】在卧室增设独立CO报警器,确保老人睡眠区域有直接的CO监测能力", "【中期】配置CO报警联动自动化规则:触发时自动开窗通风、开启所有灯光、向紧急联系人发送通知、触发本地声光警报", "【中期】为独居老人配备可穿戴紧急呼叫设备或跌倒检测设备,弥补老人可能无法自主应急的风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 33.41455006599426, "api_error": null} {"episode_id": "SQ5_TP_D_1031", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1031.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-16T00:00:00", "seed": 20261660, "scenario_id": "WD-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "WD-03", "scenario_name": "无人在家时漏水持续", "category": "water_damage", "is_anomaly": true, "threat_type": "unattended_water_leak", "key_evidence": ["漏水传感器持续触发超过10分钟", "全屋无人(所有 occupancy = 0,门锁为 Locked)", "无人处理导致损失持续扩大"], "expected_response": "紧急通知住户,如有智能水阀立即关闭", "difficulty": "medium", "target_room": "bathroom", "injection_time": "2026-06-16T15:59:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"water_leak\",\n \"threat_description\": \"卫生间漏水传感器在无人在家期间持续报警超过30分钟,存在水损风险,需立即应急处置。\",\n \"reasoning\": [\n \"推理步骤1: 老人于 07:04 手动开锁出门,门锁随后自动上锁(LockState=1),门传感器确认关闭(StateValue=True)。直到 08:34 老人回家开门,期间家中无人。\",\n \"推理步骤2: 在 15:59 卫生间漏水传感器首次报告 StateValue=True,随后 16:09、16:29 持续报告漏水状态,说明漏水未自行停止,持续至少 30 分钟。\",\n \"推理步骤3: 在漏水发生的 15:59~16:29 期间,没有任何运动传感器触发、没有灯光操作、没有门锁事件,表明老人当时在客厅且未察觉卫生间漏水,或虽在家但未前往卫生间处理。结合 08:34 回家后老人活动主要在客厅(living_room_occupancy 触发),卫生间无人关注。\",\n \"推理步骤4: 漏水持续且无人处置,可能导致地板浸泡、墙体渗水、电气短路等次生风险,对独居老人尤其危险(滑倒风险极高)。\",\n \"推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于附带发现的设备故障,但当前首要威胁是漏水。\"\n ],\n \"key_evidence\": [\n \"15:59 bathroom_water_leak StateValue=True,首次漏水报警\",\n \"16:09 bathroom_water_leak StateValue=True,漏水持续(10分钟后)\",\n \"16:29 bathroom_water_leak StateValue=True,漏水持续(30分钟后仍未解除)\",\n \"15:59~16:29 期间卫生间无运动传感器触发(bathroom_occupancy 无事件),无人前往处理\",\n \"整个漏水期间无任何卫生间灯光操作,确认无人进入卫生间\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭卫生间总水阀(如已接入智能水阀),或通知物业/紧急联系人上门手动关闭水阀\",\n \"【立即】通过手机推送、电话、短信等多渠道向老人发送漏水警报,提醒其注意卫生间地面湿滑,避免滑倒\",\n \"【立即】同时通知老人的紧急联系人(子女/社区工作者),告知漏水情况及持续时长,请求协助上门查看\",\n \"【短期】如老人在家,语音播报提醒其不要进入卫生间,等待专业人员处理,防止滑倒受伤\",\n \"【短期】断开卫生间相关电气设备电源(如智能插座可控),防止漏水导致电气短路\",\n \"【短期】检查漏水原因:排查水管接头、马桶底座密封、热水器连接处等常见漏水点\",\n \"【中期】安装智能水阀并接入系统,实现漏水时自动关阀联动\",\n \"【中期】排查厨房温度传感器故障(多次报告 None 值),安排维修或更换\",\n \"【中期】在卫生间增设防滑垫,降低老人因地面积水滑倒的风险\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "water_leak", "threat_description": "卫生间漏水传感器在无人在家期间持续报警超过30分钟,存在水损风险,需立即应急处置。", "reasoning": ["推理步骤1: 老人于 07:04 手动开锁出门,门锁随后自动上锁(LockState=1),门传感器确认关闭(StateValue=True)。直到 08:34 老人回家开门,期间家中无人。", "推理步骤2: 在 15:59 卫生间漏水传感器首次报告 StateValue=True,随后 16:09、16:29 持续报告漏水状态,说明漏水未自行停止,持续至少 30 分钟。", "推理步骤3: 在漏水发生的 15:59~16:29 期间,没有任何运动传感器触发、没有灯光操作、没有门锁事件,表明老人当时在客厅且未察觉卫生间漏水,或虽在家但未前往卫生间处理。结合 08:34 回家后老人活动主要在客厅(living_room_occupancy 触发),卫生间无人关注。", "推理步骤4: 漏水持续且无人处置,可能导致地板浸泡、墙体渗水、电气短路等次生风险,对独居老人尤其危险(滑倒风险极高)。", "推理步骤5: 厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None,属于附带发现的设备故障,但当前首要威胁是漏水。"], "key_evidence": ["15:59 bathroom_water_leak StateValue=True,首次漏水报警", "16:09 bathroom_water_leak StateValue=True,漏水持续(10分钟后)", "16:29 bathroom_water_leak StateValue=True,漏水持续(30分钟后仍未解除)", "15:59~16:29 期间卫生间无运动传感器触发(bathroom_occupancy 无事件),无人前往处理", "整个漏水期间无任何卫生间灯光操作,确认无人进入卫生间"], "recommended_actions": ["【立即】远程关闭卫生间总水阀(如已接入智能水阀),或通知物业/紧急联系人上门手动关闭水阀", "【立即】通过手机推送、电话、短信等多渠道向老人发送漏水警报,提醒其注意卫生间地面湿滑,避免滑倒", "【立即】同时通知老人的紧急联系人(子女/社区工作者),告知漏水情况及持续时长,请求协助上门查看", "【短期】如老人在家,语音播报提醒其不要进入卫生间,等待专业人员处理,防止滑倒受伤", "【短期】断开卫生间相关电气设备电源(如智能插座可控),防止漏水导致电气短路", "【短期】检查漏水原因:排查水管接头、马桶底座密封、热水器连接处等常见漏水点", "【中期】安装智能水阀并接入系统,实现漏水时自动关阀联动", "【中期】排查厨房温度传感器故障(多次报告 None 值),安排维修或更换", "【中期】在卫生间增设防滑垫,降低老人因地面积水滑倒的风险"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": true, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 24.25366711616516, "api_error": null} {"episode_id": "SQ5_TP_D_1034", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1034.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261663, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "kitchen", "injection_time": "2026-06-15T14:10:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告异常值(None 及一次高达 29.23°C 的突增),独居老人频繁使用灶具,一旦发生火情报警器可能无法正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-14T14:10 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,报警器处于功能降级风险状态。\",\n \"推理步骤2: 在整个日志周期内(6月15日),老人共使用灶具 4 次(05:50、11:07、14:10、17:06),每次持续约 20-38 分钟,使用频率较高。灶具是厨房最主要的火灾风险源。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:51、06:29、11:08、11:30、17:07、17:40),说明传感器可能受高温干扰或存在故障,无法提供可靠的温度监测数据。\",\n \"推理步骤4: 14:20 厨房温度传感器报告 2923(即 29.23°C),相比同时段客厅 25.46°C 和卧室 24.30°C 高出近 4-5°C,且烟雾报警器同时上报 SmokeState = 0(正常),说明虽然此次未触发烟雾,但厨房温度出现了异常突增。\",\n \"推理步骤5: 综合来看,烟雾报警器低电量 + 温度传感器间歇性失效 + 独居老人高频使用灶具,构成了一个严重的火灾安全隐患链条。如果真正发生火情,报警器可能因电量不足无法及时报警,温度传感器也可能无法提供有效预警数据。\",\n \"推理步骤6: 该住户为独居老人,一旦火灾发生且报警系统失效,自救能力有限,后果可能非常严重。\"\n ],\n \"key_evidence\": [\n \"2026-06-14T14:10 kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池电量低\",\n \"厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None,传感器可靠性存疑\",\n \"2026-06-15T14:20 厨房温度突增至 2923(29.23°C),比其他房间高出约 4°C\",\n \"一天内灶具使用 4 次,独居老人高频用火\",\n \"入户门锁在 08:21 解锁后直到 20:49 才确认上锁,长时间门锁状态不明确\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保报警功能正常。这是最高优先级措施。\",\n \"检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温时读数异常(None),必要时重新定位或更换传感器。\",\n \"为独居老人设置灶具使用超时自动关闭规则:如灶具连续开启超过 30 分钟且无人操作,自动断电并推送提醒。\",\n \"配置烟雾报警器低电量时的紧急通知机制,向家属或紧急联系人发送告警消息,避免低电量状态长期未处理。\",\n \"建议在厨房增设独立供电(非电池)的烟雾/热感报警器作为冗余,降低单点故障风险。\",\n \"检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保全屋报警系统均处于正常工作状态。\",\n \"建议为老人配置灶具使用时的定时语音提醒功能,辅助记忆关火。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告异常值(None 及一次高达 29.23°C 的突增),独居老人频繁使用灶具,一旦发生火情报警器可能无法正常工作。", "reasoning": ["推理步骤1: 2026-06-14T14:10 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,报警器处于功能降级风险状态。", "推理步骤2: 在整个日志周期内(6月15日),老人共使用灶具 4 次(05:50、11:07、14:10、17:06),每次持续约 20-38 分钟,使用频率较高。灶具是厨房最主要的火灾风险源。", "推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue = None(05:51、06:29、11:08、11:30、17:07、17:40),说明传感器可能受高温干扰或存在故障,无法提供可靠的温度监测数据。", "推理步骤4: 14:20 厨房温度传感器报告 2923(即 29.23°C),相比同时段客厅 25.46°C 和卧室 24.30°C 高出近 4-5°C,且烟雾报警器同时上报 SmokeState = 0(正常),说明虽然此次未触发烟雾,但厨房温度出现了异常突增。", "推理步骤5: 综合来看,烟雾报警器低电量 + 温度传感器间歇性失效 + 独居老人高频使用灶具,构成了一个严重的火灾安全隐患链条。如果真正发生火情,报警器可能因电量不足无法及时报警,温度传感器也可能无法提供有效预警数据。", "推理步骤6: 该住户为独居老人,一旦火灾发生且报警系统失效,自救能力有限,后果可能非常严重。"], "key_evidence": ["2026-06-14T14:10 kitchen_smoke_alarm BatteryAlert = 1,烟雾报警器电池电量低", "厨房温度传感器在灶具使用期间 6 次报告 MeasuredValue = None,传感器可靠性存疑", "2026-06-15T14:20 厨房温度突增至 2923(29.23°C),比其他房间高出约 4°C", "一天内灶具使用 4 次,独居老人高频用火", "入户门锁在 08:21 解锁后直到 20:49 才确认上锁,长时间门锁状态不明确"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保报警功能正常。这是最高优先级措施。", "检查厨房温度传感器(kitchen_temp_sensor)是否安装位置过于靠近灶具导致高温时读数异常(None),必要时重新定位或更换传感器。", "为独居老人设置灶具使用超时自动关闭规则:如灶具连续开启超过 30 分钟且无人操作,自动断电并推送提醒。", "配置烟雾报警器低电量时的紧急通知机制,向家属或紧急联系人发送告警消息,避免低电量状态长期未处理。", "建议在厨房增设独立供电(非电池)的烟雾/热感报警器作为冗余,降低单点故障风险。", "检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保全屋报警系统均处于正常工作状态。", "建议为老人配置灶具使用时的定时语音提醒功能,辅助记忆关火。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.125084400177002, "api_error": null} {"episode_id": "SQ5_TP_D_1053", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1053.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-13T00:00:00", "seed": 20261682, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "living_room", "injection_time": "2026-06-13T23:21:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"深夜23:21客厅烟雾报警器触发一氧化碳(CO)警报,独居老人已在卧室入睡,存在CO中毒的严重生命威胁。\",\n \"reasoning\": [\n \"推理步骤1: 23:21客厅烟雾报警器报告COState=1(CO检测异常)、ExpressedState=2(警报激活状态)并触发COAlarm事件,确认CO浓度已达到报警阈值,这是真实的化学危险信号而非误报。\",\n \"推理步骤2: 老人约20:35进入卧室,关灯拉窗帘就寝,此后近3小时无任何活动事件。CO警报发生在23:21,老人极大概率已深度睡眠,无法自行察觉无色无味的CO气体,中毒风险极高。\",\n \"推理步骤3: 回溯CO可能来源——厨房灶具当天使用了三次(06:04-06:37、10:55-11:38、17:08-17:27),最后一次使用在17:27关闭,距警报近6小时。虽然灶具已关闭,但需排查燃气管道是否存在慢性泄漏,或热水器等其他燃气设备不完全燃烧产生CO。\",\n \"推理步骤4: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None,说明该传感器在高温或特定工况下存在异常,可能掩盖了厨房的真实温度变化,降低了对异常的早期发现能力。\",\n \"推理步骤5: 08:26老人回家后入户门未再开启(20:35确认门锁上锁、门关闭),室内处于密闭状态,CO无法自然排出,浓度只会持续累积,进一步加剧危险。\",\n \"推理步骤6: 厨房烟雾报警器未触发,说明CO源可能不在厨房,或厨房CO浓度尚未达到该传感器阈值。CO已扩散至客厅并触发警报,表明室内CO分布范围较广。\"\n ],\n \"key_evidence\": [\n \"23:21 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认CO浓度达到危险阈值\",\n \"老人20:35后进入卧室就寝,近3小时无活动记录,极可能处于深度睡眠无法自救\",\n \"20:35入户门确认关闭上锁(BooleanState=True, LockState=1),室内密闭,CO无法排散\",\n \"厨房温度传感器多次报告None值,存在传感器故障,削弱了异常早期预警能力\",\n \"厨房灶具当日三次使用,最后一次17:27关闭,需排查燃气设备是否存在残余泄漏或不完全燃烧\"\n ],\n \"recommended_actions\": [\n \"【立即】触发紧急联系人通知和120急救电话,告知疑似CO中毒,独居老人可能在睡眠中失去意识\",\n \"【立即】远程解锁入户门(front_door_lock执行Unlock),为急救人员进入创造条件\",\n \"【立即】远程开启所有可控窗帘(bedroom_window、living_room_window设置为全开),如窗户支持远程控制则同时打开,加速通风换气\",\n \"【立即】开启所有房间灯光(bedroom_light、living_room_light、entrance_light、kitchen_light、bathroom_light),提高室内可见度,辅助老人醒来后辨别方向撤离\",\n \"【立即】关闭燃气相关设备——确认kitchen_cook_surface保持关闭状态,如有智能燃气阀门应立即切断燃气总阀\",\n \"【立即】关闭客厅空调(living_room_ac),避免空调内循环加速CO在室内扩散\",\n \"【短期】急救人员到达后,对老人进行CO中毒评估(血氧、碳氧血红蛋白检测),必要时送医进行高压氧治疗\",\n \"【短期】安排专业人员检查所有燃气设备(灶具、热水器、壁挂炉等)及燃气管道,排查CO泄漏源\",\n \"【短期】检修厨房温度传感器(多次报告None值),确保传感器工作正常以恢复完整的环境监测能力\",\n \"【长期】在卧室加装独立CO报警器,确保老人睡眠区域有直接的CO预警能力,而非仅依赖客厅报警器\",\n \"【长期】部署智能联动规则:CO警报触发时自动执行开窗通风、解锁大门、开灯、关闭燃气阀、通知紧急联系人的全套应急流程\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "深夜23:21客厅烟雾报警器触发一氧化碳(CO)警报,独居老人已在卧室入睡,存在CO中毒的严重生命威胁。", "reasoning": ["推理步骤1: 23:21客厅烟雾报警器报告COState=1(CO检测异常)、ExpressedState=2(警报激活状态)并触发COAlarm事件,确认CO浓度已达到报警阈值,这是真实的化学危险信号而非误报。", "推理步骤2: 老人约20:35进入卧室,关灯拉窗帘就寝,此后近3小时无任何活动事件。CO警报发生在23:21,老人极大概率已深度睡眠,无法自行察觉无色无味的CO气体,中毒风险极高。", "推理步骤3: 回溯CO可能来源——厨房灶具当天使用了三次(06:04-06:37、10:55-11:38、17:08-17:27),最后一次使用在17:27关闭,距警报近6小时。虽然灶具已关闭,但需排查燃气管道是否存在慢性泄漏,或热水器等其他燃气设备不完全燃烧产生CO。", "推理步骤4: 厨房温度传感器在灶具开启期间多次报告MeasuredValue=None,说明该传感器在高温或特定工况下存在异常,可能掩盖了厨房的真实温度变化,降低了对异常的早期发现能力。", "推理步骤5: 08:26老人回家后入户门未再开启(20:35确认门锁上锁、门关闭),室内处于密闭状态,CO无法自然排出,浓度只会持续累积,进一步加剧危险。", "推理步骤6: 厨房烟雾报警器未触发,说明CO源可能不在厨房,或厨房CO浓度尚未达到该传感器阈值。CO已扩散至客厅并触发警报,表明室内CO分布范围较广。"], "key_evidence": ["23:21 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件——确认CO浓度达到危险阈值", "老人20:35后进入卧室就寝,近3小时无活动记录,极可能处于深度睡眠无法自救", "20:35入户门确认关闭上锁(BooleanState=True, LockState=1),室内密闭,CO无法排散", "厨房温度传感器多次报告None值,存在传感器故障,削弱了异常早期预警能力", "厨房灶具当日三次使用,最后一次17:27关闭,需排查燃气设备是否存在残余泄漏或不完全燃烧"], "recommended_actions": ["【立即】触发紧急联系人通知和120急救电话,告知疑似CO中毒,独居老人可能在睡眠中失去意识", "【立即】远程解锁入户门(front_door_lock执行Unlock),为急救人员进入创造条件", "【立即】远程开启所有可控窗帘(bedroom_window、living_room_window设置为全开),如窗户支持远程控制则同时打开,加速通风换气", "【立即】开启所有房间灯光(bedroom_light、living_room_light、entrance_light、kitchen_light、bathroom_light),提高室内可见度,辅助老人醒来后辨别方向撤离", "【立即】关闭燃气相关设备——确认kitchen_cook_surface保持关闭状态,如有智能燃气阀门应立即切断燃气总阀", "【立即】关闭客厅空调(living_room_ac),避免空调内循环加速CO在室内扩散", "【短期】急救人员到达后,对老人进行CO中毒评估(血氧、碳氧血红蛋白检测),必要时送医进行高压氧治疗", "【短期】安排专业人员检查所有燃气设备(灶具、热水器、壁挂炉等)及燃气管道,排查CO泄漏源", "【短期】检修厨房温度传感器(多次报告None值),确保传感器工作正常以恢复完整的环境监测能力", "【长期】在卧室加装独立CO报警器,确保老人睡眠区域有直接的CO预警能力,而非仅依赖客厅报警器", "【长期】部署智能联动规则:CO警报触发时自动执行开窗通风、解锁大门、开灯、关闭燃气阀、通知紧急联系人的全套应急流程"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.39545202255249, "api_error": null} {"episode_id": "SQ5_TP_D_1044", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1044.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-08T00:00:00", "seed": 20261673, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-08T07:14:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"07:14 入户门被远程/凭证方式解锁,但老人当时已外出,疑似被盗或复制凭证的非法入侵。\",\n \"reasoning\": [\n \"推理步骤1: 老人于 06:56 手动开锁出门(OperationSource=Manual, LockOperationType=1 解锁),门打开后关闭并自动上锁(LockState=1),这是正常的外出行为。\",\n \"推理步骤2: 07:14 门锁再次被解锁,但操作来源为 OperationSource=8(远程/凭证方式),使用 UserIndex=1。此时老人刚出门不到 20 分钟,若是本人返回,通常会使用手动方式开锁,而非远程凭证。\",\n \"推理步骤3: 07:14 开锁后,入户门传感器显示门被打开(StateValue=False),玄关和客厅运动传感器依次触发,说明确实有人进入室内并走到客厅。但客厅灯未被打开(OnOff=False),这与老人 08:27 回家后立即开灯的习惯不一致,暗示进入者刻意不开灯、行为隐蔽。\",\n \"推理步骤4: 07:14 开锁后门传感器只记录了开门(StateValue=False),没有记录关门和重新上锁的事件,说明入侵者可能未正常关门或门锁状态异常。而 06:56 老人出门时有完整的开门→关门→自动上锁序列。\",\n \"推理步骤5: 08:27 老人通过手动方式解锁回家,进门后开灯,行为模式正常。这进一步证实 07:14 的开锁事件并非老人本人操作。\",\n \"推理步骤6: 在 07:14 至 08:27 这段时间内,室内无任何其他正常生活活动记录(无厨房、卧室、卫生间活动),但有人在客厅区域活动,高度可疑。\",\n \"推理步骤7: OperationSource=8 在 Matter DoorLock 协议中通常对应远程操作(Remote),结合 UserIndex=1,说明攻击者可能获取了合法用户的远程访问凭证(如 PIN 码被复制、手机 App 凭证泄露、或 RFID 卡被克隆)。\"\n ],\n \"key_evidence\": [\n \"07:14 门锁通过远程凭证(OperationSource=8, UserIndex=1)解锁,而老人 06:56 刚手动出门\",\n \"07:14 入侵者进入后客厅运动传感器触发,但灯未开启(OnOff=False),行为隐蔽\",\n \"07:14 开门后无关门和自动上锁记录,与 06:56 正常出门的完整序列不一致\",\n \"08:27 老人手动开锁回家并正常开灯,证实 07:14 操作非本人\",\n \"07:14-08:27 期间无任何正常居家生活活动(无做饭、无卫生间使用),排除老人折返的可能\"\n ],\n \"recommended_actions\": [\n \"立即远程锁定入户门锁,禁用当前所有远程访问凭证和 UserIndex=1 对应的 PIN/RFID 凭证\",\n \"通过门锁管理系统重置所有用户凭证(PIN 码、RFID 卡、远程访问 Token),重新为老人录入新凭证\",\n \"检查门锁的完整访问日志,排查 UserIndex=1 凭证是否在其他时间段也有异常使用记录\",\n \"立即联系老人确认安全状况,询问是否有授权他人使用凭证,并确认家中是否有财物丢失\",\n \"报警并向物业/社区安保通报,提供 07:14 的入侵时间点以便调取走廊/电梯监控录像\",\n \"检查门锁固件版本,排查是否存在已知安全漏洞,必要时升级固件\",\n \"为老人安装入户门区域的摄像头,增加可视化安防手段\",\n \"启用门锁异常操作的实时推送告警,当非手动方式开锁时立即通知老人及紧急联系人\",\n \"考虑启用双因素认证机制(如远程开锁需老人手机确认),防止单一凭证泄露导致入侵\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "07:14 入户门被远程/凭证方式解锁,但老人当时已外出,疑似被盗或复制凭证的非法入侵。", "reasoning": ["推理步骤1: 老人于 06:56 手动开锁出门(OperationSource=Manual, LockOperationType=1 解锁),门打开后关闭并自动上锁(LockState=1),这是正常的外出行为。", "推理步骤2: 07:14 门锁再次被解锁,但操作来源为 OperationSource=8(远程/凭证方式),使用 UserIndex=1。此时老人刚出门不到 20 分钟,若是本人返回,通常会使用手动方式开锁,而非远程凭证。", "推理步骤3: 07:14 开锁后,入户门传感器显示门被打开(StateValue=False),玄关和客厅运动传感器依次触发,说明确实有人进入室内并走到客厅。但客厅灯未被打开(OnOff=False),这与老人 08:27 回家后立即开灯的习惯不一致,暗示进入者刻意不开灯、行为隐蔽。", "推理步骤4: 07:14 开锁后门传感器只记录了开门(StateValue=False),没有记录关门和重新上锁的事件,说明入侵者可能未正常关门或门锁状态异常。而 06:56 老人出门时有完整的开门→关门→自动上锁序列。", "推理步骤5: 08:27 老人通过手动方式解锁回家,进门后开灯,行为模式正常。这进一步证实 07:14 的开锁事件并非老人本人操作。", "推理步骤6: 在 07:14 至 08:27 这段时间内,室内无任何其他正常生活活动记录(无厨房、卧室、卫生间活动),但有人在客厅区域活动,高度可疑。", "推理步骤7: OperationSource=8 在 Matter DoorLock 协议中通常对应远程操作(Remote),结合 UserIndex=1,说明攻击者可能获取了合法用户的远程访问凭证(如 PIN 码被复制、手机 App 凭证泄露、或 RFID 卡被克隆)。"], "key_evidence": ["07:14 门锁通过远程凭证(OperationSource=8, UserIndex=1)解锁,而老人 06:56 刚手动出门", "07:14 入侵者进入后客厅运动传感器触发,但灯未开启(OnOff=False),行为隐蔽", "07:14 开门后无关门和自动上锁记录,与 06:56 正常出门的完整序列不一致", "08:27 老人手动开锁回家并正常开灯,证实 07:14 操作非本人", "07:14-08:27 期间无任何正常居家生活活动(无做饭、无卫生间使用),排除老人折返的可能"], "recommended_actions": ["立即远程锁定入户门锁,禁用当前所有远程访问凭证和 UserIndex=1 对应的 PIN/RFID 凭证", "通过门锁管理系统重置所有用户凭证(PIN 码、RFID 卡、远程访问 Token),重新为老人录入新凭证", "检查门锁的完整访问日志,排查 UserIndex=1 凭证是否在其他时间段也有异常使用记录", "立即联系老人确认安全状况,询问是否有授权他人使用凭证,并确认家中是否有财物丢失", "报警并向物业/社区安保通报,提供 07:14 的入侵时间点以便调取走廊/电梯监控录像", "检查门锁固件版本,排查是否存在已知安全漏洞,必要时升级固件", "为老人安装入户门区域的摄像头,增加可视化安防手段", "启用门锁异常操作的实时推送告警,当非手动方式开锁时立即通知老人及紧急联系人", "考虑启用双因素认证机制(如远程开锁需老人手机确认),防止单一凭证泄露导致入侵"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 35.35389161109924, "api_error": null} {"episode_id": "SQ5_TP_D_1059", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1059.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261688, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-18T17:02:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而厨房在此期间发生了温度异常飙升事件,报警器可能无法正常触发,对独居老人构成严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-17T17:02 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,该报警器的可靠性已经下降。\",\n \"推理步骤2: 2026-06-18 当天老人三次使用灶具(06:07-06:23、11:04-11:32、16:56-17:30),每次使用期间厨房温度传感器均出现 MeasuredValue = None 的异常读数,说明传感器在灶具工作时可能受干扰或故障。\",\n \"推理步骤3: 第三次使用灶具期间(16:56-17:30),17:12 厨房温度传感器突然报告 MeasuredValue = 3065(约30.65°C),相比同时段客厅的24.7°C和卧室的23.9°C,厨房温度异常偏高约6°C,存在烹饪过热或局部高温风险。\",\n \"推理步骤4: 同一时刻 17:12 烟雾报警器上报 SmokeState = 0(无烟雾),但由于报警器已处于低电量状态,其检测灵敏度和可靠性存疑——如果真正发生烟雾,可能无法及时报警。\",\n \"推理步骤5: 该住户为独居老人,一旦发生火灾且烟雾报警器失效,无人能及时发现和协助疏散,后果极为严重。\",\n \"推理步骤6: 厨房温度传感器在灶具开关前后多次报告 None 值(06:08、06:24、11:05、11:33、16:57、17:31),该传感器本身也存在故障嫌疑,进一步削弱了厨房安全监测能力。\"\n ],\n \"key_evidence\": [\n \"2026-06-17T17:02 kitchen_smoke_alarm BatteryAlert = 1(低电量告警)\",\n \"2026-06-18T17:12 kitchen_temp_sensor MeasuredValue = 3065(异常高温,约30.65°C,高出其他房间约6°C)\",\n \"2026-06-18T17:12 kitchen_smoke_alarm SmokeState = 0(低电量状态下报告无烟雾,可靠性存疑)\",\n \"厨房温度传感器在三次灶具使用期间均出现 MeasuredValue = None 的异常读数(共6次)\",\n \"入户门锁在 08:34 解锁后未重新上锁(直到 20:49 才自动上锁),期间老人外出安全保障不足\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力,这是最紧急的措施。\",\n \"检修或更换厨房温度传感器(kitchen_temp_sensor),排查其在灶具使用期间反复报告 None 值的故障原因。\",\n \"在电池更换前,建议老人减少灶具使用或使用时保持厨房门窗通风,并安排家人或社区人员定期探视。\",\n \"检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保至少有一个备用报警器处于正常工作状态。\",\n \"为灶具设置自动超时关闭规则(如超过30分钟未手动操作则自动断电),防止老人忘记关火。\",\n \"配置低电量告警的自动通知机制,当任何安全类传感器(烟雾报警器、漏水传感器)电量低时,立即推送通知给老人的紧急联系人。\",\n \"建议在厨房增设独立的燃气泄漏检测器,作为烟雾报警器的补充安全层。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而厨房在此期间发生了温度异常飙升事件,报警器可能无法正常触发,对独居老人构成严重火灾风险。", "reasoning": ["推理步骤1: 2026-06-17T17:02 厨房烟雾报警器上报 BatteryAlert = 1,表示电池电量低,该报警器的可靠性已经下降。", "推理步骤2: 2026-06-18 当天老人三次使用灶具(06:07-06:23、11:04-11:32、16:56-17:30),每次使用期间厨房温度传感器均出现 MeasuredValue = None 的异常读数,说明传感器在灶具工作时可能受干扰或故障。", "推理步骤3: 第三次使用灶具期间(16:56-17:30),17:12 厨房温度传感器突然报告 MeasuredValue = 3065(约30.65°C),相比同时段客厅的24.7°C和卧室的23.9°C,厨房温度异常偏高约6°C,存在烹饪过热或局部高温风险。", "推理步骤4: 同一时刻 17:12 烟雾报警器上报 SmokeState = 0(无烟雾),但由于报警器已处于低电量状态,其检测灵敏度和可靠性存疑——如果真正发生烟雾,可能无法及时报警。", "推理步骤5: 该住户为独居老人,一旦发生火灾且烟雾报警器失效,无人能及时发现和协助疏散,后果极为严重。", "推理步骤6: 厨房温度传感器在灶具开关前后多次报告 None 值(06:08、06:24、11:05、11:33、16:57、17:31),该传感器本身也存在故障嫌疑,进一步削弱了厨房安全监测能力。"], "key_evidence": ["2026-06-17T17:02 kitchen_smoke_alarm BatteryAlert = 1(低电量告警)", "2026-06-18T17:12 kitchen_temp_sensor MeasuredValue = 3065(异常高温,约30.65°C,高出其他房间约6°C)", "2026-06-18T17:12 kitchen_smoke_alarm SmokeState = 0(低电量状态下报告无烟雾,可靠性存疑)", "厨房温度传感器在三次灶具使用期间均出现 MeasuredValue = None 的异常读数(共6次)", "入户门锁在 08:34 解锁后未重新上锁(直到 20:49 才自动上锁),期间老人外出安全保障不足"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常报警能力,这是最紧急的措施。", "检修或更换厨房温度传感器(kitchen_temp_sensor),排查其在灶具使用期间反复报告 None 值的故障原因。", "在电池更换前,建议老人减少灶具使用或使用时保持厨房门窗通风,并安排家人或社区人员定期探视。", "检查客厅烟雾报警器(living_room_smoke_alarm)的电池状态,确保至少有一个备用报警器处于正常工作状态。", "为灶具设置自动超时关闭规则(如超过30分钟未手动操作则自动断电),防止老人忘记关火。", "配置低电量告警的自动通知机制,当任何安全类传感器(烟雾报警器、漏水传感器)电量低时,立即推送通知给老人的紧急联系人。", "建议在厨房增设独立的燃气泄漏检测器,作为烟雾报警器的补充安全层。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 25.01849102973938, "api_error": null} {"episode_id": "SQ5_TP_D_1054", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1054.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-21T00:00:00", "seed": 20261683, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "bedroom", "injection_time": "2026-06-21T23:32:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"深夜23:32厨房灶具在无人操作迹象下开启,厨房温度10分钟内从约23.4°C飙升至30.2°C,且烟雾报警器处于低电量状态,存在严重火灾风险。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-20T23:32 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警能力可能受损。\",\n \"推理步骤2: 2026-06-21T23:32 厨房灶具在深夜开启(OnOff=True),但日志中没有任何厨房运动传感器触发(kitchen_occupancy 无变化)、厨房灯也未开启,说明无人进入厨房操作灶具。\",\n \"推理步骤3: 老人在20:37已回到卧室关灯就寝,此后无任何卧室/客厅/玄关的活动记录,可以确认老人在23:32时应处于睡眠状态,不可能在厨房操作。\",\n \"推理步骤4: 2026-06-21T23:42 厨房温度传感器读数飙升至3021(即30.21°C),相比23:30的2338(23.38°C)在10分钟内上升近7°C,这是异常的急剧升温。\",\n \"推理步骤5: 同一时刻23:42烟雾报警器报告 SmokeState=0(正常/无烟雾),但考虑到报警器已处于低电量状态,其检测可靠性存疑,不能依赖该读数排除火灾风险。\",\n \"推理步骤6: 对比白天三次正常烹饪(05:54-06:20、10:54-11:23、16:56-17:20),每次都有厨房灯开启+运动传感器触发+灶具开启的完整序列,且烹饪时长20-29分钟。深夜这次完全缺少人为操作的前置事件,模式高度异常。\",\n \"推理步骤7: 灶具可能因故障、误触或遥控误操作而意外开启。独居老人在睡眠中无法察觉,若灶具持续运行且附近有可燃物,火灾风险极高。\"\n ],\n \"key_evidence\": [\n \"2026-06-20T23:32 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器低电量\",\n \"2026-06-21T23:32 kitchen_cook_surface OnOff=True,深夜灶具开启\",\n \"深夜灶具开启前后无 kitchen_occupancy 触发、无 kitchen_light 开启,无人在厨房\",\n \"2026-06-21T23:42 厨房温度从23.38°C急升至30.21°C(10分钟内+6.83°C)\",\n \"2026-06-21T23:42 SmokeState=0 但报警器处于低电量状态,可靠性存疑\",\n \"老人20:37已就寝(卧室灯关闭、窗帘关闭),此后无任何活动记录\"\n ],\n \"recommended_actions\": [\n \"立即远程关闭厨房灶具(kitchen_cook_surface → OnOff=False),消除热源\",\n \"触发全屋警报(客厅/卧室灯闪烁、卧室窗帘打开)唤醒老人,确保老人意识到异常情况\",\n \"通过紧急联系人(家属/社区看护)电话通知老人家中灶具异常开启,确认老人安全\",\n \"若无法在2分钟内确认灶具已关闭或联系上老人,立即拨打119报警\",\n \"持续监控厨房温度传感器读数,若温度继续上升或出现烟雾信号,立即升级为火灾响应\",\n \"尽快更换厨房烟雾报警器电池,恢复其正常报警能力\",\n \"排查灶具异常开启原因:检查是否存在设备故障、自动化规则误触发或未授权的远程控制\",\n \"建议为独居老人增设深夜灶具自动锁定规则(如22:00-06:00期间禁止灶具远程开启)\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "深夜23:32厨房灶具在无人操作迹象下开启,厨房温度10分钟内从约23.4°C飙升至30.2°C,且烟雾报警器处于低电量状态,存在严重火灾风险。", "reasoning": ["推理步骤1: 2026-06-20T23:32 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警能力可能受损。", "推理步骤2: 2026-06-21T23:32 厨房灶具在深夜开启(OnOff=True),但日志中没有任何厨房运动传感器触发(kitchen_occupancy 无变化)、厨房灯也未开启,说明无人进入厨房操作灶具。", "推理步骤3: 老人在20:37已回到卧室关灯就寝,此后无任何卧室/客厅/玄关的活动记录,可以确认老人在23:32时应处于睡眠状态,不可能在厨房操作。", "推理步骤4: 2026-06-21T23:42 厨房温度传感器读数飙升至3021(即30.21°C),相比23:30的2338(23.38°C)在10分钟内上升近7°C,这是异常的急剧升温。", "推理步骤5: 同一时刻23:42烟雾报警器报告 SmokeState=0(正常/无烟雾),但考虑到报警器已处于低电量状态,其检测可靠性存疑,不能依赖该读数排除火灾风险。", "推理步骤6: 对比白天三次正常烹饪(05:54-06:20、10:54-11:23、16:56-17:20),每次都有厨房灯开启+运动传感器触发+灶具开启的完整序列,且烹饪时长20-29分钟。深夜这次完全缺少人为操作的前置事件,模式高度异常。", "推理步骤7: 灶具可能因故障、误触或遥控误操作而意外开启。独居老人在睡眠中无法察觉,若灶具持续运行且附近有可燃物,火灾风险极高。"], "key_evidence": ["2026-06-20T23:32 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器低电量", "2026-06-21T23:32 kitchen_cook_surface OnOff=True,深夜灶具开启", "深夜灶具开启前后无 kitchen_occupancy 触发、无 kitchen_light 开启,无人在厨房", "2026-06-21T23:42 厨房温度从23.38°C急升至30.21°C(10分钟内+6.83°C)", "2026-06-21T23:42 SmokeState=0 但报警器处于低电量状态,可靠性存疑", "老人20:37已就寝(卧室灯关闭、窗帘关闭),此后无任何活动记录"], "recommended_actions": ["立即远程关闭厨房灶具(kitchen_cook_surface → OnOff=False),消除热源", "触发全屋警报(客厅/卧室灯闪烁、卧室窗帘打开)唤醒老人,确保老人意识到异常情况", "通过紧急联系人(家属/社区看护)电话通知老人家中灶具异常开启,确认老人安全", "若无法在2分钟内确认灶具已关闭或联系上老人,立即拨打119报警", "持续监控厨房温度传感器读数,若温度继续上升或出现烟雾信号,立即升级为火灾响应", "尽快更换厨房烟雾报警器电池,恢复其正常报警能力", "排查灶具异常开启原因:检查是否存在设备故障、自动化规则误触发或未授权的远程控制", "建议为独居老人增设深夜灶具自动锁定规则(如22:00-06:00期间禁止灶具远程开启)"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.078439474105835, "api_error": null} {"episode_id": "SQ5_TP_D_1067", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1067.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-28T00:00:00", "seed": 20261696, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-28T22:43:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而深夜无人时灶具被开启且厨房温度骤升,存在严重火灾隐患。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-27T22:43 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾事件中正常发出警报。\",\n \"推理步骤2: 老人于 20:41 进入卧室、关灯、拉窗帘就寝,此后全屋无任何运动传感器触发,说明老人已入睡。\",\n \"推理步骤3: 2026-06-28T22:43 厨房灶具被开启(OnOff=True),但此时厨房无运动传感器触发、厨房灯未开启,不符合老人白天三次使用灶具时'先开灯→运动检测→再开灶'的正常模式,开启原因不明。\",\n \"推理步骤4: 22:53 厨房温度传感器报告 MeasuredValue=3039(约30.4°C),相比同时段客厅 23.4°C 和卧室 22.4°C 高出约7°C,出现异常温升。\",\n \"推理步骤5: 22:53 烟雾报警器报告 SmokeState=0(正常),但由于电池低电量,该读数的可靠性存疑,不能排除烟雾已产生但未被检测到的可能。\",\n \"推理步骤6: 白天三次正常用灶(05:53-06:21、11:07-11:38、17:00-17:21)期间温度传感器均报告 None(被灶具热源干扰),而此次 22:53 却报出了具体高温值 3039,说明热源分布模式与正常烹饪不同,可能存在干烧或意外点火。\",\n \"推理步骤7: 截至日志结束(23:30),灶具未见关闭记录,已持续运行至少47分钟,而老人白天用灶时长分别约28分钟、31分钟、21分钟,此次明显超时且无人看管。\",\n \"推理步骤8: 独居老人已就寝,烟雾报警器电量不足可能无法发出足够响亮的警报将其唤醒,火灾风险与人身安全风险叠加,情况危急。\"\n ],\n \"key_evidence\": [\n \"2026-06-27T22:43 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器低电量\",\n \"2026-06-28T22:43 灶具开启,但厨房无运动检测、灯未开,老人已就寝\",\n \"2026-06-28T22:53 厨房温度骤升至 3039(约30.4°C),比其他房间高约7°C\",\n \"截至 23:30 灶具无关闭记录,已无人看管运行超47分钟\",\n \"深夜灶具开启模式与白天正常使用模式(先开灯→运动检测→开灶)完全不符\",\n \"烟雾报警器 SmokeState=0 但因低电量其可靠性存疑\"\n ],\n \"recommended_actions\": [\n \"【立即】远程关闭厨房灶具(kitchen_cook_surface),消除火源\",\n \"【立即】触发全屋警报或通过卧室设备(如开灯、语音播报)唤醒老人,提醒其远离厨房\",\n \"【立即】通知紧急联系人(家属/社区看护),告知厨房异常情况,必要时拨打 119 火警\",\n \"【立即】开启客厅烟雾报警器辅助监测,弥补厨房报警器低电量的不足\",\n \"【短期】尽快更换厨房烟雾报警器电池,恢复其正常报警能力\",\n \"【短期】排查灶具深夜无人操作却自动开启的原因——检查是否存在误触、定时任务错误配置或设备故障\",\n \"【中期】为灶具增加安全联动规则:当厨房运动传感器无人且灶具开启超过设定时间时,自动关闭灶具并发送告警\",\n \"【中期】为烟雾报警器设置低电量自动提醒机制,确保电池及时更换\",\n \"【中期】考虑为独居老人安装燃气泄漏传感器和自动断气阀,增加厨房安全冗余\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而深夜无人时灶具被开启且厨房温度骤升,存在严重火灾隐患。", "reasoning": ["推理步骤1: 2026-06-27T22:43 厨房烟雾报警器报告 BatteryAlert=1,表明电池电量低,报警器可能无法在烟雾事件中正常发出警报。", "推理步骤2: 老人于 20:41 进入卧室、关灯、拉窗帘就寝,此后全屋无任何运动传感器触发,说明老人已入睡。", "推理步骤3: 2026-06-28T22:43 厨房灶具被开启(OnOff=True),但此时厨房无运动传感器触发、厨房灯未开启,不符合老人白天三次使用灶具时'先开灯→运动检测→再开灶'的正常模式,开启原因不明。", "推理步骤4: 22:53 厨房温度传感器报告 MeasuredValue=3039(约30.4°C),相比同时段客厅 23.4°C 和卧室 22.4°C 高出约7°C,出现异常温升。", "推理步骤5: 22:53 烟雾报警器报告 SmokeState=0(正常),但由于电池低电量,该读数的可靠性存疑,不能排除烟雾已产生但未被检测到的可能。", "推理步骤6: 白天三次正常用灶(05:53-06:21、11:07-11:38、17:00-17:21)期间温度传感器均报告 None(被灶具热源干扰),而此次 22:53 却报出了具体高温值 3039,说明热源分布模式与正常烹饪不同,可能存在干烧或意外点火。", "推理步骤7: 截至日志结束(23:30),灶具未见关闭记录,已持续运行至少47分钟,而老人白天用灶时长分别约28分钟、31分钟、21分钟,此次明显超时且无人看管。", "推理步骤8: 独居老人已就寝,烟雾报警器电量不足可能无法发出足够响亮的警报将其唤醒,火灾风险与人身安全风险叠加,情况危急。"], "key_evidence": ["2026-06-27T22:43 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器低电量", "2026-06-28T22:43 灶具开启,但厨房无运动检测、灯未开,老人已就寝", "2026-06-28T22:53 厨房温度骤升至 3039(约30.4°C),比其他房间高约7°C", "截至 23:30 灶具无关闭记录,已无人看管运行超47分钟", "深夜灶具开启模式与白天正常使用模式(先开灯→运动检测→开灶)完全不符", "烟雾报警器 SmokeState=0 但因低电量其可靠性存疑"], "recommended_actions": ["【立即】远程关闭厨房灶具(kitchen_cook_surface),消除火源", "【立即】触发全屋警报或通过卧室设备(如开灯、语音播报)唤醒老人,提醒其远离厨房", "【立即】通知紧急联系人(家属/社区看护),告知厨房异常情况,必要时拨打 119 火警", "【立即】开启客厅烟雾报警器辅助监测,弥补厨房报警器低电量的不足", "【短期】尽快更换厨房烟雾报警器电池,恢复其正常报警能力", "【短期】排查灶具深夜无人操作却自动开启的原因——检查是否存在误触、定时任务错误配置或设备故障", "【中期】为灶具增加安全联动规则:当厨房运动传感器无人且灶具开启超过设定时间时,自动关闭灶具并发送告警", "【中期】为烟雾报警器设置低电量自动提醒机制,确保电池及时更换", "【中期】考虑为独居老人安装燃气泄漏传感器和自动断气阀,增加厨房安全冗余"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 8, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 29.573963403701782, "api_error": null} {"episode_id": "SQ5_TP_D_1070", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1070.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-15T00:00:00", "seed": 20261699, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-15T14:40:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"14:40 入户门被以可疑凭证远程解锁,老人在家期间有不明身份人员进入,存在伪装开锁/凭证被盗风险。\",\n \"reasoning\": [\n \"推理步骤1: 14:40 门锁事件 LockOperationType=1(解锁)、OperationSource=8 且携带 UserIndex=1。OperationSource=8 对应远程操作(Remote),而当天其余两次开锁(07:03、08:20)均为 Manual 手动操作,这是全天唯一一次远程解锁,方式异常。\",\n \"推理步骤2: 07:03 老人手动开锁出门,门自动上锁;08:20 老人手动开锁回家。说明 08:20 之后老人一直在家(客厅、厨房、卧室持续有活动)。14:40 远程解锁时老人正在客厅(14:02 客厅运动传感器触发、灯已打开),老人本人无需远程开锁自己的门。\",\n \"推理步骤3: 14:40:03 门被打开(StateValue=False),14:40:05 玄关运动传感器触发,14:40:20 客厅运动传感器触发,但 14:40:25 客厅灯随即被关闭。老人此前一直开着客厅灯活动,灯突然被关闭不符合老人的正常习惯,暗示可能是另一个人进入后的操作。\",\n \"推理步骤4: 关键异常——门被远程解锁后,日志中没有出现对应的关门(StateValue=True)和重新上锁记录。直到 20:48:09 才出现门关闭和自动上锁,中间长达约 6 小时入户门处于开启/未锁状态,这对独居老人极不正常。\",\n \"推理步骤5: 综合判断:远程凭证(可能是 PIN 码、App 密钥或 RFID 令牌)可能已被盗用或复制。攻击者利用合法 UserIndex=1 的凭证远程开锁进入,构成伪装开锁入侵威胁。\"\n ],\n \"key_evidence\": [\n \"14:40:00 门锁远程解锁事件 OperationSource=8(Remote),与当天其他手动开锁方式不一致\",\n \"14:40 解锁时老人已在家中(14:02 客厅有活动),老人无需远程开自己的门\",\n \"14:40:25 客厅灯被关闭,与老人此前保持开灯的习惯矛盾,疑似他人操作\",\n \"14:40 开门后长达约 6 小时无关门/上锁记录,直到 20:48 才关门上锁,期间入户门处于不安全状态\",\n \"使用了 UserIndex=1 的合法凭证,说明凭证可能已泄露或被复制\"\n ],\n \"recommended_actions\": [\n \"立即锁定入户门锁:通过系统远程发送 Lock 指令,确保门锁处于锁定状态\",\n \"立即吊销/重置 UserIndex=1 的凭证:删除当前门锁中所有已注册的 PIN 码、RFID 令牌和远程访问密钥,重新生成新凭证并仅分发给老人本人\",\n \"禁用门锁远程解锁功能:在确认安全之前,暂时关闭门锁的远程操作权限(OperationSource=Remote),仅保留手动和本地操作方式\",\n \"联系老人确认安全:立即通过电话或紧急联系人确认老人当前是否安全、是否认识 14:40 进入的人员;如无法联系上,通知社区或报警\",\n \"审查门锁访问日志:导出门锁完整的操作历史,排查 UserIndex=1 凭证最近的注册/修改记录,确定凭证泄露的时间和途径\",\n \"启用门锁异常告警规则:配置自动化规则——当老人在家时出现远程解锁、或门长时间未关闭(超过 5 分钟)时,立即推送告警给紧急联系人\",\n \"考虑升级门锁认证方式:将单因素认证(PIN/RFID)升级为双因素认证(如 PIN + 指纹),降低凭证被复制后的入侵风险\",\n \"检查家中是否有财物丢失或被篡改的迹象,必要时报警并保留日志作为证据\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "14:40 入户门被以可疑凭证远程解锁,老人在家期间有不明身份人员进入,存在伪装开锁/凭证被盗风险。", "reasoning": ["推理步骤1: 14:40 门锁事件 LockOperationType=1(解锁)、OperationSource=8 且携带 UserIndex=1。OperationSource=8 对应远程操作(Remote),而当天其余两次开锁(07:03、08:20)均为 Manual 手动操作,这是全天唯一一次远程解锁,方式异常。", "推理步骤2: 07:03 老人手动开锁出门,门自动上锁;08:20 老人手动开锁回家。说明 08:20 之后老人一直在家(客厅、厨房、卧室持续有活动)。14:40 远程解锁时老人正在客厅(14:02 客厅运动传感器触发、灯已打开),老人本人无需远程开锁自己的门。", "推理步骤3: 14:40:03 门被打开(StateValue=False),14:40:05 玄关运动传感器触发,14:40:20 客厅运动传感器触发,但 14:40:25 客厅灯随即被关闭。老人此前一直开着客厅灯活动,灯突然被关闭不符合老人的正常习惯,暗示可能是另一个人进入后的操作。", "推理步骤4: 关键异常——门被远程解锁后,日志中没有出现对应的关门(StateValue=True)和重新上锁记录。直到 20:48:09 才出现门关闭和自动上锁,中间长达约 6 小时入户门处于开启/未锁状态,这对独居老人极不正常。", "推理步骤5: 综合判断:远程凭证(可能是 PIN 码、App 密钥或 RFID 令牌)可能已被盗用或复制。攻击者利用合法 UserIndex=1 的凭证远程开锁进入,构成伪装开锁入侵威胁。"], "key_evidence": ["14:40:00 门锁远程解锁事件 OperationSource=8(Remote),与当天其他手动开锁方式不一致", "14:40 解锁时老人已在家中(14:02 客厅有活动),老人无需远程开自己的门", "14:40:25 客厅灯被关闭,与老人此前保持开灯的习惯矛盾,疑似他人操作", "14:40 开门后长达约 6 小时无关门/上锁记录,直到 20:48 才关门上锁,期间入户门处于不安全状态", "使用了 UserIndex=1 的合法凭证,说明凭证可能已泄露或被复制"], "recommended_actions": ["立即锁定入户门锁:通过系统远程发送 Lock 指令,确保门锁处于锁定状态", "立即吊销/重置 UserIndex=1 的凭证:删除当前门锁中所有已注册的 PIN 码、RFID 令牌和远程访问密钥,重新生成新凭证并仅分发给老人本人", "禁用门锁远程解锁功能:在确认安全之前,暂时关闭门锁的远程操作权限(OperationSource=Remote),仅保留手动和本地操作方式", "联系老人确认安全:立即通过电话或紧急联系人确认老人当前是否安全、是否认识 14:40 进入的人员;如无法联系上,通知社区或报警", "审查门锁访问日志:导出门锁完整的操作历史,排查 UserIndex=1 凭证最近的注册/修改记录,确定凭证泄露的时间和途径", "启用门锁异常告警规则:配置自动化规则——当老人在家时出现远程解锁、或门长时间未关闭(超过 5 分钟)时,立即推送告警给紧急联系人", "考虑升级门锁认证方式:将单因素认证(PIN/RFID)升级为双因素认证(如 PIN + 指纹),降低凭证被复制后的入侵风险", "检查家中是否有财物丢失或被篡改的迹象,必要时报警并保留日志作为证据"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 5, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.396068572998047, "api_error": null} {"episode_id": "SQ5_TP_D_1083", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1083.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-18T00:00:00", "seed": 20261712, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-18T11:53:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,而厨房灶具在无人看管情况下仍在运行,且厨房温度传感器出现异常读数,存在火灾风险且报警器可能无法正常工作。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-17T11:53 厨房烟雾报警器报告 BatteryAlert=1,表示电池电量低,报警器的可靠性已经下降。\",\n \"推理步骤2: 2026-06-18T11:53 灶具再次被开启(kitchen_cook_surface OnOff=True),但此前 11:28 灶具已关闭、11:09 的烹饪周期已结束,老人约 12:21 进入卧室休息并关闭客厅灯、拉上窗帘,说明灶具在 11:53 开启后长时间处于无人主动看管状态。\",\n \"推理步骤3: 2026-06-18T12:03 厨房温度传感器突然飙升至 3017(约30.17°C),相比 12:00 的 2586(约25.86°C)在3分钟内上升了约4.3°C,这是异常的急剧升温。\",\n \"推理步骤4: 同一时刻 12:03 烟雾报警器报告 SmokeState=0(正常/无烟雾),但考虑到电池低电量告警已存在超过24小时未处理,报警器的检测灵敏度和可靠性存疑,SmokeState=0 不能完全排除烟雾风险。\",\n \"推理步骤5: 厨房温度传感器在灶具运行期间多次报告 MeasuredValue=None(06:10、06:33、11:10、11:29、17:07、17:38),传感器本身可能存在故障或受高温干扰,进一步削弱了厨房环境监测的可靠性。\",\n \"推理步骤6: 该住户为独居老人,火灾风险的后果尤为严重——一旦发生火情,缺乏他人协助疏散,而低电量的烟雾报警器可能无法及时发出警报。\",\n \"推理步骤7: 入户门在 08:26 被手动开锁后,直到 20:46 才再次确认关门上锁,期间门锁状态为未锁定(LockState=2),长时间未锁门也增加了紧急情况下的风险暴露面。\"\n ],\n \"key_evidence\": [\n \"2026-06-17T11:53 kitchen_smoke_alarm BatteryAlert=1,低电量告警已超过24小时未处理\",\n \"2026-06-18T11:53 灶具被再次开启,但老人约12:21已离开厨房进入卧室休息,灶具处于无人看管状态\",\n \"2026-06-18T12:03 厨房温度从25.86°C骤升至30.17°C(3分钟内+4.3°C),异常急剧升温\",\n \"2026-06-18T12:03 烟雾报警器报告 SmokeState=0,但在电池低电量下该读数可靠性存疑\",\n \"厨房温度传感器在灶具运行期间多次报告 None 值,传感器可能存在故障\",\n \"2026-06-18T08:26 至 20:46 入户门长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常检测能力,这是最高优先级操作\",\n \"远程关闭厨房灶具(kitchen_cook_surface),消除当前无人看管的火灾隐患\",\n \"检查并维修厨房温度传感器(kitchen_temp_sensor),排查多次报告 None 值的故障原因,确保温度监测链路完整\",\n \"向老人或其紧急联系人(家属/社区护理人员)发送通知,告知烟雾报警器低电量和灶具无人看管的情况\",\n \"配置自动化规则:当烟雾报警器 BatteryAlert 触发时,立即推送通知给紧急联系人,并限制灶具的使用或增加额外监控\",\n \"配置自动化规则:灶具开启超过30分钟且厨房无人(occupancy=0)时,自动关闭灶具并发出警报\",\n \"建议在入户门设置自动上锁策略(如开锁后10分钟无操作自动锁定),减少长时间未锁门的安全风险\",\n \"考虑为独居老人增设厨房燃气泄漏传感器,形成烟雾+温度+燃气的多重火灾预警体系\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,而厨房灶具在无人看管情况下仍在运行,且厨房温度传感器出现异常读数,存在火灾风险且报警器可能无法正常工作。", "reasoning": ["推理步骤1: 2026-06-17T11:53 厨房烟雾报警器报告 BatteryAlert=1,表示电池电量低,报警器的可靠性已经下降。", "推理步骤2: 2026-06-18T11:53 灶具再次被开启(kitchen_cook_surface OnOff=True),但此前 11:28 灶具已关闭、11:09 的烹饪周期已结束,老人约 12:21 进入卧室休息并关闭客厅灯、拉上窗帘,说明灶具在 11:53 开启后长时间处于无人主动看管状态。", "推理步骤3: 2026-06-18T12:03 厨房温度传感器突然飙升至 3017(约30.17°C),相比 12:00 的 2586(约25.86°C)在3分钟内上升了约4.3°C,这是异常的急剧升温。", "推理步骤4: 同一时刻 12:03 烟雾报警器报告 SmokeState=0(正常/无烟雾),但考虑到电池低电量告警已存在超过24小时未处理,报警器的检测灵敏度和可靠性存疑,SmokeState=0 不能完全排除烟雾风险。", "推理步骤5: 厨房温度传感器在灶具运行期间多次报告 MeasuredValue=None(06:10、06:33、11:10、11:29、17:07、17:38),传感器本身可能存在故障或受高温干扰,进一步削弱了厨房环境监测的可靠性。", "推理步骤6: 该住户为独居老人,火灾风险的后果尤为严重——一旦发生火情,缺乏他人协助疏散,而低电量的烟雾报警器可能无法及时发出警报。", "推理步骤7: 入户门在 08:26 被手动开锁后,直到 20:46 才再次确认关门上锁,期间门锁状态为未锁定(LockState=2),长时间未锁门也增加了紧急情况下的风险暴露面。"], "key_evidence": ["2026-06-17T11:53 kitchen_smoke_alarm BatteryAlert=1,低电量告警已超过24小时未处理", "2026-06-18T11:53 灶具被再次开启,但老人约12:21已离开厨房进入卧室休息,灶具处于无人看管状态", "2026-06-18T12:03 厨房温度从25.86°C骤升至30.17°C(3分钟内+4.3°C),异常急剧升温", "2026-06-18T12:03 烟雾报警器报告 SmokeState=0,但在电池低电量下该读数可靠性存疑", "厨房温度传感器在灶具运行期间多次报告 None 值,传感器可能存在故障", "2026-06-18T08:26 至 20:46 入户门长时间处于未锁定状态"], "recommended_actions": ["立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,恢复其正常检测能力,这是最高优先级操作", "远程关闭厨房灶具(kitchen_cook_surface),消除当前无人看管的火灾隐患", "检查并维修厨房温度传感器(kitchen_temp_sensor),排查多次报告 None 值的故障原因,确保温度监测链路完整", "向老人或其紧急联系人(家属/社区护理人员)发送通知,告知烟雾报警器低电量和灶具无人看管的情况", "配置自动化规则:当烟雾报警器 BatteryAlert 触发时,立即推送通知给紧急联系人,并限制灶具的使用或增加额外监控", "配置自动化规则:灶具开启超过30分钟且厨房无人(occupancy=0)时,自动关闭灶具并发出警报", "建议在入户门设置自动上锁策略(如开锁后10分钟无操作自动锁定),减少长时间未锁门的安全风险", "考虑为独居老人增设厨房燃气泄漏传感器,形成烟雾+温度+燃气的多重火灾预警体系"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 7, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 28.808128595352173, "api_error": null} {"episode_id": "SQ5_TP_D_1088", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1088.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-07T00:00:00", "seed": 20261717, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-07T06:09:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"06:09 有人使用合法用户凭证(UserIndex=1)通过远程方式开锁进入,但老人当时在厨房做饭且未离开过家,存在凭证被盗用/复制的高度嫌疑。\",\n \"reasoning\": [\n \"推理步骤1: 05:24 卧室运动传感器触发,老人起床,随后05:36进入卫生间,05:56进入厨房并于05:56:34开启灶具做早餐——老人全程在家中活动,动线清晰连续。\",\n \"推理步骤2: 06:09 入户门锁记录了一次开锁事件,LockOperationType=1(Unlock),OperationSource=8(远程/凭证方式),使用的是 UserIndex=1(通常为户主本人的主凭证)。然而此时老人正在厨房做饭(灶具05:56开启,06:21才关闭),厨房运动传感器在05:56已触发且老人未离开厨房区域。\",\n \"推理步骤3: 06:09:03 入户门传感器 StateValue=False 表示门被打开,06:09:05 玄关运动传感器触发表明确实有人进入。06:09:20 客厅运动传感器触发说明来人进入了客厅,但06:09:25客厅灯被关闭(而非打开),这一反常操作暗示来人可能不希望引起注意。\",\n \"推理步骤4: 关键矛盾——老人是独居状态,本人在厨房,却有人用她的主凭证(UserIndex=1)通过远程方式(OperationSource=8)从外部开锁进入。正常情况下老人从内部出门应为 Manual 操作源,且不会在自己做饭时从外面开门。这强烈指向凭证被盗用或复制。\",\n \"推理步骤5: 对比06:54的正常出门事件——老人关厨房灯后手动开锁(OperationSource=Manual)、开门、关门、自动上锁,流程完全合理。而06:09的事件缺少老人从厨房移动到玄关的过程,且操作源为远程,进一步证实这不是老人本人的操作。\",\n \"推理步骤6: 入侵者在06:09:20进入客厅后,直到老人06:21关灶、06:54出门之间的活动不明。老人08:31回家时手动开锁进入,说明她对06:09的入侵可能毫不知情。\"\n ],\n \"key_evidence\": [\n \"06:09 开锁事件使用 OperationSource=8(远程凭证),UserIndex=1(户主主凭证),但老人此时在厨房做饭(灶具05:56~06:21持续开启)\",\n \"06:09:03 入户门打开(StateValue=False),06:09:05 玄关有人进入,06:09:20 客厅有人进入——存在明确的物理入侵轨迹\",\n \"06:09:25 客厅灯被关闭而非打开,来人刻意避免引起注意,行为异常\",\n \"老人为独居状态,不应有第二人持有合法凭证从外部远程开锁\",\n \"对比06:54老人正常出门为 Manual 操作源,06:09的远程操作源明显不符合老人日常习惯\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,撤销当前所有数字凭证/密码/远程访问令牌,防止入侵者再次使用被盗凭证进入\",\n \"【立即】通过紧急联系人或社区服务确认老人当前安全状况,必要时拨打110报警\",\n \"【立即】向老人或其监护人发送高优先级安全警报,告知06:09存在可疑入侵事件\",\n \"【短期】检查门锁的凭证管理日志,排查 UserIndex=1 的凭证是否被复制、共享或通过漏洞泄露;检查远程访问平台(App/云端)是否存在异常登录记录\",\n \"【短期】重新为老人生成全新的门锁凭证(PIN码、数字钥匙等),启用双因素认证(如远程开锁需老人手机确认)\",\n \"【短期】检查家中是否有财物丢失或被翻动的痕迹,配合警方调取小区监控录像确认06:09前后入户门外的人员情况\",\n \"【中期】为门锁启用异常开锁实时告警规则:当室内有人活动时从外部远程开锁,立即触发警报并推送通知\",\n \"【中期】考虑加装入户门外的摄像头/可视门铃,为后续类似事件提供视频证据\",\n \"【中期】对门锁固件进行安全更新,排查是否存在已知的远程凭证漏洞\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "06:09 有人使用合法用户凭证(UserIndex=1)通过远程方式开锁进入,但老人当时在厨房做饭且未离开过家,存在凭证被盗用/复制的高度嫌疑。", "reasoning": ["推理步骤1: 05:24 卧室运动传感器触发,老人起床,随后05:36进入卫生间,05:56进入厨房并于05:56:34开启灶具做早餐——老人全程在家中活动,动线清晰连续。", "推理步骤2: 06:09 入户门锁记录了一次开锁事件,LockOperationType=1(Unlock),OperationSource=8(远程/凭证方式),使用的是 UserIndex=1(通常为户主本人的主凭证)。然而此时老人正在厨房做饭(灶具05:56开启,06:21才关闭),厨房运动传感器在05:56已触发且老人未离开厨房区域。", "推理步骤3: 06:09:03 入户门传感器 StateValue=False 表示门被打开,06:09:05 玄关运动传感器触发表明确实有人进入。06:09:20 客厅运动传感器触发说明来人进入了客厅,但06:09:25客厅灯被关闭(而非打开),这一反常操作暗示来人可能不希望引起注意。", "推理步骤4: 关键矛盾——老人是独居状态,本人在厨房,却有人用她的主凭证(UserIndex=1)通过远程方式(OperationSource=8)从外部开锁进入。正常情况下老人从内部出门应为 Manual 操作源,且不会在自己做饭时从外面开门。这强烈指向凭证被盗用或复制。", "推理步骤5: 对比06:54的正常出门事件——老人关厨房灯后手动开锁(OperationSource=Manual)、开门、关门、自动上锁,流程完全合理。而06:09的事件缺少老人从厨房移动到玄关的过程,且操作源为远程,进一步证实这不是老人本人的操作。", "推理步骤6: 入侵者在06:09:20进入客厅后,直到老人06:21关灶、06:54出门之间的活动不明。老人08:31回家时手动开锁进入,说明她对06:09的入侵可能毫不知情。"], "key_evidence": ["06:09 开锁事件使用 OperationSource=8(远程凭证),UserIndex=1(户主主凭证),但老人此时在厨房做饭(灶具05:56~06:21持续开启)", "06:09:03 入户门打开(StateValue=False),06:09:05 玄关有人进入,06:09:20 客厅有人进入——存在明确的物理入侵轨迹", "06:09:25 客厅灯被关闭而非打开,来人刻意避免引起注意,行为异常", "老人为独居状态,不应有第二人持有合法凭证从外部远程开锁", "对比06:54老人正常出门为 Manual 操作源,06:09的远程操作源明显不符合老人日常习惯"], "recommended_actions": ["【立即】远程锁定入户门锁,撤销当前所有数字凭证/密码/远程访问令牌,防止入侵者再次使用被盗凭证进入", "【立即】通过紧急联系人或社区服务确认老人当前安全状况,必要时拨打110报警", "【立即】向老人或其监护人发送高优先级安全警报,告知06:09存在可疑入侵事件", "【短期】检查门锁的凭证管理日志,排查 UserIndex=1 的凭证是否被复制、共享或通过漏洞泄露;检查远程访问平台(App/云端)是否存在异常登录记录", "【短期】重新为老人生成全新的门锁凭证(PIN码、数字钥匙等),启用双因素认证(如远程开锁需老人手机确认)", "【短期】检查家中是否有财物丢失或被翻动的痕迹,配合警方调取小区监控录像确认06:09前后入户门外的人员情况", "【中期】为门锁启用异常开锁实时告警规则:当室内有人活动时从外部远程开锁,立即触发警报并推送通知", "【中期】考虑加装入户门外的摄像头/可视门铃,为后续类似事件提供视频证据", "【中期】对门锁固件进行安全更新,排查是否存在已知的远程凭证漏洞"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 34.77970218658447, "api_error": null} {"episode_id": "SQ5_TP_D_1093", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1093.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-26T00:00:00", "seed": 20261722, "scenario_id": "FG-04", "total_events": 208, "anomaly_events_count": 4}, "ground_truth": {"scenario_id": "FG-04", "scenario_name": "烟雾报警器低电量时发生事件", "category": "fire_gas", "is_anomaly": true, "threat_type": "degraded_safety_device", "key_evidence": ["烟雾报警器处于低电量状态", "厨房有高温活动但烟雾传感器未触发", "两个信号组合:低电量 + 温度上升但烟雾传感器无反应 → 设备可能失灵", "这是复合推理场景,需要关联两个独立信号"], "expected_response": "警告住户烟雾报警器可能失灵,建议更换电池/设备", "difficulty": "hard", "target_room": "living_room", "injection_time": "2026-06-26T10:30:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告 None(疑似故障),独居老人每日多次使用灶具,火灾预警能力严重削弱。\",\n \"reasoning\": [\n \"推理步骤1: 2026-06-25T10:30 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。\",\n \"推理步骤2: 日志显示老人当天共使用灶具三次(06:03-06:24、11:06-11:31、16:50-17:34),用火频率较高,对烟雾报警器的依赖程度很高。\",\n \"推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:04、06:25、11:07、11:32、16:51、17:35),说明该传感器存在间歇性故障,无法在烹饪期间提供有效的温度监测数据,进一步削弱了厨房的安全监控能力。\",\n \"推理步骤4: 10:30 灶具开启后,10:40 厨房温度从约 2510(25.1°C)骤升至 2977(29.77°C),涨幅近 4.7°C,此时烟雾报警器报告 SmokeState=0(正常),但考虑到电池低电量,该读数的可靠性存疑。\",\n \"推理步骤5: 住户为独居老人,一旦发生火灾或燃气泄漏,低电量报警器可能无法及时发出警报,加上温度传感器故障,老人将完全失去厨房安全预警,后果极为严重。\",\n \"推理步骤6: 08:29 老人回家后入户门未重新上锁(日志中无 LockOperationType=0 的上锁事件,直到 20:53 才自动上锁),白天长时间门锁处于未锁定状态,虽非本次核心威胁,但对独居老人也构成安全隐患。\"\n ],\n \"key_evidence\": [\n \"2026-06-25T10:30 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低\",\n \"厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:04、06:25、11:07、11:32、16:51、17:35),传感器间歇性失效\",\n \"老人当天三次使用灶具(06:03-06:24、11:06-11:31、16:50-17:34),用火频繁\",\n \"10:40 厨房温度骤升至 29.77°C(较基线升高约 4.7°C),虽然 SmokeState=0,但报警器低电量下可靠性存疑\",\n \"08:29 入户门解锁后至 20:53 期间无上锁记录,门锁长时间处于未锁定状态\"\n ],\n \"recommended_actions\": [\n \"【紧急】立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保其能在烟雾事件中正常报警。若为不可更换电池型号,应立即更换整个设备。\",\n \"【紧急】检修或更换厨房温度传感器(kitchen_temp_sensor),该传感器在灶具使用时反复报告 None,已无法提供有效的温度异常监测。\",\n \"【重要】在烟雾报警器电池更换完成前,建议老人减少灶具使用,或安排家人/护工在烹饪时陪同监护。\",\n \"【重要】对烟雾报警器进行一次手动测试(按下测试按钮),验证其在当前电量下是否仍能发出声光报警。\",\n \"【建议】为厨房增设独立的燃气泄漏检测器,形成多重安全防护,不完全依赖单一烟雾报警器。\",\n \"【建议】配置入户门锁自动上锁策略(如解锁后 5 分钟无操作自动上锁),避免老人外出归来后忘记锁门导致长时间门户大开。\",\n \"【建议】为烟雾报警器和温度传感器设置低电量/离线告警的自动通知,推送给老人的紧急联系人(子女或社区工作人员),确保设备异常能被及时发现和处理。\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "厨房烟雾报警器处于低电量状态,同时厨房温度传感器多次报告 None(疑似故障),独居老人每日多次使用灶具,火灾预警能力严重削弱。", "reasoning": ["推理步骤1: 2026-06-25T10:30 厨房烟雾报警器上报 BatteryAlert=1,表示电池电量低,报警器可能无法在烟雾浓度达到阈值时正常发出警报。", "推理步骤2: 日志显示老人当天共使用灶具三次(06:03-06:24、11:06-11:31、16:50-17:34),用火频率较高,对烟雾报警器的依赖程度很高。", "推理步骤3: 厨房温度传感器在灶具开启期间多次报告 MeasuredValue=None(06:04、06:25、11:07、11:32、16:51、17:35),说明该传感器存在间歇性故障,无法在烹饪期间提供有效的温度监测数据,进一步削弱了厨房的安全监控能力。", "推理步骤4: 10:30 灶具开启后,10:40 厨房温度从约 2510(25.1°C)骤升至 2977(29.77°C),涨幅近 4.7°C,此时烟雾报警器报告 SmokeState=0(正常),但考虑到电池低电量,该读数的可靠性存疑。", "推理步骤5: 住户为独居老人,一旦发生火灾或燃气泄漏,低电量报警器可能无法及时发出警报,加上温度传感器故障,老人将完全失去厨房安全预警,后果极为严重。", "推理步骤6: 08:29 老人回家后入户门未重新上锁(日志中无 LockOperationType=0 的上锁事件,直到 20:53 才自动上锁),白天长时间门锁处于未锁定状态,虽非本次核心威胁,但对独居老人也构成安全隐患。"], "key_evidence": ["2026-06-25T10:30 kitchen_smoke_alarm BatteryAlert=1,烟雾报警器电池电量低", "厨房温度传感器在灶具使用期间多次报告 MeasuredValue=None(06:04、06:25、11:07、11:32、16:51、17:35),传感器间歇性失效", "老人当天三次使用灶具(06:03-06:24、11:06-11:31、16:50-17:34),用火频繁", "10:40 厨房温度骤升至 29.77°C(较基线升高约 4.7°C),虽然 SmokeState=0,但报警器低电量下可靠性存疑", "08:29 入户门解锁后至 20:53 期间无上锁记录,门锁长时间处于未锁定状态"], "recommended_actions": ["【紧急】立即更换厨房烟雾报警器(kitchen_smoke_alarm)的电池,确保其能在烟雾事件中正常报警。若为不可更换电池型号,应立即更换整个设备。", "【紧急】检修或更换厨房温度传感器(kitchen_temp_sensor),该传感器在灶具使用时反复报告 None,已无法提供有效的温度异常监测。", "【重要】在烟雾报警器电池更换完成前,建议老人减少灶具使用,或安排家人/护工在烹饪时陪同监护。", "【重要】对烟雾报警器进行一次手动测试(按下测试按钮),验证其在当前电量下是否仍能发出声光报警。", "【建议】为厨房增设独立的燃气泄漏检测器,形成多重安全防护,不完全依赖单一烟雾报警器。", "【建议】配置入户门锁自动上锁策略(如解锁后 5 分钟无操作自动上锁),避免老人外出归来后忘记锁门导致长时间门户大开。", "【建议】为烟雾报警器和温度传感器设置低电量/离线告警的自动通知,推送给老人的紧急联系人(子女或社区工作人员),确保设备异常能被及时发现和处理。"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 26.728437185287476, "api_error": null} {"episode_id": "SQ5_TP_D_1096", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1096.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-11T00:00:00", "seed": 20261725, "scenario_id": "INS-05", "total_events": 209, "anomaly_events_count": 5}, "ground_truth": {"scenario_id": "INS-05", "scenario_name": "伪装开锁(被盗/复制凭证)", "category": "intrusion", "is_anomaly": true, "threat_type": "credential_theft", "key_evidence": ["合法凭证开锁,但进入后的行为模式与住户不符", "不开灯(住户通常到家后开灯)", "如果已知住户此时在别处(如还有工作GPS等外部信息),则更可疑", "本场景的难点:单看门锁事件是合法的,需要结合行为模式判断"], "expected_response": "中等可信度警报,建议住户确认是否本人操作", "difficulty": "very_hard", "target_room": "living_room", "injection_time": "2026-06-11T18:52:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"intrusion\",\n \"threat_description\": \"18:52 有人使用已注册用户凭证(UserIndex=1)远程开锁进入,但老人当时在家且未主动开门,入户门随后长时间未关闭未上锁,高度疑似凭证被盗用或复制。\",\n \"reasoning\": [\n \"推理步骤1: 18:52 入户门锁事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/凭证方式)、UserIndex=1。这不是手动开锁,也不是物理钥匙,而是通过远程指令或已注册凭证触发的解锁操作。\",\n \"推理步骤2: 老人当天 06:50 手动开锁出门、06:50:11 自动上锁;08:33 手动开锁回家。从 08:33 到 18:52 期间,老人一直在家活动(客厅、卧室、厨房均有持续的运动和灯光事件),没有出门的记录。因此 18:52 的开锁不是老人自己在门外操作。\",\n \"推理步骤3: 18:52:03 门被打开(StateValue=False),18:52:05 玄关检测到有人进入,18:52:20 客厅检测到运动,但 18:52:25 客厅灯随即被关闭——这与老人平时回家开灯的习惯相反(参考 08:33 回家后开灯),行为模式异常。\",\n \"推理步骤4: 关键异常——从 18:52 门被打开后,直到 20:55:10 才记录到门关闭(StateValue=True)和自动上锁。这意味着入户门敞开了约 2 小时,这对独居老人来说极不正常,暗示老人可能未意识到门被打开,或者有人故意保持门开启状态。\",\n \"推理步骤5: 19:21 客厅灯被调到很低亮度(CurrentLevel=30),而非正常开启,这与老人白天/傍晚的正常用灯习惯不符,可能是入侵者试图保持低调。\",\n \"推理步骤6: 综合判断——远程凭证开锁 + 老人在家却非本人操作 + 进入后关灯而非开灯 + 入户门长时间未关闭 + 异常低亮度灯光,强烈指向凭证被盗用/复制,有人利用合法凭证非法进入住宅。\"\n ],\n \"key_evidence\": [\n \"18:52 入户门通过远程凭证(OperationSource=8, UserIndex=1)解锁,而老人自 08:33 起一直在家,非本人在门外操作\",\n \"18:52:25 进入后立即关闭客厅灯,与老人 08:33 回家后开灯的正常习惯完全相反\",\n \"入户门从 18:52 打开后直到 20:55:10 才关闭上锁,敞开长达约 2 小时\",\n \"19:21 客厅灯被设置为极低亮度(Level=30),行为异常\",\n \"当天老人的正常开锁均为 Manual 方式(06:50、08:33),18:52 的远程开锁方式与日常习惯不一致\"\n ],\n \"recommended_actions\": [\n \"【立即】远程锁定入户门锁,撤销 UserIndex=1 的当前凭证(PIN码/指纹/远程密钥),防止凭证被再次使用\",\n \"【立即】通过紧急联系人或社区服务确认老人当前安全状况,必要时拨打 110 报警\",\n \"【立即】调取门锁完整的凭证使用日志和远程访问记录,确认 OperationSource=8 的具体来源(APP远程开锁、NFC、蓝牙等)\",\n \"【短期】为老人重新生成全部门锁凭证(更换PIN码、重新录入指纹),启用门锁的双重认证机制\",\n \"【短期】检查智能家居平台账户安全:修改账户密码、启用两步验证、检查是否有未授权设备或会话登录\",\n \"【短期】设置门锁安全规则:当老人在家时(室内有运动传感器活动),若收到远程开锁指令,先向老人和紧急联系人发送确认通知\",\n \"【中期】增加入户门区域的摄像头监控,便于事后追溯和实时告警\",\n \"【中期】配置异常开锁行为的实时告警规则:非 Manual 方式开锁、深夜开锁、门长时间未关闭等场景自动推送通知给老人家属\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "intrusion", "threat_description": "18:52 有人使用已注册用户凭证(UserIndex=1)远程开锁进入,但老人当时在家且未主动开门,入户门随后长时间未关闭未上锁,高度疑似凭证被盗用或复制。", "reasoning": ["推理步骤1: 18:52 入户门锁事件显示 LockOperationType=1(解锁)、OperationSource=8(远程/凭证方式)、UserIndex=1。这不是手动开锁,也不是物理钥匙,而是通过远程指令或已注册凭证触发的解锁操作。", "推理步骤2: 老人当天 06:50 手动开锁出门、06:50:11 自动上锁;08:33 手动开锁回家。从 08:33 到 18:52 期间,老人一直在家活动(客厅、卧室、厨房均有持续的运动和灯光事件),没有出门的记录。因此 18:52 的开锁不是老人自己在门外操作。", "推理步骤3: 18:52:03 门被打开(StateValue=False),18:52:05 玄关检测到有人进入,18:52:20 客厅检测到运动,但 18:52:25 客厅灯随即被关闭——这与老人平时回家开灯的习惯相反(参考 08:33 回家后开灯),行为模式异常。", "推理步骤4: 关键异常——从 18:52 门被打开后,直到 20:55:10 才记录到门关闭(StateValue=True)和自动上锁。这意味着入户门敞开了约 2 小时,这对独居老人来说极不正常,暗示老人可能未意识到门被打开,或者有人故意保持门开启状态。", "推理步骤5: 19:21 客厅灯被调到很低亮度(CurrentLevel=30),而非正常开启,这与老人白天/傍晚的正常用灯习惯不符,可能是入侵者试图保持低调。", "推理步骤6: 综合判断——远程凭证开锁 + 老人在家却非本人操作 + 进入后关灯而非开灯 + 入户门长时间未关闭 + 异常低亮度灯光,强烈指向凭证被盗用/复制,有人利用合法凭证非法进入住宅。"], "key_evidence": ["18:52 入户门通过远程凭证(OperationSource=8, UserIndex=1)解锁,而老人自 08:33 起一直在家,非本人在门外操作", "18:52:25 进入后立即关闭客厅灯,与老人 08:33 回家后开灯的正常习惯完全相反", "入户门从 18:52 打开后直到 20:55:10 才关闭上锁,敞开长达约 2 小时", "19:21 客厅灯被设置为极低亮度(Level=30),行为异常", "当天老人的正常开锁均为 Manual 方式(06:50、08:33),18:52 的远程开锁方式与日常习惯不一致"], "recommended_actions": ["【立即】远程锁定入户门锁,撤销 UserIndex=1 的当前凭证(PIN码/指纹/远程密钥),防止凭证被再次使用", "【立即】通过紧急联系人或社区服务确认老人当前安全状况,必要时拨打 110 报警", "【立即】调取门锁完整的凭证使用日志和远程访问记录,确认 OperationSource=8 的具体来源(APP远程开锁、NFC、蓝牙等)", "【短期】为老人重新生成全部门锁凭证(更换PIN码、重新录入指纹),启用门锁的双重认证机制", "【短期】检查智能家居平台账户安全:修改账户密码、启用两步验证、检查是否有未授权设备或会话登录", "【短期】设置门锁安全规则:当老人在家时(室内有运动传感器活动),若收到远程开锁指令,先向老人和紧急联系人发送确认通知", "【中期】增加入户门区域的摄像头监控,便于事后追溯和实时告警", "【中期】配置异常开锁行为的实时告警规则:非 Manual 方式开锁、深夜开锁、门长时间未关闭等场景自动推送通知给老人家属"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 32.47166323661804, "api_error": null} {"episode_id": "SQ5_TP_D_1097", "episode_path": "C:\\Users\\Wal1et\\Downloads\\llmiotsafe\\data\\benchmark\\sq5\\SQ5_TP_D_1097.json", "metadata": {"sq_type": "SQ5", "sq_name": "应急响应规划", "variant": "TP", "layout_id": "D", "layout_name": "独居老人 (Elderly Living Alone)", "profile_id": "elderly_living_alone", "base_date": "2026-06-24T00:00:00", "seed": 20261726, "scenario_id": "FG-03", "total_events": 207, "anomaly_events_count": 3}, "ground_truth": {"scenario_id": "FG-03", "scenario_name": "CO浓度升高", "category": "fire_gas", "is_anomaly": true, "threat_type": "carbon_monoxide", "key_evidence": ["SmokeCoAlarm 的 COState 变为 Warning 或 Critical", "CO 报警是严重安全事件,不同于烟雾报警"], "expected_response": "紧急通知所有住户撤离,开窗通风,联系燃气公司", "difficulty": "medium", "target_room": "bedroom", "injection_time": "2026-06-24T13:08:00", "variant": "TP"}, "raw_response": "```json\n{\n \"is_anomaly\": true,\n \"confidence\": \"high\",\n \"threat_type\": \"fire_risk\",\n \"threat_description\": \"客厅烟雾报警器在13:08触发CO(一氧化碳)警报,老人当时在卧室午休,存在一氧化碳中毒的严重生命威胁。\",\n \"reasoning\": [\n \"推理步骤1: 13:08客厅烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认一氧化碳浓度已达到报警阈值。\",\n \"推理步骤2: 回溯事件链——10:51厨房灶具开启,11:36关闭,使用时长约45分钟。灶具关闭后厨房温度传感器在11:37报告None(可能受热干扰),但CO警报在灶具关闭后约1.5小时才触发,说明CO可能在灶具使用期间持续积累,或存在燃气不完全燃烧、排烟不畅等问题。\",\n \"推理步骤3: 检查通风状况——日志中未见任何窗户打开记录(客厅窗户传感器无状态变化),客厅空调也未开启,说明室内通风极差,CO无法有效排出,这与CO持续积累的推断一致。\",\n \"推理步骤4: 老人在12:39进入卧室(卧室运动传感器触发、窗帘关闭),直到13:58才再次出现活动。CO警报在13:08触发时老人正在卧室,且在警报触发后约50分钟才有活动迹象,存在老人未能及时察觉警报或已受CO影响的可能。\",\n \"推理步骤5: 这是独居老人场景,CO中毒初期症状(头晕、嗜睡)容易与午休混淆,且无其他人可以协助发现异常,风险等级极高。\",\n \"推理步骤6: 厨房温度传感器在灶具使用期间多次报告None值(05:54、06:34、10:52、11:37),这一反复出现的异常可能指示传感器受高温干扰或厨房环境异常,间接佐证厨房燃烧环境存在问题。\"\n ],\n \"key_evidence\": [\n \"13:08 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件\",\n \"10:51-11:36 厨房灶具持续使用约45分钟,CO警报在灶具关闭后约1.5小时触发\",\n \"全天无客厅窗户打开记录,空调未开启,室内通风条件极差\",\n \"12:39老人进入卧室午休,13:08 CO警报触发时老人在卧室,13:58才恢复活动(间隔约50分钟)\",\n \"厨房温度传感器多次报告None值,提示厨房环境或传感器存在异常\",\n \"08:38老人回家后入户门未关闭(无front_door_contact恢复True的记录,直到20:49才关门上锁),但门开状态未能有效通风排出CO\"\n ],\n \"recommended_actions\": [\n \"【立即】远程或自动打开所有窗户(客厅窗帘/窗户、卧室窗户)进行紧急通风,如支持窗户开启控制应立即执行\",\n \"【立即】通过紧急联系人系统拨打120急救电话,并通知老人的紧急联系人(家属/社区),告知CO警报已触发、老人可能在卧室午休未响应\",\n \"【立即】远程关闭厨房灶具燃气阀门(如有智能燃气阀),确认灶具已完全关闭,防止继续产生CO\",\n \"【立即】开启客厅空调的送风/换气模式,加速室内空气流通\",\n \"【立即】触发卧室灯和床头灯全亮、客厅灯全亮,尝试唤醒老人引起注意\",\n \"【短期】安排专业人员检查厨房灶具燃烧状况、排烟管道是否堵塞,排查CO泄漏源\",\n \"【短期】检查厨房温度传感器反复报告None的原因,确认是否存在传感器故障或厨房环境异常\",\n \"【中期】在厨房加装独立CO报警器,实现更早期的CO检测预警\",\n \"【中期】配置自动化规则:当CO警报触发时自动开窗通风、关闭燃气、发送紧急通知、触发声光警报\",\n \"【中期】为独居老人配备可穿戴紧急呼叫设备,在无法自主响应时可自动求助\"\n ]\n}\n```", "model_response": {"is_anomaly": true, "confidence": "high", "threat_type": "fire_risk", "threat_description": "客厅烟雾报警器在13:08触发CO(一氧化碳)警报,老人当时在卧室午休,存在一氧化碳中毒的严重生命威胁。", "reasoning": ["推理步骤1: 13:08客厅烟雾报警器报告COState=1(CO检测到)、ExpressedState=2(CO报警状态)并触发COAlarm事件,确认一氧化碳浓度已达到报警阈值。", "推理步骤2: 回溯事件链——10:51厨房灶具开启,11:36关闭,使用时长约45分钟。灶具关闭后厨房温度传感器在11:37报告None(可能受热干扰),但CO警报在灶具关闭后约1.5小时才触发,说明CO可能在灶具使用期间持续积累,或存在燃气不完全燃烧、排烟不畅等问题。", "推理步骤3: 检查通风状况——日志中未见任何窗户打开记录(客厅窗户传感器无状态变化),客厅空调也未开启,说明室内通风极差,CO无法有效排出,这与CO持续积累的推断一致。", "推理步骤4: 老人在12:39进入卧室(卧室运动传感器触发、窗帘关闭),直到13:58才再次出现活动。CO警报在13:08触发时老人正在卧室,且在警报触发后约50分钟才有活动迹象,存在老人未能及时察觉警报或已受CO影响的可能。", "推理步骤5: 这是独居老人场景,CO中毒初期症状(头晕、嗜睡)容易与午休混淆,且无其他人可以协助发现异常,风险等级极高。", "推理步骤6: 厨房温度传感器在灶具使用期间多次报告None值(05:54、06:34、10:52、11:37),这一反复出现的异常可能指示传感器受高温干扰或厨房环境异常,间接佐证厨房燃烧环境存在问题。"], "key_evidence": ["13:08 living_room_smoke_alarm COState=1, ExpressedState=2, 触发COAlarm事件", "10:51-11:36 厨房灶具持续使用约45分钟,CO警报在灶具关闭后约1.5小时触发", "全天无客厅窗户打开记录,空调未开启,室内通风条件极差", "12:39老人进入卧室午休,13:08 CO警报触发时老人在卧室,13:58才恢复活动(间隔约50分钟)", "厨房温度传感器多次报告None值,提示厨房环境或传感器存在异常", "08:38老人回家后入户门未关闭(无front_door_contact恢复True的记录,直到20:49才关门上锁),但门开状态未能有效通风排出CO"], "recommended_actions": ["【立即】远程或自动打开所有窗户(客厅窗帘/窗户、卧室窗户)进行紧急通风,如支持窗户开启控制应立即执行", "【立即】通过紧急联系人系统拨打120急救电话,并通知老人的紧急联系人(家属/社区),告知CO警报已触发、老人可能在卧室午休未响应", "【立即】远程关闭厨房灶具燃气阀门(如有智能燃气阀),确认灶具已完全关闭,防止继续产生CO", "【立即】开启客厅空调的送风/换气模式,加速室内空气流通", "【立即】触发卧室灯和床头灯全亮、客厅灯全亮,尝试唤醒老人引起注意", "【短期】安排专业人员检查厨房灶具燃烧状况、排烟管道是否堵塞,排查CO泄漏源", "【短期】检查厨房温度传感器反复报告None的原因,确认是否存在传感器故障或厨房环境异常", "【中期】在厨房加装独立CO报警器,实现更早期的CO检测预警", "【中期】配置自动化规则:当CO警报触发时自动开窗通风、关闭燃气、发送紧急通知、触发声光警报", "【中期】为独居老人配备可穿戴紧急呼叫设备,在无法自主响应时可自动求助"]}, "scores": {"parse_success": true, "detection_correct": true, "detection_label": "HIT", "is_miss": false, "is_false_alarm": false, "threat_type_correct": false, "reasoning_steps": 6, "has_evidence": true, "has_actions": true, "confidence": "high"}, "latency": 31.028728246688843, "api_error": null}