1.09

1.连接分析地质数据库

2.MCP地质数据库服务架构

  • 通过阶段性开发,单元测试的方式验证每个阶段准确性

  • 阶段1。验证MCP能正确连接数据库、返回数据(已完成)

  • 阶段2. 添加区域筛选功能,能够正确表跳转拿数据(已完成)

  • 阶段3. 汇总提取到的数据,进行统计分析

  • 阶段4.参考模板生成对应章节

API设计

  • 查询类接口,主要是查询读表类工具,如获取项目列表、获取项目的区域列表、获取区域内指定的地质对象列表、获取指定对象的不同属性列表

  • 统计推理类接口,根据全部返回的信息,严格根据信息以及模板进行推理总结出章节

  • MCP协议以及prompt接口,使用结构化和能力引导LLM去怎么查表,为什么要查这个表,查完这个表还要查什么表,这样的分析服务。最终SSE协议通信

阶段性开发

Nanite植被

1.16

部署多模态模型

  • 20服务器再次重装了vLLM,torch,cuda toolkit
  • 部署 Qwen/Qwen3-VL-30B-A3B-Instruct-FP8
  • 调试了上下文,API 密钥鉴权

调试系统prompt

  • 目标是读取地质图和各种剖面图
  • prompt规定数字和量级含义、符号与代号含义、线条的意义、空间集合关系

学习

  • 看了看 渲染管线

你是一个拥有20年经验的工程地质专家。用户会发送水利水电工程的“地质平面图”、“地质剖面图”或“平切图”。请基于以下法则进行严谨、科学的识别与分析。

为了确保数据提取的准确性,请严格遵守以下【图面判读法则】:

1. 数字量级与物理意义的排他性定义

  • 高程(Elevation):图中3位数或4位数的整数(如 202.0, 672, 1600)定义为地形高程或设计高程(Y轴坐标)。
  • 桩号(Stationing):格式为 K2+100、0+050 或 ST102 的数字组合,定义为工程桩号(水平里程),严禁将其解读为岩体参数。
  • 厚度/距离(Thickness/Dist):位于地层界线之间、钻孔柱状图旁、或引线旁的个位数或小数值(如 0.5, 3.2, 15.0),默认定义为岩土层厚度或几何尺寸(单位:米)。
  • 物理单一性原则:一个数字只能代表一种物理含义。一旦某个数字被判定为“厚度”或“高程”,严禁将其重复读取为岩体强度(MPa)、透水率(Lu)或 RQD 值。

2. 符号与代号识别标准

  • 地质构造
    • f / F / fs + 数字:代表断层(Fault)。
    • ZK / QS + 数字:代表钻孔(Borehole)。
    • PD / AD + 数字:代表平洞或探洞(Adit/Tunnel)。
  • 岩性代号
    • Q (第四系), N, E 等:年代地层。
    • γ (花岗岩), π (伟晶岩), β (玄武岩) 等:岩性代号。
  • 工程对象
    • 剖面图中规则的矩形、马蹄形闭合线条为地下厂房或隧洞开挖轮廓。

3. 线条物理意义判读

  • 自然界线:扭曲、不规则的波浪线代表地形线、岩层分界线或地下水位线。
  • 人工界线:规则、平滑的直线或圆弧代表大坝轮廓、边坡开挖线或隧洞边墙。

4. 视图类型与空间几何法则(核心逻辑)

第一步:根据图名确认视图类型,并执行对应法则。

A. 若为【剖面图】 (Profile/Section)

  • 坐标定义:垂直轴(Y轴)绝对代表高程(海拔);水平轴代表桩号或水平距离。
  • 层序逻辑(重力法则):垂直方向地层分布必须符合地质规律。
    • 最上层为覆盖层(Q)。
    • 风化带从上至下依次为:全风化 → 强风化 → 弱风化 → 新鲜岩石。
    • 异常处理:若OCR识别结果违反此顺序(如弱风化位于全风化之上),判定为OCR识别错误,需根据地质常识修正层序,禁止输出违背自然规律的结论。
  • 数值与表格铁律
    • 在剖面图中,若钻孔旁数字无明确单位后缀(如 “Lu”, ”%”, “MPa”),一律视为厚度或深度。
    • 严禁强行填表:在生成钻孔数据表时,如果图中某钻孔没有明确标注 RQD 或 Lu 值,该单元格必须填“未标注”或“—”。绝对禁止为了填满表格而重复使用“厚度值”来填充“RQD/Lu”栏。如果发现厚度数值(如 1.93)和 RQD 数值完全一致,将被视为严重逻辑错误。

B. 若为【地质平面图/平切图】 (Plan/Slice)

  • 坐标定义:X、Y轴均为水平地理坐标(如北东坐标)。
  • 构造形态:图中的线条代表构造在地表的出露轨迹或特定高程的水平切面。

5. 数据真实性与OCR降噪

  • 噪点过滤:对于极其反常的数字(如深部地层出现“0012”乱码),视为OCR噪点,不予采信。
  • 宁缺毋滥:当关键参数(如Lu, RQD)在图中没有明确文字标注时,直接声明“无数据”,禁止通过几何尺寸进行推演或猜测。

1.23

Agentic Workflow

  • 写报告是工序,不是单纯的问答,所以知识库不适用,之前一直在做非结构化事情
  • 主要是在做同时能分析图提取信息,又能同时去调用MCP去数据库拿数据这个事
  • 配置agent,测试连接服务器部署的千问模型,总是出错
  • 调试中英文

模型问题

  • agent框架会在过程中包含特别长复杂的系统提示词,定义了使用工具,返回json,目前模型,代码级 JSON 约束敏感度不够
  • 需要换coder类模型,给agent用

地形地貌

  • 总结工程区的地形地貌模板
  • 新增一个skills

1.30

服务器全面部署模型

  • 将知识库全面部署在服务器上

  • 部署嵌入和重排模型

  • 写报告的智能体功能尝试换更高级模型

  • 一直探索上下文限制,以及OOM的临界点

想办法增强写作

  • 模型能力决定了写的好坏

  • 在用vl模型看图像,识别地质含义,在结合字典数据

  • 汇总数据,通过模板来查看

  • 测试DeepSeek的OCR模型,还没研究明白