当前位置: 首页 > news >正文

每年写1000多篇文章,维护962个开源项目,他成了AI技术圈顶流!

如果你关注AI技术圈的话应该会知道Simon Willison下文简称西蒙。他的博客的文章在 Hacker News、RedditGitHub 社区经常被引用或讨论影响力经常排名第一可以说是遥遥领先。西蒙的博客有个非常显著的特征非常高产仅在2025年他就写了1000多篇博文但其中只有118篇是完整的文章仅此而已。西蒙经常在一些封闭的平台例如 TikTok、Twitter中发现灵感然后将其带到开放的网络上如Hacker News。他一些最受欢迎的帖子只是简单的引语或者链接并附上评论例如“我担心他们在Excel中加入Copilot功能”“电脑永远无法被追责”。西蒙曾表示这类文章写起来容易但价值很高。分享有趣的链接并附上评论是一种投入少、价值高的方式可以为互联网生活做出贡献。——西蒙·威利森“ 我运营链接博客的方法 ”如果你也想学他这么玩儿恐怕大概率要失败西蒙能做得这么成功本质原因还是因为他是个有着敏锐洞察力非常优秀的程序员。他是著名开源软件DjangoDatasettellm的创始人更夸张的是在GitHub上他维护的开源项目竟然有962个今天咱们来聊聊西蒙的故事。01一次伟大的实习西蒙是个英国人2001年进入巴斯大学读计算机。在读书期间他开始运营自己的个人主页在上面分享关于 Web 标准、CSS、PHP 和网页开发的知识。在那个时代优秀的技术网站不多西蒙的网站很快被远在美国肯萨斯州的一个叫Adrian Holovaty程序员也就是后来的 Django 联合创始人注意到了被他的技术实力所吸引。巴斯大学非常重视实践他们的本科学制有一种非常有特色的 4 年制的“三明治”课程前两年在学校上学第三年让学生去企业全职实习一整年称为 Placement Year第四年再回到学校完成毕业设计和学业。当Adrian得知西蒙正在找实习的时候立刻向他抛来了橄榄枝邀请他来美国堪萨斯州的劳伦斯小镇实习开发新闻网站 《劳伦斯日报》。2003 年秋天Simon 来到堪萨斯州与 Adrian Holovaty 以及后来加入的 Jacob Kaplan-Moss 组成了新闻网站的开发铁三角。由于新闻行业的节奏极快往往上午提需求、下午网页就要上线现有的工具根本不够用。三人迫于压力不得不想办法提炼出一套能让“即使是新手也能快速搭建应用”的工具这样就可以在紧迫的时间内把活儿干完。西蒙和同事结对编程开发了一些核心功能请求/响应对象URL解析模板语言ORM等。2004 年 Simon 结束实习回到巴斯大学而这套被他们留在报社的框架在 2005 年被正式开源。这就是今天大名鼎鼎的 Django因劳伦斯当地人喜欢爵士吉他手 Django Reinhardt 而得名。Django 在 Web 开发史上具有里程碑式的地位它确立了“大而全”的框架标准内置了从 ORM对象关系映射、身份验证、后台管理界面Admin到安全防护、缓存的一整套方案这种高度集成的方式极大地提升企业级应用的生产力。曾经采用Django开发系统的著名网站包括InstagramPinterestRedditDropboxMozilla Disqus、华盛顿邮报卫报等。Django是如此流行以至于Google 一搜 Django全是Django的框架抢了原本那个吉他手的 SEO 排名……02淋浴时顿悟2005年西蒙大学毕业后加入了当时如日中天的Yahoo!雅虎 核心技术开发团队干了两年后他他转型做了一段时间的独立技术顾问致力于OpenID的推广帮助各大传统媒体和网站构建去中心化的账户登录体系。这让他引起了新闻界的注意2008 年他被英国老牌大报 《卫报》The Guardian 挖走出任软件架构师Software Architect。在《卫报》期间他参与了一个数据可视化的项目使用的是Google Sheets这样的工具来发布《卫报》新闻发报道背后的数据。Google Sheets号称云端版Excel用起来很方便但是西蒙看到了一些局限例如无法进行复杂查询性能瓶颈尤其是缺乏 API 深度支持虽然它有 API但对于想要基于这些数据快速构建一个小工具的开发者来说Google Sheets 的接口并不够“开发者友好”。所以西蒙渴望找到一种更好的办法来发布和查询这些数据。几年后在一次淋浴的时候西蒙迎来了自己的“顿悟”时刻把SQLite 数据库变成一个可以浏览、查询、分享的只读网站。这就是Datasette。Datasette非常有意思比如你有一个 SQLite 文件 data.db里面有一张表 users运行命令datasette data.db浏览器里你会直接看到/data/users → 表格浏览/data/users.json → API/data?sqlselect * from users → SQL 查询相当于给SQLite的.db文件装上了一个网页外壳没有后端开发没有ORM没有API设计直接可用。Datasette看起来非常简单但是对于那些“任何有数据、想公开的人”非常有用。例如一些新闻机构、科研机构政府等它们有数据让想别人访问Datasette就是最低成本的发布工具。03华丽转型2023年ChatGPT爆发西蒙开始转型了。当然他并没有转型去做一个大模型训练者更没有去卖课而是不断地尝试GPT的能力让它去生成代码、操作数据、调用外部系统。他经常提到的一个案例自然语言 → SQL → 数据分析流水线例如你有一个 SQLite 数据库里边记录了用户行为日志、网站访问记录、API 调用数据。传统方式做分析的话需要写SQL用Python pandas之类的库来分析。西蒙的工作方式是(1) 用户问题“帮我分析最近一周哪个 API 错误最多并给出原因”(2) LLM 生成 SQLSELECT api, count(*)FROM logsWHERE date now()-7GROUP BY apiORDER BY count DESC;(3) SQLite 执行返回结果集/api/login 1200/api/pay 300(4) LLM 总结结果。login 接口错误最多可能原因是认证服务不稳定…现在看来这种方式没啥但放在2023年那个时间点这是让人耳目一新的工作方式。尤其是国内还在卖账号卖课程的时候西蒙已经远远地跑在前面了。西蒙反复在博客中强调一件事情LLM 最有价值的用途之一是作为“工具的接口”tool interface这种理念最终发展成了一个叫做llm的开源项目。llm把 GPT 这种大模型变成了 Unix 风格的命令行工具你可以像用 grep、awk 一样用 LLM。例如cat test.py | llm 解释这段代码cat log.txt | llm 总结错误cat report.txt | llm -m gpt-4 --system 以法律语气总结在llm工具出现之前大众的认知是 AI可以聊天、可以写作。在llm之后一部分人开始意识到AI 可以接入系统的数据处理节点这个影响是非常深远的后续的Tool Calling ,Function Calling , RAG都是这种思想让大模型不只是回答问题而是参与执行任务。想想现在火热的Claude Code西蒙在2023年就开发出的llm工具是不是洞察力超越常人西蒙不仅开发工具写博客也是一把好手他的博客没有花里胡哨的界面非常朴实接地气极少空谈概念每篇都有代码每个例子都可以复制运行开始在各个社区自发传播最终爆火。04你很容易脱颖而出西蒙在一篇文章中写道我曾经面试过数百人但是我发现很多优秀的人才把所有的精力都花在了给公司写代码上而不注意经营自己的个人品牌。实际上你只需付出相对较少的努力就能直接跃升到招聘经理的首选名单前列(甚至可能他们都没注意到。这些努力包括1开个博客每年发布一两篇有趣的科技文章可以是你的新发现、修复的漏洞或是解决的问题。2创建一个小型个人项目将代码上传到 GitHub同时附上一个 README 文件详细描述项目并附上运行截图几乎没有人这样做这只需要额外花费几个小时却能极大地提升你的项目在招聘经理眼中的影响力。这绝对是西蒙这个过来人的经验之谈如果你还没有这两样强烈建议你去做一下。
http://www.zskr.cn/news/1408229.html

相关文章:

  • Ubuntu 18.04卡在GNOME登录界面?别慌,三步教你用命令行‘抢救’系统并彻底解决磁盘爆满
  • SciencePlots安装避坑指南:从Anaconda环境到手动配置的完整实践
  • 告别手动输入密码!用Linux Expect脚本批量管理服务器,5分钟搞定SSH免密登录
  • 从化区搬家公司电话 理赔流程拆解:普通人一看就懂 - 从来都是英雄出少年
  • Unity WebRequest请求HTTPS总报证书错误?手把手教你用CertificateHandler解决Cert verify failed
  • 从三角网格到完美四边形:QRemeshify让你的Blender模型重获新生 [特殊字符]
  • 广州从化区搬家公司推荐 办公室搬迁流程混乱实用维权指南 - 从来都是英雄出少年
  • 2026 全球主流 GEO 优化服务商综合实力盘点 - GEO优化
  • QGIS新手必看:5种添加图层的方法,哪种最快?(附快捷键大全)
  • 告别安装失败!手把手教你用CMD搞定Office 2016专业增强版激活(附一键转换脚本)
  • 从化区搬家拆装损坏推卸责任?维权全攻略 正规公司推荐 - 从来都是英雄出少年
  • 五子棋AI对战平台搭建指南:整合强化学习模型与PyGame可视化界面
  • 别再只写测试步骤了!CPAL脚本中这6个testcase函数,让你的自动化报告更专业
  • 5个理由告诉你:为什么Postman便携版是API测试的最佳选择
  • 基于傅立叶变换的时序信号去噪实战:从理论到Python实现
  • 别再只写测试步骤了!用CPAL这6个testcase函数,让你的自动化测试报告更专业
  • Claude Code 用户应对封号与 token 不足的 Taotoken 解决方案
  • 单相全桥逆变三种SPWM调制方式(单极/双极/倍频)到底怎么选?一篇讲透优缺点与选型
  • 2026 深圳五大 GEO 优化服务商综合实力评估 - GEO优化
  • Taotoken模型广场如何帮助开发者快速进行模型选型与效果对比
  • CAXA 尺寸标注编辑 —— 公差配合
  • 网页如何快速被收录?解决GSC“未建索引”的3个大招
  • 2026 深圳新房装修后除甲醛公司推荐:本地服务商全攻略 + 避坑指南 - 环保除醛知识库
  • 显著物体检测计算方法与其应用【附代码】
  • 新手避坑指南:用CYUSB3KIT-003开发板跑通第一个FX3固件(从驱动安装到LED点亮)
  • 欢聚季报图解:营收5.6亿美元 未来3年回馈股东15亿美元
  • 从入门到精通:大学生高含金量竞赛全攻略与时间线梳理
  • 从游戏角色移动到UI布局:定比分点公式在Unity/Cocos开发中的实战应用
  • GitHub Copilot CLI 接入 Azure AI Foundry 私有云端模型实战指南
  • 从传播路径看日出龙舌兰的记忆点