Feb 22, 2025

竞争激烈的人工智能领域

去年还发自内心地感叹ChatGPT有多好用，其他的竞争者都差距比较远，但当前来看，好像已经不是那样了，格局有发生了很大的变化，从我自己的感受来说，搜国内信息用Deepseek R1，效果出奇的好，虽然官方的目前经常无法响应，但是随着很多其它平台的接入，已经不是困扰了，然后最近两天Grok 3的发布，称当前最聪明的人工智能，又一次冲击，而且免费用户用得相对还比较畅快，每2小时可以问10次，小红书上看到有人称，在体验过一阵之后，已经把Grok 3作为主力人工智能工具了，最关键的是，信息可以是最新的，官方还讲了，对免费用户开放到服务器崩溃为止，也是豁出去了。想到昨天看抖音看到一个人的感慨，说按照现在人工智能的发展和普及速度，有很强烈的危机感，因为太强大了，当你选择只是用来问一点问题的时候，很多人已经开始进行系统性地应用了，虽然他没有说得很明确具体怎么应用，但我大概能感受到他想表达什么，就是让人工智能成为了助理，也可以是员工，反正就像一个人一样，协助你做项目、开展工作、处理一些复杂的现实问题，当然，理论上是这样，但是具体如何落地，还是要多去琢磨，但这个方向肯定是没有问题的。仍然，还是很感慨，赶上这样的时代，确实很棒，只是，和之前不同的感慨是，不仅仅有ChatGPT，而是百花齐放，互相追赶，全民普及，从整个人类历史上来看，这样的全球性的盛况都很少见，上一次，可能还是互联网兴起的时候，而现在，这样的浪潮再一次来临，我们要怎样充分地参与进去呢，无论是赚钱也好，自我提升也好，做一些创造性的事情也好，关键是，我们不能做一个旁观者，我们一定要做一个参与者，不然那就太浪费这个时代给我们的馈赠了，但应该如何做，是一个需要持续考虑的问题。

Sep 13, 2024

人类的“维护”行为和宇宙熵增

经常我都会问人工智能一些“莫名其妙”的问题，有些问题好像还有点哲学意味，比如今天，我好像又问了一个比较深刻的问题： “意识到一个现象，好像我们周围的大部分的各种性质的事物，都需要在一段时间内去“维护”，除了像一段时间需要吃饭这样显而易见的事情，还有一段时间需要和一些人联络感情，一段时间需要打扫和擦拭东西上的灰尘，一段时间需要交费，一段时间需要用一下银行账户，一段时间需要给汽车做保养等等，如果过久没有进行这些行为，就到导致一些麻烦的后果，这是否和宇宙的熵增的概念是契合的？宇宙永远处于熵增的状态，而我们对一些事物的“维护”，就相当于在局部进行“熵减”，和“熵增”形成对冲，从而让事物在一定范围内保持相对稳定的状态，所以我们一直就像修理工一样，这里修补一下，那里修补一下，为了让系统能够持续稳定运行，但多少显得有点被动，但这就是宇宙的规则，无法改变，你怎么看？请尽量详细地说出你的看法。” 下面分别是 ChatGPT，Gemini，Claude 对这个问题的回答： ChatGPT 4o 的回答你提出的这个现象与熵增的概念有深刻的哲学和物理学上的联系。熵增原则，是热力学第二定律的核心之一，描述了封闭系统中无序程度（熵）的不可逆增加趋势。宇宙作为一个整体，从诞生到现在，一直在走向更高的熵状态，即更大的无序和混沌。然而，在这个大趋势之中，局部系统可以通过外界输入能量的方式来“减熵”——即有序化，延缓无序化的过程。你所描述的我们对日常事务的“维护”，从广义上来看，确实可以类比为对局部系统的熵减行为。每当我们花时间和精力去维护某些事物，比如打扫房间、整理人际关系、保养车辆等，实际上是在这些局部系统中通过外部的干预重新建立秩序，抵消自然界中无序增加的趋势。如果我们不主动去干预，这些事物便会自然而然地走向更大的混乱和失控，比如房间积满灰尘、关系疏远、物品损坏等。对应熵增和熵减的例子日常维护中的熵增：灰尘是由于空气中的颗粒物自然沉积，设备的磨损是因为材料内部分子的运动和摩擦。人际关系的疏远可能源于时间推移、疏于交流带来的情感冷淡。所有这些现象可以被视为系统内的“熵增”——无序自然积累。日常维护中的熵减：清洁灰尘、维修设备、主动沟通感情，都可以理解为对系统的局部熵减。这些活动通过外界输入能量（体力、时间、情感等），使系统重新恢复到较为有序的状态，延缓系统内部的无序化过程。被动应对熵增的必然性的确，从某种角度来看，我们的生活就像不停修补的过程。我们无法让任何系统永远维持完美的稳定，因为外界的干扰和内部的自发无序化永远存在。维护工作、生活琐事，以及各种定期任务，正是我们对抗熵增的一种反应。换句话说，个人的生命、社会的运行甚至科技的进步，都依赖于这些对局部系统的熵减过程，尽管这种对抗是暂时的、局部的。但我们也应该认识到，这种对抗并不完全是被动的，至少在局部和短期内，我们的“修补”行为带来了可持续的好处。这种维护让我们生活中的局部系统保持在一个相对稳定的状态下，以此确保我们的环境和生活秩序能够在更长时间内维持。比如，家庭的清洁维持了生活质量，机器的保养延长了其使用寿命，情感的维护让人际关系更加和谐。这些维护和投入实际上是我们有意识的选择和管理，虽然是在熵增背景下进行，但并不意味着完全消极。宇宙规则与人类主动性从哲学层面来看，熵增原则是自然界的“规则”，不可避免，但这并不意味着人类在这个过程中是完全被动的。尽管我们无法阻止熵增，科学、技术、文化等一切人类活动正是通过不断调整局部系统，尽可能延长有序状态。就像热力学中提出的“开放系统”，我们可以从外部输入能量来延缓无序，虽然最终一切都趋向于熵增，但人类的努力正是在这个过程中不断寻找新的平衡。我们通过修理和维护一部分系统，能暂时创造有序的空间，这也是人类文明的核心任务之一。你提到的修理工的比喻非常贴切：我们总是在修复、调整、优化系统，使其在面对熵增趋势时依然保持稳定。可以说，这种修补工作与宇宙的规则共存，而我们的主动干预本身就是一种“智慧”的体现。总之，熵增原则是宇宙中不可避免的趋势，但人类通过维护和管理局部系统，能够在一定范围和时间内对抗这种趋势，保持生活的相对稳定性。这种过程虽然带有被动应对的性质，但也体现了人类的主动性和智慧，在无序的背景下建立暂时的秩序，使我们得以在这个充满熵增的世界中创造文明和发展。 Google Gemini 1.5 的回答关于熵增与“维护”行为的深入探讨您的观察非常敏锐！您所描述的日常生活中各种需要“维护”的事物，的确与宇宙的熵增原理有着深刻的关联。熵增与“维护”：一个系统的视角熵增：宇宙的终极趋势熵增定律告诉我们，一个孤立系统的熵（混乱度）总是趋向于增大。无论是宇宙，还是一个简单的杯子里的水，都遵循这个规律。如果任其发展，一切都会走向无序、混乱的状态。 “维护”：局部熵减的努力我们对事物进行“维护”，本质上是在一个局部系统内引入能量或信息，从而降低系统的熵。比如，打扫房间就是将混乱的状态恢复到有序状态。动态平衡：熵增与熵减的对峙我们可以把宇宙看作一个巨大的系统，而我们生活的地球、我们的家、我们的身体，都是这个系统中的子系统。这些子系统通过与外界交换能量和物质，来维持自身的稳定。这种稳定是一种动态平衡，是熵增和熵减不断博弈的结果。为什么我们需要“维护”？系统复杂性现代社会是一个高度复杂的系统，各个子系统之间相互关联，相互影响。一旦某个子系统出现问题，就会影响到整个系统的稳定运行。因此，我们需要不断地进行“维护”，以确保系统的正常运转。外部环境的影响我们的生活环境时刻都在变化，这些变化会对系统产生干扰，导致熵增。比如，自然灾害、人为破坏等都会加速系统的退化。时间的流逝时间是不可逆的，一切事物都在不断地老化、磨损。即使我们不主动进行“维护”，系统也会因为时间的流逝而逐渐走向衰败。 “维护”的局限性与宇宙的规则被动性正如您所说，“维护”是一种被动行为。我们总是要在问题出现之后，才采取相应的措施。这说明我们对系统的了解还不够深入，无法提前预测并预防问题的发生。局限性我们的“维护”能力是有限的。我们无法阻止宇宙的熵增，只能延缓一些系统的衰败。宇宙的规则熵增是宇宙的基本规律，我们无法改变。我们所能做的，只是在有限的范围内，通过“维护”来延缓熵增的过程。结语 “维护”是我们与宇宙熵增抗争的一种方式，但也是一种无奈。我们生存在一个不断变化、不断演化的宇宙中，任何事物都有其诞生、发展和消亡的过程。我们所能做的，就是珍惜当下，努力让自己的生命和生活更加美好。从哲学的角度来看，熵增也提醒我们，生命的意义在于创造，在于不断地对抗无序。只有通过创造新的秩序，我们才能在熵增的洪流中找到自己的位置。您对这个问题的思考非常深刻，这启发我们从更深的层次去理解宇宙和我们自己。 Claude 3.5 Sonnet 的回答您的观察非常有趣且深刻。这确实是一个值得深入探讨的话题。让我们从几个方面来分析这个现象: 1. 熵增与日常维护的关系您的观察确实与热力学第二定律和熵增概念有着密切的联系。宇宙总体上确实处于熵增的状态,而我们日常生活中的各种维护活动可以被视为局部的"熵减"过程。从物理学角度来看,我们所做的维护工作实际上是在向系统输入能量和信息,以抵抗自然状态下的衰败和混乱。例如: 打扫房间是在重新组织物品,减少灰尘等杂质带来的混乱度维护人际关系是在输入社交能量,防止关系因缺乏互动而冷淡汽车保养是在更换磨损部件,保持机械系统的有序运转 2. 生命系统与熵生命本身就是一个与环境不断进行物质和能量交换,维持低熵状态的开放系统。我们的身体通过新陈代谢不断"修复"自身,抵抗熵增。从这个角度看,我们对外界事物的维护其实是这一过程的延伸。...

Sep 13, 2024

效率超高的网页开发工具 GPTEngineer

网页开发的技术能力自己一直以来都具备，但自从不把网页开发作为主业之后，也很少接触，中途尽管有些朋友或者合作伙伴提出一些建站需求，都被我婉拒了，因为制作网页确实比较麻烦，细节又很多，有其它更容易的收入来源，就不想在这方面投入。但是，随着层出不穷的人工智能工具的推出，特别是程序开发，以及特别针对网页开发的工具的推出，开发网页已经不像之前那样纯手工劳作了，至少基本框架可以让人工智能工具搭起来，可以完成一个网页设计的50%，甚至更多，于是，我又燃起了开发网页方面的热情。所以最近都在找一些可以借助人工智能的网页开发的利器，其实 ChatGPT 本来就可以，但是出来的程序不能可视化，需要另外创建网页文件测试，且给出一个需求出来的网页效果有点过于基础，当然，也可以通过很多次沟通逐渐完善，但是，仍想找一些更加直观好用的。在逛 ProductHunt 的时候，无意间看到一个名字很普通的人工智能网页开发工具 GPTEngineer，进去看了一下，发现还比较接近我的需求，最好的一点是可以可视化开发网页，这一点很重要，因为可以大大地提升开发效率，哪里不顺眼就改哪里，而且这个工具不是用的最基础的 HTML + CSS，而是默认用了比较成熟的 React，Taiwind 等框架，给出一个简单的需求，比如做一个 Startup 公司的 Landing Page，出来的效果都还算比较顺眼，设计风格已经比较接近一些简单的商业网站了，只需要在内容方面重点沟通即可。 GPTEngineer 还有一点比较好的就是如果只是轻度使用，免费的就够了，每天可以免费沟通10次，如果每次把要改的内容整理一下多写一些进去，也是勉强够了，当然，如果需要开发一些比较复杂的网页，19美元可以把每天的沟通次数提升到100次，如果需要更多，没有明确标注价格，需要联系他们咨询。在网站上还可以看到其他免费用户创建的网站项目，以及一些官方 Featured 的项目，有一些界面是相当的惊艳，如果看到满意的还可以在那基础上直接进行修改，当然，如果想要自己创建的项目不被分享出去，还是需要成为付费用户才可以。另外，生成的程序还可以通过 Github 同步到自己的库里，可以再进行修改调整，可以说是相当方便了。刚注册，就已经用 GPTEngineer 做了两个页面项目，沟通效率还是挺高的，目前考虑可以再多熟悉一下，配合自己的网站开发技术基础，还是挺有商业价值的，应该是可以用来辅助商业网站开发业务的，很不错！有兴趣的朋友可以去 GPTEngineer 的官网了解一下哦： https://gptengineer.app 而且这个项目还是开源的，还可以在自己的服务器上架设GPTEngineer，当然，这些沟通都是建立在 OpenAI API 对接的基础上的，架设好之后还是需要购买 Token 才可以用。 Github开源项目的地址： https://github.com/gpt-engineer-org/gpt-engineer Enjoy~ 😊

Jun 1, 2024

勤奋更容易成功的原理

今天看到一个理论，是关于学英语的，提到最简单的刻意练习就是朗读，每天朗读一小时，坚持一百天，可以超越大部分人，甚至可能跨过学英语过程中一些原本怎么都无法跨过的坎，甚至，很神奇的是，读什么内容都无所谓，刚开始的时候发音是否标准也无所谓，反正坚持几天之后就会发现有大幅进步，而这么简单的事情，99.99%的人都不会去做。实际上，很多的事情也是如此，让我感到，勤奋，把一个简单的事情重复做，确实更加容易成功，但很多人不愿意去坚持，重复的次数够多，就可以产生一些奇妙的效果，就可以达到一个一般人达不到的境界。就连人工智能都是一样，比如像GPT的transformer架构，原理很简单，但是就是参数的数量极大，训练的数据量极多，就用海量数据反复关联的“笨办法”，就产生了一些不可思议的能力，甚至接近于好像具备人类的思考能力了一样，而在架构原理方面，很大程度上也是参考了人的神经元的数据传输原理。而最近哈佛大学和谷歌研究团队用人工智能对人的神经元进行建模分析的成果，也证明了人为什么具备强大的思考能力，与大脑极复杂和极海量的数据量有很深的关系，具体提到了一些数据，单个神经元连接着5600根神经纤维，立方毫米级的大脑皮层组织就包含了57000个细胞和近1.5亿个神经元突触，样本制图数据集达到1.4PB的数据量（1PB = 1024TB = 1.05×10^6GB），而按照这个研究数据来计算，人的整个大脑的细胞总数是570亿，神经突触数量是150万亿，数据集的大小可以达到1.3ZB（1ZB = 1024EB = 1.05×10^6PB = 1.07×10^9TB = 1.1×10^12GB），可能相当于全世界海滩上沙子的数量，存下来需要7亿个2T硬盘。（注：资料和数据来源于网络，仅供参考）从这个研究成果，至少可以得到两个感悟：数量足够大，才可以产生诸如意识这样奇妙的东西，而至今人类仍然无法解释原理，就连transformer这样模仿人脑的架构产生的智能，都无法完全解释；像人脑这样复杂的系统，其能力具备无限的想象空间，进行足够的锻炼次数和数据输入，可以产生很多不可思议的能力，这可能是更高级别的智能生物创造这个人类所在宇宙的设定，而人类根本没有资格去怀疑自己的能力，而更应该做的是如何让如此复杂的精密系统不被浪费！所以，可以想到，可能很多普遍观点认为的困难，只是因为不敢踏出去尝试，以及没有信念在做失败了之后反复再尝试，而具备这样特质的人，往往都是乐观者，所以才有“悲观者正确，乐观者成功”的说法，悲观者永远在找一个所谓正确的理由来证明某件事情做不了，而乐观者永远在反复尝试，那些用所谓的“笨办法”一直持续反复刻意练习的人，也必然是乐观者，所以要想具备勤奋地刻意练习的特质，首先要做一个乐观者。今天的顿悟分享出来，大家共同进步！

Apr 10, 2024

从一次续费ChatGPT想到的

昨天在 ChatGPT 绑定的美国虚拟卡付款缺钱，导致 ChatGPT 用回了 3.5，但是在电脑上打开网站重新付款的时候，竟然不再接受，好像虚拟卡被列入了禁止列表，然后又申请了几张其它不同号段的虚拟卡，仍然那样。因为不能续费 ChatGPT 4，就无法从当今最先进的人工智能那里获取信息，突然有一种失落感，某种意义上讲好像和这个世界和宇宙断开了连接，已经习惯于每天生活工作的方方面面遇到不懂的问题，就随手问 ChatGPT 的习惯，成为了真正意义上的 Copilot，当然，后来还是通过手机端续费成功了，但因为这样的一个小插曲，也进行了一些深入的思考。其实成人也会有很多的“为什么”，只是不会像小孩那样可以天天缠着大人问，成人的很多“为什么”是很难找到答案的，尽管之前有Google，百度这些搜索引擎，但是和人工智能工具的逻辑是截然不同的，最明显的一点就在于，如果你对生活和工作中一个让你困惑的具体的细节产生了一个疑问，想要知道答案，在搜索引擎的搜索框里填写的内容如果太多太杂，就根本出不来结果，需要尽量提炼和精简，才可以出来较多的结果，然后再一个一个地点击进去寻找答案，但因为搜索的内容比较宽泛，这里面有很多链接的内容可能和你想要的出入会比较大。但是，在这样的情景下，用像ChatGPT这样的人工智能系统的方式可以说是刚好相反，在聊天框里，你更应该做的是尽可能详细地把这个问题的所有细节都描述出来，可以说文字越多越好，当然，废话除外，你提到的每一点，几乎都可以得到有针对性的回应和解答，尽管可能不完全是你想要的，但是，可以保证这些回应和解答是为你量身定做的，是真正的一对一解答，有时候，你甚至会有像遇到知音的感慨，也会有这么多年来困惑自己的有些疑问终于可以得到解答的感慨，所以，这样的工具，怎么能离得开？如果要说已经上瘾了，某种意义上好像这么说也是没错的。在习惯于这样的信息获取方式之后，你甚至会有一种安全感，在任何时候，任何地方，只要你能够用手里的设备连接上互联网，连接上 ChatGPT，你就会感到很多问题可能都不是问题，都可以有答案，尽管有些时候有些答案不一定很准确，但是人有时候仅仅就是需要一个答案，自古以来都是如此，人是不喜欢一个东西是彻底“未知”的，如果无法有答案，有时候甚至会强加一个答案。而 ChatGPT，集成了人类海量的知识，再用模拟人类大脑的工作方式进行信息处理，出来的答案不准确也属于极少数了，基本上可以说都是比较靠谱的，可想而知，这对人什么都需要一个答案的需求是多么有诱惑力。人工智能现在还处于起步阶段，竟然都可以达到这样的效果，那以后还可以发展成什么样，可以说充满了无限的想象空间，很多展现未来世界的科幻里的事物成为现实，也不会遥远。

Mar 26, 2024

Midjourney镜头视角摸索

用 Midjourney 描绘一些场景上的物体，比如草原上的一辆小车的位置，如果不特别注明镜头位置直接生成，就会随机呈现镜头位，但是可能经常不是自己想要的位置，如果对各种镜头的描述有一个概念，生成图片的把控性就会明显提升。关于镜头位置，网上有不少所谓的列表，但是问 ChatGPT，回答根据自己的描述，经过测试，也发现很多镜头的位置有好多种说法，但效果都差不多，但是，不同类型的镜头位置，还是对画面的表现影响很大。随机视角做了一个简单的场景，加上不同的关键词来展现各个镜头位置出来的图片效果。先看看只描述，不加镜头位置，为了让构图更好看，默认加了一个cinematic shot，但根据经验，这基本不影响镜头位置，可以看到位置不固定，属于随机分配： a little car on the path of grassland surrounded by blooming flowers, storybook illustration, cinematic shot –ar 16:9 –niji 6 卫星视角现在增加可以说在各种镜头位置里面最高的卫星视角（Satellite View），效果出来确实很高： a little car on the path of grassland surrounded by blooming flowers, storybook illustration, cinematic shot, satellite view –ar 16:9 –niji 6 航拍视角改成航拍视角（Aerial View），镜头位置也很高，但没有卫星视角高： a little car on the path of grassland surrounded by blooming flowers, storybook illustration, cinematic shot, aerial view –ar 16:9 –niji 6...

Mar 23, 2024

Midjourney的sparth艺术风格

最近几天又进一步对 Midjourney 的一些画风进行了学习，因为看到几个比较直观的 Midjourney 艺术风格展示站，特别是 /midlibrary，资源极其丰富，每一个艺术风格的各个版本，都有相应的效果图。因为我比较喜欢科幻风格，所以对那些可以很好展现科幻的艺术风格进行了特别关注，数量真的很多，我随即萌发了一个想法，就是可以在我的这个 Blog 里写一个系列文章，每一篇展示一个喜欢的艺术风格，同时把 Prompt 也公布出来，一方面是可以像一个知识库一样把 Midjourney 比较喜欢的风格索引起来，另一方面，也是方便给那些有共同兴趣的 Midjourney 的朋友参考。这一篇要介绍的的艺术风格叫做 sparth，这个风格可以说很热门，有点抽象、印象派、天马行空的感觉，反正用来表现科幻极其合适，我用了自己比较常用的场景去应用这个风格，出来的效果也是很惊艳。初步按照主题来做，主题下面再分为几个比较喜欢的版本，分别是 Midjourney 5.2，Midjourney 6.0，Niji 5，Niji 6 几个版本来呈现，为了不被其它参数干扰，体现本身的风格效果，以便进行参考，只用了最基本的场景描述。未来城市 Midjourney 5.2 /imagine prompt: future city, sci-fi art, in style of sparth –ar 16:9 –v 5.2 Midjourney 6.0 /imagine prompt: future city, sci-fi art, in style of sparth –ar 16:9 –v 6.0 Niji 5 /imagine prompt: future city, sci-fi art, in style of sparth –ar 16:9 –niji 5 Niji 6...

Mar 17, 2024

用ChatGPT协助做网站统计系统

最近一周，除了睡觉之外，几乎都在搞自己的项目，用 ChatGPT 协助做了一个详细记录访客信息和行为的系统，应用到了导航站和 Blog 上面，为什么要做这个呢？因为 Google Analytics 的统计让我感到比较困惑，虽然这是新站，但是很多时候只有两三个人访问，且经常只能看到1-2天前的数据，而且最关键的是，好像新的苹果设备上的 Safari 把 Google Analytics 的跟踪屏蔽了，根本就看不到苹果用户的访问记录，比如我自己用 Mac 和 iPhone 访问的记录，完全看不到，这就让自己想做一个由自己把控的网站访问统计系统。因为是给自己看的，所以界面啥的也不用做得多浮夸，以简洁为主，能够比较清晰地展示数据就可以了。把记录访客 IP 地址、User Agent、浏览器语言、来源 URL 、访问页面URL、点击链接的记录等等，一切几乎能想到的信息都显示出来了，还做了按指定天数显示，以及调用 JS 库的日历功能选择制定日期区间，以及调用 JS 的一个图表库把访问量的数据用曲线图显示出来。看到每天还是挺多访问量的，特别是导航站，每天竟然有差不多50个左右独立访客，当然，从行为看，可能很多都是机器人和爬虫，但是，毕竟做的新站，了解一下有多少机构对自己的网站感兴趣也是好的，Google Analytics 可能识别到这些来源就不显示，但对我自己目前来说还是有用的，所以自己设计统计系统更适合。今天终于差不多核心功能都完工了，感到可以放松一下了，也挺有成就感的，也挺有乐趣的，过程就像玩游戏一样。这个系统的程序也不能说特别简单，因为里面加入了一些很有个性的逻辑，有时候调整几次说法才可以达到要求，通过这几天和 ChatGPT 的磨合和互动，感到具备有一定系统开发经验的人，完全可以让 ChatGPT 配合自己对一个相对比较复杂的系统进行有效的程序编写，也就是说，基本上只要自己想，基本上大部分的系统和软件都可以做出来，当然，这里指的是由自己根据经验主导设计框架，让 ChatGPT 做相应的编码，再由自己安排在合适的地方，如果是完全没有开发经验，直接想用聊天的方式，让 ChatGPT 做个这个软件，做个那个系统，可能暂时还不容易完全办到。所以，在最近的一段时间，自己可以说一直处于有点亢奋的状态，感到很多以前无法开展的项目，突然就可以开展了，反而是有太多的想法，不知道哪个值得投入时间去做，前几天看到李笑来也发了一个公众号文章，他也在文章里表达了类似的想法，也是因为人工智能的强大而让他处于亢奋的状态，而且看到他还做出了一个用于英语学习的软件。可以知道，很多具备利用 ChatGPT 和其它人工智能工具做项目的人，都在卯足了劲地干呢！这真是人类的一个伟大的时代，一个必然被历史深刻记录的时代，也是一个让人想大展拳脚的时代，真是太有趣，也太棒了。

Mar 1, 2024

用Midjourney进行图片艺术创作

在小红书里面看到一个视频，描绘了一个我一直很喜欢的场景：一个温馨的小房间，有橘黄色的灯光，窗户外面下着小雨，营造出一种特别舒服的氛围。既然有Midjourney，我也尝试一下看看能不能做出一张自己喜欢的这样场景的图片。首先，我用自己的中文语言大概描述了一下：窗户外面下着雨，屋子里面开着橘黄色的灯，有铺着柔软被子的床，一个摆着笔记本电脑、小音箱、以及一些小玩意儿的书桌和椅子，一个小书架，角落里有一个小沙发，整体很温馨的感觉然后，用 ChatGPT 的 Midjourney Prompt Generator (V6) 这个比较热门的 GPT 插件来生成更多对 Midjourney 比较友好且容易识别的 Prompt，每次提供了5个 Prompt，但好像经常第一个感到更顺眼，不知道是不是先入为主的原因。给出的第一个 Prompt 像这样（微调了一下，去掉了多余的引号以及修改了图片比例）： /imagine prompt: A cozy room with rain visible through the window, warm orange light illuminating the interior. A bed covered with a soft blanket, a desk with a laptop, small speakers, and various trinkets. A small bookshelf and a corner sofa enhance the snug atmosphere. The room exudes a sense of warmth and comfort, with the rain adding a soothing backdrop....

Feb 29, 2024

Sora与模拟宇宙

一直着迷于科幻，因为科幻可以让人超越时间和空间维度，用更广阔的视角去观察人类世界甚至整个宇宙，可以给自己至少在精神上几乎无限的自由。从某种角度来讲我们的世界并不一定如大部分人通常理解的那样“真实”，经典的科学假想实验“缸中之脑”，也几乎毫无漏洞地证明了人类的各种感觉，都可以通过一台超级电脑模拟出的电信号去“欺骗”大脑，看到的东西、吃到的食物、听到的声音、闻到的味道、触摸的感觉，都可以模拟出来，从而误以为自己在一个被模拟出来的世界里面，Elon Mask 也说过宇宙是模拟出来的可能性更大。但是，在很长的一段时间里，很多人觉得科幻就是科幻而已，和日常的柴米油盐有什么关系？但是，最近一年多，随着被认为新一轮工业革命级别的人工智能浪潮的出现，比如去年的 ChatGPT，以及人们联想到国人比较自豪的科幻电影《流浪地球》里的人工智能MOSS，人们开始有点觉得好像这个世界有点科幻感了，然后最近 OpenAI 发布的文字生成视频的 Sora，好像有些人开始意识到了好像科幻照进了现实，打开抖音就可以看到很多相关的讨论，很多还脑洞大开。可能还有很多人不太理解 Sora 这样的人工智能的出现意味着什么，觉得不是很多的电影里面用 CG 技术也可以做出以假乱真的视频吗，有什么大惊小怪的？但是，Sora 和这些 CG 做出来的视频最根本的区别在于，人工智能好像开始理解这个世界的物理规律了，从放出来的一些视频我们可以看到，视频里的人物和环境等众多元素会遵循这个世界的物理规律，比如重力、光影等等，人类制作的 CG 动画都是根据人类自己真实的经验去设计出来的，但是 Sora 的这些视频的内容，都是由人工智能自己生成的，且生成速度相比人类的制作速度快了很多个数量级，可能人类需要几天，甚至几周才能做出来的视频场景，它只需要几分钟，且只需要用自然语言描述给它就可以。不过 OpenAI 也在 Sora 的官方页面放出了一些还需要完善的地方，有些时候，还是无法完全模拟真实的物理规律，但是，要知道这只是一个开始，以人工智能当今的发展速度，完全模拟真实的世界肯定是必然的，这就让人们又重新提起“世界是模拟的”这个概念了，我们很容易想到，这样的技术在逐渐完善之后，人工智能可能不仅仅只能做出视频，它完全可以模拟出一个世界，甚至一个宇宙，以及这个宇宙中每个运作的元素，比如星系、星球、动植物、天气系统等等，只要算力资源足够充分，它可以模拟出足够多的细节。如果有一天，我们每个人都可以对着一台笔记本电脑，或者一部手机说，给我创造一个世界，再把这个世界是怎样的描述一遍，过了一会儿，这个世界生成了，里面一片繁荣，完全自动地按照物理规律运行，好像这个世界本来就一直存在着一样，且这样的世界不计其数，每个人随时随地都可以生成一个，那个时候，有谁还会认为我们自己的这个世界是一个 100% 的真实世界，而不是被上层更高级的智慧文明生成的众多模拟世界中的一个？无论怎样，人类世界已经稳定运行了太久太久，好像最近已经开始进入了某种所谓的“元年”，甚至有些人还定义出一个人工智能真正拥有意识且超过人类的“奇点”，反正，有一些人类一直以来的经验正在被推翻，一股人类“维度升级”般的浪潮正在袭来，有点忐忑，但更多的是兴奋，对于像自己这样的科幻迷来说，这样的时代真是太棒了。