百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Grok 3 与 DeepSeek R1:谁更胜一筹?

wptr33 2025-02-27 16:56 18 浏览

几个月前,DeepSeek 凭借其 V3、R1 和 Janus 模型震撼了 AI 世界。而最近,埃隆·马斯克的 Grok 3 也加入了这场竞争!Grok 3 声称是地球上最智能的 AI,人们对它的期望极高。根据 xAI 团队在发布会上公布的官方基准测试结果,它似乎是一个性能强大的模型,在多项基准测试中超越了所有竞争对手。但问题是,它是否真的适合我们日常生活中需要完成的普通任务呢?


读完这篇文章,你就会找到答案。让我们开始对 Grok 3 和 DeepSeek R1 进行五项不同任务的测试!





任务 1:Python 代码生成

提示:“编写一个 Python 函数,使用深度优先搜索生成随机迷宫,并通过 Matplotlib 进行可视化”


Grok 3 生成的代码:

import random
import numpy as np
import matplotlib.pyplot as plt

def generate_maze(width, height):
 """
 Generate a random maze using Depth-First Search and visualize it with Matplotlib.
 Parameters:
 width (int): Width of the maze (number of columns)
 height (int): Height of the maze (number of rows)
 """
 # Initialize the maze grid with walls (1) and paths (0)
 maze = np.ones((height * 2 + 1, width * 2 + 1), dtype=int)
 maze[1::2, 1::2] = 0 # Set paths (odd rows/columns) to 0
 def carve_path(x, y):
 """
 Recursively carve paths in the maze using DFS.
 """
 directions = [(0, 2), (2, 0), (-2, 0), (0, -2)] # Down, Right, Up, Left
 random.shuffle(directions)
 for dx, dy in directions:
 new_x, new_y = x + dx, y + dy
 if (0 <= new_x < height * 2 + 1 and
 0 <= new_y < width * 2 + 1 and
 maze[new_x, new_y] == 1):
 maze[new_x - dx // 2, new_y - dy // 2] = 0 # Remove wall
 maze[new_x, new_y] = 0 # Carve path
 carve_path(new_x, new_y)
 # Start carving from the top-left path (1,1)
 carve_path(1, 1)
 # Ensure entrance and exit are open (top-left and bottom-right paths)
 maze[0, 1] = 0 # Entrance
 maze[-1, -2] = 0 # Exit
 # Visualize the maze
 plt.figure(figsize=(width // 2, height // 2))
 plt.imshow(maze, cmap='binary', interpolation='nearest')
 plt.title("Random Maze Generated with DFS")
 plt.axis('off')
 plt.show()
 return maze

# Example usage
if __name__ == "__main__":
 # Generate a 10x10 maze (actual grid will be 21x21 due to walls)
 maze = generate_maze(10, 10)#import csv



DeepSeek R1 生成的代码:

import random
import matplotlib.pyplot as plt

def generate_maze(width, height):
 # Initialize the grid with walls (1)
 grid = [[1 for _ in range(width)] for _ in range(height)]
 # Starting point
 start_x, start_y = 1, 1
 grid[start_y][start_x] = 0
 # Stack for DFS
 stack = [(start_x, start_y)]
 # Directions: up, right, down, left
 directions = [(0, -2), (2, 0), (0, 2), (-2, 0)]
 while stack:
 x, y = stack[-1]
 random.shuffle(directions)
 for dx, dy in directions:
 nx, ny = x + dx, y + dy
 if 0 < nx < width - 1 and 0 < ny < height - 1 and grid[ny][nx] == 1:
 grid[ny][nx] = 0
 grid[y + dy // 2][x + dx // 2] = 0
 stack.append((nx, ny))
 break
 else:
 stack.pop()
 return grid

def plot_maze(grid):
 height = len(grid)
 width = len(grid[0])
 fig, ax = plt.subplots(figsize=(width, height))
 ax.set_xticks([])
 ax.set_yticks([])
 for y in range(height):
 for x in range(width):
 if grid[y][x] == 1:
 ax.add_patch(plt.Rectangle((x, height - y - 1), 1, 1, color='black'))
 ax.set_xlim(0, width)
 ax.set_ylim(0, height)
 ax.set_aspect('equal')
 plt.gca().invert_yaxis()
 plt.show()

# Parameters
maze_width = 21 # Should be odd
maze_height = 21 # Should be odd

# Generate and plot the maze
maze = generate_maze(maze_width, maze_height)
plot_maze(maze)#import csv



观察:

DeepSeek R1 的输出展示了一个清晰且结构良好的迷宫,看起来非常专业。其尖锐且一致的墙壁形成了一条封闭的迷宫路径,既具有挑战性,又在视觉上显得干净整洁。它遵循了良好的迷宫生成原则,既实用又美观。


相比之下,Grok 3 的输出显得非常像素化,由于厚重的黑白网格结构,路径不够清晰。整体设计显得更加混乱,与 DeepSeek R1 相比,路径不够明确。尽管它也使用了深度优先搜索(DFS)进行生成,但在视觉清晰度和可用性方面明显不如 DeepSeek R1,使其成为一个不太有效的迷宫表示。


结论:

Grok 3 ? | DeepSeek R1 ?


任务 2:网络搜索

由于 DeepSeek R1 不支持网络搜索,因此我使用了 DeepSeek 的搜索功能来完成这项任务。

提示:“截至 2025 年,核聚变技术的最新进展有哪些?输出格式——进展列表 + 来源”


观察:

在回答像核聚变技术进展这样的研究性问题时,DeepSeek R1 比 Grok 3 更出色。DeepSeek R1 的最大优势在于它为每个说法都提供了可点击的来源链接,确保了透明度和可信度。它涵盖了更广泛的进展,包括聚变燃料技术、私人投资、监管变化以及政府举措,使其回答更加全面。此外,其来源来自 ITER、UKAEA 和美国能源部等权威平台,显著提高了可信度。


相比之下,虽然 Grok 3 在解释深度上表现更好,但由于没有提供直接的来源链接,因此在可信度方面稍显不足。它模糊地引用了 BBC 新闻或 MIT 新闻等新闻媒体,但没有明确的引用。一个主要弱点是它依赖于 X(Twitter)上的帖子,这些帖子往往包含未经验证的说法。尽管 Grok 3 承认了这些局限性,但缺乏可靠的来源使其在事实性研究方面不太可靠。


结论:

Grok 3 ? | DeepSeek R1 ?



任务 3:使用 HTML 进行基础动画

提示: “创建一个 HTML + CSS 代码,让一个红色小球在一个正方形内持续旋转。”


Grok 3 输出:




 
 
 在正方形内旋转的红色小球
 


 


DeepSeek R1 输出:




 


 


输出:


观察:

显然,Grok 3 在理解提示并生成正确回答方面存在困难。DeepSeek R1 大约花费了 8 到 10 分钟才给出回答,但其输出更加精确和准确。


结论:

Grok 3 ? | DeepSeek R1 ?



任务 4:图像分析

提示:“分析这个棋盘局面。建议当前玩家(白方)的最佳走法以将死黑方,并解释理由”



观察:

Grok 3 和 DeepSeek R1 都没有给出正确答案。Grok 3 建议 e4-e5,但这并不能将死黑方或威胁到黑方的国王。DeepSeek R1 建议 Qe1#,但在这个局面中,这个走法是不可能的,说明它误解了棋盘位置。正确的走法是 Qf7#,此时白方的后可以通过困住黑方国王来实现将死。Grok 3 没有识别出立即的将死机会,而 DeepSeek R1 则错误地假设了棋盘布局,而不是分析实际的局面。


结论:

Grok 3 ? | DeepSeek R1 ?



任务 5:逻辑推理

提示:“解决这个斑马谜题。以表格形式给出答案”





观察:

DeepSeek R1 的回答虽然花费了更长时间,但给出了正确答案。Grok 3 没有理解图像内容,给出了错误的输出。


结论:

Grok 3 ? | DeepSeek R1 ?


Grok 3 与 DeepSeek R1:结果

埃隆·马斯克的 Grok 3 被宣传为 AI 领域的颠覆者,声称是地球上最智能的模型。然而,在实际测试中,它未能达到预期。


在多项任务中,Grok 3 在准确性、逻辑推理和复杂问题解决方面表现出色,常常给出错误或结构不佳的回答。与此同时,DeepSeek R1 一直表现更好,在代码生成、网络搜索和逻辑推理等关键领域提供了更准确、更有条理且可验证的答案。


尽管宣传力度很大,但 Grok 3 在基本推理任务上仍然存在不足,这表明 xAI 的训练方法需要进行重大改进。然而,考虑到马斯克在快速迭代和改进方面的记录,未来版本是否能够弥补这一差距将非常有趣。Grok 3 是否会成为其宣称的 AI 强国,还是会成为一个被过度炒作的实验?时间会给出答案。


#deepseek##grok##我的宝藏兴趣#

相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...