百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

JVM 语言比较研究:Java、Kotlin 和 Scala 的利与弊

wptr33 2025-02-08 13:05 24 浏览

作者 | A N M Bazlur Rahman

译者 | 刘雅梦

策划 | 丁晓昀

在编程世界中,下划线( '_ ')是一个用途广泛的字符。它通常被称为语法糖,因为它简化了代码,使其更加简洁。


本文将探讨下划线在三种流行编程语言中的使用:Java、Kotlin 和 Scala。


Java:使用 JEP443 的未命名模式和变量


随着 JEP443 的引入,不断发展的 Java 语言在增强代码可读性和可维护性方面又迈出了重要的一步。这个名为“未命名模式和变量(预览版本)”的提案已经从 JDK21 的 Targeted 状态提成到 Completed 状态。


该 JEP 旨在通过未命名的模式和未命名的变量来增强语言,未命名模式匹配记录组件而无需声明组件的名称或类型,未命名的变量可以被初始化但不使用。


这两者都是用下划线字符表示的,如 r instanceof _(int x, int y) and r instanceof _


未命名模式

未命名模式旨在简化数据处理,尤其是在处理记录类时。它们允许开发人员在模式匹配中省略记录组件的类型和名称,这可以显著地提高代码的可读性。


考虑如下的代码片段:


if (r instanceof ColoredPoint(Point p, Color c)) {
    // ...
}


如果 if 块中不需要 Color c 组件,则将其包含在模式中可能会很徒劳并且也不清楚。使用 JEP 443,开发人员可以简单地省略不必要的组件,从而生成更干净、更可读的代码:


if (r instanceof ColoredPoint(Point p, _)) {
    // ...
}


在只需记录类的某些组件的嵌套模式匹配场景中,这一特性特别有用。例如,考虑一个包含 PointColor 的记录类 ColoredPoint 。如果只需要点的 x 坐标,可以使用未命名模式来省略 yColor 组件:


if (r instanceof ColoredPoint(Point(int x, _), _)) {
    // ...
}


未命名变量

当必须声明变量,但又不使用其值时,未命名变量会非常有用。这在循环、try-with-resources 语句、catch 块和 lambda 表达式中很常见。


例如,考虑以下的循环:


for (Order order : orders) {
    if (total < limit) total++;
}


在本例中,在循环中没有使用 order 变量。使用 JEP 443,开发人员可以用下划线替换未使用的变量,使代码更加简洁明了:


for (_ : orders) {
    if (total < limit) total++;
}


switch 语句中,未命名变量也很有用,在这种语句中,对多种情况执行相同的操作,并且不使用变量。例如:


switch (b) {
    case Box(RedBall _), Box(BlueBall _) -> processBox(b);
    case Box(GreenBall _) -> stopProcessing();
    case Box(_) -> pickAnotherBox();
}


在本例中,前两中情况使用未命名的模式变量,因为它们的右侧没有使用 Box 的组件。第三种情况使用未命名模式来匹配具有空(null)的 Box 组件。


启用预览特性


未命名模式和变量是预览特性,默认情况下处于禁用状态。要使用它,开发人员必须启用预览特性来编译代码才行,命令如下所示:


javac --release 21 --enable-preview Main.java


运行程序也需要相同的标志:


java --enable-preview Main


但是,可以使用源代码启动器直接运行该程序。在这种情况下,命令行如下:


java --source 21 --enable-preview Main.java


jshell 选项也是可用的,但它也需要启用预览特性:


jshell --enable-preview


Kotlin:下划线表示未使用的参数

在 Kotlin 中,下划线字符( _ )用于表示函数、lambda 或析构函数声明中未使用的参数。此特性允许开发人员省略此类参数的名称,从而生成更干净、更简洁的代码。


在 Kotlin 中,如果 lambda 的参数未使用,开发人员可以使用下划线来代替其名称。这在处理带有多个参数但只需其中某些参数的 lambda 函数时特别有用。


考虑如下的 Kotlin 代码片段:


mapOf(1 to "one", 2 to "two", 3 to "three")
   .forEach { (_, value) -> println("$value!") }


在本例中, forEach 函数需要一个 lambda,它接受两个参数:一个 key 和一个 value 。但是,我们只对 value 感兴趣,所以我们将 key 参数替换为下划线。


让我们考虑另一个代码片段:


var name: String by Delegates.observable("no name") {
    kProperty, oldValue, newValue -> println("$oldValue")
}


在这种情况下,如果在 lambda 中不使用 kPropertynewValue 参数,那么将它们包括在内可能会徒劳且不清楚。使用下划线特性,开发人员可以简单地用下划线替换未使用的参数:


var name: String by Delegates.observable("no name") {
    _, oldValue, _ -> println("$oldValue")
}


该特性在想要跳过某些组件的析构函数声明中也很有用:


val (w, x, y, z) = listOf(1, 2, 3, 4)
print(x + z) // 'w'和'y'未被使用


使用下划线特性,开发人员可以用下划线替换未使用的组件:


val (_, x, _, z) = listOf(1, 2, 3, 4)
print(x + z)


该特性并非 Kotlin 所独有。Haskell 等其他语言在模式匹配中使用下划线字符作为通配符。对于 C#来说,lambdas 中的“ _ ”只是一个习语,在语言中没有特殊处理。在 Java 的未来版本中可能也会应用相同的语义。


Scala:下划线的多功能性

在 Scala 中,下划线( _ )是一个用途广泛的通用字符。然而,这有时会导致混乱,并增加 Scala 新人的学习曲线。在本节中,我们将探讨 Scala 中下划线的不同用法和最常见的用法。


模式匹配和通配符

下划线被广泛用作通配符,用于匹配未知模式。这可能是 Scala 开发人员遇到的首个下划线用法。


模块导入

在导入包时,我们使用下划线来指示应该导入模块的所有或部分成员:


//导入包junit的所有成员。(相当于java中使用通配符*的导入)
import org.junit._




// 导入junit中除Before之外的所有成员。
import org.junit.{Before => _, _}




// 导入junit的所有成员,但将Before重命名为B4。
import org.junit.{Before => B4, _}


存在类型(Existential Type)

下划线还用作通配符,用于匹配类型创建器中的所有类型,如 List、Array、Seq、Option 或 Vector。


// 在List中使用下划线
val list: List[_] = List(1, "two", true)
println(list)




// 在Array中使用下划线
val array: Array[_] = Array(1, "two", true)
println(array.mkString("Array(", ", ", ")"))




// 在Seq中使用下划线
val seq: Seq[_] = Seq(1, "two", true)
println(seq)




// 在Option中使用下划线
val opt: Option[_] = Some("Hello")
println(opt)




// 在Vector中使用下划线
val vector: Vector[_] = Vector(1, "two", true)
println(vector)


使用_ ,我们允许所有类型的元素进入内链表。


匹配


使用 match 关键字,开发人员可以使用下划线来捕获任何已定义的用例无法处理的所有可能情况。例如,给定一个商品的价格,购买或出售该商品的决定是基于某些特殊价格做出的。如果价格是 130,该商品就可以购买,但如果价格是 150,该商品就要出售。除上述价格外,其他价格都需要获得批准:


def itemTransaction(price: Double): String = {
 price match {
   case 130 => "Buy"
   case 150 => "Sell"




   // 如果价格不是130和150中的任何一个,则执行这一情况
   case _ => "Need approval"
 }
}




println(itemTransaction(130)) // 购买
println(itemTransaction(150)) // 出售
println(itemTransaction(70))  // 需要批准
println(itemTransaction(400)) // 需要批准


忽略事物

下划线可以忽略代码中未使用的变量和类型。


忽略参数


例如,在函数执行中,开发人员可以使用下划线来隐藏未使用的参数:


val ints = (1 to 4).map(_ => "Hello")
println(ints) // Vector(Hello, Hello, Hello, Hello)


开发人员还可以使用下划线来访问嵌套集合:


val books = Seq(("Moby Dick", "Melville", 1851), ("The Great Gatsby", "Fitzgerald", 1925), ("1984", "Orwell", 1949), ("Brave New World", "Huxley", 1932))




val recentBooks = books
 .filter(_._3 > 1900)  // 只筛选1900年以后出版的书
 .filter(_._2.startsWith("F"))  // 只筛选作者名字以“F”开头的书。
// 只返回元组的第一个元素;书名




println(recentBooks) // List(The Great Gatsby)


在本例中,下划线用于引用列表中元组的元素。 filter 函数只筛选满足给定条件的图书,然后 map 函数将元组转换为它们的第一个元素(书名)。结果是一个包含符合标准书名的序列。


忽略变量


当开发人员遇到不必要或不相关的细节时,他们可以使用下划线来忽略它们。


例如,开发人员只想要拆分字符串中的第一个元素:


val text = "a,b"
val Array(a, _) = text.split(",")
println(a)


如果开发人员只想考虑构造中的第二个元素,那么同样的原则也适用。


val Array(_, b) = text.split(",")
println(b)


这一原则实际上可以扩展到两个以上的条目。例如,考虑下面的示例:


val text = "a,b,c,d,e"
val Array(a, _*) = text.split(",")
println(a)

在本例中,开发人员将文本拆分成一个元素数组。然而,他们只对第一个元素 a 感兴趣。带星号的下划线( _* )会忽略数组中的其余条目,只关注所需的元素。


为了忽略第一个条目之后的其余条目,我们将下划线与 “* ”一起使用。


下划线也可以用于随机忽略:


val text = "a,b,c,d,e"
val Array(a, b, _, d, e) = text.split(",")
println(a)
println(b)
println(d)
println(e)


初始化为变量的默认值


当变量的初始值不是必需的时候,则可以使用下划线来作为默认值:


var x: String = _
x = "real value"
println(x) // 真实值


然而,这并不适用于局部变量;局部变量必须要初始化。


转换

可以通过多种方式在转换中使用下划线。


函数重新分配(Eta 扩展)


使用下划线,可以将方法转换为函数。这对于将函数作为首选值来传递非常有用。


def greet(prefix: String, name: String): String = s"$prefix $name"




// Eta扩展,将greet变成一个函数
val greeting = greet _




println(greeting("Hello", "John"))


可变参数序列


序列可以使用 seqName:_* (类型归属的特殊实例)转换为可变参数。


def multiply(numbers: Int*): Int = {
 numbers.reduce(_ * _)
}




val factors = Seq(2, 3, 4)
val product = multiply(factors: _*)
//使用factors: _*将Seq元素转换为变量




println(product) // 应该打印:24


部分应用函数


通过在函数中只提供所需参数的一部分,并将其余部分留待稍后传递,开发人员可以创建所谓的部分应用函数(Partially-Applied Function)。用下划线替代尚未提供的参数。


def sum(x: Int, y: Int): Int = x + y
val sumToTen = sum(10, _: Int)
val sumFiveAndTen = sumToTen(5)




println(sumFiveAndTen, 15)


在部分应用函数中使用下划线也可以被归类为忽略事物。开发人员可以忽略具有多个参数组的函数中的整组参数,从而创建一种特殊类型的部分应用函数:


def bar(x: Int, y: Int)(z: String, a: String)(b: Float, c: Float): Int = x
val foo = bar(1, 2) _




println(foo("Some string", "Another string")(3 / 5, 6 / 5), 1)


赋值运算符(Setter 重写)


可以认为重写默认的 setter 是一种使用下划线的转换:


class User {
 private var pass = ""
 def password = pass
 def password_=(str: String): Unit = {
   require(str.nonEmpty, "Password cannot be empty")
   require(str.length >= 6, "Password length must be at least 6 characters")
   pass = str
 }
}




val user = new User
user.password = "Secr3tC0de"
println(user.password) // 应该打印:"Secr3tC0de"




try {
 user.password = "123" //将会失败,应为它少于6个字符
 println("Password should be at least 6 characters")
} catch {
 case _: IllegalArgumentException => println("Invalid password")
}


高阶类型(Higher-Kinded Type)

高阶类型(Higher-Kinded Type)是对某种类型进行抽象,而这种类型又对另一种类型进行抽象。通过这种方式,Scala 可以跨类型构造函数进行泛化。它与存在类型(Existential Type)非常相似。可以使用下划线定义高阶类型:


trait Wrapper[F[_]] {
 def wrap[A](value: A): F[A]
}




object OptionWrapper extends Wrapper[Option] {
 override def wrap[A](value: A): Option[A] = Option(value)
}




val wrappedInt = OptionWrapper.wrap(5)
println(wrappedInt)




val wrappedString = OptionWrapper.wrap("Hello")
println(wrappedString)


在上面的例子中, Wrapper 是一个具有高阶类型参数 F[_] 的 trait。它提供了一个方法 wrap ,用于将值包装到给定的类型中。 OptionWrapper 是为 Option 类型扩展此 trait 的对象。 F[_] 中的下划线表示任何类型,使 Wrapper 在所有 Option 类型中都是通用的。


这些例子都说明了 Scala 是一个强大的工具,它可以通过各种方式来简化和提高代码的可读性。这一特性非常符合 Scala 的理念,即成为一种简洁而富有表现力的语言,促进代码的可读性和可维护性。


结论

通过 JEP 443 在 Java 中引入未命名的模式和变量,标志着该语言发展的一个重要里程碑。该特性允许开发人员通过省略不必要的组件并替换未使用的变量来简化代码,使 Java 更接近 Kotlin 和 Scala 等语言的表达力和多功能性。


然而,需要注意的是,尽管这是向前迈出的重要一步,但 Java 在这一领域的历程仍然不完整。Kotlin 和 Scala 等语言长期以来一直采用类似的概念,并以各种方式使用它们来增强代码的可读性、可维护性和简洁性。这些语言已经证明了这些概念在使代码更高效、更容易理解方面的力量。


相比之下,Java 目前对未命名模式和变量的使用虽然有益,但仍有一定的局限性。Java 进一步利用这些概念的潜力巨大。该语言的未来更新可能会包含更多对未命名模式和变量的高级使用,从 Kotlin 和 Scala 等语言中汲取如何使用这些概念的灵感。


尽管如此,在 Java 中采用未命名的模式和变量是提高语言表达性和可读性的重要一步。随着 Java 的不断发展和壮大,我们希望看到这些概念的进一步创新使用,从而产生更高效和更可维护的代码。这段旅程还在继续,成为 Java 社区的一员是一个激动人心的时刻。


编码快乐!


原文链接:

https://www.infoq.com/articles/comparative-study-java-kotlin-scala/


本文转载来源:

https://www.infoq.cn/article/ThrjTB6kHMdXmjIPeaEv

相关推荐

MySQL进阶五之自动读写分离mysql-proxy

自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...

Postgres vs MySQL_vs2022连接mysql数据库

...

3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?

引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...

一文由浅入深带你完全掌握MySQL的锁机制原理与应用

本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...

验证Mysql中联合索引的最左匹配原则

后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...

MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)

目录1.索引基础...

你会看 MySQL 的执行计划(EXPLAIN)吗?

SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...

MySQL 从入门到精通(四)之索引结构

索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...

mysql总结——面试中最常问到的知识点

mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...

mysql总结——面试中最常问到的知识点(2)

首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...

MySQL基础全知全解!超详细无废话!轻松上手~

本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...

深入剖析 MySQL 中的锁机制原理_mysql 锁详解

在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...

Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析

引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...

MySQL基础篇:DQL数据查询操作_mysql 查

一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...

MySql:索引的基本使用_mysql索引的使用和原理

一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...