如何解决 Kotlin/Native 在 Windows 下 main 函数的 args 乱码?-程序员充电站

之前在用 Kotlin/Native 写 codex-kkp 的时候遇到了一个问题：
当我尝试在 Windows 的命令行上向它的产物 exe 传递参数的时候，传入的中文参数会变成我们熟悉又陌生的乱码“锟斤拷”。

codex-kkp-cli.exe"分析代码"# 实际收到的参数变成了乱码

问题分析

那么为什么会这样呢？众所周知，“锟斤拷”系列的乱码通常是 GBK 和 UTF-8 之间的错误转码导致的。
而又众所周知，Windows 存在两套字符API：GBK 是 Windows 默认的中文系统编码(A 版本, ANSI)，
UTF-16 则是内核的原生编码(W 版本, 宽、Unicode)。

参考文档：

Windows API 中的 Unicode
代码页

而 Kotlin/Native mingwX64 平台的 main 函数编译后会使用 ANSI 版本的API的入口点：

launcher.cpp#L72-L78
中的Konan_main函数：

extern "C" RUNTIME_EXPORT int Konan_main(int argc, const char** argv) { return Init_and_run_start(argc, argv, 1); }

和 StubIrDriver.kt#L225-L232
里面生成的 main 函数：

out("extern int Konan_main(int argc, char** argv);") out("") out("__attribute__((__used__))") out("int $entryPoint(int argc, char** argv) {") out(" return Konan_main(argc, argv);") out("}")

也就是:

extern int Konan_main(int argc, char** argv); int main(int argc, char** argv) { return Konan_main(argc, argv); }

它没有使用wmain或wchar_t** argv，所以它使用的是 ANSI 的 API 而不是 Unicode 的那个。

这个问题在 YouTrack 上也有相关记载：

KT-82801: Kotlin/Native: Windows Non-ASCII command-line arguments garbled characters
KT-80201: K/N: Windows main(args) receives corrupted Unicode arguments

在 KT-80201 中，也有热心网友贴出了解决方案，这也是接下来要进行介绍的内容。

解决方案

如果你比较熟悉 Windows 的 API，那么应该很快就能想到该如何了解。但是我就不一样了，我对这类 native 相关的东西一窍不通（

OK 言归正传，由于 Kotlin 的main函数接收到的args已经是处于乱码状态的错误参数，因此我们不能直接使用这个args了，
而是要用 Windows 的 W 版本 API 来直接获取通过 UTF-16 编码的正确参数，以此绕过 ANSI 的入口点带来的错误结果。

那么怎么绕开呢？说难也不难，我们可以直接通过platform.windows.GetCommandLineW()来获取 UTF-16 的命令行参数。
完整代码参考如下：

fun getUnicodeArgs(): Array<String> = memScoped { // 获取原始的 UTF-16 命令行 val commandLine = GetCommandLineW() ?: return@memScoped emptyArray() // 解析命令行为参数数组 val argc = alloc<IntVar>() val argv = CommandLineToArgvW(commandLine.toKString(), argc.ptr) ?: return@memScoped emptyArray() try { val argCount = argc.value if (argCount <= 1) { // 只有程序名本身，没有其他参数 return@memScoped emptyArray() } // 转换参数（跳过程序名） Array(argCount - 1) { index -> argv[index + 1]?.toKStringFromUtf16() ?: "" } } finally { LocalFree(argv) } }

通过GetCommandLineW获取到W版本的命令行参数，然后通过CommandLineToArgvW将它们解析为参数数组，
随后将程序名之后的真正的 args 们通过toKStringFromUtf16转化为 Kotlin String 之后就得到了之最终我们需要的东西：
不乱码的 args 数组。

在一个 KMP 项目中，我们现在可以通过expect/actual来实现 mingwX64 平台下对参数的解析（至少我现在是这么做的）：

// commonMain - 声明期望函数 internal expect fun resolveArgs(args: Array<String>): Array<String> // appleMain & linuxMain - 直接返回原参数（这些平台默认 UTF-8） internal actual fun resolveArgs(args: Array<String>): Array<String> = args // mingwMain - 使用 Windows Unicode API 重新获取参数 internal actual fun resolveArgs(args: Array<String>): Array<String> { // ... Unicode 处理逻辑 }

main方法中：

fun main(args: Array<String>) { val processedArgs = resolveArgs(args) // 接下来使用 processedArgs 而不是 args（你直接用 args 覆盖也行） }

总结

根据 KT-80201 的状态，至少目前来看官方还没有解决这个问题。
如果你比较关心这个问题的话，可以追踪下这个 issue，跟踪它的未来进展。

OpenUtau终极指南：5步快速掌握免费音乐合成平台

OpenUtau终极指南：5步快速掌握免费音乐合成平台【免费下载链接】OpenUtau Open singing synthesis platform / Open source UTAU successor 项目地址: https://gitcode.com/gh_mirrors/op/OpenUtau 想要创作虚拟歌手音乐却担心技术门槛太高？Open…

李华

PostgreSQL pgvector扩展Windows部署指南：高效向量搜索方案解析

PostgreSQL pgvector扩展Windows部署指南：高效向量搜索方案解析【免费下载链接】pgvector Open-source vector similarity search for Postgres 项目地址: https://gitcode.com/GitHub_Trending/pg/pgvector pgvector作为PostgreSQL生态中的开源向量相似性搜…

李华

Note-Gen多图床管理全攻略：一键解决Markdown图片上传难题

Note-Gen多图床管理全攻略：一键解决Markdown图片上传难题【免费下载链接】note-gen 一款跨平台的 Markdown AI 笔记软件，致力于使用 AI 建立记录和写作的桥梁。项目地址: https://gitcode.com/codexu/note-gen 还在为Markdown笔记中的图片管理而…

李华

从文本到富有情感的语音：揭秘EmotiVoice的合成机制

从文本到富有情感的语音：揭秘 EmotiVoice 的合成机制在虚拟主播的一句“谢谢大家的支持”中，是机械地念出台词，还是带着真挚笑意、略带哽咽地说出这句话，用户体验可能截然不同。今天，我们早已不再满足于“能说话”的A…

李华

EmotiVoice是否支持增量更新？模型热升级可行性探讨

EmotiVoice是否支持增量更新？模型热升级可行性探讨在语音合成技术日益渗透到游戏、虚拟人、智能助手等实时交互场景的今天，一个核心问题逐渐浮现：当模型需要优化或扩展时，我们是否必须中断服务、重新部署整个系统？对于…

李华

EmotiVoice语音合成服务回滚机制设计原则

EmotiVoice语音合成服务回滚机制设计原则在虚拟主播直播带货、智能客服实时应答、游戏NPC情感化对白等场景中，用户早已不再满足于“能说话”的机械语音。他们期待的是富有情绪起伏、具备个性音色、自然流畅的拟人化表达——这正是EmotiVoice这类高表现力TTS系统崛起…

李华