Lua中如何实现类似gdb的断点调试—06断点行号检查与自动修正 Lua中如何实现类似gdb的断点调

前面两篇我们对性能做了一个优化，接下来继续来丰富调试器的特性。
我们前面提到过，函数内并不是所有行都是有效行，空行和注释行就不是有效行。我们之前在添加断点的时候，并没有对行号进行检查，任何行号都能成功添加断点。所以如果添加的断点行号是无效的，那么永远也不会断到那里。但是钩子里并不知道它是无效的，call事件仍然会以为函数有断点从而启动line事件，造成CPU的浪费。
所以本篇，我们将对断点的行号进行检查，对于不在函数范围内的行号直接添加断点失败；在函数范围内的行号则自动修正为下一个有效的行号；另外支持不指定行号，默认为函数的第一个有效行。
源码已经上传Github，欢迎watch/star。
本博客已迁移至CatBro's Blog，那是我自己搭建的个人博客，欢迎关注。
添加断点因为是断点行号相关的检查，所以修改主要集中在添加断点的函数中。首先因为支持了不指定行号，所以修改了参数检查的地方允许为空。其次，因为要检查行号是否有效，我们就需要先获取到函数的信息。考虑到在钩子函数中也需要获取函数信息，我们就把相关的操作封装成了一个单独的函数getfuncinfo()。获取到函数信息之后，就可以验证行号是否有效了，同样我们将这个验证行号的操作也封装成了一个单独的函数verifyfuncline。

local function setbreakpoint(func, line) local s = status if type(func) ~= "function" or ( line and type(line) ~= "number") then io.write("invalid parameter\n") return nil end-- get func info local info = getfuncinfo(func) if not info then io.write("unable to get func info\n") return nil end-- verify the line line = verifyfuncline(info, line) if not line then io.write("invalid line\n") return nil end-- 省略 end

获取函数信息 getfuncinfo函数的代码如下：

local function getfuncinfo (func, level) local s = status local info = s.funcinfos[func] if not info then if level then s.funcinfos[func] = debug.getinfo(level + 1, "nSL") else s.funcinfos[func] = debug.getinfo(func, "SL") end info = s.funcinfos[func] info.sortedlines = {} for k, _ in pairs(info.activelines) do table.insert(info.sortedlines, k) end table.sort(info.sortedlines) elseif level then -- name和namewhat需要实时获取 local nameinfo = debug.getinfo(level + 1, "n") info.name = nameinfo.name info.namewhat = nameinfo.namewhat end return info end

该函数有两个参数，第一个参数就是函数，第二个可选的参数level用于指定在调用栈中的层数，第二个参数只有在钩子函数中时才会指定，返回值就是函数信息。如果在调用debug.getinfo的时候传递函数作为参数，那么是获取不到函数的名字信息的，name和namewhat字段都为空。因为函数可能是任意名字，Lua需要通过查找调用该函数的代码，知道它是怎么被调用的，从而确定函数的名字。所以只有当指定调用栈的层数时才能获取到名字信息。
我们接着看代码的主体部分：
首先尝试去s.funcinfos表中查找是否有缓存的函数信息。如果没有那就只能调用debug.getinfo去获取了，这里分为两种情况，如果指定了level参数，那么就以层数（这里+1同样是为了修正层数，我们在前面多次提到过）作为参数调用，此时第二个参数设置为了"nSL"，比之前多了"L"用于获取有效行号；如果没有指定level参数，则以函数作为参数调用。获取到函数信息之后，为了方便我们后面的行号检查，我们对有效的行号进行了排序，info.sortedlines数组就是排序后的有效行号，然后就返回函数信息info了。
如果缓存中已经有函数信息了，如果本次调用又指定了level参数，那么我们就更新下name信息。调用debug.getinfo获取到信息之后设置到原有的info表中。完成之后同样是返回函数信息info。
检查及修正函数行号 verifyfuncline函数的代码如下：

local function verifyfuncline (info, line) if not line then return info.sortedlines[1] end if line < info.linedefined or line > info.lastlinedefined then return nil end for _, v in ipairs(info.sortedlines) do if v >= line then return v end end assert(false)-- impossible to reach here end

该函数有两个参数，其中第二个行号是可选的。如果没有指定行号，那么直接返回函数的第一个有效行号。如果指定了行号，但是范围超出了函数定义的范围，那么返回nil。如果行号落在函数范围内，那么就遍历已经排好序的有效行号数组，返回碰到的第一个大于等于指定行号的值。
钩子函数接下来看下钩子函数的修改，因为我们已经封装了getfuncinfo函数，所以钩子函数中也改成用它来获取函数信息。不过这里在调用的时候指定了level从而可以获取到函数名字信息。

local function hook (event, line) -- 省略 elseif event == "line" then local curfunc = s.stackinfos[s.stackdepth].func local funcbp = s.funcbpt[curfunc] assert(funcbp) if funcbp[line] then local info = getfuncinfo(curfunc, 2) local prompt = string.format("%s (%s)%s %s:%d\n", info.what, info.namewhat, info.name, info.short_src, line) io.write(prompt) debug.debug() end end end

OK，代码修改完了，我们进行测试。
测试有效行排序首先测试一下，有效行号排序那块的逻辑。我们编写了一个如下的测试脚本：

local debug = require "debug"local function foo() local a = 0a = a + 1a = a + 1 endlocal function bar() endlocal function sortlines(func) local info = debug.getinfo(func, "nSL") info.sortedlines = {} for k, v in pairs(info.activelines) do print(k, v) table.insert(info.sortedlines, k) endtable.sort(info.sortedlines)for k, v in ipairs(info.sortedlines) do print(k, v) end endprint("foo") sortlines(foo) print("bar") sortlines(bar)

我们定义了两个函数foo和bar，其中foo函数的范围为第3行到第9行，有4个有效行4、6、8、9。而bar函数则为特殊的单行函数。
运行脚本，输出如下

$ lua sortlines.lua foo 4 true 9 true 6 true 8 true 1 4 2 6 3 8 4 9 bar 11 true 1 11

foo函数4个有效行没排之前是4、9、6、8，排序之后变成4、6、8、9。bar函数唯一的有效行就是它开始定义的那行。
测试行号检查和自动修正编写测试脚本如下：

local ldb = require "luadebug" local setbp = ldb.setbreakpoint local rmbp = ldb.removebreakpointlocal function foo() local a = 0a = a + 1a = a + 1 endlocal id1 = setbp(foo) assert(id1 == 1) local id2 = setbp(foo, 5) assert(id2 == id1) local id3 = setbp(foo, 6) assert(id3 == id1) local id4 = setbp(foo, 7) assert(id4 == 2) local id5 = setbp(foo, 8) assert(id5 == id4) local id6 = setbp(foo, 9) assert(id6 == 3) local id7 = setbp(foo, 100) assert(not id7)foo()rmbp(id1) rmbp(id4)foo()rmbp(id6)foo()

我们在foo函数上添加了好几个断点，第一个断点行号省略，第二个断点加在了第5行，也就是函数开始定义的行，第三个断点加在了第6行，这是函数第一个有效行。预期前三次添加断点应该都返回同一个断点id，断在第6行。接下来添加的两个断点，第7行不是有效行，第8行是有效行，预期返回同一个断点id，断在第8行。然后在第9行添加了一个断点，因为不是有效行，预期断在第10行。最后一个在第100行设置了一个断点，因为超出了函数的范围，预期设置断点失败返回nil。
设置好断点，先调用一次foo函数，然后删除两个断点，在调用一次foo函数，最后将剩余那个断点删除，再调用一次foo函数。
我们了运行下测试脚本

$ lua test.lua invalid line Lua (local)foo test.lua:6 lua_debug>

断点的设置都符合预期，最后一个因为行号超出了范围，打了一行错误日志invalid line，程序停在了第6行处。然后我们输入两个cont，程序停在了最后一个断点处。

Lua (local)foo test.lua:6 lua_debug> cont Lua (local)foo test.lua:8 lua_debug> cont Lua (local)foo test.lua:10 lua_debug>

我们再次输入cont，foo函数运行结束，此时因为前两个断点已经被删除，第二次调用foo函数应该直接停在断点3处，也就是第10行

Lua (local)foo test.lua:6 lua_debug> cont Lua (local)foo test.lua:8 lua_debug> cont Lua (local)foo test.lua:10 lua_debug> cont Lua (local)foo test.lua:10 lua_debug>

【Lua中如何实现类似gdb的断点调试—06断点行号检查与自动修正】我们再次输入cont，因为最后一个断点也被删除了，所以最后一个执行foo函数没有再碰到断点。

$ lua test.lua invalid line Lua (local)foo test.lua:6 lua_debug> cont Lua (local)foo test.lua:8 lua_debug> cont Lua (local)foo test.lua:10 lua_debug> cont Lua (local)foo test.lua:10 lua_debug> cont $