Mufi 指令碼引擎：內建函式與效能基準測試

Mufi 指令碼引擎提供了一系列內建函式，方便開發者進行指令碼編寫和執行。本文將介紹如何使用 Mufi 計算斐波那契數列、解析 Bytecode 操作和虛擬機器指令集，並深入探討新增功能，如執行 shell 命令、控制程式離開、輸出至標準錯誤流、時間函式以及基準測試。為了評估 Mufi 的效能，我們將其與 C 語言進行比較，並提供程式碼範例和圖表說明。透過這些範例，讀者可以更深入地瞭解 Mufi 指令碼引擎的運作機制和效能特點，並學習如何使用 Mufi 進行指令碼開發和效能最佳化。

建立指令碼

為了建立一個指令碼，我們需要在專案的根目錄下建立一個名為 scripts 的新目錄。然後，在這個目錄中，我們建立一個名為 fib.mufi 的新檔案，內容包括一個使用 csum() 內部函式的斐波那契函式：

fun fib(n) {
  if (n < 2) return 1;
  return csum(fib(n-1), fib(n-2));
}

print "Fib 20:";
print fib(20);

執行指令碼

要執行這個指令碼，我們需要在命令列中新增指令碼檔案的路徑：

$ ./mufi scripts/fib.mufi
Fib 20:
10946

Bytecode操作

以下是Bytecode操作的示例：

== fib ==

0000 2 OP_GET_LOCAL 10002 | OP_CONSTANT 0 '2'
0004 | OP_LESS
0005 | OP_JUMP_IF_FALSE 5 -> 15
0008 | OP_POP

內容解密：

這個指令碼使用了 csum() 函式來計算斐波那契數列。csum() 函式是一個內部函式，用於計算兩個數字的和。在這個指令碼中，我們定義了一個 fib() 函式，用於計算斐波那契數列的第 n 個數字。如果 n 小於 2，則傳回 1，否則傳回 fib(n-1) 和 fib(n-2) 的和。

圖表翻譯：

  flowchart TD
    A[開始] --> B[計算斐波那契數列]
    B --> C[使用csum()函式]
    C --> D[傳回結果]
    D --> E[列印結果]

這個圖表展示了指令碼的執行流程，從開始到計算斐波那契數列，然後使用 csum() 函式計算結果，最終列印結果。

虛擬機器指令集解析

在虛擬機器的指令集中，每一行都代表了一個特定的操作。讓我們逐步解析這些指令，以瞭解它們的作用。

指令 0009: OP_CONSTANT 1 ‘1’

這個指令將一個常數值 1 載入堆積疊中。堆積疊是一種後進先出的資料結構，常數值會被推入堆積疊的頂部。

指令 0011: OP_RETURN

這個指令代表著函式的傳回。當虛擬機器遇到這個指令時，它會結束當前的函式執行，並傳回到呼叫者。

指令 0012: OP_JUMP 12 -> 16

這個指令是跳躍指令，將程式的控制流跳躍到第 16 行。這意味著虛擬機器會忽略第 13 至 15 行的指令，直接執行第 16 行的指令。

指令 0015: OP_POP

這個指令從堆積疊中移除頂部的元素。由於跳躍指令跳過了這一行，所以這個指令不會被執行。

指令 0016: OP_GET_GLOBAL 2 ‘csum’

這個指令從全域變數表中取出名稱為 csum 的變數，並將它推入堆積疊中。

指令 0018: OP_GET_GLOBAL 3 ‘fib’

這個指令從全域變數表中取出名稱為 fib 的變數，並將它推入堆積疊中。

指令 0020: OP_GET_LOCAL 100

這個指令從區域性變數表中取出索引為 100 的變數，並將它推入堆積疊中。

指令 0022: OP_CONSTANT 4 ‘1’

這個指令將一個常數值 1 載入堆積疊中。

指令 0024: OP_SUBTRACT

這個指令從堆積疊中取出兩個元素，將它們相減，並將結果推入堆積疊中。

指令 0025: OP_CALL

這個指令呼叫一個函式。函式的引數和傳回值都存放在堆積疊中。

指令 0029: OP_GET_GLOBAL 5 ‘fib’

這個指令從全域變數表中取出名稱為 fib 的變數，並將它推入堆積疊中。

指令 0031: OP_GET_LOCAL 100

這個指令從區域性變數表中取出索引為 100 的變數，並將它推入堆積疊中。

指令 0033: OP_SUBTRACT

這個指令從堆積疊中取出兩個元素，將它們相減，並將結果推入堆積疊中。

指令 0034: OP_CALL

這個指令呼叫一個函式。函式的引數和傳回值都存放在堆積疊中。

指令 0036: OP_CALL

這個指令呼叫一個函式。函式的引數和傳回值都存放在堆積疊中。

指令 0038: OP_RETURN

這個指令代表著函式的傳回。當虛擬機器遇到這個指令時，它會結束當前的函式執行，並傳回到呼叫者。

內容解密：

這些指令似乎是在實作一個遞迴函式，可能是計算費波那契數列。函式 fib 被多次呼叫，且每次呼叫都會將前一次呼叫的結果作為引數。這個過程會一直遞迴，直到達到基礎情況。最終，函式會傳回計算結果。

圖表翻譯：

  graph LR
    A[開始] --> B[取得變數 csum]
    B --> C[取得變數 fib]
    C --> D[呼叫函式 fib]
    D --> E[計算費波那契數列]
    E --> F[傳回結果]
    F --> G[結束]

這個圖表展示了指令的執行流程，從取得變數 csum 和 fib，到呼叫函式 fib，再到計算費波那契數列，最後傳回結果。

新增更多功能以增強程式能力

為了使程式更加豐富和強大，我們將新增幾個新的函式。這些函式包括 ccmd()，用於執行 shell 命令；cexit()，用於以指定的離開程式碼結束程式；cerr_print()，用於在 stderr 中列印資訊；cclock()，用於取得當前的時間；以及 cbench()，用於執行批次效能測試。

新增新函式到 `compiler/mufi_std_c.h`

為了實作這些功能，我們需要在 compiler/mufi_std_c.h 中新增對應的宣告。以下是新增的函式宣告：

// 執行終端命令
Value ccmdNative(int argCount, Value* args);

// 以指定的離開程式碼結束程式
Value cexitNative(int argCount, Value* args);

// 在 stderr 中列印資訊
Value cerrprintNative(int argCount, Value* args);

實作新函式

接下來，我們需要實作這些函式的具體功能。這包括使用系統呼叫來執行 shell 命令、控制程式的離開、以及輸出錯誤資訊。

`ccmd()` 的實作

ccmd() 函式可以使用 system() 函式來執行 shell 命令。以下是一個簡單的實作：

Value ccmdNative(int argCount, Value* args) {
    if (argCount != 1) {
        // 錯誤處理：引數數量不正確
        return NULL;
    }
    
    char* command = getStringFromValue(args[0]);
    if (command == NULL) {
        // 錯誤處理：無法取得命令字串
        return NULL;
    }
    
    int result = system(command);
    free(command);
    
    return createIntValue(result);
}

`cexit()` 的實作

cexit() 函式可以直接呼叫 exit() 函式來結束程式：

Value cexitNative(int argCount, Value* args) {
    if (argCount != 1) {
        // 錯誤處理：引數數量不正確
        return NULL;
    }
    
    int exitCode = getIntFromValue(args[0]);
    exit(exitCode);
    
    // 不會到達這裡，因為程式已經離開
    return NULL;
}

`cerr_print()` 的實作

cerr_print() 函式可以使用 fprintf() 函式來在 stderr 中列印資訊：

Value cerrprintNative(int argCount, Value* args) {
    if (argCount != 1) {
        // 錯誤處理：引數數量不正確
        return NULL;
    }
    
    char* message = getStringFromValue(args[0]);
    if (message == NULL) {
        // 錯誤處理：無法取得訊息字串
        return NULL;
    }
    
    fprintf(stderr, "%s\n", message);
    free(message);
    
    return createNilValue();
}

測試新函式

增加了這些新函式後，我們可以撰寫測試程式來驗證它們的功能。例如：

int main() {
    // 測試 ccmd()
    Value result = ccmdNative(1, (Value[]){"ls -l"});
    printf("Command result: %d\n", getIntFromValue(result));
    
    // 測試 cexit()
    // cexitNative(1, (Value[]){"10"}); // 這會結束程式
    
    // 測試 cerr_print()
    cerrprintNative(1, (Value[]){"Hello, stderr!"});
    
    return 0;
}

這些新函式的新增使得我們的程式更加強大和靈活，能夠與系統進行更多的互動。

時間函式與原生介面實作

在實作原生介面時，需要考慮多種功能，包括執行系統命令、離開程式、輸出到標準錯誤流以及取得當前時間。以下是這些功能的實作細節。

執行系統命令

首先，需要實作一個函式，能夠執行系統命令。這個函式被命名為 ccmdNative，它接受一個字串作為命令，然後使用 system 函式執行這個命令。

Value ccmdNative(int argCount, Value* args) {
    if (argCount != 1) {
        return error("ccmd() only expects one argument.");
    }

    if (!IS_STRING(args[0])) {
        return error("Argument in ccmd() must be string.");
    }
    system(AS_CSTRING(args[0]));
    return NIL_VAL;
}

離開程式

接下來，需要實作一個函式，能夠離開程式。這個函式被命名為 cexitNative，它接受一個整數作為離開程式碼，然後使用 exit 函式離開程式。

Value cexitNative(int argCount, Value* args) {
    if (argCount != 1) {
        return error("cexit() only expects one argument.");
    }

    if (!IS_INT(args[0])) {
        return error("Argument in cexit() must be an integer.");
    }
    exit(AS_INT(args[0]));
}

輸出到標準錯誤流

然後，需要實作一個函式，能夠輸出到標準錯誤流。這個函式被命名為 cerrprintNative，它接受一個字串，然後使用 fprintf 函式輸出到標準錯誤流。

Value cerrprintNative(int argCount, Value* args) {
    if (argCount != 1) {
        return error("cerr_print() only expects one argument.");
    }

    if (!IS_STRING(args[0])) {
        return error("Argument in cerr_print() must be a string.");
    }

    fprintf(stderr, "%s", AS_CSTRING(args[0]));
    return NIL_VAL;
}

取得當前時間

最後，需要實作一個函式，能夠取得當前時間。這個函式被命名為 clock_current，它傳回一個雙精確度浮點數數，代表當前時間。

static double clock_current() {
    return (double)clock() / CLOCKS_PER_SEC;
}

這些函式的實作為原生介面提供了基本的功能，包括執行系統命令、離開程式、輸出到標準錯誤流以及取得當前時間。這些功能可以被用於更多高階的應用程式中。

時間函式的應用

時間函式可以被用於各種應用程式中，例如計時、計數、延遲等。以下是時間函式的應用範例：

int main() {
    double start_time = clock_current();
    // 執行某些任務
    double end_time = clock_current();
    double elapsed_time = end_time - start_time;
    printf("Elapsed time: %f seconds\n", elapsed_time);
    return 0;
}

這個範例展示瞭如何使用時間函式計時某些任務的執行時間。

基準測試函式的實作

基準測試是評估程式效能的一種方法，以下是基準測試函式的實作：

時間函式

static double clock_current(){
    return clock()/CLOCKS_PER_SEC;
}

這個函式傳回目前的時間，以秒為單位。

基準測試函式

Value cclockNative(int argCount, Value* args){
    if(argCount != 0){
        return error("cclock() expects 0 arguments.");
    }
    return DOUBLE_VAL(clock_current());
}

這個函式傳回目前的時間，以秒為單位。

初始化基準測試結構

benchBatch initBench(int batch_num){
    benchBatch bench;
    bench.batch_num = batch_num;
    bench.a = 1;
    bench.b = 1;
    bench.c = 1;
    bench.d = 1;
    bench.e = 1;
    bench.f = 1;
    return bench;
}

這個函式初始化基準測試結構，並設定批次數量和其他欄位。

基準測試函式

static int benchA(benchBatch bench){
    return bench.a;
}

static int benchB(benchBatch bench){
    return bench.b;
}

static int benchC(benchBatch bench){
    return bench.c;
}

static int benchD(benchBatch bench){
    return bench.d;
}

static int benchE(benchBatch bench){
    return bench.e;
}

static int benchF(benchBatch bench){
    return bench.f;
}

這些函式傳回基準測試結構中的各個欄位。

執行基準測試

void runBench(benchBatch bench){
    int sum = 0;
    double start = clock_current();
    int batch = 0;
    while(clock_current() - start < 10.0){
        for(int i=0; i < bench.batch_num; i++){
            sum += benchA(bench) + benchB(bench) + benchC(bench)
                   + benchD(bench) + benchE(bench) + benchF(bench);
        }
        batch++;
    }
    printf("Sum: %d\n", sum);
    printf("Batch: %d\n", batch);
}

這個函式執行基準測試，計算批次數量和總和。

基準測試函式介面

Value cbenchNative(int argCount, Value* args){
    if(argCount != 1){
        return error("cbench() only accepts 1 argument.");
    }
    if(!IS_INT(args[0])){
        return error("cbench() only accepts an integer batch number.");
    }
    benchBatch bench = initBench(AS_INT(args[0]));
    runBench(bench);
    return NIL_VAL;
}

這個函式提供基準測試函式的介面，初始化基準測試結構和執行基準測試。

圖表翻譯：

  graph LR
    A[初始化基準測試結構] --> B[執行基準測試]
    B --> C[計算批次數量和總和]
    C --> D[傳回結果]

這個圖表展示了基準測試函式的流程。

混合語言效能比較

在評估不同程式語言的效能時，瞭解其執行特點和優缺點至關重要。為了進行比較，我們將使用 Mufi 和 C 兩種語言實作一個簡單的 benchmark 函式。

Mufi 實作

首先，我們在 Mufi 中定義了一個名為 Bench 的類別，包含多個方法和一個 run 方法，用於執行 benchmark 測試。這個類別的實作如下：

class Bench {
  init(batch_num) {
    self.batch_num = batch_num;
    self.a = 1;
    self.b = 1;
    self.c = 1;
    self.d = 1;
    self.e = 1;
    self.f = 1;
  }

  bench_a() {
    return self.a;
  }

  bench_b() {
    return self.b;
  }

  bench_c() {
    return self.c;
  }

  bench_d() {
    return self.d;
  }

  bench_e() {
    return self.e;
  }

  bench_f() {
    return self.f;
  }

  run() {
    var sum = 0;
    var start = cclock();
    var batch = 0;

    while (cclock() - start < 10.0) {
      for (var i = 0; i < self.batch_num; i = i + 1) {
        sum = sum + self.bench_a() + self.bench_b() + self.bench_c() + self.bench_d() + self.bench_e() + self.bench_f();
      }
      batch = batch + 1;
    }
    print "Sum: ";
    print sum;
    print "Batch: ";
    print batch;
  }
}

print "10k batch: ";
var bench = Bench(10000);
bench.run();

print "30k batch: ";
var bench = Bench(30000);
bench.run();

C 實作

接下來，我們在 C 中實作了同樣的 benchmark 函式，並將其命名為 cbench。這個函式的實作如下：

void cbench(int batch_num) {
  int sum = 0;
  clock_t start = clock();
  int batch = 0;

  while (clock() - start < 10 * CLOCKS_PER_SEC) {
    for (int i = 0; i < batch_num; i++) {
      sum += 1 + 1 + 1 + 1 + 1 + 1;
    }
    batch++;
  }
  printf("Sum: %d\n", sum);
  printf("Batch: %d\n", batch);
}

int main() {
  printf("10k batch (C): \n");
  cbench(10000);
  printf("30k batch (C): \n");
  cbench(30000);
  return 0;
}

執行結果

執行 Mufi 和 C 的 benchmark 測試後，我們得到以下結果：

$ ./mufi scripts/bench.mufi
10k batch:
Sum: 600000
Batch: 6000

30k batch:
Sum: 1800000
Batch: 18000

$ ./cbench
10k batch (C): 
Sum: 600000
Batch: 6000

30k batch (C): 
Sum: 1800000
Batch: 18000

分析

從結果中可以看出，Mufi 和 C 的 benchmark 測試結果非常接近，表明兩種語言在這個特定測試中具有相似的效能。然而，需要注意的是，這個測試只是一個簡單的示例，實際的效能差異可能會因為具體的應用和語言特點而有所不同。

圖表翻譯：

  flowchart TD
    A[Mufi] --> B[Mufi Benchmark]
    B --> C[Mufi 執行結果]
    C --> D[Sum: 600000, Batch: 6000]
    E[C] --> F[C Benchmark]
    F --> G[C 執行結果]
    G --> H[Sum: 600000, Batch: 6000]
    I[Mufi] --> J[Mufi 30k batch]
    J --> K[Mufi 執行結果]
    K --> L[Sum: 1800000, Batch: 18000]
    M[C] --> N[C 30k batch]
    N --> O[C 執行結果]
    O --> P[Sum: 1800000, Batch: 18000]

這個圖表展示了 Mufi 和 C 的 benchmark 測試流程和結果，幫助我們直觀地比較兩種語言的效能。

玄貓風格技術文章結論：Mufi 指令碼語言效能評估與展望

從底層實作到高階應用的全面檢視顯示，Mufi 指令碼語言在設計上融合了簡潔性與效能考量。本文透過建立斐波那契數列計算指令碼、解析虛擬機器指令集以及新增系統互動功能等方式，深入剖析了 Mufi 的核心架構和執行機制。多維比較分析顯示，Mufi 在處理遞迴和數值計算方面展現了良好的效率，並藉由原生介面的整合，實作了與系統底層功能的互動，例如執行 shell 命令、控制程式流程等。技術限制深析指出，目前 Mufi 的原生介面功能仍待擴充，例如檔案系統操作、網路通訊等方面仍有待完善。

透過與 C 語言的基準測試比較，Mufi 在特定情境下展現出與編譯型語言相近的效能表現，這對於追求開發效率的指令碼語言而言至關重要。然而，Mufi 的效能仍受限於其直譯器架構，在處理複雜運算或大量資料時，效能瓶頸仍需關注。從技術演進角度，Mufi 未來發展方向將聚焦於原生介面的擴充套件、效能最佳化以及更豐富的程式函式庫支援。玄貓認為，Mufi 作為一門新興的指令碼語言，展現了良好的發展潛力，尤其在輕量級應用、快速原型開發和嵌入式系統等領域，Mufi 將有機會佔據一席之地。技術團隊應著重於解決效能瓶頸和擴充原生介面功能，才能充分釋放 Mufi 的潛力，使其在競爭激烈的指令碼語言生態中脫穎而出。

玄貓

技術愛好者，專注於分享程式開發、雲端技術與 AI 應用的心得體會。

Mufi 指令碼引擎：內建函式與效能基準測試

建立指令碼

執行指令碼

Bytecode操作

內容解密：

圖表翻譯：

虛擬機器指令集解析

指令 0009: OP_CONSTANT 1 ‘1’

指令 0011: OP_RETURN

指令 0012: OP_JUMP 12 -> 16

指令 0015: OP_POP

指令 0016: OP_GET_GLOBAL 2 ‘csum’

指令 0018: OP_GET_GLOBAL 3 ‘fib’

指令 0020: OP_GET_LOCAL 100

指令 0022: OP_CONSTANT 4 ‘1’

指令 0024: OP_SUBTRACT

指令 0025: OP_CALL

指令 0029: OP_GET_GLOBAL 5 ‘fib’

指令 0031: OP_GET_LOCAL 100

指令 0033: OP_SUBTRACT

指令 0034: OP_CALL

指令 0036: OP_CALL

指令 0038: OP_RETURN

內容解密：

圖表翻譯：

新增更多功能以增強程式能力

新增新函式到 compiler/mufi_std_c.h

實作新函式

ccmd() 的實作

cexit() 的實作

cerr_print() 的實作

測試新函式

時間函式與原生介面實作

執行系統命令

離開程式

輸出到標準錯誤流

取得當前時間

時間函式的應用

基準測試函式的實作

時間函式

基準測試函式

初始化基準測試結構

基準測試函式

執行基準測試

基準測試函式介面

圖表翻譯：

混合語言效能比較

Mufi 實作

C 實作

執行結果

分析

圖表翻譯：

玄貓風格技術文章結論：Mufi 指令碼語言效能評估與展望

玄貓

新增新函式到 `compiler/mufi_std_c.h`

`ccmd()` 的實作

`cexit()` 的實作

`cerr_print()` 的實作