いんちょき通信: プログラム

2012/03/25

Cocoa Applicationを作ってみる - その1

Xcodeを4.3.2にアップデートしたので、Mac OS XのGUIアプリケーションを作成してみた。以前に買ったまま積まれていたObjective-Cの本達を引っ張り出してきて見ながら挑戦しようと思ったが、Xcode 4になってから、ユーザーインターフェースが大きく変わっており、いまいち対応関係がわからない。仕方がないので、Apple Dev CenterにあったYour First Mac Appを参照しながら試行錯誤してみた。ちなみにObjective-Cはほぼ初見状態だったので、少し無謀だったかもしれない。

プロジェクトの作成

Xcodeを起動したのち、[File]-[New]-[Project]を選択すると新規プロジェクト作成のウィザード(Macはウィザードと言わない？)が表示されるので、適当に「CocoaPractice」とプロジェクト名を付けて、後はデフォルト値から変更せずにプロジェクトを生成した。詳しく見ていないが、このときにGitリポジトリを自動で生成できるようだ(デフォルトで生成されるっぽい)。

プロジェクトが生成されると、すでにゴチャゴチャとファイルが含まれている。試しに[Run]ボタンを押してみたところ、空のウインドウが表示された。

メニューも[File]や[Edit]など一般的なものはすでに用意されているようだ。

デフォルト言語が英語になっていて、システムのデフォルト言語を使ってはくれないようだ。Xcodeのインターフェースが英語なのでそりゃそうかという気もする。

ユーザーインターフェースを作る

プロジェクトを作って、デフォルトの空っぽウインドウを表示させて、Cocoaアプリケーションを作ったと言うのもどうかと思うので、ウインドウにGUIコントロールを配置していく。

Navigation Areaから[CocoaPractice]-[MainMenu.xib]を選択すると、Editor AreaにInterface Builderが表示される。

ここに右下のLibrary PaneからWindow上にDrag&DropでGUIコントロールを配置していけばいいらしい。とりあえず、[Label]と[Push Button]、[TextField]を配置した。この段階でビルドすると、もうすでにユーザーインターフェースが配置された状態でアプリケーションが起動する。

当然のことながら、ボタンを押しても何も起こらない。

画像が多くて記事が長くなってきたので、続きは次回と言うことにする。

投稿情報: 07:29 カテゴリー: Apple, Cocoa, Objective-C, プログラム | 個別ページ | コメント (1) | トラックバック (0)

2012/03/20

OpenCLをクラスでラップしてみた

「OpenCLのC++ Bindingsを使ってみる - その1」、「OpenCLのC++ Bindingsを使ってみる - その2」、「OpenCLのC++ Bindingsを使ってみる - その3」、「OpenCLのC++ Bindingsを使ってみる - その4」、「OpenCLのC++ Bindingsを使ってみる - その5」とOpenCL C++ Bindingsを使ってみたが、やはり計算を始めるまでの処理があれやこれやと長々と続くので、ある程度クラスでラップしてみた。このクラスがある前提で、「OpenCLのC++ Bindingsを使ってみる - その5」のコードを書き換えると、次のようになる。

#define __CL_ENABLE_EXCEPTIONS
 
#include "OpenCL.hpp"
#include <iostream>

const int nElements = 9000000;
float input1[nElements];
float input2[nElements];
float output[nElements];
int main(int argc, char* argv[])
{
    std::string addVector(
        "__kernel void\n\
        addVector(__global const float *input1,\n\
        __global const float *input2,\n\
        __global float *output)\n\
        {\n\
        int index = get_global_id(0);\n\
        output[index] = sin(input1[index]) * sin(input2[index]);\n\
        output[index] = cos(output[index]);\n\
        output[index] = pow(output[index], output[index]);\n\
        }\n");
    for(int i = 0; i < nElements; i++){
        input1[i] = (float)i * 10.0f;
        input2[i] = (float)i / 20.0f;
        output[i] = 0.0f;
    }

    try{
        DECS::OpenCL ocl;
        ocl.setSource(addVector);
        ocl.buildProgram();
        ocl.setKernel(std::string("addVector"));
        ocl.setKernelInputArgument(0, input1, nElements);
        ocl.setKernelInputArgument(1, input2, nElements);
        ocl.setKernelOutputArgument(2, nElements);
        ocl.enqueueNDRange(nElements);
        ocl.readBuffer(2, output, nElements);

        for(int i = 0; i < 20; i++){
            std::cout << "input1[" << i << "], input2[" << i << "], output[" << i << "] : ";
            std::cout << input1[i] << ", " << input2[i] << ", " << output[i] << std::endl;
        }

    }catch(cl::Error err){
         std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;

    }

    return 0;
}

こんな具合でかなり短くなった。そして、今回作ったOpenCL.hppとOpenCL.cppはこれ( DECS_OpenCLをダウンロード)。前回までのOpenCL部分をクラス内部に入れただけなので、まだまだいけてない部分が多い。特に次にあげる部分は何とかしないとあまり使えないと思う。

デバイス選択ができず先頭のデバイス固定なところ
コマンドキューが一つしか持てないところ
バイナリからプログラムが用意できないところ
カーネル引数がfloat型固定なところ
イベントを考慮していないところ
タスク分割型を考慮していないところ
Bufferまわりに柔軟性が全くないところ
OpenCLソースを外部ファイルから読み取れないところ

などなど、まだまだ足りない部分だらけなので、少しずつ足していこうかと思う。

このブログの開発用PCはこちら

投稿情報: 17:05 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (3) | トラックバック (0)

C++からPythonにちょっかいかけてみた

C言語アプリケーションに Pythonを組み込むが興味がわいたので、自分でもやってみた。

#include <iostream>
#include <cstdlib>
#include <Python.h>

using namespace std;

int main(int argc, char* argv[], char* envp[])
{
  Py_Initialize();
  PyRun_SimpleString("print 'Hello Python From C/C++!'");
  Py_Finalize();
  return EXIT_SUCCESS;
}

MinGWでビルドしようとしたが、python27.libが見つからないといわれる。ちょっと調べると*.libはMinGWではリンクできないよという情報も見つかるが、MSYSからだと大丈夫っぽいことも書いてある。

とりあえず、

$ g++ -o cpy -I/c/Python27/include -L/c/Python27/libs main.cpp -lpython27 --static

としてみると、ちゃんとビルドできたみたい。実行してみると、

$ ./cpy
Hello Python From C/C++!

と表示された。

ただ、最初の記事を読み進めると、Boost.Pythonを使うのがいいみたいなので、今度試してみよう。

このブログの開発用PCはこちら

投稿情報: 03:09 カテゴリー: C++, Python, プログラム | 個別ページ | コメント (0) | トラックバック (0)

OpenCLのC++ Bindingsを使ってみる - その5

「OpenCLのC++ Bindingsを使ってみる - その1」、「OpenCLのC++ Bindingsを使ってみる - その2」、「OpenCLのC++ Bindingsを使ってみる - その3」、「OpenCLのC++ Bindingsを使ってみる - その4」に引き続き、今回はOpenCLのC++ Bindingsを使って、コマンドキューの生成とキューにカーネルを入れ実際に計算することにする。これまでと同様に前回までのコードに追記していく。

 #define __CL_ENABLE_EXCEPTIONS
 
 #if defined(__APPLE__) || defined(__MACOSX)
    #include 
 #else
    #include 
 #endif
 #include 
const int nElements = 9000000;
float input1[nElements];
float input2[nElements];
float output[nElements];
int main(int argc, char* argv[])
{
    cl_int error = CL_SUCCESS;

    try{
        std::vector platforms;
        cl::Platform::get(&platforms);
        if(platforms.size() == 0){
            std::cout << "Any Platforms is NOT FOUNT." << std::endl;
            return 1;
        }

        cl_context_properties properties[] =
            {CL_CONTEXT_PLATFORM, (cl_context_properties)(platforms[0])(), 0};
        cl::Context context(CL_DEVICE_TYPE_GPU, properties);
        std::vector devices = context.getInfo();

        char* addVector = {
        "__kernel void\n\
        addVector(__global const float *input1,\n\
        __global const float *input2,\n\
        __global float *output)\n\
        {\n\
        int index = get_global_id(0);\n\
		output[index] = sin(input1[index]) * sin(input2[index]);\n\
		output[index] = cos(output[index]);\n\
		output[index] = pow(output[index], output[index]);\n\
        }\n"};

        cl::Program::Sources source(1,std::make_pair(addVector, strlen(addVector)));
        cl::Program program = cl::Program(context, source);
        program.build(devices);
        cl::Kernel kernel(program, "addVector", &error);

        for(int i = 0; i < nElements; i++){
            input1[i] = (float)i * 10.0f;
            input2[i] = (float)i / 20.0f;
            output[i] = 0.0f;
        }

        cl::Buffer memInput1 = cl::Buffer(context,
            CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
            sizeof(cl_float) * nElements,
            input1,
            &error);
        cl::Buffer memInput2 = cl::Buffer(context,
            CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
            sizeof(cl_float) * nElements,
            input2,
            &error);
        cl::Buffer memOutput = cl::Buffer(context,
            CL_MEM_WRITE_ONLY,
            sizeof(cl_float) * nElements,
            NULL,
            &error);

        kernel.setArg(0, memInput1);
        kernel.setArg(1, memInput2);
        kernel.setArg(2, memOutput);
        
        cl::CommandQueue queue(context, devices.at(0), 0, &error);
        queue.enqueueNDRangeKernel(kernel, cl::NullRange,
            cl::NDRange(nElements), cl::NullRange, NULL, NULL);

        queue.enqueueReadBuffer(memOutput, CL_TRUE, 0,
            sizeof(cl_float) * nElements, output, NULL, NULL);

        for(int i = 0; i < 20; i++){
            std::cout << "input1[" << i << "], input2[" << i << "], output[" << i << "] : ";
            std::cout << input1[i] << ", " << input2[i] << ", " << output[i] << std::endl;
        }
    }catch(cl::Error err){
         std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;
    }

    return 0;
}

まず、cl::CommandQueueクラスのインスタンスを生成する。この時の引数はコンテキストとデバイス、キューのプロパティ、エラーコードとなる。キューのプロパティはOpenCL 1.1 Specification [PDF]のTable 5.1に記載されている。queue.enqueueNDRangeKernelでは、生成したコマンドキューにカーネルを入れている。この時の引数はカーネル、オフセット、グローバルデータの次元、ローカルデータの次元、イベントリスト、イベント出力用変数となる。ここで、カーネルが実行される。

次に結果を取得する。queue.enqueueReadBufferで出力用変数outputに結果を読み込む。最後に読み込んだ変数の一部を表示している。

結果このようになる

input1[0], input2[0], output[0] : 0, 0, 1
input1[1], input2[1], output[1] : 10, 0.05, 0.999631
input1[2], input2[2], output[2] : 20, 0.1, 0.995867
input1[3], input2[3], output[3] : 30, 0.15, 0.989237
input1[4], input2[4], output[4] : 40, 0.2, 0.989182
input1[5], input2[5], output[5] : 50, 0.25, 0.997898
input1[6], input2[6], output[6] : 60, 0.3, 0.995962
input1[7], input2[7], output[7] : 70, 0.35, 0.966201
input1[8], input2[8], output[8] : 80, 0.4, 0.93131
input1[9], input2[9], output[9] : 90, 0.45, 0.930719
input1[10], input2[10], output[10] : 100, 0.5, 0.971525
input1[11], input2[11], output[11] : 110, 0.55, 0.999733
input1[12], input2[12], output[12] : 120, 0.6, 0.949504
input1[13], input2[13], output[13] : 130, 0.65, 0.867867
input1[14], input2[14], output[14] : 140, 0.7, 0.841198
input1[15], input2[15], output[15] : 150, 0.75, 0.896425
input1[16], input2[16], output[16] : 160, 0.8, 0.987789
input1[17], input2[17], output[17] : 170, 0.85, 0.967397
input1[18], input2[18], output[18] : 180, 0.9, 0.842729
input1[19], input2[19], output[19] : 190, 0.95, 0.7733

これで、OpenCL C++ Bindingsを使用した一連の計算をすることができた。

このブログの開発用PCはこちら

投稿情報: 01:34 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

2012/03/18

OpenCLのC++ Bindingsを使ってみる - その4

「OpenCLのC++ Bindingsを使ってみる - その1」、「OpenCLのC++ Bindingsを使ってみる - その2」、「OpenCLのC++ Bindingsを使ってみる - その3」に引き続き、今回はOpenCLのC++ Bindingsを使って、メモリオブジェクトの生成とメモリオブジェクトをカーネルにセットすることにする。これまでと同様に前回までのコードに追記していく。

 #define __CL_ENABLE_EXCEPTIONS
 
 #if defined(__APPLE__) || defined(__MACOSX)
    #include <OpenCL/cl.hpp>
 #else
    #include <CL/cl.hpp>
 #endif
 #include <iostream>

const int nElements = 9000000;
float input1[nElements];
float input2[nElements];
float output[nElements];

int main(int argc, char* argv[])
{
    cl_int error = CL_SUCCESS;

    try{
        std::vector platforms;
        cl::Platform::get(&platforms);
        if(platforms.size() == 0){
            std::cout << "Any Platforms is NOT FOUNT." << std::endl;
            return 1;
        }

        cl_context_properties properties[] =
            {CL_CONTEXT_PLATFORM, (cl_context_properties)(platforms[0])(), 0};
        cl::Context context(CL_DEVICE_TYPE_GPU, properties);
        std::vector devices = context.getInfo();

        char* addVector = {
        "__kernel void\n\
        addVector(__global const float *input1,\n\
        __global const float *input2,\n\
        __global float *output)\n\
        {\n\
        int index = get_global_id(0);\n\
		output[index] = sin(input1[index]) * sin(input2[index]);\n\
		output[index] = cos(output[index]);\n\
		output[index] = pow(output[index], output[index]);\n\
        }\n"};

        cl::Program::Sources source(1,std::make_pair(addVector, strlen(addVector)));
        cl::Program program = cl::Program(context, source);
        program.build(devices);
        cl::Kernel kernel(program, "addVector", &error);

        
        for(int i = 0; i< nElements; i++){
            input1[i] = (float)i * 10.0f;
            input2[i] = (float)i / 20.0f;
            output[i] = 0.0f;
        }

        cl::Buffer memInput1 = cl::Buffer(context,
            CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
            sizeof(cl_float) * nElements,
            input1,
            &error);
        cl::Buffer memInput2 = cl::Buffer(context,
            CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
            sizeof(cl_float) * nElements,
            input2,
            &error);
        cl::Buffer memOutput = cl::Buffer(context,
            CL_MEM_WRITE_ONLY,
            sizeof(cl_float) * nElements,
            NULL,
            &error);

        kernel.setArg(0, memInput1);
        kernel.setArg(1, memInput2);
        kernel.setArg(2, memOutput);

    }catch(cl::Error err){
         std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;
    }

    return 0;
}

太字に下部分が今回追加したコードになる。

まず、addVectorに渡す引数であるinput1, input2, outputを用意する。このあたりの初期値は「OpenCLで実際に計算してみる」で使用したものを流用した。

次に、用意した配列からメモリオブジェクトを生成する。

cl::Buffer memInput1 = cl::Buffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_float) * nElements, input1, &error);

上記はinput1のメモリオブジェクトを生成している。コンテキストとメモリオブジェクトのフラグ、配列のサイズと配列のポインタ、エラーコード用変数からcl::Bufferのインスタンスを生成する。メモリオブジェクトのフラグはOpenCL 1.1 Specification [PDF]のTable 5.3に一覧が記載されている。この辺の引数はC++ Bindingsを使用しない場合と特に変わらない。

続いて、生成したメモリオブジェクトをカーネル引数にセットする。

kernel.setArg(0, memInput1);

セットする引数のインデックスと、メモリオブジェクトを指定する。たとえばinput1はaddVectorの第一引数なので、0をインデックスとする。

次回はコマンドキューの生成と、カーネルをキューに入れ実行してみようと思う。

3/19 : 2カ所修正

入力データをグローバルに移動 (Stack Overflowの可能性があるため)→安易
output用のメモリオブジェクトのフラグをCL_MEM_WRITE_ONLYに変更、CL_MEM_READ_ONLYだと結果を書き込めない。

このブログの開発用PCはこちら

投稿情報: 04:59 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

OpenCLのC++ Bindingsを使ってみる - その3

「OpenCLのC++ Bindingsを使ってみる - その1」、「OpenCLのC++ Bindingsを使ってみる - その2」に引き続き、今回はOpenCLのC++ Bindingsを使って、ソースからプログラムの作成とカーネルの生成を行う。これまでと同様に前回までのコードに追記していく。

 #define __CL_ENABLE_EXCEPTIONS
 
 #if defined(__APPLE__) || defined(__MACOSX)
    #include <OpenCL/cl.hpp>
 #else
    #include <CL/cl.hpp>
 #endif
 #include <iostream>

int main(int argc, char* argv[])
{
    cl_int error = CL_SUCCESS;

    try{
        std::vector platforms;
        cl::Platform::get(&platforms);
        if(platforms.size() == 0){
            std::cout << "Any Platforms is NOT FOUNT." << std::endl;
            return 1;
        }

        cl_context_properties properties[] =
            {CL_CONTEXT_PLATFORM, (cl_context_properties)(platforms[0])(), 0};
        cl::Context context(CL_DEVICE_TYPE_GPU, properties);
        std::vector devices = context.getInfo();
        char* addVector = {
        "__kernel void\n\
        addVector(__global const float *input1,\n\
        __global const float *input2,\n\
        __global float *output)\n\
        {\n\
        int index = get_global_id(0);\n\
		output[index] = sin(input1[index]) * sin(input2[index]);\n\
		output[index] = cos(output[index]);\n\
		output[index] = pow(output[index], output[index]);\n\
        }\n"};
        cl::Program::Sources source(1,std::make_pair(addVector, strlen(addVector)));
        cl::Program program = cl::Program(context, source);
        program.build(devices);
        cl::Kernel kernel(program, "addVector", &error);

    }catch(cl::Error err){
         std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;
    }

    return 0;
}

太字に下部分が今回追加したコードになる。

まず、プログラムにするソースである文字列addVectorを用意する。これは、「OpenCLで実際に計算してみる」で使用したものを流用した。この文字列addVectorからcl::Program::Source型のsourceを用意する。このcl::Program::SourceはC++ Bindings Specification [PDF] によると、

typedef VECTOR_CLASS<std::pair<const char*, ::size_t> > Sources

と定義されているようで、実態はソース文字列とサイズのペアのstd::vectorのようだ。つまり、要素数1、addVectorとaddVectorのサイズのペアのstd::vectorということになる。

次にこのソースからプログラムをビルドする必要がある。まずはコンテキストとソースからプログラムのインスタンスを生成する。

cl::Program program = cl::Program(context, source);

の部分がこれにあたる。続いて、

program.build(devices);

とし使用するデバイス向けにビルドする。

これで、カーネルを生成する準備が整ったので、

cl::Kernel kernel(program, "addVector", &error);

プログラムと名前とエラーコード保存用の変数からカーネルを生成している。メイン関数先頭でcl_int errorを用意しているのはここで使用するためである。

次回はメモリオブジェクトを用意しようと思う。

このブログの開発用PCはこちら

投稿情報: 04:26 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

2012/03/16

OpenCLのC++ Bindingsを使ってみる - その2

「OpenCLのC++ Bindingsを使ってみる - その1」ではOpenCLプラットフォームの取得を行ったが、今回はコンテキストの生成とデバイスの取得を行う。今回は「OpenCLのC++ Bindingsを使ってみる - その1」のコードを修正していくことにする。次に前回のコードと今回修正した部分を太字にしたものを示す。

 #define __CL_ENABLE_EXCEPTIONS
 
 #if defined(__APPLE__) || defined(__MACOSX)
    #include <OpenCL/cl.hpp>
 #else
    #include <CL/cl.hpp>
 #endif
 #include <iostream>

int main(int argc, char* argv[])
{
    std::string param;
    try{
        std::vector platforms;
        cl::Platform::get(&platforms);
        if(platforms.size() == 0){
            std::cout << "Any Platforms is NOT FOUNT." << std::endl;
            return 1;
        }

        cl_context_properties properties[] =
            {CL_CONTEXT_PLATFORM, (cl_context_properties)(platforms[0])(), 0};
        cl::Context context(CL_DEVICE_TYPE_GPU, properties);
        std::vector devices = context.getInfo();
        std::cout << "Device Name : " << devices.at(0).getInfo() << std::endl;
        std::string param;
        devices.at(0).getInfo(CL_DEVICE_VENDOR, &param);
        std::cout << "Device Vendor : " << param << std::endl;

    }catch(cl::Error err){
         std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;
    }

    return 0;
}

コンテキストプロパティ(properties)はCの時と変わらず、一つ目のプラットフォームを使用して作成している。このコンテキストプロパティとデバイスタイプ(CL_DEVICE_TYPE_GPU)を引数にしてcl::Contextクラスのインスタンスを生成する。デバイスタイプについては、Cの場合と共通でOpenCL 1.1 Specification [PDF]のTable 4.2に記載があるものを使用できる。

CL_DEVICE_TYPE_CPU 見たまんまCPU
CL_DEVICE_TYPE_GPU 見たまんまGPU
CL_DEVICE_TYPE_ACCELERATOR PCIeで接続された専用機器とからしい
CL_DEVICE_TYPE_DEFAULT システムのデフォルトになっているもの
CL_DEVICE_TYPE_ALL すべてのタイプ

次に生成したコンテキストからcl::Contextクラスのメンバ関数getInfoを使用してデバイスを取得する。このときデバイスはvectorクラスに格納される。getInfoは2種類あるらしく、context.getInfo(CL_CONTEXT_DEVICES, devices)としてもいいようだ。ちなみにcl::Context::getInfoの第一引数に指定できるのは、CL_CONTEXT_DEVICES, CL_CONTEXT_PROPERTIESの2つであり、どちらもvectorクラスに格納される。

最後に、実際に取得したデバイスの情報をcl::Device::getInfoを使用してデバイス名とベンダー名を取得している。こちらもcl::Context::getInfoと同様に2種類存在する。デバイスの方で指定できる項目とそれぞれの型はC++ Bindings Specification [PDF] のTable 1に記載がある。

コンテキストとデバイスについてはここまでで、次はプログラムのビルドから。

このブログの開発用PCはこちら

投稿情報: 02:34 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

OpenCLのC++ Bindingsを使ってみる - その1

前回にOpenCLを使用してGPUを使用した並列計算を試してみたが、デバイスの取得やGPU側でのコードの準備、データの準備や転送など、実際の計算よりも前に行う処理が煩雑だった。また、この事前処理が毎回あまり変わらない処理を書く必要があった。そこで、C++クラスとしてラップし定型処理部分を隠蔽して、煩雑な部分をさよならしようと思ったわけだ。

その前にもう一度OpenCLの規格を決めているKhronos Groupを覗いてみると、あるじゃないかC++の公式Bindingsが、もうすでに。C++ Bindings Specification [PDF] OpenCL 1.1 C++ Bindings Header File(cl.hpp)

すでにあるなら、使った方がよいと言うことで、このC++ Bindingsを試してみることにした。計算を行うまでの処理の流れは前回記載しものと同じようになるので、順番に見ていこうと思う。

まずはプラットフォームを取得することから始める。

 #define __CL_ENABLE_EXCEPTIONS
 
 #if defined(__APPLE__) || defined(__MACOSX)
    #include <OpenCL/cl.hpp>
 #else
    #include <CL/cl.hpp>
 #endif
 #include <iostream>

int main(int argc, char* argv[])
{
    try{
        std::vector platforms;
        cl::Platform::get(&platforms);
        if(platforms.size() == 0){
            std::cout << "Any Platforms is NOT FOUNT." << std::endl;
            return 1;
        }
        std::cout << platforms.size() << std::endl;
        std::string param;
        platforms.at(0).getInfo(CL_PLATFORM_PROFILE, &param);
        std::cout << param << std::endl;
     }catch(cl::Error err){
          std::cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << std::endl;
     }
      return 0;
 }

まず先頭の「#define __CL_ENABLE_EXCEPTIONS」はC++例外を使用する場合に定義する必要がある。この定義があると、各OpenCLクラス内でエラーがあった場合、「cl::Error」クラスがthrowされる。

次にヘッダーファイルが"opencl.h"から"cl.hpp"に変わる。このヘッダー内で必要なOpenCLのヘッダーファイルを読み込んでいるので、他は特に必要ない。

ここまでで、とりあえずOpenCL C++ Bindingsを使用する準備は整った。

メイン関数の中身を見ていくことにする。OpenCLの例外を有効にしているので、処理部分は「try」で囲み、最後に例外クラスcl::Errorを捕捉している。

プラットフォームの取得はcl::Platformクラスのスタティックメンバ関数getを使用するが、取得したプラットフォームはvectorに格納される。このC++ Bindingsでは配列や文字列を基本的にvectorクラスやstringクラスを使用するようにしているようだ。

取得したプラットフォームの情報を確認する場合はメンバ関数のgetInfoが使用できる。第一引数は列挙型cl_platform_info、第二引数は取得した情報を格納する文字列クラスになる。列挙型cl_platform_infoの一覧はOpenCL 1.1 Specification [PDF]のTable 4.1に記載されている。C++ Bindings Specification [PDF] はOpenCL 1.1 Specification [PDF]の別紙扱いなのか、参照している部分が多い。

ひとまず、プラットフォームについてはここまでで、つぎはコンテキストの取得をしようと思う。

このブログの開発用PCはこちら

投稿情報: 01:13 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

2012/03/12

OpenCLで実際に計算してみる

以前にOpenCLについて少しだけ触れたが、その時はOpenCL環境を確認したのみだった。今回はOpenCLを使って実際に簡単な計算をしてみようと思う。

OpenCLで実際に計算を行うまでの流れは次のようになる。

プラットフォーム情報を取得
コンテキストを生成
コンテキスト内のデバイスを取得
使用するデバイスにコマンドキューを生成
プログラムオブジェクトの生成
プログラムのビルド
カーネルの生成
メモリオブジェクトの生成
カーネルをコマンドキューに入れる
結果の取得
リソースの解放

今回のコードはOpenCL入門―GPU&マルチコアCPU並列プログラミング for MacOS Windows LinuxのChapter 3を参考に、エラー処理を省き、実行タスクを処理が重いものに変更し、実行時間計測を入れている。実行時間の計測はBoost.Chronoを使用した。

ソースは次のようになる。

#include <iostream>
#include <cmath>
#include <boost/chrono.hpp>
#include <boost/chrono/duration.hpp>

using namespace boost;

#ifdef __APPLE__
#include 
#else
#include 
#endif //__APPLE__

const int nElements = 9000000;
const int maxDevices  = 10;

float input1[nElements];
float input2[nElements];
float output[nElements];

void addVector(float* input1, float* input2, float* output){
	for(int i = 0; i < nElements; i++){
		output[i] = sin(input1[i]) * sin(input2[i]);
		output[i] = cos(output[i]);
		output[i] = pow(output[i], output[i]);
	}
}

int main(int argc, char* argv[])
{
    cl_int status;

    cl_platform_id platforms[10];
    cl_uint num_platforms;
    status = clGetPlatformIDs(sizeof(platforms) / sizeof(platforms[0]),
		platforms,
		&num_platforms); // 1. プラットフォーム情報を取得

    cl_context_properties properties[]
        = {CL_CONTEXT_PLATFORM, (cl_context_properties)platforms[0], 0};

    cl_context context = clCreateContextFromType(properties,
        CL_DEVICE_TYPE_GPU,
        NULL,
        NULL,
        &status); // 2. コンテキストを生成

    cl_device_id devices[maxDevices];
    size_t size_return;
    status = clGetContextInfo(context,
		CL_CONTEXT_DEVICES,
		sizeof(devices),
		devices,
		&size_return); // 3. コンテキスト内のデバイスを取得

    cl_command_queue queue = clCreateCommandQueue(context,
        devices[0],
        0,
        &status); // 4. 使用するデバイスにコマンドキューを生成

    const char *sources[] = {
        "__kernel void\n\
        addVector(__global const float *input1,\n\
        __global const float *input2,\n\
        __global float *output)\n\
        {\n\
        int index = get_global_id(0);\n\
		output[index] = sin(input1[index]) * sin(input2[index]);\n\
		output[index] = cos(output[index]);\n\
		output[index] = pow(output[index], output[index]);\n\
    }\n"}; // カーネルのソースファイル

    cl_program program = clCreateProgramWithSource(context,
        1,
        (const char**)&sources,
        NULL,
        &status); // 5. プログラムオブジェクトの生成

    status = clBuildProgram(program, 1, devices, NULL, NULL, NULL);
    clUnloadCompiler(); // 6. プログラムのビルド

    cl_kernel kernel = clCreateKernel(program, "addVector", &status); // 7. カーネルの生成

    for (int i = 0; i < nElements; i++) {
        input1[i] = (float)i * 10.0f;
        input2[i] = (float)i / 20.0f;
        output[i] = 0.0f;
    }

    cl_mem memInput1 = clCreateBuffer(context,
		CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
		sizeof(cl_float) * nElements,
		input1,
		&status); // 8. メモリオブジェクトの生成

    cl_mem memInput2 = clCreateBuffer(context,
        CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
        sizeof(cl_float) * nElements,
        input2,
        &status);　// 8. メモリオブジェクトの生成

    cl_mem memOutput = clCreateBuffer(context,
        CL_MEM_WRITE_ONLY,
        sizeof(cl_float) * nElements,
        NULL,
        &status);　// 8. メモリオブジェクトの生成

    status = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&memInput1); // カーネル引数にセット
    status = clSetKernelArg(kernel, 1, sizeof(cl_mem), (void *)&memInput2); // カーネル引数にセット
    status = clSetKernelArg(kernel, 2, sizeof(cl_mem), (void *)&memOutput); // カーネル引数にセット

	 boost::chrono::steady_clock::time_point start =
		 boost::chrono::steady_clock::now(); // 時間計測開始

    size_t globalSize[] = {nElements};
    status = clEnqueueNDRangeKernel(queue,
        kernel,
        1,
        NULL,
        globalSize,
        0, 0, NULL, NULL); // 9. カーネルをコマンドキューに入れる

    status = clEnqueueReadBuffer(queue,
        memOutput,
        CL_TRUE,
        0,
        sizeof(cl_float) * nElements,
        output, 0, NULL, NULL); // 10. 結果の取得

	boost::chrono::duration sec =
		boost::chrono::steady_clock::now() - start; // 時間計測終了

    std::cout << "input1, input2, output" << std::endl;
    for (int i = 0; i < 100; i++) {
        std::cout << input1[i] << ", " << input2[i] << ", " << output[i] << std::endl;
    }
	
    std::cout << "OpenCL addVector " << sec.count() << " seconds\n";
	
    clReleaseMemObject(memOutput); // 11. リソース解放
    clReleaseMemObject(memInput2); // 11. リソース解放
    clReleaseMemObject(memInput1); // 11. リソース解放
    clReleaseKernel(kernel); // 11. リソース解放
    clReleaseProgram(program); // 11. リソース解放
    clReleaseCommandQueue(queue); // 11. リソース解放
    clReleaseContext(context); // 11. リソース解放

	boost::chrono::steady_clock::time_point start2 =
		boost::chrono::steady_clock::now(); //　時間計測開始

	addVector(input1, input2, output); // 通常の関数

	boost::chrono::duration sec2 =
		boost::chrono::steady_clock::now() - start2; // 時間計測終了

	std::cout << "Normal addVector " << sec2.count() << " seconds\n";
    return 0;
}

これをビルドし実行したところ次のような結果となった。

OpenCL addVector 0.126067 seconds
Normal addVector 1.13217 seconds

ちなみに実行環境は次のようになっている。

CPU : Core i7-2670QM (2.20GHz 4Core/8Thread VT:enable)
GPU : AMD RADEON 6770M
MEM : 8GB
HDD : 160GB SSD (Intel 320)
OS : Windows 7 Ultimate (x64)

このブログの開発用PCはこちら

投稿情報: 02:39 カテゴリー: C++, OpenCL, プログラム | 個別ページ | コメント (0) | トラックバック (0)

2012/03/08

サブウインドウからOpenGLアニメーションを制御する - wxWidgets

これまで何回かwxWidgetsをつかったり、OpenGLのアニメーションを作ったりしてきたが、今回はこれらをまとめ、サブウインドウからOpenGLを制御してみようと思う。

今までの関連記事は以下の通り

完成イメージは次のようになる。

コントロール側のウインドウから再生・停止と再生速度を制御できるようにする。基本的に過去に書いてきたことの組み合わせで実現できる。これまで作ってきたGLPanelやControlPanelに制御用の変数を追加し、これらのクラスとMainWindowにコントローラのwidgetからのイベントを処理するイベントハンドラを追加している。

glpanel.hpp

#ifndef __GLPANEL_HPP__
#define __GLPANEL_HPP__

#include <wx/wx.h>
#include <wx/glcanvas/h>
#include "opengl.hpp"

class GLPanel : public wxGLCanvas
{
private:
	bool isInitialized_;
	bool isPlayable_;

	int frameRate_;
	wxTimer* timer_;

	OpenGL gl_;
public:
	GLPanel(wxWindow* parent, wxGLContext* sharedContext,
            wxWindowID id, int frameRate);
	~GLPanel();

	void setPlayable(bool isPlayable);
       void setFrameRate(int frameRate);
       void restartTimer();

	void OnPaint(wxPaintEvent &event);
	void OnSize(wxSizeEvent &event);
	void OnEraseBackground(wxEraseEvent& event);
	void OnTimer(wxTimerEvent& event);
};
#endif //__GLPANEL_HPP__

glpanel.cpp

#include "glpanel.hpp"

GLPanel::GLPanel(wxWindow* parent, wxGLContext* sharedContext, wxWindowID id, int frameRate)
	: wxGLCanvas(parent, sharedContext, id), isInitialized_(false), frameRate_(frameRate)
{
	this->Connect(wxEVT_SIZE, wxSizeEventHandler(GLPanel::OnSize));
	this->Connect(wxEVT_PAINT, wxPaintEventHandler(GLPanel::OnPaint));
	this->Connect(wxEVT_ERASE_BACKGROUND, wxEraseEventHandler(GLPanel::OnEraseBackground));

	this->timer_ = new wxTimer(this);
	this->Connect(wxEVT_TIMER, wxTimerEventHandler(GLPanel::OnTimer));
	this->timer_->Start(frameRate);
}

GLPanel::~GLPanel()
{
	this->timer_->Stop();
}

void GLPanel::setPlayable(bool isPlayable)
{
	this->isPlayable_ = isPlayable;
}

void GLPanel::setFrameRate(int frameRate)
{
	this->frameRate_ = frameRate;
}

void GLPanel::restartTimer()
{
	this->timer_->Stop();
	this->timer_->Start(this->frameRate_);
}

void GLPanel::OnPaint(wxPaintEvent &event)
{
	wxPaintDC dc(this);

	if(!GetContext()){
		return;
	}

	if(!isInitialized_){
		SetCurrent();
		gl_.init();
		int w;
		int h;
		GetClientSize(&w, &h);
		gl_.setViewport(w, h);
		isInitialized_=true;
	}

	gl_.draw();
	glFlush();
	SwapBuffers();
}

void GLPanel::OnSize(wxSizeEvent &event)
{
	wxGLCanvas::OnSize(event);

	if(GetContext())
	{
		SetCurrent();
		gl_.setViewport(event.GetSize().GetWidth(), event.GetSize().GetHeight());
		Refresh();
	}
}

void GLPanel::OnEraseBackground(wxEraseEvent& event)
{
	// Do nothing, to avoid flashing.
}

void GLPanel::OnTimer(wxTimerEvent& WXUNUSED(event)){
	if(this->isPlayable_){
		if(GetContext()){
			this->SetCurrent();
			this->Refresh();
		}
	}
}

たとえばGLPanelクラスではisPlayable_変数を追加し、OnTimerで再描画行う際のフラグとしている。また、各変数へアクセスするメンバ関数も用意した。

一方でControlPanelクラスでもイベントハンドラを用意しwidgetからのイベントを処理して、上位widgetに伝播させている。

ControlPanel::OnPlay, ControlPanle::OnSlide

void ControlPanel::OnPlay(wxCommandEvent & event)
{
	if(this->isPlay_){
		event.SetString(wxT("STOP"));
		this->statusText_->SetLabel(wxT("Status : STOP"));
		this->button_->SetLabel(wxT("PLAY"));
		this->isPlay_ = false;
	}else{
		event.SetString(wxT("PLAY"));
		this->statusText_->SetLabel(wxT("Status : PLAY"));
		this->button_->SetLabel(wxT("STOP"));
		this->isPlay_ = true;
	}
	event.SetInt(this->isPlay_);
	event.Skip();
}

void ControlPanel::OnSlide(wxCommandEvent & event)
{
	int fps = this->slider_->GetValue();
	this->frameRate_ = 1000 / fps;
	this->sliderText_->SetLabel(wxString::Format(wxT("fps : %d (frame/sec)"), fps));
	event.SetInt(this->frameRate_);
	event.Skip();
}

また、MainWindowクラスでも、それぞれのイベントを扱うイベントハンドラを作成した。

MainWindow::OnPlay, MainWindow::OnSlide

void MainWindow::OnPlay(wxCommandEvent& event)
{
	this->statusbar_->SetStatusText(event.GetString());
	this->glpanel_->setPlayable(event.GetInt());
}

void MainWindow::OnSlide(wxCommandEvent& event)
{
	int frameRate = event.GetInt();
	this->glpanel_->setFrameRate(frameRate);
	this->glpanel_->restartTimer();
}

それぞれGLPanelクラスのフレームレートやフラグなど制御用変数を変更している。

全体のソースはこちら→ WxGLAnimationをダウンロード

何を動かしてアニメーションとするかについてはOpenGL内で解決できそうに思うので、wxWidgets+OpenGLという点では、大方のことができるのではないだろうか。

このブログの開発用PCはこちら

投稿情報: 21:11 カテゴリー: C++, OpenGL, Windows, wxWidgets, プログラム | 個別ページ | コメント (0) | トラックバック (0)

いんちょき通信

INCHOKI Journal 自分的備忘録

2012/03/25

Cocoa Applicationを作ってみる - その1

プロジェクトの作成

ユーザーインターフェースを作る

2012/03/20

OpenCLをクラスでラップしてみた

C++からPythonにちょっかいかけてみた

OpenCLのC++ Bindingsを使ってみる - その5

2012/03/18

OpenCLのC++ Bindingsを使ってみる - その4

OpenCLのC++ Bindingsを使ってみる - その3

2012/03/16

OpenCLのC++ Bindingsを使ってみる - その2

OpenCLのC++ Bindingsを使ってみる - その1

2012/03/12

OpenCLで実際に計算してみる

2012/03/08

サブウインドウからOpenGLアニメーションを制御する - wxWidgets

検索

目次

最近の記事

カテゴリー

他のサービス