پستگرس چگونه کار می‌کند؟ جلسه یک – زندگی یک کوئری

۰ 593 زمان تقریبی مطالعه 11 دقیقه

متن زیر توسط هادی مشیدی در وبلاگ شخصی خودش منتشر شده است و سایت مهندسی داده ضمن تشکر از کار ارزشمندی که توسط ایشان انجام شده است، با هدف گسترش مطالب مفید در حوزه‌های مرتبط با پردازش داده به بازنشر آن، اقدام کرده است. امید که برای علاقه‌مندان مفید باشد.

در این نوشته خلاصه‌‌ای از ویدئویی که چند روز پیش با عنوان «درونیجات پستگرس – زندگی یک کوئری» ضبط کردم را ارائه می‌دهم.

می‌خواهیم به این سوال بپردازیم که وقتی یک کوئری مثل SELECT * FROM t در پستگرس اجرا می‌کنیم، چه اتفاقهایی در پشت صحنه می‌افتد.

لینک ویدئو: youtu.be/Z09rG7cLzF8 (لینک دیدئو )

پیش‌نیازها

اگر می‌خواهید گام‌هایی که در این مقاله ذکر شده‌اند را اجرا کنید، نیاز دارید پستگرس را کامپایل و نصب کنید، که گام‌های لازم برای این امر را در این مقاله آورده‌ام.

همچنین نیاز به نصب tcpflow دارید که در اوبونتو با دستور sudo apt install tcpflow می‌توانید نصب کنید.

وصل شدن کلاینت به پستگرس

برای ایجاد کلاستر پستگرس و اجرای آن دستورات زیر را وارد کنید:

initdb -D data
pg_ctl -D data -l logfile

پس از اینکه پستگرس ایجاد شد، یک پردازه اصلی و چند پردازه فرعی ایجاد می‌کند. پس از اجرای دستورات بالا، می‌توانیم از دستور ps برای دیدن پردازه‌هایی که پستگرس ایجاد کرده استفاده کنیم:

$ ps ef --forest -C postgres
  PID TTY      STAT   TIME COMMAND
۲۴۶۹۵ ?        Ss     0:00 /home/hadi/pg/12/bin/postgres -D data
۲۴۶۹۷ ?        Ss     0:00  \_ postgres: checkpointer
۲۴۶۹۸ ?        Ss     0:00  \_ postgres: background writer
۲۴۶۹۹ ?        Ss     0:00  \_ postgres: walwriter
۲۴۷۰۰ ?        Ss     0:00  \_ postgres: autovacuum launcher
۲۴۷۰۱ ?        Ss     0:00  \_ postgres: stats collector
۲۴۷۰۲ ?        Ss     0:00  \_ postgres: logical replication launcher

در نتیجه بالا پردازه شماره ۲۴۶۹۵ پردازه اصلی است و بقیه یک سری پردازه مربوط به کارهای داخلی پستگرس.

پستگرس برای هر کلاینت یک پردازه جدا ایجاد می‌کند

اکنون دو پنجره باز کنید و در هر کدام از آنها با برنامه psql به پستگرس متصل شوید:

# window 1
$ psql -d postgres -h localhost

# window 2
$ psql -d postgres -h localhost

در پنجره‌ای دیگر دستور ps را برای یافتن پردازه‌های پستگرس و psql اجرا کنید:

$ ps ef --forest -C psql
  PID TTY      STAT   TIME COMMAND
۲۴۸۱۷ pts/7    S+     0:00 psql -d postgres -h localhost
۲۴۷۶۷ pts/6    S+     0:00 psql -d postgres -h localhost

$ ps ef --forest -C postgres
  PID TTY      STAT   TIME COMMAND
۲۴۶۹۵ ?        Ss     0:00 /home/hadi/pg/12/bin/postgres -D data
۲۴۶۹۷ ?        Ss     0:00  \_ postgres: checkpointer
۲۴۶۹۸ ?        Ss     0:00  \_ postgres: background writer
۲۴۶۹۹ ?        Ss     0:00  \_ postgres: walwriter
۲۴۷۰۰ ?        Ss     0:00  \_ postgres: autovacuum launcher
۲۴۷۰۱ ?        Ss     0:00  \_ postgres: stats collector
۲۴۷۰۲ ?        Ss     0:00  \_ postgres: logical replication launcher
۲۴۷۶۸ ?        Ss     0:00  \_ postgres: hadi postgres 127.0.0.1(55904) idle 4) idle
۲۴۸۱۸ ?        Ss     0:00  \_ postgres: hadi postgres 127.0.0.1(55906) idle 6) idle

همانطور که مشاهده می‌کنید پستگرس دو پردازه به شماره ۲۴۷۶۸ و ۲۴۸۱۸ ایجاد کرده که هر کدام از آن‌ها به پردازه‌های psql به شماره‌های ۲۴۸۱۷ و ۲۴۷۶۷ متصل شده‌اند.

حتی اگر به جای psql برنامه شما بود که به پستگرس وصل می‌شد، باز شما به ازای هر ارتباط یک پردازه جدید می‌دیدید.

پستگرس از پروتکل لایه ارتباطی TCP برای ارتباط با کلاینت‌ها استفاده می‌کند.

همچنان که دو کلاینت psql در حال اجرا هستند، دستور زیر را برای لیست کردن ارتباطات شبکه بین پردازه‌ها اجرا کنید:

$ lsof | grep "localhost:postgres"
postgres  24695  hadi  3u   IPv4    91393    0t0    TCP localhost:postgresql (LISTEN)
psql      24767  hadi  3u   IPv4    86470    0t0    TCP localhost:55904->localhost:postgresql (ESTABLISHED)
postgres  24768  hadi  8u   IPv4    91419    0t0    TCP localhost:postgresql->localhost:55904 (ESTABLISHED)
psql      24817  hadi  3u   IPv4    86481    0t0    TCP localhost:55906->localhost:postgresql (ESTABLISHED)
postgres  24818  hadi  8u   IPv4    91432    0t0    TCP localhost:postgresql->localhost:55906 (ESTABLISHED)

پستگرس به صورت پیش‌فرض به پورت ۵۴۳۲ گوش می‌کند. دستور lsof برای خوانا شدن خروجی به جای ۵۴۳۲ از “postgresql” استفاده کرده است.

مواردی که از خروجی بالا می‌فهمیم:

پردازه postgres به شماره ۲۴۶۹۵ که پدر همه پردازه‌ها در خروجی ps بود، به پورت TCP پستگرس یا همان ۵۴۳۲ گوش می‌کند و منتظر درخواست ارتباط جدید است.
پردازه psql با شماره ۲۴۷۶۷ پورت محلی ۵۵۹۰۴ را برای انتخاب کرده است و به پردازه postgres با شماره ۲۴۷۶۸ با استفاده پورت TCP پستگرس یا همان ۵۴۳۲ وصل شده است.
همچنین پردازه psql به شماره ۲۴۸۱۷ به پردازه postgres با شماره ۲۴۸۱۸ وصل شده است.

پروتکل لایه کاربردی پستگرس

برای مشاهده اینکه کلاینت پستگرس چگونه پرسش‌ها را به پستگرس می‌فرستد و پستگرس چگونه به این پرسش‌ها پاسخ می‌دهد، ابتدا با یکی از psql هایی که اجرا کردید، یک جدول برای تمرین ایجاد کنید:

create table t(a int, b text);
insert into t values (1, 'a'), (2, 'b');

اکنون در پنجره‌ای دیگر دستور tcpflow را برای گوش کردن به ترافیک پستگرس اجرا کنید:

sudo tcpflow -D -c port 5432 -i lo

در دستور بالا port 5432 مشخص می‌کند که به پورت پستگرس گوش می‌کنیم و -i lo مشخص می‌کند که به رابط شبکه محلی گوش می‌دهیم.

اکنون دستور زیر را در psql اجرا کنید و خروجی آن را مشاهده کنید:

postgres=# select * from t;
 a | b
---+---
 ۱ | a
 ۲ | b
(۲ rows)

در پنجره tcpflow خروجی شبیه زیر را مشاهده خواهید کرد:

۱۲۷٫۰۰۰٫۰۰۰٫۰۰۱٫۵۵۹۰۶-۱۲۷٫۰۰۰٫۰۰۰٫۰۰۱٫۰۵۴۳۲:
۰۰۰۰: ۵۱۰۰ ۰۰۰۰ ۱۵۷۳ ۶۵۶c 6563 7420 2a20 6672 6f6d 2074 3b00  Q....select * from t;.

۱۲۷٫۰۰۰٫۰۰۰٫۰۰۱٫۰۵۴۳۲-۱۲۷٫۰۰۰٫۰۰۰٫۰۰۱٫۵۵۹۰۶:
۰۰۰۰: ۵۴۰۰ ۰۰۰۰ ۲e00 0261 0000 0040 0000 0100 0000 1700 04ff ffff ff00 0062 0000 0040  T......a...@...............b...@
۰۰۲۰: ۰۰۰۰ ۰۲۰۰ ۰۰۰۰ ۱۹ff ffff ffff ff00 0044 0000 0010 0002 0000 0001 3100 0000 0161  ...............D..........1....a
۰۰۴۰: ۴۴۰۰ ۰۰۰۰ ۱۰۰۰ ۰۲۰۰ ۰۰۰۰ ۰۱۳۲ ۰۰۰۰ ۰۰۰۱ ۶۲۴۳ ۰۰۰۰ ۰۰۰d 5345 4c45 4354 2032 005a  D..........2....bC....SELECT 2.Z
۰۰۶۰: ۰۰۰۰ ۰۰۰۵ ۴۹

که بخش اول این خروجی نشان می‌دهد که کلاینت کوئری را چگونه به پستگرس ارسال کرد، و بخش دوم نشان می‌دهد که پستگرس برای پاسخ به این کوئری چه دنباله از بایت‌ها را به کلاینت فرستاد. اگر به بخش پاسخ دقت کنید، تمام اطلاعاتی که در خروجی کوئری دید را در اینجا نیز تشخصی خواهید داد.

برای مشاهده جزییات پروتکل پستگرس به بخش «قالب پیام پروتکل» در مستندات پستگرس مشاهده کنید. به عنوان نمونه، در مستندات برای پیام کوئری آمده است:

Query (F)
  Byte1('Q')
     Identifies the message as a simple query.

  Int32
     Length of message contents in bytes, including self.

  String
     The query string itself.

و اگر به خروجی tcpflow دقت کنید، برای ارسال کوئری ابتدا یک Q ارسال شد، سپس طول کوئری به صورت یک عدد صحیح ۴ بایتی (دنباله ۰۰ ۰۰ ۰۰ ۱۵ در بخش هگزادسیمال)، و سپس خود کوئری به صورت متنی.

پردازش کوئری

بین دریافت کوئری و ارسال پاسخ چه اتفاقی می‌افتد؟

به صورت کلی، مراحی پردازش کوئری عبارتند از:

مرحله Parse و Analyze

پس از اینکه پستگرس کوئری را به صورت متنی دریافت کرد، آن را پردازش می‌کند و به داده ساختار داخلی کوئری تبدیل می‌کند. این مرحله از ۲ گام تشکیل شده است:

مرحله Parse که توسط تابع raw_parser پیاده‌سازی شده و ساختار کلی کوئری را درمی‌آورد.
مرحله آنالیز که توسط تابع parse_analyze پیاده‌سازی شده و اشاره‌گرهای موجود در کوئری را ارزیابی می‌کند. مثلا اشاره‌گر به یک جدول یا ستون‌های جدول.

این داده ساختار در فایل src/include/nodes/parsenodes.h تعریف شده است:

typedef struct Query
{
    NodeTag type;
    CmdType    commandType;
    QuerySource querySource;
...
}

برای اینکه حاصل این تبدیل را ببینید، ابتدا تنظیمات زیر را در پنجره psql انجام دهید:

set client_min_messages to log;
set debug_print_parse to true;

و سپس کوئری را اجرا کنید:

select a, b from t;

خروجی مرحله Parse به صورت زیر چاپ خواهد شد. بخشی از خروجی را به علت طولانی بودن حذف کرده‌ام:

LOG:  parse tree:
DETAIL:     {QUERY
   :commandType 1
...
   :rtable (
      {RTE
      :alias <>
      :eref
         {ALIAS
         :aliasname t
         :colnames ("a" "b")
         }
      :rtekind 0
      :relid 16384
...
      }
   )
...
   :targetList (
      {TARGETENTRY
      :expr
         {VAR
         :varno 1
         :varattno 1
         :vartype 23
...
         }
...
      }
      {TARGETENTRY
      :expr
         {VAR
         :varno 1
         :varattno 2
         :vartype 25
...
         }
...
      }
   )
...
   }

اکنون به بررسی بخش‌هایی از این خروجی می‌پردازیم:

نوع کوئری

بخش اولی که در خروجی Parse به آن دقت می‌کنیم، :commandType 1 است که مشخص می‌کند که این کوئری SELECT است. مقدار این متغیر از لیست ثوابت زیر در کد پستگرس انتخاب می‌شود:

typedef enum CmdType
{
    CMD_UNKNOWN,
    CMD_SELECT,
    CMD_UPDATE,
    CMD_INSERT,
    CMD_DELETE,
    CMD_UTILITY, /* cmds like create, destroy, copy, vacuum, etc. */
    CMD_NOTHING
} CmdType;

همانطور که میدانید، در زبان سی اعضای enum مقدار عددی معادل موقعیت خود را دریافت می‌کنند، و در اینجا CMD_SELECT معادل ۱ خواهد بود.

لینک تعریف CmdType

اطلاعات مربوط به بخش FROM

بخش rtable یک لیست از مواردی هستند که در بخش FROM کوئری آمده است. که در این مورد فقط جدول t است. همانطور که مشاهده می‌کنید، با یک شماره :relid 16384‍ مشخص شده است. پستگرس اطلاعات مربوط به جدول‌ها را در جدول سیستمی pg_class نگهداری می‌کند. برای اینکه ببنیم برای جدول ما چه اطلاعاتی ذخیره شده است، می‌توانیم کوئری زیر را اجرا کنیم:

\x

select * from pg_class where oid=16384;
-[ RECORD 1 ]-------+------
oid                 | 16384
relname             | t
relnamespace        | 2200
reltype             | 16386
reloftype           | 0
relowner            | 10
...

در کد بالا \x برای این بود که پستگرس به جای ستونی، خروجی را به صورت سطری نشان دهد.

اطلاعات مربوط به ستون‌های انتخاب شده

یکی از بخش‌های جالب خروجی مرحله Parse لیست targetList است که در خروجی بالا ۲ عنصر از نوع TargetEntry دارد که هر کدام شامل یک Var یا همان متغیر یا همان یک اشاره‌گر به ستون‌های جدول است. مقدار varno شماره جدول در بخش FROM و مقدار varattno شماره ستون در آن جدول را مشخص می‌کند. مثلا متغیر زیر یعنی ستون دوم از جدول اول:

      {TARGETENTRY
      :expr
         {VAR
         :varno 1
         :varattno 2
         :vartype 25
...
         }
...
      }

مقدار vartype شماره نوع آن ستون را مشخص می‌کند. این شماره به یک سطر در جدول pg_type اشاره می‌کند. مثلا برای نوع شماره ۲۳:

select * from pg_type where oid=23;
-[ RECORD 1 ]--+---------
oid            | 23
typname        | int4
typnamespace   | 11
typowner       | 10
typlen         | 4
typbyval       | t
typtype        | b
...
typinput       | int4in
typoutput      | int4out
typreceive     | int4recv
typsend        | int4send
...

که نشان میدهد نوع شماره ۲۳ عدد صحیح ۴ بایتی است که توسط int4out به رشته تبدیل می‌شود و توسط int4in از رشته ایجاد می‌شود. در ویدئو به بررسی بیشتر تابع int4in پرداختیم.

مرحله آنالیز

اگر در کوئری اسم جدول را اشتباه بنویسیم، خطایی رخ خواهد داد:

select a, b from t2;
ERROR:  relation "t2" does not exist
LINE 1: select a, b from t2;

این که آیا واقعا جدول اشاره شده و سایر موارد اشاره شده (مثل ستون‌ها) وجود دارند، در مرحل آنالیز انجام می‌شود.

در مورد نام جدول، تابع transformSelectStmt در مرحله آنالیز صدا می‌شود که پس از چند مرحله تابع parserOpenTable را صدا می‌کند که بررسی می‌کند آیا واقعا جدول وجود دارد یا نه و در صورت عدم وجود خطا می‌دهد:

Relation
parserOpenTable(ParseState *pstate, const RangeVar *relation, int lockmode)
{
    rel = table_openrv_extended(relation, lockmode, true);
    if (rel == NULL)
    {
...
                ereport(ERROR,
                        (errcode(ERRCODE_UNDEFINED_TABLE),
                         errmsg("relation \"%s\" does not exist",
                                relation->relname)));
...
    }
...
    return rel;
}

مرحله بازنویسی (Rewrite)

در این مرحله برای خیلی از کوئری‌ها و به خصوص کوئری بالای ما اتفاقی نمی‌افتد و حاصل بازنویسی دقیقا همان حاصل مرحله Parse است.

ولی اگر کوئری شما شامل یک View باشد، حاصل بخش parse فقط شامل اسم View است و حاصل مرحله بازنویسی، View را با کوئری که معادل View است جایگزین می‌شود.

حاصل این مرحله را می‌توانید با روشن کردن debug_print_rewritten مشاهده کنید.

به عنوان مثال، دستورات زیر را اجرا کنید:

create view t_view as select count(*) from t;
set client_min_messages to log;
set debug_print_parse to true;
set debug_print_rewritten to true;

و سپس کوئری زیر را اجرا کنید:

SELECT * FROM t_view;

و خروجی مراحل Parse و بازنویسی را مقایسه کنید.

در ویدئو این کار را انجام دادیم، ولی اینجا به خاطر حجم از این بخش عبور می‌کنیم.

مرحله برنامه‌ریزی (Plan/Optimize)

تا این مرحله پستگرس کوئری را Parse کرده است، ولی هنوز تصمیم نگرفته است آن را چگونه اجرا کند. در این مرحله تصمیم می‌گیرد که کوئری قرار است چگونه اجرا شود. حاصل این مرحله یک مقدار از نوع ساختار PlannedStmt است.

برای مشاهده حاصل این مرحله می‌توانید پارامتر تنظیم debug_print_plan را فعال کنید:

set client_min_messages to log;
set debug_print_plan to true;

اکنون اگر کوئری را اجرا کنیم، حاصل این مرحله به صورت زیر چاپ خواهد شد که به علت صرفه‌جویی در فضا بخش‌هایی از آن را حذف کرده‌ایم

postgres=# select a, b from t;
LOG:  plan:
DETAIL:     {PLANNEDSTMT 
	   :commandType 1 
...
	   :planTree 
	      {SEQSCAN 
...
	      :qual <> 
...
	      }
...
	   }

همانطور که مشاهده می‌کنید، طرح اجرای این کوئری بسیار ساده و شامل تنها یک SeqScan است که کد مربوط به آن را می‌توانید در nodeSeqScan.c بیابید.

حال کوئری را با افزودن یک شرط پیچیده‌تر می‌کنیم و مشاهده می‌کنیم که بخش qual حاصل تغییر می‌کند:

postgres=# select a, b from t where a > 1;
LOG:  plan:
DETAIL:     {PLANNEDSTMT 
	   :commandType 1 
...
	   :planTree 
	      {SEQSCAN 
...
	      :qual (
	         {OPEXPR 
	         :opno 521 
	         :opfuncid 147 
	         :opresulttype 16 
...
	         :args (
	            {VAR 
	            :varno 1 
	            :varattno 1 
...
	            }
	            {CONST 
	            :consttype 23 
...
	            :constvalue 4 [ 1 0 0 0 0 0 0 0 ]
	            }
	         )
	         :location 27
	         }
	      )
...
	      }
...
	   }

اکنون بخش qual یک مقدار از نوع OpExpr است که از تابع شماره ۱۴۷ برای مقایسه ستون اول جدول با ثابت صحیح ۱ استفاده می‌کند.

برای اینکه بفهمیم تابع شماره ۱۴۷ چه تابعی است، می‌توانیم به جدول سیستمی pg_proc مراجعه کنیم:

postgres=# select * from pg_proc where oid=147; 
-[ RECORD 1 ]---+-------
oid             | 147
proname         | int4gt
...
prorettype      | 16
proargtypes     | 23 23
...

مشاهده می‌کنیم که اسم این تابع int4gt است که کد مربوط به آن را در src/backend/utils/adt/int.c می‌توانید بیابید. پیاده‌سازی این تابع بسیار ساده است و دو آرگومان را مقایسه و نتیجه را به صورت بولین برمی‌گرداند:

Datum
int4gt(PG_FUNCTION_ARGS)
{
	int32		arg1 = PG_GETARG_INT32(0);
	int32		arg2 = PG_GETARG_INT32(1);

	PG_RETURN_BOOL(arg1 > arg2);
}

برای اینکه بتوانید به جای PlannedStmt، طرح اجرا به صورت خواناتر برای انسان دریافت کنید، می‌توانید از EXPLAIN استفاده کنید:

postgres=# explain select a, b from t where a > 1;
                     QUERY PLAN
-----------------------------------------------------
 Seq Scan on t  (cost=0.00..25.88 rows=423 width=36)
   Filter: (a > 1)
(۲ rows)

برای مشاهده یک طرح اجرای پیچیده‌تر، از یک join استفاده می‌کنیم:

postgres=# explain select t1.a,t1.b, t2.a from t t1,t t2 where t1.a=t2.a;
                             QUERY PLAN
---------------------------------------------------------------------
 Merge Join  (cost=176.34..303.67 rows=8064 width=40)
   Merge Cond: (t1.a = t2.a)
   ->  Sort  (cost=88.17..91.35 rows=1270 width=36)
         Sort Key: t1.a
         ->  Seq Scan on t t1  (cost=0.00..22.70 rows=1270 width=36)
   ->  Sort  (cost=88.17..91.35 rows=1270 width=4)
         Sort Key: t2.a
         ->  Seq Scan on t t2  (cost=0.00..22.70 rows=1270 width=4)
(۸ rows)

مشاهده می‌کنیم که پستگرس از الگوریتم Merge Join برای اجرای این کوئری استفاده می‌کند.

بهینه‌سازی طرح اجرا

پستگرس برای اجرای یک کوئری می‌تواند از الگوریتم‌های مختلف استفاده کند. مثلا برای Join می‌تواند از (۱) مرتب‌سازی و ادغام، یا (۲) استفاده از جدول هش، یا (۳) از حلقه تو در تو استفاده کند. که در مثال بالا از مرتب‌سازی و ادغام استفاده کرد.

در مرحله بهینه‌سازی، پستگرس طرح‌های مختلف را ایجاد می‌کند، هزینه هر کدام را تخمین میزند، و کم هزینه‌ترین را انتخاب می‌کند. مثلا در مثال بالا تخمین پستگرس برای هر مرحله ذکر شده و تخمین پستگرس برای کل کوئری ۳۰۳٫۶۷ است.

اگر به مثال بالا دقت کنید، مشاهده می‌کنید که تخمین پستگرس از تعداد سطرهای جدول t نادرست است، و بنابراین شاید بهترین طرح اجرا را انتخاب نکرده باشد. برای اینکه پستگرس بتواند تخمین بهتری بزند، از دستور ANALYZE برای جمع‌آوری یک سری داده آماری برای جدول استفاده می‌کنیم:

ANALYZE t;

و دوباره دستور EXPLAIN را اجرا می‌کنیم:

postgres=# explain select t1.a,t1.b, t2.a from t t1,t t2 where t1.a=t2.a;
                           QUERY PLAN
----------------------------------------------------------------
 Nested Loop  (cost=0.00..2.10 rows=2 width=10)
   Join Filter: (t1.a = t2.a)
   ->  Seq Scan on t t1  (cost=0.00..1.02 rows=2 width=6)
   ->  Materialize  (cost=0.00..1.03 rows=2 width=4)
         ->  Seq Scan on t t2  (cost=0.00..1.02 rows=2 width=4)
(۵ rows)

مشاهده می‌کنیم که پستگرس این دفعه تخمین‌های بهتری زده است و تصمیم گرفته است برای این کوئری از حلقه تو در تو استفاده کند.

مرحله اجرا

در این مرحله پستگرس طرح اجرایی که در مرحله پیش ایجاد شد را به صورت بازگشتی اجرا می‌کند. مثلا برای طرح اجرای بالا، کد موجود در nodeSeqScan.c برای خواندن جدول‌ها، و کد موجود در nodeNestLoop.c برای عمل Join به صورت حلقه تو در تو اجرا می‌شود.

تکالیف کار در خانه ?

پستگرس را کامپایل و نصب کنید و یک کلاستر ایجاد کنید.
مراحل توضیح شده در این مقاله یا در ویدئو را تا جایی که برایتان جالب است اجرا کنید.
کوئری‌های مختلف اجرا کنید و حاصل مراحل Parse و Plan را بررسی کنید.
کامنت‌های مربوط به ساختار Query را در فایل src/include/node/parsenodes.h بخوانید.
سعی کنید پیاده‌سازی تابع pg_strtoint32 را تغییر دهید و به جای اعداد منفی از اعداد مثبت استفاده کنید، ولی متغیر حاصل را از نوع عدد ۶۴ بیتی درنظر بگیرید تا مشکل در کمترین مقدار پیش نیاید. دقت کنید که پیاده‌سازی این تابع را در این مقاله توضیح ندادیم و تنها در ویدئو توضیح دادیم.

اگر مشکلی در دنبال کردن این مقاله یا ویدئو داشتید، اگر پیشنهاد یا انتقادی داشتید، یا اگر سوالی داشتید، میتوانید از روش‌های زیر با من تماس بگیرید:

پیام مستقیم در تویتر به اکانت pykello_fa
ایمیل به hadi [at] moshayedi [dot] net.

ممنون که وقت گذاشتید و امیدوارم استفاده کرده باشید.

برچسب ها

مجتبی بنائی 1400/01/20

۰ 593 زمان تقریبی مطالعه 11 دقیقه

پستگرس چگونه کار می‌کند؟ جلسه یک – زندگی یک کوئری

پیش‌نیازها

وصل شدن کلاینت به پستگرس

پستگرس برای هر کلاینت یک پردازه جدا ایجاد می‌کند

پستگرس از پروتکل لایه ارتباطی TCP برای ارتباط با کلاینت‌ها استفاده می‌کند.

پروتکل لایه کاربردی پستگرس

پردازش کوئری

مرحله Parse و Analyze

نوع کوئری

اطلاعات مربوط به بخش FROM

اطلاعات مربوط به ستون‌های انتخاب شده

مرحله آنالیز

مرحله بازنویسی (Rewrite)

مرحله برنامه‌ریزی (Plan/Optimize)

بهینه‌سازی طرح اجرا

مرحله اجرا

تکالیف کار در خانه ?

مجتبی بنائی

بعدی را بخوانید

واکاوی مهاجرت از مانگودی‌بی به پستگرس برای ذخیره داده‌های JSON

معماری‌های مدرن؛ زمان بازنگری در نقش لایه‌ کش فرا رسیده است؟

چگونه داده‌های تاریخی را در PostgreSQL آرشیو کنیم؟ و همچنان به تمام داده‌ها دسترسی داشته باشیم

بررسی تغییرات پایگاه‌های داده در نظرسنجی Stack Overflow 2025

واکاوی مهاجرت از مانگودی‌بی به پستگرس برای ذخیره داده‌های JSON

معماری‌های مدرن؛ زمان بازنگری در نقش لایه‌ کش فرا رسیده است؟

چگونه داده‌های تاریخی را در PostgreSQL آرشیو کنیم؟ و همچنان به تمام داده‌ها دسترسی داشته باشیم

بررسی تغییرات پایگاه‌های داده در نظرسنجی Stack Overflow 2025

دیدگاهتان را بنویسید لغو پاسخ

پیش‌نیازها

وصل شدن کلاینت به پستگرس

پستگرس برای هر کلاینت یک پردازه جدا ایجاد می‌کند

پستگرس از پروتکل لایه ارتباطی TCP برای ارتباط با کلاینت‌ها استفاده می‌کند.

پروتکل لایه کاربردی پستگرس

پردازش کوئری

مرحله Parse و Analyze

نوع کوئری

اطلاعات مربوط به بخش FROM

اطلاعات مربوط به ستون‌های انتخاب شده

مرحله آنالیز

مرحله بازنویسی (Rewrite)

مرحله برنامه‌ریزی (Plan/Optimize)

بهینه‌سازی طرح اجرا

مرحله اجرا

تکالیف کار در خانه ?

مجتبی بنائی

بعدی را بخوانید

واکاوی مهاجرت از مانگودی‌بی به پستگرس برای ذخیره داده‌های JSON

معماری‌های مدرن؛ زمان بازنگری در نقش لایه‌ کش فرا رسیده است؟

چگونه داده‌های تاریخی را در PostgreSQL آرشیو کنیم؟ و همچنان به تمام داده‌ها دسترسی داشته باشیم

بررسی تغییرات پایگاه‌های داده در نظرسنجی Stack Overflow 2025

واکاوی مهاجرت از مانگودی‌بی به پستگرس برای ذخیره داده‌های JSON

معماری‌های مدرن؛ زمان بازنگری در نقش لایه‌ کش فرا رسیده است؟

چگونه داده‌های تاریخی را در PostgreSQL آرشیو کنیم؟ و همچنان به تمام داده‌ها دسترسی داشته باشیم

بررسی تغییرات پایگاه‌های داده در نظرسنجی Stack Overflow 2025

با عضویت در خبرنامه ما

آخرین مطالب سایت را سریع تر از دیگران دریافت کنید

مانیتورینگ وضعیت محصول از طریق تعریف متریک‌های مناسب

Data Mesh : معماری داده مقیاس‌پذیر،‌ دامنه‌محور و غیرمتمرکز

دیدگاهتان را بنویسید لغو پاسخ